GPT-4 について知っておくべきことジェネレーティブ AI ChatGPT の後継としてリリースされたばかりで、AI の倫理と AI 法の考慮事項

大ヒットした大ヒット映画の続編が公開されたときの通常の反応は?

一部の人々は続編を見に行き、オリジナルよりも優れているとは言わないまでも、同じくらい優れていると宣言します. 他の人は非常に高い期待を持っているかもしれません. 最新の映画に何が含まれていても、間違いなく非常に失望し、最初の映画が恥ずかしがらずに続編よりも頭と尻尾があったと簡単に宣言する人もいます.

同じ範囲の反応と感情が、AI メーカーの OpenAI による昨日の GPT-4 のリリースで前面に出てきました。Pi Day、つまり 3.14 または 14 年 2023 月 4 日に行われました。食事の日、GPT-XNUMX の発表は、多くのマスコミの注目を集め、ソーシャル メディアで多くの話題を集めました。

ここでは、GPT-4 の主な機能と機能について説明し、その前身である ChatGPT (私の類推では最初の「ブロックバスター」) と比較します。 さらに、GPT-4 と ChatGPT の例を含め、おそらく特に GPT-XNUMX と ChatGPT の例を含め、生成 AI に付随する非常に重要な AI 倫理と AI 法の考慮事項が多数あります。 AIの現在と未来。

簡単に言えば、映画の続編のように、GPT-4 はある意味で ChatGPT よりも優れています。例えば、より大きく、より速く、より流暢に見えるなどです。ここで略して)。 ちょっとモヤモヤした反応。 続編は、多くの人が予想していたスラムダンクではありません。 物事はそれよりも微妙であることがわかります。 それが私たち全員が住んでいる現実の世界のようです。

おそらく、OpenAI の CEO である Sam Altman は、14 年 2023 月 4 日のツイートで、GPT-XNUMX の打ち上げについて次のように述べています。

  • 「GPT-4 は、これまでで最も機能的で調整されたモデルです。 現在、API (待機リストあり) と ChatGPT+ で利用できます。」
  • 「それはまだ欠陥があり、まだ限定的であり、より多くの時間を費やした後よりも、最初の使用のほうが印象的です。」

GPT-4 のリリースの結果として、また現在の状況や状況に応じて、何をすることを検討するかについての私の提案は、次の潜在的なアクションで構成されています。

  • 既存の ChatGPT ユーザー。 すでに ChatGPT を使用している場合は、GPT-4 を詳しく調べて、代わりに使用するかどうかを確認する必要があります (または、ChatGPT の使用に加えて GPT-4 を使用する場合は、ChatGPT または GPT のいずれかを使用する必要があります)。 -4、発生したニーズに応じて)。 ChatGPT を使用するための月額 4 ドルのサブスクリプション モードである ChatGPT Plus に加入している場合は、GPT-20 で遊ぶことができます。それ以外の場合は、現時点で GPT-4 にアクセスするための簡単な手段が特にありません (警告またはねじれは、検索エンジンである Microsoft Bing は、GPT-4 の亜種を使用しています。これについては、こちらのリンクで説明しています)。
  • ジェネレーティブ AI を使用したことはありません。 ChatGPT を使用しておらず、ジェネレーティブ AI を使用したことがない場合は、ChatGPT に無料でアクセスできるため、最初に ChatGPT を使用することをお勧めします (または、もちろん、他の無数のジェネレーティブ AI アプリのいずれかを使用して旅を始めることを検討してください)この AI 領域に)。 既存の ChatGPT ユーザーに関する上記のポイントで述べたように、現時点では GPT-4 は無料ではありません。 ChatGPT に慣れたら、ChatGPT Plus に登録して GPT-4 へのアクセスを含む追加の特典を得る価値があるかどうかを判断できます。
  • 他のジェネレーティブ AI の使用。 ChatGPT 以外のジェネレーティブ AI アプリを使用している場合は、ChatGPT が提供する以上の改善が行われているため、GPT-4 に強い関心があるかもしれません。 私がこれについて言及したのは、一部の知識豊富な AI ユーザーが、ChatGPT が他のオプションほど適していないと判断したためです。 GPT-4 の最新情報を入手して、既存の選択が依然として最適かどうかを判断することをお勧めします。 それは可能性があります。 したがって、GPT-4 に確実に切り替えることを推奨しているわけではなく、他の利用可能な車のタイヤを蹴るのが常に賢明であると言っているだけです。
  • API 経由で ChatGPT にアクセスするその他のソフトウェア。 API (アプリケーション プログラミング インターフェース) を介して ChatGPT に接続するソフトウェアを作成している場合は、API を介した GPT-4 の使用を詳しく検討することをお勧めします。 大きな問題の 4 つは、GPT-4 API を使用するコストが ChatGPT を使用するよりもはるかに高いことです。 GPT-XNUMX の追加の利点と、ChatGPT に固執する低コストの代替案のトレードオフ分析を行う必要があります。 これはやや複雑な決定です。 無意識にではなく、意識してそうしてください。

多くの人にとって衝撃的なことの XNUMX つは、報道価値が以前に予想されていたレベルまで上昇しなかったことです。

理由を説明させてください。

オリジナルの大ヒット作とその続編

昨年の XNUMX 月末に、ChatGPT と呼ばれるジェネレーティブ AI アプリが利用可能になったことはご存知でしょう。

これが意外な大ヒット。

それまでは、ジェネレーティブ AI アプリケーションを一般にリリースするための以前の取り組みは、通常、軽蔑と憤慨に見舞われていました。 懸念の根拠は、ジェネレーティブ AI が、冒涜的な言葉、不快な偏見、虚偽、誤り、さらにはでっち上げの事実やいわゆる AIの幻覚 (AI を擬人化する傾向があるため、この「幻覚」という用語は好きではありません。こちらのリンクでの私の議論を参照してください)。

ジェネレーティブ AI は、ユーザーが入力したテキスト プロンプトから出力を生成することを含む AI の一種です。たとえば、テキストベースのエッセイを作成または生成したり、画像やアートワークを作成したり、音声を作成したり、ビデオを作成したりできます。これらは通常、テキストからテキスト、テキストからエッセイ、テキストからアート、テキストから画像、テキストからオーディオ、テキストからビデオなどと呼ばれます。 ジェネレーティブ AI の注目すべき点は、生成された作品が人間が生成した出力と同等に見えることです。 ジェネレーティブ AI の出力を、人間の心と人間の手だけによって生成された同等の構成と区別しようとするのは難しいでしょう。

ジェネレーティブ AI の詳細については、ChatGPT とジェネレーティブ AI の基礎に関するこのリンクなどの進行中のシリーズを参照してください。また、学生による ChatGPT の報道と、エッセイでの不正行為の可能性の問題 (ここのリンクを使用)、非常に疑わしい使用メンタルヘルスのアドバイスのためのChatGPTの(ここのリンクを参照)、ジェネレーティブAIの潜在的な盗作と著作権侵害に関する懸念(ここのリンク)、およびここのリンクでのより多くの顕著なトピック.

ChatGPT が通常のようなむち打ち症にならなかった理由の XNUMX つは、ChatGPT をリリースする前に、AI メーカーである OpenAI による舞台裏での作業によるものでした。 彼らは、さまざまな手法やテクノロジーを使用して、特に憎悪に満ちた汚いエッセイを出力することを拒否しようとしました。 ChatGPT は、ジェネレーティブ AI のテキストからテキストまたはテキストからエッセイ スタイルのみであることに注意してください。 このように、風変わりで激怒する出力を防止する試みは、言葉を扱うことから成ります。 出力がアートや画像の場合にも同様の問題が発生しますが、何らかの攻撃的な画像の作成を防止するためにこれを把握することは、同等またはそれ以上に困難な場合があります。

AI メーカーによってますます採用されている注目すべき手法は、 RLHF (人間のフィードバックによる強化学習)。 これが一般的な仕組みです。 インターネット上でテキストをスキャンするなどしてジェネレーティブ AI アプリが最初にデータ トレーニングされると、人間のレビュアーを利用して、言う価値のあることと言うべきスキャンダラスなことを AI にガイドまたは提示します。 この一連の承認と非承認に基づいて、ジェネレーティブ AI は、出力しても問題ないと思われるものと許容されないと思われるものを大まかにパターン マッチングできます。

もうXNUMXつ非常に重要な点について言及したいと思います。

AI には感覚がありません。

おどけた見出しが何を宣言しようとも、今日の AI は感覚を持っていないことをご安心ください。 ジェネレーティブ AI の場合、アプリは広範な計算パターン マッチング ソフトウェアおよびデータ モデリング装置です。 インターネットから何百万もの単語を調べた後、単語に関するパターンとそれらの統計的関係が導き出されます。 結果は、人間の言語の驚くべき形の模倣です (一部の AI インサイダーは、これを 確率的オウム残念ながら、それ以外の感覚的な要素を議論に持ち込んでいますが)。

ワード プロセッシング パッケージを使用している場合、ジェネレーティブ AI はオートコンプリート機能と考えることができますが、これははるかに包括的で高度な機能です。 あなたは文を書き始め、文の残りの文言を推奨するオートコンプリートを持っていると思います。 ChatGPT などの生成 AI を使用すると、プロンプトを入力すると、AI アプリは単に単語を完成させようとするだけでなく、質問に答えて応答全体を作成しようとします。

さらに、ChatGPT や他の同様の生成 AI アプリを使用するときに多くの人が犯す初歩的な間違いは、自慢のインタラクティブな会話機能を使用できないことです。 プロンプトを入力してから、回答を待つ人もいます。 彼らはそれがすべてだと思っているようです。 一つで完了。 しかし、これにはジェネレーティブ AI の核心が欠けています。 より有用なアプローチは、ジェネレーティブ AI との対話に関連する一連のプロンプトを実行することです。 ここでジェネレーティブ AI が真価を発揮します。こちらのリンクで私の例を参照してください。

ChatGPT は、AI における驚くべきブレークスルーとして、メディアや一般大衆によって予告されました。

現実には、多くの場合、研究所やシンクタンクで、他の多くの同様の AI アプリが考案されており、場合によっては、慎重に一般に公開されています。 上で述べたように、結果は通常きれいではありませんでした。 人々はジェネレーティブ AI を突いたり突いたりして、凶悪な性質のエッセイを手に入れることができました。こちらのリンクで私の記事を参照してください。 このような場合、AI メーカーは通常、オープンな市場から AI を撤回し、ラボでの使用または慎重に選択された AI ベータ テスターと開発者に集中することに戻ることを余儀なくされました。

AI 業界の残りの部分の多くは、ChatGPT がまだ不正な出力を生成するという綱渡りを管理していたにもかかわらず、世論が OpenAI を全体的なアクセスから AI アプリを削除することを余儀なくされたほどではなかったことにうんざりしていました.

これがChatGPTの本当の衝撃でした。

ほとんどの人は、ショックは会話力だと思っていました。 AI のユーザー向けではありません。 ほぼすべての AI インサイダーを驚かせたのは、憎悪に満ちたスピーチを吐き出す可能性のある生成 AI を解放できることと、その反動が迅速な撤退を強いるほど激しくないことでした。 誰かわかったね? 実際、ChatGPT のリリースに先立って、うわさ工場は、せいぜい数日または数週間以内に、OpenAI が AI アプリをすべての参加者がすぐに利用できるようにしたことを後悔するだろうと予測していました。 彼らはアクセスを制限するか、おそらく家に帰って一息つく必要があります.

ChatGPT ロールアウトの信じられないほどの成功により、他のジェネレーティブ AI アプリへの扉が慎重に開かれ、ストリートにも対応できるようになりました。 たとえば、私は Google が Bard を発表したことや、生成 AI を従来の Web 検索にプラグインしたいという欲求のために、インターネット検索エンジン戦争がどのように激化しているかについて説明しました。こちらのリンクを参照してください。

ChatGPT は、ブロックバスターとして合理的に特徴付けることができます。 それはまた、いわばどこからともなく現れたものでもあります。 大ヒット映画は、リリース時に大ヒットになる可能性が高いことが事前にわかっている場合があります。 他の場合では、映画は大衆を驚かせ、映画製作者でさえも驚かせる寝台車です。 それが ChatGPT と OpenAI で起こったことです。

さて、大ヒットの ChatGPT ができました。

ChatGPT は基本的に、GPT-3.5 として知られる GPT のバージョンに基づいています。 以前は、GPT-3、GPT-2 などがあります。 AI の世界と AI に接する人々は、OpenAI が次のバージョンである GPT-4 に取り組んでいることを知っていました。

GPT-4 は、ChatGPT の後継または続編と見なされます。

これは、映画についての私のアナロジーに戻ります。 驚きの大ヒット作である ChatGPT は非常に人気がありました。 GPT-4 がどのようなものになるか、そして一般の人々がどのように反応するかについての期待は、野蛮な憶測に満ちていました。 GPT-4は水の上を歩く! GPT-4 はスピード弾丸よりも速くなります! GPT-4 は、知覚 AI または汎用人工知能 (AGI) の達成になります!

何度もこれはなくなりました。

OpenAI の CEO である Sam Altman が、YouTube に投稿されたインタビュー (17 年 2023 月 4 日付) で次のように述べたことに漠然と気づいているかもしれません。 私はそれがどこから来たのか分かりません。 人々はがっかりすることを懇願していますが、そうなるでしょう。 誇大広告はまさに… 私たちは実際の AGI を持っていません。

さて、GPT-4はここにあります。

映画が出てきました。

私たちは自分の目でそれを見ることができます。 野放しの憶測はもうありません。 現実はねぐらになりました。

ピカピカの新しいおもちゃを開梱しましょう。

GPT-4 の要点

GPT-4 が提供するものを知りたいと思うことは間違いありません。

私の議論では、OpenAI が GPT-4 について利用できるようにしたさまざまなドキュメントとビデオを参照し、GPT-4 の使用に基づいて発言します。 議論を簡単にするために、私が熱心に引用する XNUMX つの便利なドキュメントがあることを覚えておいてください。 GPT-4 テクニカル レポート もうXNUMXつはOpenAIの公式です GPT-4 システムカード ドキュメント (どちらも OpenAI Web サイトで入手できます)。 の頭字語でそれらを引用します TR GPT-4 テクニカル レポート & SC GPT-4 システムカード.

TRの要約の最初の文を引用することから始めましょう。

  • 「画像とテキストの入力を受け入れ、テキスト出力を生成できる大規模なマルチモーダル モデルである GPT-4 の開発について報告します。」

信じられないかもしれませんが、その XNUMX つの文には多くのことが詰め込まれています。

着席して、快適なドリンクを手にしてください。

ジェネレーティブ AI に関して一般的に受け入れられている経験則の XNUMX つは、システムが大きくなればなるほど、流暢さと全体的な能力が向上する可能性が高いということです。 これは、歴史的に生成 AI システムのサイズが大きくなり、インタラクティブな会話を行うという点でますます流暢になっていることから、比較的十分に確立されているようです。 誰もがこれが事実であると信じているわけではなく、さまざまな最適化を使用してより大きな兄弟と同じくらい多くのことを達成する可能性のある、より小さなサイズのセットアップを積極的に探している研究者がいます.

TR からの GPT-4 に関する上記の引用文で、それが「大規模な」生成 AI であるという言い回しに気付いたかもしれません。 今日のジェネレーティブ AI システムの相対的なサイズに基づいて、誰もが代々同意する傾向があるでしょう。

AI インサイダーの心に浮かぶ明らかな疑問は、その規模がどれほど大きいかということです。 大規模 GPT-4に関しては?

通常、AI メーカーは、生成 AI のさまざまなサイジング メトリックを誇らしげに宣言します。 サイズとスケールがどのように重要であるかを他の AI の世界に知らせるためにそうするかもしれません。 自慢するためにそうするかもしれません。 単純に車のようなもので、エンジンがどれくらいの大きさで、どれくらい速く走るかということに自然な好奇心を抱くからかもしれません。

TR によると、次のように示されています。

  • 「競合状況とGPT-4のような大規模モデルの安全性への影響の両方を考慮して、このレポートには、アーキテクチャ(モデルサイズを含む)、ハードウェア、トレーニングコンピューティング、データセット構築、トレーニング方法などに関する詳細は含まれていません.」

AI のインサイダーは、これを魅力的に感じる傾向があります。 一方では、これらの重要な特性について語らないことは、外交との不穏な断絶のように思われます。 そうは言っても、そうすることで独自の秘密が明らかになったり、サイバーセキュリティの侵害への扉が開かれたりする可能性があるという論理は、まあ、それも理にかなっているようです.

AI メーカーは、重要な証拠の手がかりを不注意に与えない程度と方法で、生成 AI に関する特定の特性を明らかにすることを余儀なくされるべきでしょうか?

この考慮事項について熟考するために、AI 倫理の帽子をかぶらせてください。

一部の人々は、明示的な開示を要求する新しい AI 法を制定する可能性もあると考えています。

特に AI が大きくなり、最終的には実存的リスクの悲惨なゾーンに入る可能性がある場合は、AI で何が起こっているのかを一般の人々が知る必要があると考えられています。こちらのリンクで私の分析を参照してください。

さらに、GPT-4 のトレーニングにどのデータが使用されたかもわかりません。

データは、ジェネレーティブ AI の出現を左右します。 一部の人々は、これらのジェネレーティブ AI 機能を考案するためにインターネット全体がスキャンされたと誤って思い込んでいます。 いいえ。 実際、ここのリンクで説明しているように、スキャンされているのはインターネットのごく一部にすぎません。

関連する側面として、ジェネレーティブ AI がリアルタイムでインターネットをスキャンし、計算パターン マッチングをオンザフライで調整しているかどうかがあります。 ChatGPT は、2021 年までに行われたスキャンに限定されていました。つまり、ChatGPT を使用する場合、2022 年と 2023 年に何が起こったのかについてのデータはほとんどありません。

噂によると、GPT-4 には、オンザフライで調整するためのインターネットへの最新のリアルタイム接続が含まれるというものでした。

TR の内容は次のとおりです。

  • 「GPT-4 は一般的に、2021 年 XNUMX 月に事前トレーニング データの大部分が途絶えた後に発生したイベントに関する知識が不足しており、その経験から学習していません。 非常に多くの分野にわたる能力に見合っていないように見える単純な推論エラーを作成したり、ユーザーからの明らかに虚偽の発言を受け入れたりして、過度にだまされやすくなることがあります。」

一部の人が GPT-4 に少しがっかりしている理由がわかります。 噂によると、リアルタイムで動作すると同時に、オンザフライでインターネットに適応しているとのことでした。 ChatGPT より大幅に改善されたと考えられます。 現実には、GPT-4 はまだ古いデータを扱っています。 また、インターネットからの更新に基づいて計算パターン マッチング自体がリアルタイムで調整されることはありません。

さらにお知らせがあります。

GPT-4 が大規模であると先に引用した文章でも、GPT-4 は大規模であると述べています。 マルチモーダル.

の概念の背景を説明させてください。 マルチモーダル ジェネレーティブ AI。

この議論の冒頭で、テキストからテキストまたはテキストからエッセイ、テキストからアートまたはテキストから画像、テキストからオーディオ、テキストなど、さまざまなタイプの生成 AI があると述べました。 -to-video など。これらはすべて、コンテンツを処理する単一のモードと見なされます。 たとえば、テキストを入力して生成されたエッセイを取得する場合があります。 もう XNUMX つの例は、テキストを入力して生成されたアートワークを取得することです。

昨年末、私は 2023 年の AI の進歩について年次予測を行いました (こちらのリンクを参照)。 私は、マルチモーダル生成 AI が熱くなるだろうと述べました。 たとえば、テキストと画像を入力し (入力の XNUMX つのモード)、それらを生成 AI へのプロンプトとして使用すると、生成されたビデオとオーディオ トラックと共にエッセイを出力として取得できます (入力の XNUMX つのモード)。出力)。

したがって、多数のモードが共存する可能性があります。 プロンプトまたは入力に多数のモードがある場合があります。 生成された応答または出力に多数のモードがある場合もあります。 入力と出力の両方で組み合わせが可能です。 それが物事が向かっているところです。 マルチモーダル機能により、ジェネレーティブ AI でできることの可能性が大きく広がります。

ChatGPT には単一モードしかありません。 テキストを入力すると、生成されたテキストが出力として得られます。

噂によると、GPT-4 は、いわば音の壁を打ち破り、あらゆるものにあらゆるものの完全なマルチモーダル機能を提供するというものでした。 テキストが含まれることは誰もが知っていました。 画像やアートワークが追加され、オーディオや、場合によってはビデオが追加されることも予想されていました。 それは誰でも自由に参加できます。 必要な数のモードを含む、入力時の任意のモード。 さらに、必要に応じて混合されたモードを含む、出力の任意のモード。

モードの真のバイキング。

GPT-4 は何を提供しますか?

TR からその文に戻ります。

  • 「画像とテキストの入力を受け入れ、テキスト出力を生成できる大規模なマルチモーダル モデルである GPT-4 の開発について報告します。」

テキストを入力すると、テキストが出力されます。さらに、入力時に画像を入力することもできます。

入力された画像の画像または視覚処理を示すデモンストレーションは、たとえば、画像内のアイテムが生成 AI によって識別され、画像を説明する書面による物語に構成される可能性があることを示しています。 ジェネレーティブ AI に、写真が何を表しているように見えるかを説明してもらうことができます。 全体として、視覚処理は注目に値する追加です。

視覚処理または画像分析機能は、まだ一般に利用できません (OpenAI Web サイトのブログによると)。

  • 「より広い可用性のために画像入力機能を準備するために、私たちは単一のパートナーと緊密に協力して開始します。」

これらすべての要点は、GPT-4 が明らかに画像の入力と分析を行う機能を持っていることを認識するのは心温まるということです。 多くの人がこの機能の公開を待ち望んでいます。 マルチモーダルの分野に足を踏み入れた OpenAI に敬意を表します。

したがって、入力としてテキスト、入力として画像 (公開されている場合)、および出力としてテキストがあります。

一部の人は、AI コミュニティで、これが次の概念にかろうじて従うと手で締めくくっています。 マルチモーダル. はい、もう XNUMX つのモードがあります。入力としての画像です。 しかし、出力としての画像ではありません。 入力としてのオーディオも、出力としてのオーディオもないようです。 入力としてのビデオも、出力としてのビデオもないようです。 スマートな曲がり角を持つ人は、これが最もミニマリストな方法で「マルチモーダル」であることに気づきます。

反論は、歩く前にクロールし、走る前に歩く必要があるということです.

これで TR の最初の文がカバーされ、追加のトピックに移ることができると思います。

GPT-4 のその他の要点

この件について全体的な背景が追加されたので、スピードアップします。

GPT-4 に関する OpenAI ブログの投稿で指摘されている重要な点を次に示します。

  • 「過去 XNUMX 年間で、ディープ ラーニング スタック全体を再構築し、Azure と協力して、ワークロード用にゼロからスーパーコンピューターを共同設計しました。」

これについてXNUMXつの簡単なポイント。

まず、深層学習スタック全体を再構築したことは、確かに注目に値する発言であり、成果です (これは、計算パターン マッチング モデルを再構築し、内部での仕組みを再構築することを選択したことを意味します)。 彼らにとって良いことです。 この再構築で彼らが何をしたかを正確に知ることは確かに素晴らしいことです。 TR と SC は、何が起こったかについてある程度言及していますが、詳細な程度までは言及していません。

もちろん、秘密のソースを明かすべきではないと説得力を持って主張することもできます。 そうする必要はありません。 競合他社に不必要な援助を提供するのはなぜですか? コインの反対側は、AI と社会全体を改善するために、生成型 AI の進歩におそらく役立つだろうと主張しています。

AI の倫理と AI 法の境界線に戻ってきました。

第二に、引用された発言は、彼らがゼロからスーパーコンピューターを設計したことを示しています。 このスーパーコンピューターが何をするのか、そしてそれがどのように正確に機能するのかについての関心に加えて、そのいくつかは説明されていますが、これはまったく別の問題を引き起こします.

ジェネレーティブ AI がビッグマネー ゲームになりつつあると懸念する人もいます。 最大の資金と最大のリソースを持つテクノロジー企業だけが、生成型 AI を考案して運用できるようになります。 これが疑問視されている理由は、おそらく、ほんの一握りのテクノロジー企業によって厳密に制御されているジェネレーティブ AI を手に入れることになるからです。 私たちはそれらの会社とその商品に大きく依存するようになるかもしれません。

ジェネレーティブ AI が少数の狭い範囲に集中することを防ぐために、既存の法律を使用したり、新しい AI 法を考案したりする必要がある可能性はありますか?

反芻する何か。

ChatGPT と GPT-4 の間の信じられないほど大きな違いに関して靴が落ちるのを待っている場合は、GPT-4 に関する OpenAI ブログの投稿からこれを見てください。

  • 「何気ない会話では、GPT-3.5 と GPT-4 の違いは微妙です。 タスクの複雑さが十分なしきい値に達すると、違いが現れます.GPT-4は信頼性が高く、創造的であり、GPT-3.5よりもはるかに微妙な指示を処理できます。」

つまり、ChatGPT を使用して毎日のアイドル状態の雑談を行い、GPT-4 を使用して同様のことを行っている場合、GPT-4 が全体的により強力であると見なされていることに特に気付かない可能性があります。 .

際立っていると思われる XNUMX つの側面は、XNUMX つのジェネレーティブ AI アプリとの会話のコンテキストを確立することです。

ここに私が意味するものがあります。

ジェネレーティブ AI アプリを使用すると、開始した会話に飛び込んで AI と一緒に続行することがあります。 それ以外の場合は、会話のコンテキストを AI に伝えることから始めます。 たとえば、生成 AI に、自動車のエンジンについて AI と話したいこと、AI が自動車整備士のふりをしてほしいことを伝えることから始めるかもしれません。 これにより、それに応じて AI が応答するためのステージまたは設定が設定されます。

ChatGPT を使用する多くの人は、AI アプリとの対話を初めて行うときに、コンテキストを設定することの重要性を認識していません。 どのような反応が得られるかという点で、大きな違いになる可能性があります。 ChatGPT は、特定のコンテキストに向けて単独でうまく機能していないことがよくあります。 試みますが、しばしば不十分です。 これまでのところ、GPT-4 はコンテキスト確立の使用を通じて本当に輝いているようです。

ジェネレーティブ AI を使用する予定があり、その際にコンテキストを確立したい場合は、ChatGPT よりも GPT-4 の方が全体的に優れていることは間違いありません。

関連する要素には、 操縦性 それが機能します。

ChatGPT の一部のユーザーは、AI アプリが、おそらく過度にユーモラスまたは過度に簡潔に見える応答を時々提供することに驚いています。 これは、ジェネレーティブ AI が入力プロンプトで、そのような応答をトリガーするように見える何かを検出した場合に発生する可能性があります。 冗談めかして何かについて尋ねても、それが ChatGPT を冗談や気さくな口調に誘導することに気付かないかもしれません。

GPT-4 と操縦性に関する OpenAI ブログの投稿によると:

  • 「固定された冗長性、口調、スタイルを備えた従来の ChatGPT パーソナリティではなく、開発者 (および間もなく ChatGPT ユーザー) は、「システム」メッセージでそれらの方向性を説明することにより、AI のスタイルとタスクを規定できるようになりました。 システム メッセージにより、API ユーザーは範囲内でユーザー エクスペリエンスを大幅にカスタマイズできます。」

繰り返しになりますが、これにより生成 AI アプリのユーザー エクスペリエンスが向上します。 他のジェネレーティブ AI メーカーも同様のことを行っており、必然的に、そのような AI アプリのほぼすべてに、何らかの形の操縦性とコンテキスト確立機能を備えたものを用意することになります。

険しい道のりはまだ先

ジェネレーティブ AI の根底にある進行中の厄介な問題は、一般に、あらゆる種類の不快で完全に邪魔な出力が生成される可能性があることです。

私のコラムの投稿では、これらのさまざまな深刻な懸念事項について説明しました。

  • ジェネレーティブ AI が生成したエラー
  • ジェネレーティブ AI が生み出す偽り
  • ジェネレーティブ AI 埋め込みバイアス
  • AIの幻覚
  • プライバシー侵害
  • データ機密性の弱点
  • 偽情報拡散者
  • 誤報拡散者
  • 武器のデュアルユース
  • 人間による過度の依存
  • 人間への経済的影響
  • サイバー犯罪の強化

いくつかの噂では、GPT-4 が魔法のように奇跡的に、これらの生成 AI の病気をすべてクリーンアップして解決するというものでした。

まともな頭を持っている人は誰も、そのような噂が理屈に合わないとは思っていませんでした。 これらは非常に難しい AI の問題です。 それらは簡単には解決されません。 これらの永続的で腹立たしい困難に立ち向かうために、まだやるべきことがたくさんあります。 ジェネレーティブ AI の環境に絡み合った AI の倫理問題を克服するには、一村単位で取り組む必要があるでしょう。

当然のことながら、OpenAI は、これらのさまざまな課題にどのように対処しているかを説明しようと努めてきました。 AI の倫理に関心のある方は、TR と SC をよく読むことを検討してください。

たとえば、TR で OpenAI が述べた GPT-4 に関する率直なコメントを次に示します。

  • 「GPT-4 は、攻撃の計画に関するアドバイスやヘイトスピーチなど、潜在的に有害なコンテンツを生成する可能性があります。 ユーザーの意図や広く共有されている価値観を代表していない可能性がある、さまざまな社会的偏見や世界観を表している可能性があります。 また、侵害された、または脆弱なコードを生成する可能性もあります。 GPT-4 の追加機能は、新たなリスク面にもつながります。」

さらに、彼らは TR で次のように述べています。

  • 「この分析を通じて、GPT-4 は、外部データで補強された場合に、個人の識別を試みるために使用される可能性があることがわかりました。 また、GPT-4 のサイバーセキュリティ機能は、以前の世代の LLM よりもはるかに優れているわけではありませんが、ソーシャル エンジニアリングや既存のセキュリティ ツールの強化などによって、成功したサイバー攻撃の特定のステップのコストを潜在的に削減する傾向が続いていることもわかりました。 . 安全性の緩和がなければ、GPT-4 は、有害または違法な活動を行う方法について、より詳細なガイダンスを提供することもできます。」

これらの問題に関連する多数の項目をすべてカバーするためのコラム スペースはありません。 AI の倫理と AI の法律の観点から、ジェネレーティブ AI を継続的に分析しています。

少し時間を取って、OpenAI がこれらの困難な課題にどのように取り組んでいるかを明らかにしたことを認めることは価値があるように思われます。 そうしなければならない理由はなかったと言えます。 彼らはそこに何も見えないように振る舞うことができます。 あるいは、漠然と手を振って、これらの問題に対処するために多くの巧妙なことをしていると主張することもできます.

幸いなことに、彼らは、ジェネレーティブ AI のリリースに通常伴う反発や非難を先取りしようとする賢明なアプローチを選択しました。 彼らはおそらく、これらの問題を根絶し、それらを軽減または解決しようとする真剣さとコミットメントをしっかりと示すことを目指しています.

私は、これらの問題を率直かつ今後の方法で追求するための継続的かつ精力的な努力がなければ、AI の分野はすべて、厳しい打撃を受けるだろうという追加の考えを提供します. 隠されたブラックボックスのアプローチを取ることは、大衆の中で怒りを引き起こすことは間違いありません. また、AI 企業がこれらの問題に対処しようとしない場合、議員や規制当局がこれらの問題に巻き込まれ、新しい AI 法の津波がすべての AI メーカーとその分野の企業に波及する可能性が高いと予想できます。 AI。

私たちはすでにその岐路に立っていると考える人もいます。

彼らは、AI メーカーの多くが自分たちのしていることを共有しているように見えるが、これはもっともらしい否認のやや卑劣な形だと主張している. 要するに、物事がよりよく考案されるまで待つのではなく、ぞっとするような、明らかに不正な AI を世に出し、AI 倫理と AI 法の問題を食い止め、物事を正すために可能な限りのことをしていると宣言することです。 この「準備が整うまで待つ」進行中の論争については、コラムの記事で頻繁に取り上げてきました。

TR によると:

  • 「OpenAI は、より安全なローンチに向けて 4 月初旬から GPT-XNUMX と展開計画を反復してきました。 これにより、完全に排除されたわけではありませんが、リスク サーフェスが減少したと考えています。 今日の展開は、展開によるリスクの最小化、ポジティブなユースケースの実現、展開からの学習の間のバランスを表しています。」

本題に戻ると、ジェネレーティブ AI に関して言えば、AI の幻覚が一般的な問題であると前述しました。

繰り返しますが、キャッチフレーズは好きではありませんが、流行ったようです。 AI 幻覚の問題の主な原因は、非常にクレイジーなものを含む出力を生成できることです。 出力が正しいか間違っているかを判断するのはユーザー次第だと考えているかもしれません。 ここで懸念されるのは、ユーザーがでっちあげだと判断する簡単な方法がない作り話が出力に含まれている可能性があることです。 彼らは、出力が何を言おうとも、すべてを独り占めするかもしれません。

また、ジェネレーティブ AI の出力を信じてしまう微妙な傾向もあります。 通常、アウトプットは、確実に自信を持っているように見えるトーンと方法で書かれています。 ジェネレーティブ AI を定期的に使用していると仮定すると、多くの場合、真実の資料を見ることに慣れてしまいがちです。 そうでなければ、完全に賢明で事実に満ちた生成されたエッセイのように見えるものの真ん中に何かでっち上げが引き抜かれると、すぐにだまされる可能性があります。

TRがGPT-4について述べていることは次のとおりです。

  • 「GPT-4 には、『幻覚』、つまり『特定の情報源に関して無意味または不誠実なコンテンツを生成する』傾向があります。 この傾向は、モデルがますます説得力と信頼性を増し、ユーザーがモデルに過度に依存するようになるにつれて、特に有害になる可能性があります。 直感に反して、モデルがより真実になるにつれて、幻覚はより危険になる可能性があります。ユーザーは、慣れ親しんだ領域で真実の情報を提供するモデルに信頼を築くからです。」

良いニュースは、GPT-4 での AI 幻覚の可能性を減らすための努力が行われており、現在も進行中であるように見えることです。 また、GPT-4 は AI の幻覚を回避するという点で GPT-3.5 よりも優れていると主張されていますが、AI の幻覚がまだ発生することは明らかです。

これに関するTRは次のとおりです。

  • 「内部評価では、GPT-4-launch は、オープン ドメインの幻覚を回避する点で最新の GPT-19 モデルよりも 3.5 パーセント高く、クローズド ドメインの幻覚を回避する点で 29 パーセント高くなっています。」

今のところ、この部分の議論を締めくくるために、すべての AI メーカーによるジェネレーティブ AI は、これらの問題に直面しています。 これを何とか治した人はいません。 AI に関する難しい問題を探している場合は、これらの水域に飛び込んで支援することをお勧めします。 やるべきことはたくさんあります。

まとめ

大ヒット映画がしばらくの間出回っていて、劇場からホームストリーミングに移行した場合、かなり多くの人がその映画を見たことがあるか、見た他の人からその映画について何かを知っている可能性があります. その後、続編が発表されて撮影されると、期待は天文学的なレベルに達する可能性があります。

スター・ウォーズ シリーズの一部とスタートレックのリブートで今では伝説的な映画製作者である JJ エイブラムスは、続編について次のように述べています。

ピクサーの共同創設者であるエドウィン・キャットマルは、続編について次のように強調しています。

大ヒットした ChatGPT に興味がある場合は、すぐにサインアップできます。 続編のGPT-4は、アクセスするのが少し難しいです. また、他にも多くの映画が利用可能であることを認識してください。他のジェネレーティブ AI アプリも利用できるため、映画鑑賞 (別名ジェネレーティブ AI) 体験が多様で充実したものであることを確認する必要があります。

13 つの最後の冷静なメモ。 遭遇する可能性のあるコンテンツは、PG17、R、さらには NC-XNUMX である可能性があることに注意してください。 心に留めておきます。

ソース: https://www.forbes.com/sites/lanceeliot/2023/03/15/what-you-need-to-know-about-gpt-4-the-just-released-successor-to-generative- ai-chatgpt-plus-ai-ethics-and-ai-law-considerations/