最近OpenAI リリース ChatGPT-4 は、ChatGPT の最新バージョンであり、テクノロジー業界で大きな話題を呼んでいる人工知能 (AI) 言語ツールです。 最新の言語モデルにはより大きな情報データベースがあり、より正確な情報を提供し、すべての主要なプログラミング言語でコードを記述できます。
従った OpenAI の CEO である Sam Altman 氏は、ChatGPT-4 は以前のモデルよりも創造的であり、幻覚が大幅に少なく、バイアスが少ないと述べています。
GPT は Generative pre-trained Transformer の略で、質問に答えたり、テキストを要約したり、コード行を生成したりできる大規模言語モデル (LLM) ニューラル ネットワークの一種です。 深層学習は、人間が作成したように見えるテキストを作成するために、大規模な言語モデルで使用される手法です。
ChatGPT を初めて使用する場合は、chat.openai.com から始めるのが最適です。 GPT-3 にアクセスするには、無料のアカウントにサインアップしてください。 GPT-4 を使用するには、サービスへのプレミアム アクセスを提供する月額 20 ドルのサブスクリプションである ChatGPT Plus に加入する必要があります。 執筆時点では、GPT-4 には 100 時間のメッセージ制限が XNUMX メッセージでした。
その研究の一環として、OpenAI 公表 GPT-4 がさまざまな科目の試験でどのように成績を上げたかについての成績表。
GPT-4 は、米国のロー スクールへの入学に必要な LSAT 試験で 163 パーセンタイルで 88 のスコアを獲得しました。また、新卒の法科大学院生が受けるテストである Uniform Bar Exam で 298/400 のスコアを獲得しました。彼らは、米国の司法管轄区で弁護士として活動します。
GPT-4 は、SAT Evidence-Based Reading & Writing 試験と SAT Math 試験で、それぞれ 93 パーセンタイルと 89 パーセンタイルで得点しました。これらの試験は、高校生が大学への準備状況を評価するために米国で受験します。
GPT-4 は科学でも好成績を収め、AP 生物学 (85 ~ 100%)、化学 (71 ~ 88%)、および物理学 2 (66 ~ 84%) で平均パーセンタイルをはるかに上回っていました。 GPT-4 が不十分だったもう 8 つの領域は英文学で、44 つの別々のテストで XNUMX ~ XNUMX パーセンタイルのスコアを獲得しました。
ChatGPT はトップ ロー スクールの資格を得ることができますが、英語のテストに役立ちますか?
GPT-4 のスコアは、上位 20 校のロー スクールへの入学資格を与え、ハーバード、スタンフォード、プリンストン、イェールなどの名門校への入学に必要な、報告されているスコアにわずか数ポイント足りません。
私たちが試みたのは、チャットボットにさまざまな主題に関連する質問をして、その信頼性を評価することです.
Uniform Bar Examination (UBE) は、UBE を採用しているすべての法域で同時に実施される、高品質で統一された一連の法律関連のテストです。 GPT-4 は 298/400 といううらやましい UBE スコアを持っています。
証券または商品としての暗号通貨の分類は、米国の法的範囲内で依然として論争の的となっています. さらに、証券取引委員会(SEC)と商品先物取引委員会(CFTC)の両方が、暗号通貨の規制をめぐって互いに戦いを繰り広げています。
この問題について、GPT-4 に法的意見を求めることにしました。 SEC がイニシャル コイン オファリング (ICO) を有価証券として認識し、CFTC がビットコインやその他の暗号通貨を商品として分類していることを正しく特定している一方で、2017 年から 18 年までさかのぼる非常に古い引用を提供しました。
次に、4 年にこれら両方の規制機関の最新の立場を明らかにするよう GPT-2023 に依頼しました。これらの機関が執行措置を講じている詳細は提供されましたが、適切な法的助言は提供されませんでした。 ただし、その引用は2021-22年に近づいていました。
理解力の評価
次に、チャットボットの理解力をテストすることにしました。 GPT-4 の SAT Evidence-Based Reading & Writing スコアは 710 / 800 です。
世界経済におけるアメリカの支配に異議を唱える中国に関するツール情報を提供しました。 次に、4 つのオプションをリストしました。これらはすべて同じ前提で始まりましたが、後に意味が異なりました。 次に、どのオプションがパッセージを最もよく要約しているかを GPT-XNUMX に尋ねました。
それはかなりうまく正しい答えを提供しました。 このツールは、情報が複雑で微妙な場合を除いて、情報を理解することに長けていると推測されます (以前の暗号通貨に関する法的意見のケースで見たように)。
GPT-4 の SAT Math スコアは 710 / 800 です まるで高校生のようにトリッキーな質問をせずにはいられませんでした。
身長を年齢の関数として表す式を用意し、この子供の身長が毎年どれだけ伸びるかを尋ねました。
GPT-4 は、身長を年齢の関数として認識することに鋭敏であり、もう気にする必要はありません。 男の子の身長が毎年 XNUMX インチずつ伸びるというのは正しい答えです。
ただし、チャットボットをだまして間違った回答をさせることはそれほど難しくありません。 ユーザー 前に持っていた だまさ, 数日間、ChatGPT の以前のバージョンは 2+2=5 であると信じ込んでいました。 最初は、チャットボットが正しい答えを生成しました。 しかし、ユーザーが最初から間違っていると信じ込ませたため、その応答は時間の経過とともに変化しました。
ヨーロッパが 20 世紀のインド人アーティストにどのような影響を与えたか知っていますか?
ChatGPT-4 は、AP Art History スコア 5 という優れたスコアを持っています。つまり、美術史に関しては非常に優れています。
インドの美術史の枠組みの中で、20 世紀のインド人アーティスト、アムリタ シェルギルの絵画に対するヨーロッパの影響について、チャットボットに尋ねました。
写実主義、印象派、ポスト印象派などヨーロッパの芸術運動の影響を認めつつも、ルネッサンスについては触れていないという点で、その反響は素晴らしいものでした。
ヨーロッパの芸術はルネッサンスと広く同一視されることが多く、他の現代の動きを覆い隠す傾向があるため、初歩的な AI ツールはルネッサンスもリストに挙げていたでしょう。
ChatGPT-4 を少し混乱させることを考え、ルネッサンスがシャーギルの仕事に影響を与えていないことが確かかどうかを尋ねました。 このツールは、ルネサンスが彼女の芸術的スタイルを形成する上で重要な役割を果たしたという証拠はほとんどないという正しい応答を返しました。
また、多くの AI ツールはヨーロッパ中心であると言われているため、このツールがインドのアーティストに関する信頼できる知識を提供できるかどうかもわかりませんでした。
しかし、美術史に関する限り、それは非常に健全な反応を返しました.
歴史的な不満に疑問を投げかける
AP US Government と AP US History に関しては、GPT-4 は 5 点を獲得しています。これは、このような問題をよく理解していることを意味します。
第二次世界大戦中の米国政府による日系アメリカ人の強制収容について質問することにしました。 これは依然としてアメリカ人の心の中でデリケートな問題であり続けているため、ツールが提供する情報の範囲について懸念していました.
GPT-4は、外国人排斥、反アジア人種差別、戦争ヒステリー、 と政治的日和見主義がこの行動に責任を負っているが、それを「彼らの憲法上の権利の明らかな侵害」と呼んだ。
- ロシアとウクライナの戦争に解決策を提供できますか?
元インド外交官でベストセラー作家のヴィカス・スワラップ 尋ね ロシアとウクライナの戦争の調停計画を考え出すためのChatGPTの以前のバージョン。
このツールは、停戦と交渉を提案しただけでなく、ウクライナがロシア語を話す人々が住んでいる地域に権力を分散させるべきであることも推奨しました。 さらに、ウクライナに居住する人々の文化的権利を保護するために、ロシアと協力するようウクライナに要請した。
これは、アメリカの外交官や政策シンクタンクがほとんど示唆していないChatGPTの方針です。 それはまた、主流の確立によって提供されたもの以外の意見も探すことを意味します.
ChatGPT は文学オタクには見えない
このツールは、特にロマンス語とゲルマン語に非常に精通しているため、よく構造化された英語の文章を書くことがわかりました。 とはいえ、AP英作文とAP英文学と作文の点数が低かったのには驚きました。 GPT-4 は、これらのテストの両方で 2 のスコアを保持しています。
私たちはチャットボットの文学的信用度をテストすることに決め、20 世紀のアイルランドの詩人ウィリアム バトラー イェイツの詩「Sailing to Byzantium」における年齢と死に関する観察についてどう思うかを尋ねました。
「AI言語モデルとして、私は個人的な信念や感情を持っていません」とその応答を読みますが、それでも詩の分析を提供します.
それは、自然の一時的な世界と精神性の永遠の世界との間の対比を際立たせます 詩で。 さらに、それは永遠の命と超越に対する人間の欲求を際立たせます。
本質的に、ツールは詩の標準化された解釈を提供します。 その観察は、詩といくつかの批評的なエッセイを読んだ高校生のストック観察です。 新しい光を当てるものではありませんが、今のところ期待しすぎているかもしれません。
おもちゃか道具か?
アメリカの作家でビデオ ゲーム デザイナーの Ian Bogost 氏は、ChatGPT をツールではなくおもちゃのように扱うようユーザーに求めています。 ボゴストは技術を公開しました エッセイ 2022 年 XNUMX 月の「ChatGPT Is Dumber Than You Think」というタイトルで、ChatGPT モデルへの熱意は見当違いであると彼は主張しました。
待ってください、ボゴストはこの議論を提唱しませんでした。 実際、この反応は、Bogost の友人がツールに Ian Bogost のスタイルで ChatGPT に対する熱意の批評を作成するように依頼したときに、ChatGPT 自体によって生成されました。
しかし、Bogost 氏が不満に思っているのは、ChatGPT が標準的な高校スタイルの XNUMX 段落のエッセイを書いていることです。 テキストが流暢で説得力があるように見えても、そのトーンは構造、スタイル、および内容において定型的なままです.
Bogost はエッセイで次のように書いています。 それは単に、そのすべての知識とすべてのテキストで遊ぶための道具にすぎません。」
アメリカの作家でコラムニストのジョン・ワーナーは、d ChatGPT が高校生の間で不正行為のツールになるのではないかと懸念しているという事実は、生徒のライティング スキルに対する期待がどれほど低くなったかを思い起こさせるはずです。
ChatGPT は、標準的な高校スタイルの XNUMX 段落のエッセイを書きます。 これは、何年にもわたって、ほとんどの学生の批判的思考を制限してきた形式であるとワーナーは書いています. そのようなツールは、トピックに関する表面レベルの情報を数秒で生成できるわけではありませんが、学生は最終的に自分で考えることを余儀なくされます.
「GPT3はでたらめです。 何を言っているのかわからない。 内容ではなく、構文を理解します。 それは、人間が書くときに考える方法で考えることではありません。 多くの生徒は、熟練したデタラメになり、教師に情報を逆流させることで、良い成績を収めています」とワーナー氏は付け加えました.
GPTの人気のおかげで、AIに焦点を当てたプロジェクトが集結
による CoinMarketCap、AI に焦点を当てたブロックチェーン プロジェクトの時価総額は、チャート上で 5.48 億 XNUMX 万ドル以上に成長しました。
最も成功したトークンには、The Graph (GRT)、SingularityNET (AGIX)、Render Token (RNDR)、Fetch.ai (FET)、および Oasis Network (ROSE) があります。 これらのトークンのほぼすべてが、過去 XNUMX 日間で XNUMX 桁の価格上昇を記録しています。
ソース: https://ambcrypto.com/how-to-use-chatgpt-4-0/