ChatGPT V4 はバー、SAT を超え、ETH コントラクトのエクスプロイトを特定できます

人工知能 (AI) チャットボット、ChatGPT の最新バージョンである GPT-4 は、90 パーセンタイルのスコアランキングで高校のテストと法科大学院の試験に合格でき、以前のバージョンでは不可能だった新しい処理機能を備えています。

GPT-4 のテストスコアの数値は 14 月 XNUMX 日にその作成者 OpenAI によって共有され、「はるかに微妙な指示」をより創造的かつ確実に処理することに加えて、画像、音声、およびビデオ入力をテキストに変換できることも明らかになりました。

「司法試験の模擬試験に、受験者の上位 10% 程度のスコアで合格します」と OpenAI は付け加えました。「対照的に、GPT-3.5 のスコアは下位 10% あたりでした。」

この数字は、GPT-4 が LSAT 試験の 163 パーセンタイルで 88 のスコアを達成したことを示しています。大学の学生がロースクールに入学するには、米国で合格する必要があります。

*最近のさまざまな米国試験における GPT-4 および GPT-3.5 の試験結果。ソース：* *OpenAI*

GPT4 のスコアは、上位 20 校のロースクールに入学するのに適した位置にあり、ハーバード、スタンフォード、プリンストン、イェールなどの名門校への入学に必要な、報告されているスコアをわずかに下回っています。

ChatGPT の以前のバージョンは、LSAT で 149 点しか獲得できず、下位 40% に入りました。

GPT-4 はまた、統一司法試験で 298 点満点中 400 点を獲得しました。これは、最近卒業した法学生が米国の司法管轄区で弁護士として活動することを許可する試験です。

*UBE スコアは、米国の各法域で法律を実践するために認められる必要がありました。ソース：* *全国司法試験官会議*

ChatGPT の古いバージョンはこのテストで苦戦し、10 点満点中 213 点で下位 400% に入りました。

米国の高校生が大学への準備状況を測定するために受験した SAT Evidence-Based Reading & Writing および SAT Math 試験に関しては、GPT-4 はそれぞれ 93 パーセンタイルと 89 パーセンタイルで得点しました。

GPT-4 は「難しい」科学でも優れており、AP 生物学 (85-100%)、化学 (71-88%)、物理学 2 (66-84%) で平均をはるかに上回るパーセンタイルスコアを記録しました。

*最近のさまざまな米国試験における GPT-4 および GPT-3.5 の試験結果。* *出典: OpenAI.*

しかし、その AP 計算スコアはかなり平均的で、43 パーセンタイルから 59 パーセンタイルにランクされています。

GPT-4 が欠けていたもう 8 つの領域は英文学試験で、44 つの別々のテストで XNUMX パーセンタイルから XNUMX パーセンタイルのスコアを記録していました。

OpenAI によると、GPT-4 と GPT-3.5 は 2022 年から 2023 年の模擬試験からこれらのテストを受けており、言語処理ツールによる「特別なトレーニングは受けていません」。

「これらの試験のための特別なトレーニングは行いませんでした。試験の問題のごく一部は、トレーニング中にモデルによって確認されましたが、結果は代表的なものであると考えています。」

この結果は、Twitter コミュニティにも恐怖を引き起こしました。

関連する ChatGPT は Web3 空間にどのように影響しますか? 業界の回答

FactoryDAOの創設者、ニック・アーモンド言われ 14,300 月 14 日に彼の 4 人の Twitter フォロワーは、GPTXNUMX が「人々を怖がらせ」、世界の教育システムを「崩壊」させるだろうと述べました。

評価理論は、数年間、私の人生の大きな部分を占めていました。私は何年も前に、この日が来ることを大騒ぎしていました。私は文字通り当時の常駐クランクのように聞こえました。
しかし……これはつまり、この時点から、監査された評価以外は終了したことを意味します。
— Drnick ️² (@DrNickA) 2023 年 3 月 14 日

Coinbase の元ディレクターである Conor Grogan 氏は、ライブの Ethereum スマートコントラクトを GPT-4 に挿入し、すぐにいくつかの「セキュリティの脆弱性」を指摘し、コードが悪用される方法を概説したと述べました。

ライブイーサリアムコントラクトを GPT-4 にダンプしました。
すぐに、多くのセキュリティの脆弱性が強調され、コントラクトが悪用される可能性のある表面領域が指摘されました。次に、コントラクトを悪用できる特定の方法を検証しました pic.twitter.com/its5puakUW
—コナー（@jconorgrogan） 2023 年 3 月 14 日

ChatGPT での以前のスマートコントラクトの監査では、最初のバージョンでもコードのバグをある程度発見できることがわかりました。

AI ニュースレター「The Rundown」の創設者である Rowan Cheung 氏は、GPT が紙に手書きで描いた偽の Web サイトをコードに転写するビデオを共有しました。

GPT-4 が手描きのスケッチを機能的な Web サイトに変えるのを見たところです。
これは非常識です。 pic.twitter.com/P5nSjrk7Wn
— ローワン・チャン (@rowancheung) 2023 年 3 月 14 日