ジェネレーティブ AI の法的な終焉の日

クレジットが必要な場合はクレジットを付与します。

これは、おそらくあなたがしっかりと信じるように育てられた賢明な知恵です。実際、これが人生における公正で賢明な経験則であることに、私たち全員がある程度合理的に同意するかもしれないと推測または想像します。 誰かが承認に値することをしたときは、彼らが当然の承認を得られるようにします。

逆張り的な見方は、あまり説得力がないように思われるでしょう。

誰かがクレジットをすべきだと主張して歩き回った場合 あなたは、そのような信念は無礼であり、おそらく不正であると主張するかもしれません. 注目に値する何かを成し遂げた人物の信用がだまされたとき、私たちはしばしば声高に動揺します。 私たちは、他人が他人の仕事を誤って信用することを特に嫌います。 それは不安な二重苦です。 功績を認められるべきだった人は、太陽の下での瞬間を否定されます。 さらに、トリックスターはスポットライトを楽しんでいますが、彼らは私たちをだまして私たちの好意を流用させています.

最も正しい方法で信用を獲得し、間違った卑劣な方法を回避することについて、このような議論が行われるのはなぜでしょうか?

最新の人工知能 (AI) に関しては、同様の苦境に直面しているように見えるからです。

はい、主張は、これが、 生成AI. 最近のニュースで最もホットな AI であるジェネレーティブ AI は、手柄に値しないものをすでに手柄にしていると、多くの不満があります。 そして、ジェネレーティブ AI がますます拡張され、利用されるにつれて、これは悪化する可能性があります。 生成型 AI にますます多くの功績が吹き込まれていますが、悲しいことに、真の功績に値するものは塵の中に残されています。

この主張されている現象を明確に示すために私が提案した方法は、XNUMX つのおしゃれなキャッチフレーズを使用することです。

  • 1) 大規模な剽窃
  • 2) 大規模な著作権侵害

OpenAI によって XNUMX 月にリリースされた ChatGPT として知られる広く普及している AI アプリにより、ジェネレーティブ AI を認識している可能性があると思います。 ジェネレーティブ AI と ChatGPT については、もう少し詳しく説明します。 頑張れ。

いわば人々のヤギを獲得しているものの核心にすぐに行きましょう。

ジェネレーティブ AI が、コンテンツを作成した人間をだまし取っている可能性があると、熱心に不満を漏らす人もいます。 ほとんどのジェネレーティブ AI アプリは、インターネット上で見つかったデータを調べることによってトレーニングされたデータです。 そのデータに基づいて、アルゴリズムは AI アプリ内の広大な内部パターン マッチング ネットワークを磨き、その後、自動化ではなく人間の手によって考案されたかのように驚くほど新しい、一見新しいコンテンツを生成できます。

この驚くべき偉業は、インターネットでスキャンされたコンテンツの利用によるところが大きいです。 データ トレーニングのソースとしてのインターネット コンテンツの量と豊富さがなければ、ジェネレーティブ AI はほとんど空っぽであり、使用してもほとんど、またはまったく関心がありません。 AI に何百万ものオンライン ドキュメントとテキスト、およびあらゆる種類の関連コンテンツを調査させることで、人間が作成したコンテンツを模倣しようとするパターン マッチングが徐々に導き出されます。

より多くのコンテンツを調べるほど、パターン マッチングがより洗練され、模倣がさらに良くなる可能性が高くなります。他の条件はすべて同じです。

ここに、莫大な費用がかかる質問があります。

  • 大きな質問: あなたや他の人が、おそらくあなたの直接の許可なしに、そしておそらく完全にあなたの意識なしに、何らかの生成 AI アプリが訓練されたコンテンツをインターネット上に持っている場合、そこから生じる価値についてパイの一部を受け取る権利があります。その生成 AI データ トレーニング?

唯一の適切な答えは 有り、特に、これらのヒューマン コンテンツ クリエーターは実際にアクションのカットに値する. 問題は、公平な分け前を得た人を見つけるのが難しいということです。さらに悪いことに、まったく分け前を得た人はほとんどいません。 無意識のうちに貢献したインターネット コンテンツ クリエーターは、本質的に彼らの正当な信用を否定されています。

これは、凶悪で法外なものとして特徴付けられるかもしれません。 信用すべきところには信用を与えるべきだという賢者の知恵を解き明かしました。 ジェネレーティブ AI の場合、明らかにそうではありません。 信用に関する長年の経験則は無慈悲に破られているようです。

おっと、レトルトは行きます、あなたは状況を完全に誇張し、誤解しています。 確かに、生成 AI はインターネット上のコンテンツを調べました。 確かに、これはジェネレーティブ AI のデータ トレーニングの一部として非常に役立ちました。 確かに、今日の優れたジェネレーティブ AI アプリは、この考慮されたアプローチがなければ、それほど印象的ではなかったでしょう。 しかし、コンテンツ作成者に何らかの特定のクレジットを割り当てる必要があると言うのは、行き過ぎです。

ロジックは次のとおりです。 人間はインターネットに出て、インターネットから何かを学びます。それ自体は大騒ぎすることなく、日常的に行っています。 配管に関するブログを読んでから、無料で入手できる配管修理のビデオを一気見する人は、翌日外出して配管工として働く可能性があります。 シンクの配管方法について書いたブロガーに、配管関連の送金の一部を渡す必要がありますか? 浴槽の水漏れを修理する手順を紹介するビデオを作成した vlogger に料金を支払う必要がありますか?

ほとんど間違いありません。

ジェネレーティブ AI のデータ トレーニングは、パターンを開発する手段にすぎません。 ジェネレーティブ AI からのアウトプットが、正確に調べられたことの単なる逆流ではない限り、それらは「学習した」ため、特定の情報源に特定のクレジットを付与する必要はないと説得力を持って主張できます。 正確な逆流を実行する際に生成 AI を捉えることができない限り、AI が特定のソースを超えて一般化したことを示しています。

誰にも信用はありません。 あるいは、信用はすべての人にあると言えるかもしれません。 インターネット上にある人類の集合的なテキストやその他のコンテンツは、信用を得ます。 私たちは皆、信用を得ています。 特定の情報源のクレジットを特定しようとするのは無意味です。 AI が進歩し、人類が恩恵を受けることを喜んでください。 インターネット上のこれらの投稿は、AI の進歩の未来に貢献し、それが人類を永遠にどのように支援するかを光栄に思うべきです。

これらの対照的な見解の両方について、私はもっと言いたいことがあります。

一方、あなたは、インターネット上にウェブサイトを持っている人たちのクレジットは期限が来て、遅ればせながら遅れていると言う陣営に傾倒しますか?それとも、インターネット コンテンツ クリエーターは明らかに だまされることは、より説得力のある姿勢ですか?

謎となぞなぞがすべて詰まっていました。

これを開梱しましょう。

今日のコラムでは、ジェネレーティブ AI がインターネット上に投稿されたコンテンツの著作権を本質的に盗用または侵害している可能性がある (知的財産権または IP 問題と見なされる) という、これらの表明された懸念に対処します。 これらの不満の根拠を見ていきます。 ChatGPT は 600 ポンドのジェネレーティブ AI ゴリラであるため、このディスカッションでは時々 ChatGPT について言及しますが、ジェネレーティブ AI アプリは他にもたくさんあり、それらは一般的に同じ全体的な原則に基づいていることに注意してください。

一方、ジェネレーティブ AI とは実際には何なのか疑問に思われるかもしれません。

最初にジェネレーティブ AI の基礎を説明してから、差し迫った問題を詳しく見ていきましょう。

これらすべてに、多数の AI 倫理と AI 法の考慮事項が含まれます。

AI アプリの開発と運用に倫理的な AI の原則を浸透させるための継続的な取り組みがあることに注意してください。 関心を持っていたかつての AI 倫理学者の増加する部隊は、AI を考案して採用する取り組みが、実行の観点を考慮に入れることを確実にしようとしています。 AI For Good と回避 悪い人のためのAI. 同様に、AI の取り組みが人権などで暴走するのを防ぐための潜在的な解決策として、新しい AI 法が提案されています。 AI 倫理と AI 法に関する私の継続的かつ広範な報道については、以下を参照してください。 ここのリンク & ここのリンクちょうど少数の名前を挙げる。

AI を誘発する無数の罠に社会が陥るのを防ぐために、AI の倫理的教訓の開発と普及が進められています。 ユネスコの取り組みを通じて約 200 か国で考案され、支持されている国連 AI 倫理原則の私の報道については、以下を参照してください。 ここのリンク. 同様に、新しい AI 法が検討され、AI を安定した状態に保つことが試みられています。 最新のテイクの XNUMX つは、提案された一連の AI権利章典 米国のホワイト ハウスが AI 時代の人権を特定するために最近発表したことを参照してください。 ここのリンク. AI と AI 開発者を正当な道に保ち、社会を弱体化させる可能性のある意図的または偶発的な不当な努力を思いとどまらせるには、村が必要です。

AI の倫理と AI の法律に関連する考慮事項をこの議論に織り込みます。

ジェネレーティブ AI の基礎

ジェネレーティブ AI の最も広く知られているインスタンスは、ChatGPT という名前の AI アプリによって表されます。 ChatGPT は、XNUMX 月に AI 調査会社 OpenAI によってリリースされたときに世間の注目を集めました。 それ以来、ChatGPT は特大の見出しを獲得し、割り当てられた XNUMX 分間の名声を驚くほど超えました。

おそらくChatGPTについて聞いたことがあるか、それを使用したことのある人を知っていると思います.

ChatGPT は生成 AI アプリケーションと見なされます。これは、ユーザーからのテキストを入力として受け取ってから 生成 またはエッセイで構成される出力を生成します。 AI はテキストからテキストへのジェネレーターですが、私は AI をテキストからエッセイへのジェネレーターであると説明しています。 ジェネレーティブ AI を使用して長い文章を作成したり、かなり短い簡潔なコメントを提供したりできます。 それはあなたの入札ですべてです。

プロンプトを入力するだけで、AI アプリがプロンプトに応答しようとするエッセイを生成します。 構成されたテキストは、エッセイが人間の手と心によって書かれたかのように見えます。 「エイブラハム リンカーンについて教えてください」というプロンプトを入力すると、生成 AI がリンカーンに関するエッセイを提供します。 text-to-art や text-to-video など、ジェネレーティブ AI には他にもモード​​があります。 ここでは、テキストからテキストへのバリエーションに焦点を当てます。

あなたの最初の考えは、この生成能力は、エッセイを作成するという点ではそれほど大したことではないように思えるかもしれません. インターネットで簡単にオンライン検索を行い、リンカーン大統領に関する膨大な量のエッセイを簡単に見つけることができます。 ジェネレーティブ AI の場合のキッカーは、生成されたエッセイが比較的ユニークであり、模倣ではなく独自の構成を提供することです。 AI が作成したエッセイをオンラインでどこかで見つけようとしても、それを見つけることはまずありません。

ジェネレーティブ AI は事前にトレーニングされており、ウェブ全体で書かれた言葉や物語のパターンを調べることによって設定された複雑な数学的および計算式を利用します。 何千、何百万もの文章を調べた結果、AI は見つかったものの寄せ集めである新しいエッセイやストーリーを吐き出すことができます。 さまざまな確率的機能を追加することにより、結果として得られるテキストは、トレーニング セットで使用されたものと比較して非常にユニークです。

ジェネレーティブ AI には多くの懸念があります。

重大な欠点の XNUMX つは、ジェネレーティブ ベースの AI アプリによって作成されたエッセイには、明らかに真実ではない事実、誤解を招くように描かれている事実、完全に捏造されているように見える事実など、さまざまな虚偽が埋め込まれている可能性があることです。 これらの捏造された側面は、しばしば AIの幻覚、私が嫌いなキャッチフレーズですが、残念なことに、とにかく人気が高まっているようです(なぜこれがお粗末で不適切な用語であるかについての私の詳細な説明については、次の記事を参照してください ここのリンク).

別の懸念は、エッセイを自分で作成していなくても、生成 AI によって作成されたエッセイの功績を人間が簡単に認めることができることです。 教師や学校が生成 AI アプリの出現を非常に懸念していると聞いたことがあるかもしれません。 学生は、ジェネレーティブ AI を使用して、割り当てられたエッセイを書くことができる可能性があります。 エッセイが自分の手で書かれたものであると生徒が主張した場合、それがジェネレーティブ AI によって偽造されたものであるかどうかを教師が識別できる可能性はほとんどありません。 この生徒と教師の交絡面に関する私の分析については、次の記事を参照してください。 ここのリンク & ここのリンク.

ソーシャル メディアでは、 生成AI この最新バージョンの AI が実際にあると主張する 知覚力のある AI (いいえ、彼らは間違っています!)。 AI 倫理と AI 法に携わる人々は、主張の幅が広がる傾向が急速に高まっていることを特に懸念しています。 今日の AI が実際にできることを誇張している人がいると、丁寧に言うかもしれません。 彼らは、AI には私たちがまだ達成できていない機能があると想定しています。 それは残念です。 さらに悪いことに、AI は感覚を持っている、または人間のように行動できると思い込んでいるため、自分自身や他の人が悲惨な状況に陥る可能性があります。

AI を擬人化しないでください。

そうすることで、AI が実行できないことを AI が実行することを期待するという、厄介で不機嫌な依存の罠にはまります。 そうは言っても、最新のジェネレーティブ AI は、それができることに関して比較的印象的です。 ただし、ジェネレーティブ AI アプリを使用する際には、常に留意しなければならない重大な制限があることに注意してください。

とりあえず最後の予告。

ジェネレーティブ AI の応答で見たり読んだりしたものは何でも、 と思われる 純粋に事実 (日付、場所、人物など) として伝えられるようにするには、懐疑的な姿勢を保ち、目にしたものを再確認してください。

はい、日付をでっち上げたり、場所をでっち上げたりすることができます。 疑惑の対象。 生成 AI のエッセイや出力を調べるときは、読んだ内容を信じず、懐疑的な目を向けてください。 ジェネレーティブ AI アプリが、エイブラハム リンカーンがプライベート ジェットで国中を飛び回ったことを教えてくれたら、間違いなく、これは悪意があることを知っているでしょう。 残念なことに、彼の時代にジェット機が存在しなかったことを認識していない人もいれば、エッセイがこの厚かましくとんでもない虚偽の主張をしていることを知っていても気付かない人もいるかもしれません。

ジェネレーティブ AI を使用する際には、健全な懐疑心と不信感を持ち続ける姿勢が最大の武器となります。

この解明の次の段階に進む準備ができています。

インターネットとジェネレーティブ AI は一緒に存在する

ジェネレーティブ AI とは何かを理解できたので、ジェネレーティブ AI が公正または不公正に「レバレッジング」しているのか、または一部の人がそう言うのかという厄介な問題を探ることができます。 露骨に 悪用 インターネットコンテンツ。

この問題に関連する XNUMX つの重要なトピックを以下に示します。

  • 1) ダブルトラブル: 剽窃と著作権侵害
  • 2) 剽窃または著作権侵害を証明しようとすることは、試みになる
  • 3) 剽窃または著作権侵害の主張
  • 4) 合法的な地雷が待っている

これらの重要なトピックのそれぞれをカバーし、私たち全員が注意深く熟考すべき洞察に満ちた考慮事項を提供します. これらの各トピックは、より大きなパズルの不可欠な部分です。 一枚だけを見てはいけません。 また、どの部分も他の部分から切り離して見ることはできません。

これは複雑なモザイクであり、パズル全体を適切に調和させる必要があります。

ダブルトラブル:剽窃と著作権侵害

ジェネレーティブ AI を開発し、活用している企業が直面している二重の問題は、彼らの製品が XNUMX つの悪いことをしている可能性があることです。

  • 1) 剽窃。 ジェネレーティブ AI は次のように解釈できます。 盗用 AI のデータ トレーニング中に行われたインターネット スキャンに従って、インターネット上に存在するコンテンツ。
  • 2) 著作権侵害。 ジェネレーティブ AI は、次のような役割を果たしていると主張できます。 著作権侵害 データ トレーニング中にスキャンされたインターネット コンテンツに関連付けられています。

はっきりさせておきますが、インターネット上には、ジェネレーティブ AI のデータ トレーニングのために実際にスキャンされるよりもはるかに多くのコンテンツがあります。 通常、インターネットのほんの一部しか使用されていません。 したがって、データ トレーニング中にスキャンされなかったコンテンツには、ジェネレーティブ AI を使用した特定の機能はないと想定できます。

ただし、スキャンされた他のコンテンツとスキャンされなかったコンテンツを結ぶ線を引く可能性があるため、これには多少の議論の余地があります. また、もう XNUMX つの重要な条件は、スキャンされていないコンテンツがあったとしても、ジェネレーティブ AI の出力が同じ言葉遣いに基づいている場合、盗作および/または著作権侵害であると主張される可能性があることです。 私のポイントは、これらすべてに多くのスクイーズがあるということです.

ボトムライン: ジェネレーティブ AI は、剽窃や著作権侵害に関して、潜在的な AI の倫理的および AI 法の法的難問に満ちています。 一般的なデータ トレーニングの実践を支えています。

これまでのところ、AI メーカーと AI 研究者は、頭上にぶら下がっている剣が迫り、不安定にぶら下がっているにもかかわらず、このほとんど問題なく滑走してきました。 現在までに、これらの慣行に対して提起された訴訟はごくわずかです。 このような法的措置に関するニュース記事を聞いたり見たりしたことがあるかもしれません。 たとえば、Midjourney と Stability AI のテキストから画像への変換を行う企業が、インターネットに投稿された芸術的コンテンツを侵害したとして、その XNUMX つを取り上げました。 もう XNUMX つは、Copilot ソフトウェアが AI アプリを作成しているため、GitHub、Microsoft、および OpenAI に対するテキストからコードへの侵害を伴います。 Getty Images はまた、テキストから画像への侵害について Stability AI を追求することを目指しています。

今後も同様の訴訟が提起されることが予想されます。

現時点では、結果が比較的不明であるため、これらの訴訟を開始する可能性が少しあります. 裁判所は AI メーカーの側に立つのでしょうか、それともコンテンツが不当に利用されたと信じている人が勝者となるのでしょうか? 費用のかかる法廷闘争は常に深刻な問題です。 大規模な訴訟費用の支出は、勝敗の可能性と比較検討する必要があります。

AI メーカーは、戦う以外にほとんど選択肢がないように思われます。 彼らが少しでも屈服した場合、追加の訴訟が急増する可能性があります(本質的に、他の人も勝訴する可能性が高まる可能性への扉が開かれます)。 水に合法的な血が流れれば、残りの合法的なサメは考えられる「簡単なスコア」に急いで行き、スラッシングと打撃を与える金銭的な殺戮が確実に発生します。

AI メーカーを保護する新しい AI 法を可決する必要があると考える人もいます。 保護は遡及的でさえあるかもしれません。 これの根拠は、ジェネレーティブ AI の進歩を見たいのであれば、AI メーカーに安全地帯の滑走路を与える必要があるということです。 訴訟が AI メーカーに対して勝利を収め始めたら、もしそれが起こった場合 (まだわかりません)、心配なのは、誰も AI 企業を支持しようとしないため、ジェネレーティブ AI が消滅することです。

イリア・コロチェンコ博士とゴードン・プラットによる「ChatGPT: IP, Cyber​​security & Other Legal Risks of Generative AI」と題する最近のブルームバーグ法律記事で適切に指摘されているように、ブルームバーグ法律、2023 年 XNUMX 月、これらの視点を反映する XNUMX つの重要な抜粋を以下に示します。

  • 「著作権で保護されたデータの無許可のスクレイピングとその後の使用が著作権侵害に相当するかどうかについて、現在、米国の法学者と知的財産法の教授の間で激しい議論が繰り広げられています。 そのような慣行に著作権侵害があると考える法律実務家の見解が優勢である場合、そのような AI システムのユーザーも二次侵害の責任を負う可能性があり、法的影響に直面する可能性があります。」
  • 「この課題に包括的に対処するために、議員は既存の著作権法を近代化するだけでなく、一連の AI 固有の法律と規制の実施も検討する必要があります。」

社会として、私たちは社会に対して法的保護を設けたことを思い出してください。 拡大 有名または悪名高い第 230 条を検討している最高裁判所が現在目撃しているように、インターネットの. おそらく、保護は一時的に設定され、ジェネレーティブ AI が所定の習熟レベルに達した後に期限切れになる可能性があります。 他のセーフガード規定を考案することができます。

セクション 230 に関する最高裁判所の評価と最終的な判決が、ジェネレーティブ AI の出現にどのように影響するかについての私の分析を、近々投稿する予定です。 その次の投稿を探してください!

ジェネレーティブ AI として知られる、社会的に畏敬の念を起こさせる技術革新に余裕を持たせるべきだという、耳障りな意見に話を戻します。 主張されている著作権侵害が発生している、または発生している場合でも、社会全体として、ジェネレーティブ AI を進歩させるという特定の目的のためにこれを許可する必要があると言う人もいます。

新しい AI 法が慎重に作成され、ジェネレーティブ AI のデータ トレーニングに関連する詳細に合わせて調整されることが期待されています。

この目的のために新しい AI 法を考案するというこの概念には、多くの反論があります。 XNUMX つの懸念は、そのような新しい AI 法が、あらゆる種類の著作権侵害の水門を開くことです。 私たちは、そのような新しい AI 法が本に上陸することを許可した日を後悔します。 これを AI データ トレーニングだけに限定しようとしても、他の人がこっそりまたは巧妙に抜け穴を見つけて、自由で横行する著作権侵害につながる可能性があります。

引数をぐるぐる回します。

特に根拠のない議論の XNUMX つは、AI 自体を訴えようとすることと関係があります。 AI メーカーまたは AI 研究者を有罪の利害関係者と呼んでいることに注意してください。 これらは人と企業です。 AIを訴える対象にすべきだという意見もある。 私は、まだ法人格を AI に帰属させていないことを私のコラムで詳細に議論しました。 ここのリンク たとえば、AI 自体を対象としたそのような訴訟は、現時点では無意味と見なされます。

誰または何を訴えるべきかという問題の補足として、これは別の興味深いトピックをもたらします.

特定のジェネレーティブ AI アプリが、Widget Company と呼ばれる AI メーカーによって考案されたとします。 Widget Company は比較的小規模で、収益も資産もあまりありません。 それらを訴えることは、人が求めるかもしれない壮大な富を獲得する可能性は低いです. せいぜい、自分が間違っていると認識しているものを正すという満足感しか得られないでしょう。

あなたは大きな魚を追いかけたいです。

これがどのように発生するかです。 AI メーカーは、大量の生地と大量の資産を持つ大手コングロマリットである Big Time Company が生成 AI を利用できるようにすることを選択しました。 Widget Company の名前を付けた訴訟は、より適切なターゲットを視野に入れることになります。つまり、Big Time Company の名前も付けることです。 これは、弁護士が楽しむダビデとゴリアテの戦いです。 もちろん、Big Time Company は間違いなく釣り針から小刻みに逃げようとします。 彼らがそうできるかどうかは、不確かな法的な問題であり、どうしようもなく泥沼にはまってしまう可能性があります。

これについてさらに詳しく説明する前に、データ トレーニングによるジェネレーティブ AI の競合する侵害について、重要なことを話しておきたいと思います。 剽窃と著作権侵害は、多少異なる XNUMX つの獣であることを直感的に理解していると思います。 それらには多くの共通点がありますが、大きく異なります。

以下は、この XNUMX つを説明するデューク大学の簡潔な説明です。

  • 「剽窃とは、他人の作品を認められずに使用することと定義するのが最も適切です。 これは、請求者が作成したのではない著作物に対する信用の請求に関する倫理的な問題です。 作品の著作権状況に関係なく、他人の作品を盗用することができます。 たとえば、古すぎて著作権の対象とならない本や記事からコピーすることは、それでも剽窃です。 データのような事実に基づく素材が著作権で保護されていない場合でも、承認されていないソースから取得したデータを使用することも剽窃です。 しかし、剽窃は簡単に治ります - 資料の元の情報源への適切な引用.
  • 一方、著作権侵害は、他人の作品を無断で使用することです。 そもそも著作権で保護されているかどうかはもちろん、使用量や使用目的などの具体的な内容にもよる法律上の問題です。 保護された作品を大量にコピーしたり、不正な目的でコピーしたりする場合、単に元のソースを認めただけでは問題は解決しません。 著作権所有者に事前の許可を求めることによってのみ、侵害請求のリスクを回避できます。」

これら XNUMX つの懸念事項の重要性を指摘し、それに応じて救済策が異なる可能性があることを理解してもらいます。 また、それらは両方とも AI の倫理と AI の法律に浸透する考慮事項に絡み合っており、検討する価値があります。

主張されている救済策または解決策を探ってみましょう。 二重のトラブルの問題の XNUMX つには役立つかもしれませんが、もう XNUMX つの問題には役立たないことがわかります。

一部の人は、AI メーカーがしなければならないことは、情報源を引用することだけだと主張しています。 ジェネレーティブ AI がエッセイを生成するときは、エッセイで述べられていることについて、特定の引用を含めるだけにします。 さまざまな URL や、どのインターネット コンテンツが使用されたかを示すその他の情報を提供します。 これにより、彼らは盗作についての不安から解放されるように思われます. 出力されたエッセイは、作成された文言に使用された情報源を明確に特定するでしょう。

その主張された解決策にはいくつかの疑問がありますが、30,000 フィートのレベルでは、盗作のジレンマに対する半満足の治療法として機能するとしましょう。 上記の著作権侵害の説明で述べたように、ソース マテリアルを引用しても、必ずしも犬小屋から抜け出せるわけではありません。 コンテンツが著作権で保護されていると仮定すると、素材の使用量などの他の要因に応じて、待ち構えている著作権侵害の剣が鋭く最終的に振り下ろされる可能性があります。

ここではダブルトラブルが合言葉です。

剽窃や著作権侵害を証明しようとすることは、努力することになる

証明する!

これは、私たち全員が人生のさまざまな時期に耳にした、使い古されたリフレインです。

あなたはそれがどうなるか知っています。 何かが起こっている、または起こったと主張するかもしれません。 これが起こったことを心の中で知っているかもしれません。 しかし、プッシュ対プッシュに関しては、証拠が必要です。

今日の用語では、次のことを示す必要があります。 領収書、 彼らが言うように。

あなたへの私の質問はこれです: ジェネレーティブ AI がインターネット コンテンツを不適切に悪用したことを、どのように実証的に証明するのでしょうか?

答えは簡単だと思います。 出力されたエッセイを生成するように生成 AI に依頼または指示します。 次に、エッセイを取り、インターネットで見つけられるものと比較します。 エッセイを見つけた場合は、ジェネレーティブ AI が壁に釘付けになっていることになります。

人生はそれほど簡単ではないようです。

ジェネレーティブ AI が約 100 語を含むエッセイを生成することを想像してみてください。 私たちはインターネットの隅々まで行き来し、その 100 語を探します。 100 個の単語がまったく同じ順序でまったく同じ方法で表示されている場合、私たちは自分自身を熱いものに捉えたようです。

しかし、80 語中 100 語しか一致しないものの、一見「比較可能な」エッセイをインターネットで見つけたとします。 おそらく、これで十分だと思われます。 しかし、一致する 10 個の単語のうち 100 個の単語のインスタンスしか見つからないと想像してください。 剽窃が発生したか、著作権侵害が発生したかのいずれかを主張するには、それで十分ですか?

灰色が存在します。

そういう意味でテキストは面白いです。

これを、テキストから画像またはテキストからアートへの状況と比較してください。 ジェネレーティブ AI が text-to-image または text-to-art 機能を提供する場合、テキスト プロンプトを入力すると、AI アプリは提供されたプロンプトにある程度基づいて画像を生成します。 この画像は、この惑星または他の惑星でこれまでに見られた画像とは異なる場合があります。

一方、その画像は、存在する他の画像を連想させる場合があります。 ジェネレーティブ AI によって生成された画像を見て、本能的に、以前に見た別の画像のように見えると言うことができます。 一般に、 ビジュアル 比較と対照の側面は、もう少し簡単に実行できます。 そうは言っても、ある画像と別の画像の重複または複製を構成するものについては、大規模な法的な議論が行われていることを知っておいてください.

音楽にも同様の状況がもう XNUMX つあります。 テキスト プロンプトを入力できるジェネレーティブ AI アプリがあり、AI によって生成される出力はオーディオ音楽です。 これらのテキストからオーディオ、またはテキストから音楽への AI 機能は、まだ登場し始めたばかりです。 あなたが最高額を賭けることができるXNUMXつのことは、ジェネレーティブAIによって生成された音楽が侵害のために厳しく精査されることです. 私たちは音楽の侵害をいつ聞いたのかを知っているようですが、これも複雑な法的問題であり、認識された複製についてどのように感じるかだけに基づくものではありません.

例をもう XNUMX つ挙げてください。

テキストからコードへの生成 AI により、テキスト プロンプトを入力する機能が提供され、AI がプログラミング コードを生成します。 その後、このコードを使用してコンピューター プログラムを準備できます。 生成されたコードをそのまま使用することも、必要に応じてコードを編集および調整することもできます。 生成されたコードにエラーや誤りが発生する可能性があるため、コードが適切で実行可能であることを確認する必要もあります。

あなたの最初の仮定は、プログラミング コードはテキストと変わらないということかもしれません。 それはただのテキストです。 確かに、それは特定の目的を提供するテキストですが、それでもテキストです。

まあ、正確ではありません。 ほとんどのプログラミング言語は、その言語のコーディング ステートメントの性質に厳密な形式と構造を持っています。 これはある意味で、自由に流れる自然言語よりもはるかに狭いものです。 コーディングステートメントがどのように定式化されているかについて、あなたはいくらか箱詰めされています。 同様に、ステートメントが使用され、配列される順序と方法は、いくぶんボックス化されています。

全体として、プログラミング コードが剽窃または侵害されていることを示す可能性は、自然言語が言うよりもほとんど簡単です。 したがって、ジェネレーティブ AI がインターネット上のプログラミング コードをスキャンし、後でプログラミング コードを生成する場合、コードが露骨に複製されたと主張する可能性は比較的説得力があります。 スラムダンクではないので、これで苦い戦いが繰り広げられることを期待してください.

私の最も重要なポイントは、ジェネレーティブ AI のすべてのモードに直面する同じ AI 倫理と AI 法の問題が発生するということです。

剽窃および著作権侵害は、次の場合に問題になります。

  • テキストからテキストまたはテキストからエッセイ
  • テキストから画像またはテキストからアート
  • テキストからオーディオまたはテキストから音楽
  • テキストからビデオへ
  • テキストからコードへ

それらはすべて同じ懸念の対象です。 いくつかは、他のものよりも「証明」するのが少し簡単かもしれません. それらのすべては、AI の倫理と AI の法律が根底にあるという独自のさまざまな悪夢を見ることになります。

剽窃ま​​たは著作権侵害の主張

ディスカッションのために、テキストからテキストまたはテキストからエッセイの生成 AI に焦点を当てましょう。 私がそうする理由の一部は、生成 AI のテキストからテキストへのタイプである ChatGPT の絶大な人気のためです。 多くの人が ChatGPT を使用しており、同様のさまざまなテキストからテキストへの生成 AI アプリを使用している他の多くの人もいます。

ジェネレーティブ AI アプリを使用している人々は、盗作や著作権侵害に依存している可能性があることを知っていますか?

彼らがそうするかどうかは疑わしいようです。

ジェネレーティブ AI アプリが使用可能である場合、AI メーカーまたは AI を配備した企業は、彼らが提供している製品に不都合が何もないことを知っているか、確信している必要があるというのが一般的な仮定です。 使えるなら船上にあるに違いない。

特定のジェネレーティブ AI がデータ トレーニングに関して不正な根拠に基づいて動作していることを証明する方法についての以前のコメントに戻りましょう。

また、XNUMX つの生成 AI がそうしているのを見つけることができれば、他の生成 AI を捕まえる可能性が高まる可能性が高いことも付け加えておきます。 すべてのジェネレーティブ AI アプリが同じボートに乗っていると言っているわけではありません。 しかし、そのうちの XNUMX つが壁に固定されると、かなり厳しい海に身を置くことになります。

だからこそ、既存の訴訟に目を光らせておくことは非常に価値のあることです。 主張された侵害に関して最初に勝ったものは、これが発生した場合、他のジェネレーティブ AI アプリに破滅と暗黒をもたらす可能性があります。 主張された侵害に関して負けたものは、必ずしもジェネレーティブ AI アプリが鐘を鳴らして祝うことができることを意味するわけではありません。 損失は​​、他のジェネレーティブ AI アプリとは関係のない他の要因に起因している可能性があります。

100 語のエッセイを作成し、インターネット上でまったく同じ順序でそれらの正確な単語を見つけようとすると、盗作または著作権侵害の比較的確固たる証拠が得られる可能性があると述べました。 しかし、一致した単語の数が少ない場合、私たちは薄い氷の上にいるように見えます.

そこをもっと掘り下げてみたい。

比較を行う際の明らかな側面は、まったく同じ順序のまったく同じ単語で構成されています。 これは、パッセージ全体で発生する可能性があります。 これは、銀の大皿で私たちに渡されるように、見つけるのに便利です.

単語のスニペットだけが一致した場合も疑わしい可能性があります。 アイデアは、それらが重要な単語か、簡単に削除または無視できるフィラー ワードかどうかを確認することです。 また、過去形や未来形の単語の使用や、別のおふざけにだまされたくありません。 これらの言葉のバリエーションも考慮する必要があります。

別のレベルの比較は、単語が特に大部分が同じ単語ではない場合でも、さまざまな状態の単語でも同じ点を指摘しているように見える場合です。 たとえば、要約は元の情報源として非常によく似た単語を使用することがよくありますが、要約が元の情報源に基づいているように見えることがわかります。

最も難しいレベルの比較は、概念またはアイデアに基づくものです。 比較対象となる同じまたは類似した単語がないが、本質またはアイデアは同じであるエッセイを見たとします。 私たちは確かに大まかな領域に近づいています。 アイデアが厳重に保護されていると簡単に言うなら、ほとんどすべての形式の知識と知識の拡大に蓋をすることになります。

デューク大学からの便利な説明をもう一度参照できます。

  • 「著作権はアイデアを保護するのではなく、アイデアの特定の表現のみを保護します。 たとえば、裁判所は、ダン ブラウンが書いた以前の本の著作権を侵害していないと判断しました。 ダ·ヴィンチ·コード 彼が以前の作品から借りたのは基本的なアイデアだけであり、筋書きや対話の詳細ではないからです. 著作権は創造的な制作を奨励することを目的としているため、他人のアイデアを使用して新しいオリジナルの作品を作成することは、著作権の目的を維持するものであり、それを侵害するものではありません。 他人の表現を許可なくコピーした場合にのみ、著作権が侵害される可能性があります。」
  • 「他方、剽窃を避けるためには、他の誰かから借りたアイデアであっても、それらのアイデアの表現が彼らと一緒に借りられたかどうかに関係なく、出所を認めなければなりません。 したがって、たとえ著作権の問題が生じることはめったにありませんが、言い換えには引用が必要です。」

前述のように、ダブル トラブル ファセットの違いに注意してください。

さて、比較手法の実践は長年にわたって行われてきました。 このように考えてください。 学業のためにエッセイを書く学生は、インターネットからコンテンツを入手して、A グレードのピューリッツァー賞を受賞した言葉を書いたふりをしたくなるかもしれません。

教師は、これに対処するために盗作チェック プログラムを長い間使用してきました。 教師が生徒のエッセイを受け取り、剽窃チェッカーに入力します。 場合によっては、学校全体が剽窃チェック プログラムの使用を許可することもあります。 生徒がエッセイを提出するときはいつでも、まずエッセイを剽窃チェック プログラムに送信する必要があります。 教師は、プログラムが報告する内容について通知されます。

残念ながら、これらの剽窃チェック プログラムの内容については、非常に注意する必要があります。 報告された適応症が有効かどうかを慎重に評価することが重要です。 すでに述べたように、著作物がコピーされたかどうかを確認する機能は曖昧な場合があります。 チェック プログラムの結果を軽率に受け入れると、学生がコピーしていないのにコピーしたと誤って非難する可能性があります。 これは魂を砕くことができます。

次に、生成 AI の出力をテストする領域で盗作チェック プログラムの使用を試みることができます。 ジェネレーティブ AI アプリから出力されたエッセイを、学生が書いたものとして扱います。 次に、盗作チェッカーの内容を評価します。 これは一粒の塩で行われます。

まさにこのような方法で、生成 AI のコンテキストでこれらのタイプの比較を運用化しようとした最近の調査研究があります。 興味深い発見をいくつか紹介したいと思います。

まず、追加の背景が必要です。 ジェネレーティブ AI は、LLM (大規模言語モデル) または単に LM (言語モデル) と呼ばれることもあります。 次に、ChatGPT は、GPT-3.5 と呼ばれる別の OpenAI 生成 AI パッケージのバージョンに基づいています。 GPT-3.5 の前には GPT-3 があり、その前には GPT-2 がありました。 現在、GPT-2 は後のシリーズに比べてかなり原始的であると考えられており、GPT-4 の次の発表を待ち望んでいます。 ここのリンク.

私が簡単に調査したい調査研究は、GPT-2 の調査で構成されていました。 GPT-2 の機能をはるかに超えているため、これを認識することが重要です。 この GPT-2 の分析結果について、性急な結論を下さないでください。 それにもかかわらず、GPT-2 の評価から多くのことを学ぶことができます。 この研究は、「言語モデルは剽窃するか?」と題されています。 Jooyoung Lee、Thai Le、Jinghui Chen、Dongwon Lee 著、ACM WWW '23、1 年 5 月 2023 ~ XNUMX 日、米国テキサス州オースティンに出演。

これが彼らの主な研究課題です。

  • 「LM はどの程度 (暗記に限らず) トレーニング サンプルからフレーズや文を利用しますか?」

彼らは次の XNUMX つのレベルまたはカテゴリの盗用の可能性を使用しました。

  • 「逐語的剽窃: 単語やフレーズを変形せずに正確にコピーしたもの。」
  • 「言い換え剽窃: 同義語の置換、単語の並べ替え、および/または逆翻訳。」
  • 「アイデアの盗用: 核となる内容を細長い形で表現すること。」

GPT-2 は実際にインターネット データでトレーニングされているため、このタイプの分析に適した候補です。

  • 「GPT-2 は WebText で事前にトレーニングされており、8 万の Reddit リンクから取得された 45 万を超えるドキュメントが含まれています。 OpenAI は WebText を公開していないため、WebText コーパスをオープンソースで再現した OpenWebText を使用します。 これは、以前の文献で確実に使用されています。」

研究から抜粋された主な調査結果は次のとおりです。

  • 「事前に訓練された GPT-2 ファミリが OpenWebText から盗用していることを発見しました。」
  • 「私たちの調査結果は、微調整により、OpenWebText からの逐語的な剽窃のケースが大幅に減少することを示しています。」
  • 「Carliniらと一致しています。 と Carlini らの調査によると、より大きな GPT-2 モデル (大および xl) は、一般に、小さいものよりも頻繁に盗用されたシーケンスを生成することがわかりました。」
  • 「しかし、異なるLMは盗用の異なるパターンを示す可能性があるため、GPT-3やBLOOMなどの最近のLMを含む他のLMに直接一般化できない可能性があります。」
  • さらに、自動剽窃検出器には多くの失敗モードがあることが知られています (偽陰性と偽陽性の両方)。
  • 「LM のトレーニング データの大部分が、コンテンツ所有者に通知することなく Web からスクレイピングされていることを考えると、トレーニング セットから生成されたテキストへの単語、フレーズ、さらにはコア アイデアの反復には、倫理的な意味があります。」

この種の研究がもっともっと必要であることは間違いありません。

データ トレーニングに関して GPT-2 と GPT-3 を比較する方法に興味がある場合は、かなり顕著な違いがあります。

報告された兆候によると、GPT-3 のデータ トレーニングは、はるかに広範でした。

  • 「このモデルは、インターネットのテキスト データベースを使用してトレーニングされました。 これには、書籍、Web テキスト、ウィキペディア、記事、およびインターネット上のその他の文章から得られた、なんと 570 GB のデータが含まれていました。 さらに正確に言うと、300 億語がシステムに入力されました」(BBCサイエンスフォーカス 雑誌、「ChatGPT: All you need to know about OpenAI's GPT-3 tool」、Alex Hughes 著、2023 年 XNUMX 月)。

GPT-3 のデータ トレーニングの詳細な説明に興味がある方のために、GitHub に投稿された公式の GPT-3 モデル カードからの抜粋を以下に示します (最終更新日は 2020 年 XNUMX 月と記載されています)。

  • 「GPT-3 トレーニング データセットは、インターネットに投稿されたテキスト、またはインターネットにアップロードされたテキスト (書籍など) で構成されています。 これまでにトレーニングおよび評価されたインターネット データには、(1) 高品質の参照コーパスとの類似性に基づいてフィルタリングされた CommonCrawl データセットのバージョン、(2) Webtext データセットの拡張バージョン、(3) が含まれます。 ) 4 つのインターネット ベースの書籍コーパス、および (XNUMX) 英語版ウィキペディア。」
  • 「そのトレーニング データを考えると、GPT-3 の出力とパフォーマンスは、口頭の非デジタル文化に染み込んだ人々よりも、インターネットに接続された人々をより代表しています。 インターネットに接続している人口は、先進国、裕福で若く、男性的な見方をより代表しており、ほとんどが米国中心です。 裕福な国と先進国の人口が多いほど、インターネットの普及率が高くなります。 デジタルの男女格差は、世界中でオンラインに参加している女性の数が少ないことも示しています。 さらに、世界のさまざまな地域でインターネットの浸透度とアクセスのレベルが異なるため、データセットはあまり接続されていないコミュニティを過小評価しています。」

GPT-3 に関する上記の指摘からの XNUMX つのポイントは、ジェネレーティブ AI を作成する人々の間の経験則は、スキャンできるインターネット データが多いほど、ジェネレーティブ AI を改善または進歩させる可能性が高くなるということです。

これは、XNUMX つの方法のいずれかで見ることができます。

  • 1) 改善されたAI. 可能な限り多くのインターネットをクロールするジェネレーティブ AI を導入します。 エキサイティングな結果は、ジェネレーティブ AI が現在よりも優れたものになるということです。 それは楽しみです。
  • 2) 潜在的なガロアをコピーする. このようにインターネットをスキャンする範囲が拡大したことで、剽窃と著作権侵害の問題が潜在的にますます大きくなっています。 以前はそれほど多くのコンテンツ クリエーターが影響を受けていませんでしたが、その規模は拡大するでしょう。 あなたがコンテンツ作成者側の弁護士である場合、これはあなたの目に涙をもたらします (おそらく落胆の涙、または訴訟に関してこれがどのような見通しをもたらすかについての喜びの涙)。

グラスは半分満たされていますか、それとも半分空ですか?

あなたが決める。

合法的な地雷が待っている

あなたが熟考しているかもしれない質問は、投稿されたインターネット コンテンツがスキャンされて公正なゲームと見なされるかどうかです。 コンテンツがペイウォールの背後にある場合、ペイウォールの強度によってはすぐにアクセスできないため、おそらくスキャンの対象にはなりません。

ほとんどの人は、自分のコンテンツをペイウォールの後ろに隠しているとは思いません。 彼らは、自分のコンテンツを公開したいと考えています。 彼らは、人々がそれを見るだろうと想定しています。

コンテンツを公開するということは、データ トレーニング中のジェネレーティブ AI で使用するためにコンテンツをスキャンすることを承認していることを自明に意味するのでしょうか?

たぶんそうだけどたぶん違う。

それは、目を丸くするような法的問題のXNUMXつです。

冒頭の引用に戻る ブルームバーグ法 この記事の著者は、多くの Web サイトに関連する利用規約 (T&C) の重要性について言及しています。

  • 「法的な地雷は、データ スクレイピング用のオンライン ボットを運用する無意識の AI 企業によって大幅に無視されていますが、あらゆる種類の公開 Web サイトで一般的に利用できる利用規約に隠されています。 現在未解決の知的財産法と著作権侵害のジレンマとは対照的に、ウェブサイトの利用規約は十分に確立された契約法に裏打ちされており、通常、十分な数の先例に基づいて法廷で執行することができます。」

Web サイトにライセンス関連のページがあると仮定すると、標準化された最新のテンプレートを使用した場合、次のような重要な条項が含まれている可能性があります。

  • 「その結果、無料アクセスで豊富に入手できるウェブサイトの定型的な利用規約のほとんどには、自動データスクレイピングを禁止する条項が含まれています。 皮肉なことに、このような無料で入手できるテンプレートは、ChatGPT のトレーニングに使用された可能性があります。 したがって、コンテンツ所有者は利用規約を確認し、別の条項を挿入して、ウェブサイト所有者の事前の書面による許可なしに、手動または自動で収集されたかどうかにかかわらず、AI トレーニングまたは関連する目的でのウェブサイトからのコンテンツのすべての使用を一律に禁止することを希望する場合があります。 」

追加のキッカーは、コンテンツ作成者が自分の Web サイトに対して行う潜在的なアクションの分析に含まれています。

  • 「したがって、スクレイピング禁止条項の違反ごとに執行可能な損害賠償条項を挿入し、保証金なしの差し止め命令条項で強化することは、創造的なコンテンツの成果を提供することに熱心ではない創造的なコンテンツの作成者にとって、支持できる解決策になる可能性があります。対価を支払わず、少なくともその仕事に対して適切な評価を与えることなく、AI トレーニングの目的で知的労働を行っている。」

これについては、弁護士に相談することをお勧めします。

これは、コンテンツ クリエーターがコンテンツの保護に非常に真剣に取り組んでいることを AI メーカーに伝えるための重要な方法であると言う人もいます。 ライセンスに適切な文言が含まれていることを確認することは、AI メーカーに注意を喚起するように思われます。

他の人は少し悲観的です。 彼らは落胆して、あなたのウェブサイトに最も厳しく、最も致命的な法的文言を掲載することができると言っていますが、最終的には、AI メーカーはそれをスキャンします. 彼らがそうしたことをあなたは知らないでしょう。 あなたは彼らがしたことを証明する時間の悪魔を持っています. それらの出力があなたのコンテンツを反映していることに気付くことはほとんどありません。 勝てない厳しい戦いです。

反論は、戦闘が行われる前にあなたが降伏しているというものです。 少なくとも十分な法的言語を持っていない場合、もし彼らを捕まえたとしても、彼らは小刻みに動き、責任を逃れようとします. すべては、適切な種類の法律用語を投稿しなかったためです。

一方、牽引力を得ようとしている別のアプローチは、 マーキング サイトがジェネレーティブ AI によってスキャンされないことを示す何かを含む Web サイト。 アイデアは、標準化されたマーカーが考案されるということです。 Web サイトは、おそらくマーカーをサイトに追加できます。 AI メーカーは、マークされた Web サイトをスキップするようにデータ スキャンを変更する必要があると言われます。

マーカーアプローチは成功するか? 懸念事項には、マーカーを取得して投稿するためのコストが含まれます。 AIメーカーがマーカーを遵守し、マークされたサイトをスキャンしないようにするかどうか. もう XNUMX つの見方は、AI メーカーがマーキングに同意しなくても、これは法廷に行き、コンテンツ作成者が AI スキャンについて警告するために最後の一歩を踏み出したと主張するための別の明確な手がかりを提供するということです.

うーん、それはすべてあなたの頭を回転させます。

まとめ

この厄介なトピックに関するいくつかの最後の発言。

剽窃者および著作権侵害者のジレンマとしてのこの AI 全体について、衝撃的な見方をする準備はできていますか?

盗作または著作権侵害の行為でジェネレーティブ AI を「捕まえる」ことについての仮定の多くは、次の出力を発見することにかかっています。 よく似ている データ トレーニング中にスキャンされた可能性のあるインターネット上のコンテンツなどの以前の作業。

ただし、ここで分割統治の策略が行われているとします。

ここに私が意味するものがあります。

ジェネレーティブ AI がここから少しずつ借りてきて、最終的にそれらを混ぜ合わせて特定の出力を生成する場合、落とし穴が発生する可能性は大幅に減少します。 どの出力も、特定のソース アイテムからコピーされたと確信できるほど十分なしきい値まで上昇していないように見えます。 結果として得られるエッセイまたはその他の出力モードは、部分的にしか一致しません。 そして、剽窃または著作権侵害が発生したと主張しようとする通常のアプローチでは、特にその一口が目立ったものではなく、インターネット全体で広く見られる場合 (アンダーカット不正使用の十分な立証責任)。

提案された証拠が表面上は重要でない割合であったとしても、ジェネレーティブ AI によるデータ トレーニングが Web サイトやコンテンツ クリエーターを食い物にしたと説得力を持って宣言できますか?

それについて考えてください。

大規模な盗作や大規模な著作権侵害の可能性に直面している場合は、盗用や著作権侵害を構成するものを定義するアプローチを変更する必要があるかもしれません。 おそらく、大部分または全体として、盗作または著作権侵害の訴訟が提起される可能性があります。 数千または数百万の小さなスニペットで構成されるモザイクは、そのような違反を犯していると解釈される可能性があります。 ただし、明らかな問題は、これによりあらゆる種類のコンテンツが突然侵害の傘下に入る可能性があることです. これは滑りやすい斜面かもしれません。

重い思い。

重い考えについて言えば、伝説的な作家であるレオ・トルストイは、「人生の唯一の意味は、人類に奉仕することである」という有名な言葉を残しました。

あなたの Web サイトや他の Web サイトが AI の改善のためにスキャンされていて、そのために XNUMX セントも得られていなくても、人類の未来に貢献しているという熱烈な信念に厳粛な慰めがあるでしょうか? 支払う代償は小さいようです。

まあ、AIがすべての人間を存在から一掃する恐ろしい実存的リスクであることが判明しない限り. あなたはそれを手柄にすべきではありません。 私はあなたがその悲惨な結果に貢献していないと思います. その悲惨な予測はさておき、AI メーカーが生成 AI から利益を得ており、彼らが利益を享受しているように見えるなら、あなたもパイの一部を手に入れるべきだと考えているかもしれません。 共有し、同様に共有します。 AI メーカーは、あらゆる Web サイトをスキャンする許可を求め、スキャンを許可された場合に支払われる対価についても交渉する必要があります。

クレジットが必要な場合はクレジットを付与します。

サー・ウォルター・スコットに今のところ最後の言葉を贈りましょう。 最初は欺く練習をします。」

これは、欺瞞が進行中であると信じている場合に当てはまるかもしれませんし、すべてが順調で完全に率直で合法的であると考えている場合には当てはまらないかもしれません。 これを熟考したことに対して、寛大に自分の功績を認めてください。 あなたはそれに値する。

ソース: https://www.forbes.com/sites/lanceeliot/2023/02/26/legal-doomsday-for-generative-ai-chatgpt-if-caught-plagiarizing-or-infringing-warns-ai-ethics- and-ai-law/