生成的 AI 近親交配: AI 開発で高まる懸念

その進歩に伴い、人工知能 (AI) もますます進歩しており、生成 AI システムにおけるいわゆる「近親交配」のリスクは、人間と家畜集団の間で長い間一般的であった危険となっています。

この記事では、生成 AI を考慮した近親交配の概念と、近親交配が AI 生成コンテンツの将来にどのように関係するかについて光を当てます。

生成 AI 近親交配について理解する 大規模言語モデル (LLM) のような生成 AI システムは、主に、Web 上で利用可能なテキスト、ビジュアル、オーディオ コンテンツからの包括的なデータ セットでトレーニングされます。当初、データ セットには、文学、記事、芸術作品など、人間が作成したアイテムが主に含まれていました。しかし、生成 AI ツールの台頭により、インターネット上のコンテンツが AI 自体によって記述されることが増えています。

この変化により、将来の AI システムのトレーニングに使用されるデータセットの品質と多様性に関する懸念が生じます。 AI によって生成されたコンテンツの進化に伴い、多くの将来世代の AI モデルは、人間のコンテンツではなく AI によって作成されたマテリアルを表すデータセットから学習することが予想されます。

生成的 AI 近親交配の影響は多面的です。

それどころか、AI システムがこれまで以上に多くの同種のデータセットから学習を続けると、AI が生成する出力の創造性や独創性が低下する可能性があります。

このプロセスが何世代にもわたって連続的に繰り返される場合、つまり、コピーからコピーする場合、出力の品質は低下し、その結果は魅力の低い仕事になり、人間の創造的な出力と考えられるものを反映する可能性が低くなる危険があります。 。近交系データセットでトレーニングされた AI 生成コンテンツの増加に伴い、このような問題はさらに悪化する可能性があります。

トレーニング データセットが十分に多様でない場合、開発された AI システムは、AI 生成コンテンツ内に存在するバイアスを強化および拡大するだけの役割を果たし、情報源としての AI 生成コンテンツの信頼できる使用がさらに損なわれることになります。さらに、トレーニング データに多様性がないため、人間の幅広い経験や視点を正しく理解して表現できる AI システムを開発する可能性が制限される可能性があります。これにより、自然言語処理、コンテンツ生成、意思決定システムなど、AI のさまざまな応用分野の進歩が制限される可能性があります。

生成的 AI 近親交配の課題に対処する

とりわけ、これは真のリスクであり、特に生成型 AI テクノロジーの近親交配が当てはまります。それでも、研究者、開発者、さらには政策立案者に、AI システムのトレーニング中に最優先事項として多様で代表的なデータセットが確実に使用されるように、検出して削減できるメカニズムを統合して、積極的に行動する責任が与えられています。 AI によって生成されたコンテンツのバイアスを排除し、AI 構築の倫理的および社会的影響に対処し、確実に対処しながら、効果的な学際的コラボレーションを確保します。 

AI システムの展開における公開性と説明責任の必要性をさらに促進し、制限と偏見に対する認識を AI で生成されたコンテンツのユーザーと共有することを要求する必要があります。したがって、すべての関係者は、AI 開発における近親交配に伴うリスクを軽減しながら、生成 AI の力を活用するために積極的に協力することができます。 

生成 AI における近親交配の概念は、AI システムの開発と展開における将来の大きな課題です。これは、生成的 AI の近親交配を効果的に改善するための意味と方法を理解することで、社会のための技術改善の責任ある倫理的な開発が確実に満たされるようにするのに役立ちます。

出典: https://www.cryptopolitan.com/generative-ai-growing-in-ai-development/