新しい Al Generative Art の概要

アル・ジェネレーティブ・アート 人間と自律システムとの協力に基づいた、ほとんどの場合視覚的な芸術の一種です。 「自律システム」は、 Artificial Intelligence プログラマーの介入を必要とせずに複雑な操作を実行できるソフトウェア、アルゴリズム、またはモデル。

によって作成された画像の奇妙な並置から Dall-Eミニ NFT 市場では、AI アルゴリズムによって生成された画像が主流の想像力にますます入ってきています。 実際、分析に値する主題に関するXNUMXつの重要なプロジェクトは次のとおりです。 ミッドジャーニー & DALL-E2.

もちろん、このニュースはTwitterにも流れています。 とりわけ、それについてコメントしているのは、次のように書いたチャールズ・ホスキンソンです。

Al Generative Art: 初期の実験と機能

ジェネレーティブ アートとは何かを理解したら、その基本原則の XNUMX つを強調することが重要です。 ランダム. これは、ジェネラティブ アートの基本的な特性です。

実際、ソフトウェアのタイプに応じて、自律システムは生成コマンドが実行されるたびに常に異なる一意の結果を処理したり、ユーザー入力に応じて可変数の結果を返すことができます。

ジェネレーティブ アートの最初の実験は、1960 年代にさかのぼります。 ハロルド・コーエン と彼 AARON プログラム。 コーエンは最初、スタンドアローンのソフトウェアを使用して、ポップアートのシルクスクリーンにインスパイアされた抽象的なアートワークを作成しました。 コーエンの作品は現在、ロンドンのテート ギャラリーに展示されています。

ジェネレーティブ アートのもう XNUMX つの属性ですが、ますます特権的ではなくなりつつあるのは、プログラマーによって提供され、ソフトウェア コード内に実装されたパターンまたは抽象要素の繰り返しです。

さらに、テキストと画像の関連付けで動作するますます複雑になるニューラル ネットワークの開発により、ますます現実的で正確な画像を作成できる生成モデルの開発が可能になりました。 ジェネラティブ アートのこのカテゴリの最もよく知られている例は、 ダルイー.

Dall-E は、に基づくマルチモーダル ニューラル ネットワークです。 GPT-3 からの深層学習モデル OpenAI、最近開発した同じ会社 AI言語モデルを活用してコードのデバッグからデータの異常検出まで、、2022 年 XNUMX 月にリリースされ、最適化されたチャットボット 「監督」 そして強化学習技術。

Dall-E に戻ると、このシステムは、 "促す、" テキストと画像のペアのデータセットに基づいています。

2021 年 3 月に公開され、この分野の少数の専門家の特権であった Dall-E の最初のバージョンは、この種の生成モデルの点で真の革命を表し、GPT の革新を上回りました。 XNUMXそのもの。

また、重要なのは、Dall-E によって処理された結果の精度が、別の OpenAI ソリューションの完全な範囲であることが証明されたという事実です。 CLIP (対照的な言語イメージの事前トレーニング)。

インターネットで見つかったキャプションなどのテキストと画像の関連付けに基づいてトレーニングされた、画像の分類とランキングのニューラル ネットワーク。 プロンプトごとにユーザーに提案される結果の数を 32 に減らす CLIP の介入のおかげで、Dall-E はほとんどの場合に満足のいく画像を返すことがわかりました。

旅の途中: デザイン、人間のインフラストラクチャ、人工知能

予想通り、 ミッドジャーニー は、新興の Al Generative Art コンセプトの一部である重要なプロジェクトです。 具体的には、ミッドジャーニーは、新しい思考手段を探求し、人類の想像力を拡大する独立した研究所です。

使い方は簡単です。最初にアカウントを作成する必要があります Discord、さまざまなコミュニティをホストするプラットフォームであり、Midjourney はその XNUMX つです。 アプリケーション内には、ディスカッションに積極的に参加したり参加したりできないさまざまなチャットルームがあります。

人工知能を初めて使用するには、 「初心者」 チャネル、場所 25 の無料レンダリング ご利用いただけます。

XNUMX 回のレンダリングは、同じテキスト入力から生成される XNUMX つの異なるバリアントの生成に対応します。

したがって、25 のレンダリングは、Midjourney ボットによって実行される 25 の処理ジョブを参照します。 したがって、画像を生成するには、「プロンプト」と呼ばれるテキスト メッセージを介して Midjourney ボットと対話する必要があります。プロンプトには、ユーザーが考えている画像を説明するキーワードが含まれます。

必要なだけ詳細を追加できます。重要なことは、キーワードをカンマで区切ることです。 レンダリングが完了すると、コンピューターは選択する説明に基づいて XNUMX つの異なる画像を返します。

さらに、プログラムがレンダリングを終了したら、画像に基づいて好みを伝え、必要に応じてさらに XNUMX つのバージョンを再度生成することができます。

DALL-E 2: アートワーク向けの新しい AI システム

Midjourney に加えて、DALL-E 2 も新しい AI システムであり、自然言語の記述からリアルな画像やアートワークを作成できます。 それだけでなく、DALL-E 2 はコンセプト、属性、スタイルを組み合わせることができます。

新しい AI システムの強みは、元のキャンバスにあるものを超えてイメージを拡張できることにもあります。 新しい拡張的な構成. さらに、自然言語のキャプションから既存の画像にリアルな変更を加えたり、影、反射、テクスチャを考慮して要素を追加および削除したりできます。

DALL-E 2 の機能には、画像を取得し、オリジナルに触発された複数のバリエーションを作成することも含まれます。 DALL-E 2 は、画像とそれらを説明するために使用されるテキストとの関係を学習しました。

と呼ばれるプロセスを使用します。 "拡散、" ランダムなドットのパターンから始まり、画像の特定の側面を認識すると、そのパターンを画像に向かって徐々に変更します。

そのため、OpenAI が 2021 年 2 月に DALL-E を導入した後、最新のシステムである DALL-E XNUMX は、XNUMX 倍の解像度でより現実的で正確な画像を生成します。

DALL-E 2 は研究プロジェクトとして開始され、現在は ベータ版. システムが開発し、改善を続けているセキュリティ緩和策には、暴力的、憎悪、または成人向けの画像を生成するシステムの能力を制限すること、および学習ベースの段階的な展開が含まれます。

出典:https://en.cryptonomist.ch/2023/02/02/ai-generative-art/