Midjourney の創設者 David Holz が AI が芸術、想像力、創造的経済に与える影響について

ミッドジャーニー は、人工知能 (AI) を使用してテキスト プロンプトから視覚的な画像を作成する新しいテクノロジの主要な原動力の XNUMX つです。 サンフランシスコを拠点とするこのスタートアップは最近、コロラド州のフェア コンペティションで賞を受賞したアートワークの背後にあるエンジンとしてニュースを発表しました。これが、今後 AI アートが直面する最後の複雑な問題になる可能性は低いです。

Midjourney は、生成される画像の絵画的な美学を強調することで、空間内の他のものと区別されます。 このプラットフォームは、写真と間違われる可能性のあるフォトリアリスティックな画像を作成しようとはしていません。CEO の David Holz 氏は、ディープフェイクやその他の作品があまりにも現実に近いものをシミュレートするという奇妙な品質に個人的に非常に不安を感じていると述べています。 代わりに、Holz 氏によると、Midjourney は、普通の人々に説明するだけで美しい写真を作成するツールを提供することで、普通の人々の創造性を解き放つように設計されています。

しかし、ヒューマニストで消費者志向の会社であるにもかかわらず、コマーシャル アートやプロのアーティストへの影響については、避けられない疑問があります。 ホルツにインタビューしました AI アートが画像の制作にもたらす可能性のある潜在的な混乱に関するより広範な記事 エンターテイメント、ビデオゲーム、出版用。 これは、ホルツがこれらの問題に対処し、会社、業界、およびテクノロジーに対する彼のビジョンについて説明する際に、より深い内容と背景を提供する、私たちの会話からのより長い抜粋です。 インタビューは、長さと明確さのために編集されています。

Rob Salkowitz、Forbes 寄稿者: あなたの役割と役職は何ですか?

デビッド・ホルツ、ミッドジャーニー。 私は創業者兼CEOです。 ただし、CEO は非常にビジネス的に聞こえますが、私たちはあまりビジネス的ではないため、通常は創業者と呼ばれることを好みます。 私たちは製品を作る応用研究所です。

ミッドジャーニーの使命とは?

私たちは人類の想像力を広げようとしているとよく言います。 目標は人間をより想像力豊かにすることであり、想像力豊かな機械を作ることではありません。これは重要な違いだと思います。

会社のこれまでの歴史を簡単に教えていただけますか?

当社のイマジネーションの部分に取り組み始めたのは約XNUMX年半前です。 拡散モデル、クリップを理解する人々、openAI など、いくつかのブレークスルーがありました。 これに関わっているほぼ全員がサンフランシスコであり、私たちは皆、これが深刻になること、他の多くのものとは異なることを認識していました.

Midjourney は、このテキストから画像へのテクノロジーがビジネスや社会にもたらすメリットは何だと考えていますか?

私は間違いなくビジネスよりも社会に関心があります。 私たちは消費者向け製品ですが、現在、ユーザーの 30% ~ 50% はプロです。 大多数はそうではありません。 このプラットフォームのアーティストは、最初はより創造的で探求的になり、短時間で多くのアイデアを思いつくことができると語っています。

現在、私たちのプロのユーザーは、概念化のためにプラットフォームを使用しています。 [コマーシャル アート プロジェクト] の最も難しい部分は、利害関係者が何を望んでいるのかわからず、反応するアイデアを確認しなければならない最初の段階です。 ミッドジャーニーは、人々が望むアイデアにはるかに早く収束するのに役立ちます。なぜなら、それらの概念を反復することは非常に面倒だからです。

アーティストにとってのもう XNUMX つの利点は、自分が自信を持っていない分野で人々に自信を与えることです。すべてではないにしても、ほとんどのアーティストは、うまくできない部分があると感じています。 色、構図、背景かもしれません。 私たちの製品を使用している有名なキャラクター デザイナーがいて、人々は彼に、あなたはすでにとても優れているのになぜ AI を使うのかと尋ねます。 そして彼は、「まあ、私はキャラクターの部分だけが得意です。 これは、残り、世界、背景、配色で私を助けています。」

製品を使用している人数はどのくらいですか?

数百万人が使用しています。 私たちの不和はXNUMX万を超えています。 これは、これまでで最大のアクティブな Discord サーバーです。

Midjourney のライセンスは、プラットフォームによって生成された画像の商用利用を許可していますか?

はい。 ただし、年間収益が XNUMX 万ドルを超える企業で働いている場合は、法人ライセンスを購入するようお願いします。

データセットはどのように構築されましたか?

それはインターネットの大きな断片にすぎません。 公開されているオープン データ セットを使用し、それら全体でトレーニングを行います。 そして、それは 100% の人がすることだと思います。 私たちはうるさいわけではありませんでした。 科学は、実際に必要なデータの量とモデルの品質という点で急速に進化しています。 実際に物事を理解するには数年かかるでしょう。その頃には、ほとんど何もせずにトレーニングできるモデルができているかもしれません。 彼らが何ができるかは誰にもわかりません。

存命のアーティストや著作権下にある作品に同意を求めましたか?

いいえ。実際には、XNUMX 億枚の画像を取得して、それらがどこから来たのかを知る方法はありません。 画像に、著作権所有者などに関するメタデータが埋め込まれていれば素晴らしいと思います。 しかし、それは問題ではありません。 レジストリはありません。 インターネットで写真を見つけて、所有者を自動的に追跡し、それを認証するために何かを行う方法はありません。

アーティストは、データ トレーニング モデルに含めることをオプトアウトできますか?

私たちはそれを見ています。 今の課題は、ルールが何であるかを見つけ出し、その人が本当に特定の作品のアーティストなのか、それとも名前を付けただけなのかを判断する方法です. データセットから自分の名前を削除することを望んでいる人に会ったことはありません。

アーティストは、プロンプトでの指名をオプトアウトできますか?

今じゃない。今はだめなの。 私たちはそれを見ています。 繰り返しになりますが、これらの要求を認証する方法を見つける必要があり、これは複雑になる可能性があります.

これが彼らの生活を破壊することを心配しているコマーシャルアーティストにあなたは何と言いますか? ある時点で、コンセプト アート、プロダクション デザイン、背景などの作品を制作するためにアート ディレクターがイラストレーターを雇うのはなぜでしょうか。

まだまだ大変な作業です。 「私を背景にしてください」というだけではありません。 それは XNUMX 分の XNUMX の仕事かもしれませんが、マネージャーがやろうとしているよりもはるかに多くの仕事です。

これにはXNUMXつの方法があると思います。 XNUMX つの方法は、人々が消費するのと同じレベルのコンテンツをより低価格で提供しようとすることですよね? もう XNUMX つの方法は、私たちがすでに支払っても構わないと思っている価格で、はるかに優れたコンテンツを構築することです。 ほとんどの人は、すでにお金を使っていて、非常に優れたコンテンツと安価なコンテンツのどちらかを選択できる場合、実際には非常に優れたコンテンツを選択します。 市場は、人々が喜んで支払う価格をすでに確立しています。

アーティストを切り捨てようとする人もいると思います。 彼らは同様のものを低コストで作ろうとしますが、市場では失敗すると思います. 市場はより高品質で、より創造的で、はるかに洗練された多様で深いコンテンツに向かっていくと思います。 そして、実際にアーティストのようにツールを使用し、そのためにツールを使用できる人が勝者です。

これらのテクノロジーは、実際に、視覚媒体においてより深い認識とリテラシーを生み出します。 実際に需要があり、そのレベルで制作する能力を上回り、実際にアーティストの給与を上げることになるかもしれません。 奇妙かもしれませんが、それが起こることです。 品質と多様性の両方に対する需要の増加のペースは、いくつかの素晴らしい予期しないプロジェクトの作成につながります。

芸術学校を卒業した世代の学生の多くは多額の借金を抱えており、エンターテイメント制作、ビデオゲーム制作、コマーシャル アートなどの比較的高給の仕事に頼っていました。 AI テキストから画像へのプラットフォームの出現は、彼らの将来にどのような影響を与えますか?

コストを削減しようとする人もいれば、野心を広げようとする人もいると思います。 野心を広げようとする人は今でも同じ給料を払っていると思いますし、コストを削減しようとする人は失敗すると思います。

AI は通常、コール センターや空港での手荷物検査など、人々があまりやりたがらないような仕事に大規模に使用されます。 そして価値命題は、人々がよりやりがいのある、より興味深い種類の仕事に就けるようになるということです。 しかし、アートの仕事はやりがいがあり、興味深いものです。 人々は一生働き、この種の仕事を得るためにスキルを磨きます。 経済のそのレベルで、このテクノロジーを、あなたが行っていることの一種のビジネスの焦点と優先事項として指摘するのはなぜですか?

個人的には、そうではありません。 私の作品はプロのアーティスト向けに作られたものではありません。 彼らがそれを使いたいなら、それは素晴らしいことです。 私の作品は、香港にこの女性がいて、私のところに来て、「香港であなたの両親があなたに望んでいないことのXNUMXつはアーティストになることです.今は銀行員です。 私は立派な銀行員生活を送っています。 しかし、ミッドジャーニーのおかげで、自分が本当になりたかった自分になるというこの経験を実際に味わい始めています。」 または、楽しみのために、野生のイメージで自分のベースボール カードを作っているトラック ストップの男。 ほとんどの人と同じように、彼らはこれらのことをすることができないので、それはそれらの人々のために作られています.

これはアートに関するものではないことを強調しておくことが重要です。 これは想像力についてです。 想像力は芸術に使われることもありますが、そうでないこともよくあります。 Midjourney で作成された画像のほとんどは、専門的に使用されていません。 それらは共有されていません。 それらは、これらの他の目的、これらの非常に人間的なニーズに使用されているだけです.

それにもかかわらず、あなたの製品のアウトプットは画像であり、他のすべての特性に加えて、専門的な文脈で商業的価値があります. そして、これはその経済にとって非常に破壊的です。

私たちがボートを作っているようなものだと思います。誰かがそのボートでレースをすることはできますが、それはボートがレースに関するものであるという意味ではありません。 レースにボートを使用する場合は、そうかもしれません。 その瞬間です。 しかし、人間的な側面は本当に重要であり、私たちはそうではないと思います… 私たちは写真をきれいに見せたいと思っています. 私たちは自分たちのことの一部としてアートを作ろうとしているとは考えていません。 私たちは世界をもっと想像力豊かにしたいと考えています。 私たちは醜いものより美しいものを作りたいと思っています。

政府機関がこの技術を規制する管轄権または権限を持っていると思いますか? もしそうなら、そうすべきだと思いますか?

知らない。 レギュレーションが面白い。 何かをする自由と守られる自由のバランスを取る必要があります。 技術自体は問題ではありません。 水のようです。 水は危険で、溺れる可能性があります。 しかし、それは不可欠でもあります。 危険な部分を避けるためだけに水を禁止したくはありません。

ええと、私たちは水がきれいであることを確認したいのです。

はい、本当です。

ソース: https://www.forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder-david-holz-on-the-impact-of-ai-on-art-imagination-and-the-クリエイティブ・エコノミー/