記事を探す

2022.10.13 ITトレンド全般 InfoCom T&S World Trend Report

画像生成AIは人間の能力を超えるか？

三本松憲生 (株)情報通信総合研究所ビジネス・法制度研究部主任研究員

この記事をシェアする

はじめに

今年に入って、いくつかのキーワードを与えると、まるで絵画の大家が描いたような画像を自動で作成してくれる人工知能（以下、「AI」）を活用したサービスに注目が集まっている。本稿では、あたかも人間が描いたかのような絵を瞬時に生成するAIにはどのようなものがあり、現時点ではどのようなことができるのか、また社会に与えるインパクトとしてはどのようなことが考えられそうかということについて紹介したい。

画像生成AIにはどのようなものがあるのか

AIによる画像生成サービスは多数あるが、筆者が代表的であると考えるものを表1にまとめた。以下ではこれらについて順に紹介する。言うまでもないが、これ以外にもAIによる画像生成サービスは複数提供されている。

【表1】AIによる画像生成サービス
（出典：各種ウェブサイトより情総研作成）

OpenAI^[1]はAIを研究する機関として2015年に設立された。当初は非営利団体として運営が行われていたが、現在では営利企業として活動を行っており、Microsoft等から出資を受けている。OpenAIが注目を集めたものの一つが、2019年2月のAIによる自然な文章の作成を可能にするGPT-2の公表だろう。2020年には学習データ量を増やしたGPT-3が公表されている。GPT-2は人間と同等の文章作成能力を有するとして、当初OpenAIは公開を限定的としていた。今回のDELL・EではGPT-3が画像生成に応用されているようだ。

Midjourney^[2]はテキストから画像を生成するAIの開発を行う独立の研究所である。Midjouneyのウェブサイトによればフルタイムのメンバーは11名と記載されており（9月11日現在）、少数精鋭で画像生成AIの開発、提供を行っていることがうかがえる。

同社のサービスを利用するためには、チャットサービスである「Discord」に登録する必要がある。Discordの登録が完了した後、Discordサーバーを通じて画像を生成することができるようになるというものだ。約25回分までは無料で利用が可能^[3]であり、さらに利用を望む場合は有料になり、コンシューマー向けには10ドル（200分/月）、30ドル（15時間/月）の料金プランが、法人向けには年額600ドル（120時間/年）の料金プランが提供されている^[4]。

Stability.ai^[5]は2022年8月22日に同社が開発した画像生成AI「Stable Diffusion」を公開した。利用者は無料で利用することが可能であるという点も大きな特徴の一つではあるが、オープンソースで提供されていることから注目を集めている。Stability.aiのウェブサイトを見るとトップページに「AI by the people, for the people」と記されており、AIの力を多くの人に届けようというメッセージが読み取れる。オープンソースで提供されていることから、現在Stable Diffusionを活用したサービスが生まれてきている。例えば、Stable Diffusion自体は英語での利用が基本となるが、日本語での利用が可能なサービスが誕生している^[6]。

上記の他にも同様のサービスを開発・提供している企業はいくつか存在する。その一つがGoogleで、同社はAIを利用した画像生成サービスの開発を行っている。Googleが開発を行っている画像生成AIは「Imagen」^[7]と呼称されるもので、現時点では一般向けには提供されていない。これはテキストから生成される画像が社会に対してネガティブな影響を与える可能性を懸念してのことだという。

実際に試すことができるサービスが多数あり、既にサービスを利用してみた読者もいるかと思うが、どのような画像が生成されるのか筆者も試してみた。

図1は上述のStable.aiが開発したStableDiffusionを使って筆者が生成させた画像である

富士山の前で走るランナーと英語で入力をしてみると、体感では5秒もしないうちに画像が生成された。

【図1】StableDiffusionによる生成画像
（出典：Dreamstudio Lite（https//beta.dreamstudio.ai/dream）を利用）

画像生成AIが注目されている理由としては、人間が考えるイメージを文章を通じて、AIに伝えることで画像が自動的に生成されることがあり、実際に生成させてみると、一種の感動を覚える。また、このような取り組みに多くの人が魅力を感じる理由はゲームにも似た感覚を覚えるからであろう。Midjourneyなどで非常に精細な画像を生成するためにはどのような言葉が必要なのか、それを呪文と呼んであたかも魔法のように楽しんでいる向きもあるようだ。

画像生成AIは人間を超えるか？

新たな機能を獲得したAIの登場については、人間を超えたかどうかという議論がつきものではないだろうか。しかし何を持ってして人間の能力を超えたというのかは難しいのではないか。画像生成AIを対象にこの問題についての事例を見てみると、2つの象徴的なトピックスを見つけることができる。

1つは、Midjourneyを利用して描かれた絵画がコンテストで優勝したというものだ^[8]。複数の報道記事を参照すると数百枚の絵画をMidjourneyで作成し、画像を調整し解像度を向上させたうえで、ベストなものを選びコンテストに臨んだようだ。そういった意味で完全に画像生成AIが作り出した内容ではないが、Midjourneyが生成した絵であることが報じられて大きな反響を生み出した。ニュースサイトに掲載されている絵を見ると非常に美しく、幻想的な絵画であることがわかる。これには自分で描いた絵画ではないといった批判や、Midjourneyは道具になっただけで描いたのは作者自身だといった意見など、賛否両論あるようだ。いずれにしても、上述のように人間の手で修正が加えられているため、これを持ってして人間の能力を超えたということは言えない。また、何を持ってして、人間の能力を超えたのかということは特に芸術分野では定義しづらいだろう。しかし、コンテストで1位になったということは非常に大きなインパクトを与えたことは間違いない。

一方で、画像生成AIもまだこれからという事例もある。筆者が本稿を執筆するために参照した記事では、「サーモンラン（鮭の遡上）」を画像生成AIに書かせようとしたところ、魚の鮭の形態ではなく、切り身の鮭が川を遡上するものが描かれたという^[9]。ジョークのつもりで生成したのか、真剣に生成しようとしたのかは不明ではあるし、利用する画像生成AIによっては上手く描かれるのではないかとも思うが、まだ画像生成AIは揺籃期にいるという判断もできそうだ。

画像生成AIが社会に与えるインパクトはどのようなものか

画像生成AI提供サービスは登場から間もないこともあって、ビジネスモデルや社会に対する影響は現時点では明らかではない。そのため、有識者やインターネットで見られる意見も多様で、一定の方向性があるわけではないと筆者は考えている。

どのような意見があるのか、筆者の関心に基づき、知り得る範囲で集約すると以下のようになる。

人間の仕事が奪われる
フェイクニュースに利用される
AIの民主化が進む

この3つについて、筆者の個人的な見解を以下に述べたい。

1つ目は、例えば画像生成AIが普及すればイラストレーター等の仕事を奪うというものだ。今回のテーマはAIによる画像生成であったが、こうしたAIによるコンテンツの生成については画像にとどまらず、文章、動画、音声といったものに既に範囲が広がりつつあり、またAI導入の当初より懸念されていた事項でもある。

上記で筆者はStable Diffusionで生成したイラストを掲載したが、筆者のような素人であっても一定程度の品質のイラストを瞬時に生成することができる。単純に考えれば、Stable Diffusionは誰にでも無料で利用できるので、イラストを描いて生計を立てている者にとっては自らの職業の存在意義を問われる大きな問題となるだろう。しかし、果たして本当にそうであろうか。

逆説的であるが、誰にでも利用できるが故に、イラストに独自色を出すこと、言い換えるならば、いかにも画像生成AIで作成したイラストではないようにすることや、クライアントの意見やコンセプトを受け取りイラストに正確に表現するということは現時点では簡単ではないだろう。したがって人間が介入する余地が大きく、そのような仕事はなくならないだろうし、創造性が求められる仕事と言えるだろう。

「イラストを描く」という作業の工程の面では変わってしまうかもしれないが、「クライアントからの要望を聞いてイラストを納品する」という視点で捉えれば、単純に人間の仕事を奪うといったことにはならないだろう。無論のこと、今後、独自性を有し、利用者の要望を汲み取るようなより洗練された画像を生成するAIが登場する可能性もないとはいえない。だが、その点については、現時点では不明確であり、推定の域を出ない。

2つ目はフェイクニュースなどに利用されてしまう可能性が高いということだ。Googleも自社で画像生成AIを開発しているが、フェイクニュースなどに利用されてしまい社会に混乱をもたらす可能性があるとして公開を差し控えているのは上述したとおりだ。

これまでにも、震災や災害の後に人々に混乱をもたらすようなフェイク画像がSNSなどを通じて拡散されてきたが、このような画像の生成がより簡単になってしまうことは想像に難くない。

こうしたことを防ぐためには、画像生成AIで生成されたものとわかるような技術的な仕組みや、法律・制度の整備も必要となるかもしれない。また、ウェブサイトに掲載される画像について、情報の真贋を見極めるようなリテラシーというものもより求められるようになるだろう。

3つ目はAIの民主化が進むという点だ。ここでいう「民主化」とは、一部の企業によって特定の技術が独占されず、誰もが利用できる様になるという意味で使用されている言葉である。画像生成AIに限らず、AIを開発、提供するためには開発を行う技術者やAIの学習に必要な大量のデータが必要不可欠であり、またこれまではそれを支える潤沢な資金も必要であった。そういった意味では、AIの開発はGAFAといった豊富な資金や画像などの各種データを保有する巨大企業の独占の場であったと言える。しかし、Stable Diffusionのようなフリーでオープンな画像生成AIが登場することにより、多くの人が無料、または安価な料金で画像生成技術を利用することが可能になる。

このような技術が広く普及すれば、独自のアイディアを持った企業、団体、個人が新しいビジネスやサービスを始めるハードルが一気に下がり、市場も拡大する可能性がある。無論のこと、利用のハードルが下がることによって、悪用されるリスクも広がることは言うまでもないが。

これら3点の他に筆者が興味深いと思った意見に画像検索がなくなるという意見がある。筆者も講演資料などを作成する際には、著作権上問題なく資料に掲載することが可能で、資料の内容に合致する画像を検索にて探し利用する、ということがある。こうした行為が今度は「検索」するのではなく「作成」するということに変化していく可能性がある。

まとめ

本稿では、画像生成AIの現時点での動向を簡単にまとめた。多くの人が指摘するように、画像生成AIの社会への導入・普及は、社会やビジネスに多くの影響を与えることになるだろう。もちろん、画像生成AIはあくまでもツールであるので、われわれがどのように利用していくのか、どう受け入れていくのかということにより、その影響はプラスにもマイナスにもなり得る。

そのような影響の波及が考えられる中で、具体的にどのような変化が社会に訪れるのかについては有識者から様々な意見が出ており、将来的な見通しは不透明だ。しかし、不透明であるからこそ、社会が大きく変化する可能性を秘めていると筆者は考えており、引き続き動向を見守りたい。

[1] https://openai.com

[2] https://www.midjourney.com/home/

[3] 厳密には25分無料で利用する時間が与えられる。もし1枚1分程度で生成させた場合は25回分の無料分が提供されていることになるという計算。

[4] https://midjourney.gitbook.io/docs/billing

[5] https://stability.ai

[6] https://www.itmedia.co.jp/news/articles/2209/ 09/news082.html

[7] https://imagen.research.google

[8] https://www.vice.com/en/article/bvmvqm/an-ai-generated-artwork-won-first-place-at-a-state-fair-fine-arts-competition-and-artists-are-pissed

[9] https://nlab.itmedia.co.jp/nl/articles/2209/09/ news064.html またはhttps://twitter.com/0Uy7d/ status/1565646265375162368?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1565646265375162368%7Ctwgr%5E9793a1a37446662ec085612af31c9e295e06e70f%7Ctwcon%5Es1_&ref_url=https%3A%2F%2Fnlab.itmedia.co.jp%2Fnl%2Farticles%2F2209%2F09%2Fnews064.html

※この記事は会員サービス「InfoCom T&S」より一部抜粋して公開しているものです。

情報通信総合研究所は、先端ICTに関する豊富な知見と課題解決力を活かし、次世代に求められる価値を協創していきます。

調査研究、委託調査等に関するご相談やICRのサービスに関するご質問などお気軽にお問い合わせください。

ICTに関わる調査研究のご依頼はこちら

三本松憲生(株)情報通信総合研究所
ビジネス・法制度研究部主任研究員

入社以来、海外のICT関連企業の動向に関心を持って調査しています。最近では、我々の社会課題を解決するようなスマートシティに関心を持って関連する技術やサービスについて調査を行っています。

講演・執筆のご依頼はこちら

この記事をシェアする