AIで思い通りの画像を生み出す
AIが自動でコンテンツ(画像や映像、音声など)を生成する。しかも実在の人物や景色などをそっくり真似ることもできる――そんなニュースは毎日のように流れてきて、もはや驚きではないという人も多いのではないだろうか。この論座でも、「実在するかのような人間の顔写真をAIで生み出し、それをプロフィールにしたSNSアカウントでロシア寄りの発言をさせる」という事例や、「AIを使って映像を生成し、オバマ元大統領に言っていないことを言わせる」などの事例を紹介してきた。
こうしたケースで主にAIが生み出してきたのは、(実在もしくは架空の)人間の顔や音声といったコンテンツだった。しかし当然の話だが、AIが生成できるテーマは人間だけではない。AIの開発方法次第で、どんなコンテンツでも簡単につくり出すことが可能な時代が到来しつつある。
たとえば米Googleは任意のテキスト(何らかの光景を描写するような文章)を与えると、そのテキストぴったりの画像を自動生成するAI「Imagen」を開発している。
実際の例を見てみよう。下の画像は、Googleがサンプルとして提供しているものだ。テキストは「タイムズスクエアで自転車に乗っているコーギー犬の写真。その犬はサングラスをかけてビーチハットをかぶっている」という意味の英文である。そしてその通りの画像を、AIは生成している。

与えられた任意のテキストぴったりの画像を自動生成する米GoogleのAI「Imagen」
念のために言うが、この犬の画像は人間が制作したCGではない。コーギー犬やタイムズスクエアの画像を素材として与えたわけでもない。与えられたテキストのみから、AIが自動で生成したのである(そうしたAIを開発するには大量の画像データが「学習」用に与えられているので、その意味では参考になる画像を既に手にしていると表現できるかもしれないが)。
実はこうした「テキストから画像を生成するAI」はさまざまな企業が開発に取り組んでおり、GoogleはImagenがその中でも高い性能を実現していると自負している。それが正しい評価かどうかは専門家の意見を待つしかないが、優れた技術力を持つ企業が切磋琢磨することによって、AIの性能は急速に向上しているのである。