経済・雇用

ポエムなAIに騙されるな

AI時代の日本の勝ち残り戦略とは

栄藤稔　大阪大学先導的学際研究機構教授、みらい翻訳社長、コトバデザイン社長

2017年10月18日

　大学の教員をやりながら、自動翻訳の会社、みらい翻訳の社長を兼務している。人工知能（AI）を活用したコンピューターによる自動翻訳（機械翻訳）技術の飛躍的進化を肌で感じている毎日だ。

人工知能（AI）で人間と自然な会話ができるアンドロイド「エリカ」＝仙波理撮影

　特に、昨年9月に登場した米国グーグル社が世界に先駆けて商用化したAI技術の一種、深層学習による「ニューラル機械翻訳」の性能向上は衝撃的だった。その機械翻訳技術は、その実装の難しさから実用化はまだ2019年頃と思っていたが、彼らは大量のデータと高速学習技術により実現できることを証明してくれた。みらい翻訳も、急遽、従来技術の開発を捨て、ニューラル機械翻訳の開発に取り組み、今年の6月、その商用化の目処をつけたところだ。

「グーグルに勝てるの？」

　機械翻訳の性能は、5点満点の主観評価で表現することが多い。5点は翻訳者と同じ、4点は手直しが必要だが十分使える、3点は表現に難があるが意味が通じる、2点は意味が通じなくもない、1点は意味不明――といった具合だが、1年前の機械翻訳の性能は3点と4点の間だった。ニューラル機械翻訳の性能は4点と5点の間だ。つまり、直訳なら十分、実用に使えるレベルに来てしまった。音声認識がそうだったように、あるしきい値を技術性能が超えた時、業界の構造を変えるようなイノベーションが起こると確信している。

　「あなたの会社の翻訳エンジンはグーグルの翻訳エンジンに勝てるの？」。みらい翻訳の社長としてよく受ける質問だ。私の答えは、「データがあるところで勝ち、ないところで負けます」だ。

　このニューラル機械翻訳の性能を出すには、同じ意味を持つ二つの言語の対訳文章が数百万から数億必要となる。それらがあればコンピュータは翻訳者に匹敵する性能を出してくれる。医療や農業の現場、金融商品を扱う会議、観光案内の施設で話す言葉には専門性がある。そのようなデータを利活用できるところに勝機がある。

意味は理解していない

　機械翻訳に限らず、現代のAIはどのレベルにあるのか？

　現代のAIの画像認識能力は人間を超えた。双子の区別もほぼ間違えないし、個人の顔画像を数百万人の顔画像データベースから1秒以内に特定することができる。英作文能力なら、TOEIC900点の人よりも上だ。

　ただ、だからと言って、東大入試で合格できるわけではない。また、人間のような意思と常識を持ち合わせてはいないし、情景から構造を把握する空間認識能力もない。

　哲学者ジョン・サールは、1980年に「中国語の部屋」という思考実験を提唱した。ある小部屋の中にアルファベットしか理解できない人を閉じ込めておく。例えばイギリス人だとする。小部屋の外から、中国語で書いた文章の紙切れを差し入れる。中のイギリス人は、中国語が全く理解できない。しかし、彼にはマニュアルが渡されている。そのマニュアルには例えば「『你好吗？（ご機嫌いかが？）』と書いてあれば、『我很好（元気です）』と書いて返す」と指示されており、想定される中国語の応答が網羅的に書かれている。イギリス人は、その巨大なマニュアルを引いて、指示通りに中国語を返す。そうすると中のイギリス人は中国語の意味を全く理解していないのに、外からはその部屋の住人が中国語を理解しているように見える。

　現代のAIは、残念ながら、サールの中国語の部屋と同じレベルだ。意味は理解していないが、ちゃんと正しいマニュアルがあれば、期待した性能が得られる。このマニュアルをデータから効率的に作る技術が21世紀になり大きく進歩したことが今のAI応用に貢献している。

　「鉄腕アトム」を例に改めて述べるが、AIを擬人化して捉えると本質を見誤る。AIはデジタル変革の実現に必須の最適化技術として捉えるべきだ。それにより企業や個人間の連携による産業全体の最適化や、様々なシステムの自動化が実現されようとしており、第4次産業革命と呼ばれている。

アトムとコバルト、どちらが偉い？

　AIの性能はなんで決まるのか？　まずは、アルゴリズム（計算方式）とデータだと答えておこう。

　今、深層学習と呼ばれるアルゴリズムの進化は著しい。トロント大学のジェフェリー・ヒントン博士を始め多くのパターン認識・機械学習の研究者が、数十年も諦めずに研究を続けた結果が、今に繋がっている。この分野への研究投資は今後とも重要だろう。

　AI の研究成果は多くの研究者がグローバルに協働して改良を重ねることによって生まれている。したがって、ある応用で成功を納めたアルゴリズムは、ソフトウェアで出来ていることもあって、急速に広がっていく。AIは技術のコモディティ化（陳腐化）が早い分野なのだ。

　手塚治虫が1952年から連載を始めたSF漫画の「鉄腕アトム」は、良い人と悪い人の見分けができて、当時の国連加盟国60ヶ国語を話す。電子頭脳の容量は1.7テラバイトしかないのに、すごい。

　それはさておき、アトムには、製作者の異なる同型機「コバルト」がいる。急遽作られたため、少々性能が悪いとされるが、2003年4月7日生まれのアトムもコバルトも同じレベルのアルゴリズムで動いているはずだ。

　日本の経営者の多くは、鉄腕アトムを連れて来ればAI が実現すると考えている。これを私の仲間内では、「ポエム」と呼んでいる。何しろアトムは善悪の判断ができ、60ヶ国語を話すのだ。アトムさえ来れば、その会社の電話や電子メールの自動応答、製造現場の生産性向上、議事録自動生成ができ、英語が話せる秘書業務も受付もやってくれると信じている。

　だが、そんなポエムなAIはこの世にまだない。

　まずアトムが来たら、その会社の情報システムに連結して、経理文書、契約書、過去の議事録、対訳のある多言語文書を読破して、勉強してもらうことが必要になる。ただ注意すべきなのは、性能では劣るコバルトにも、同じ勉強ができるということだ。ここで言うコバルトとは、現状のAIのことだ。カギになるのは自社が保有する「データ」の活用であって、まだ見ぬアトムではない。そして、きちんと勉強したコバルトのほうが、怠けたアトムよりも、その会社では成績が良いはずなのだ。そのことにもっと気づいて欲しい。

　「アトムとコバルトでは、どちらが偉い？」という質問を2017年にするのは、もうやめたい。その会社に来て勉強した方が偉いのだ。勉強のためには「データ」が必要。自社にデータがあり、それがAIと連結できるシステムとなっているかが、勝負の分かれ目だ。経営者には、そのことを理解して欲しい。

・・・ログインして読む
（残り：約1418文字／本文：約4113文字）