科学・環境

コンピュータはクイズ王になれるか？　　Googleの彼方をめざして

北野宏明

北野宏明　ソニーコンピュータサイエンス研究所代表取締役社長

2011年01月26日

　WATSONという名のコンピュータシステムを２月14～16日に米国で人気のクイズＴＶ番組“Jeopardy!”（「危険！」の意）に出演させ、クイズ王に挑戦させる、とIBMが発表した。

　誰かが代わりに質問を入力し、答えを出力させるのではない。人間の参加者と同じように、ステージに置かれたコンピュータが、マイクやカメラで司会者の声を聞いたり映像を見たりしながら回答する。早押しクイズなので、おそらくボタンを押すメカを備えているのか、電気的にボタンに接続されるかしているのだろう。事前のリハーサルでは、人間のチャンピオン２人（Brad RutterとKen Jennings）に僅差で勝っているとのことである。

棋士渡辺明竜王とコンピューターソフト「ボナンザ」との対局。このときは竜王が勝った＝2007年３月、東京都内のホテルで、村上耕司撮影

　このようなチャレンジが、企業の研究活動の一環として始まった背景が重要である。IBMのチームは、企業活動や研究開発などでウェブ上の情報を活用するのに、検索エンジンで単にキーワードを使って最初のページに提示される10～20のウェブサイトの情報をとり出すだけでは、十分な知識が得られないという問題意識をもっていた。そこで、幅広い問いに対して、より広範な情報を統合して即時に回答できるシステムを構築するという技術目標を定め、DeepQAというプロジェクトを発足させた。WATSONは、このプロジェクトの技術を用いて“Jeopardy!”に挑戦するためにつくられたシステムである。もちろんクイズ番組でチャンピオンになるということは、このような技術課題に対する問題設定としてわかりやすく、数年以内に達成可能であり、PR効果もあるとの判断もあってなされたものであると思う。

　IBMはDeepBlueというチェスマシンを開発し、1998年に人間の世界チャンピオンであるゲーリー・カスパロフに勝利している。DeepBlueの手法は、「計算、記憶、学習」の３要素を徹底的に突き詰めたものであった。つまり、過去の棋譜をすべて記録し、その中から勝利や敗戦へとつながる駒の動きを学びとり、実際の試合の局面でできるだけの先読みを可能とする計算能力を身につけるというものであった。

　これらの技術に対して、「やはり人間の思考方法とは違うのではないか」という議論がある。当然同じではない。しかし、チェスという局面に限って考えれば、一般に考えられているよりは、近いのではないかと思う。チェスや将棋のトップレベルのプレーヤーは過去の棋譜の多くに目を通し、記憶に留めている。先読みも、名人は重要な部分を非常に早く読むのであるが、これは、コンピュータも同様で、過去の棋譜にもとづく学習から重要な手筋に絞って先読みを行なっている。

　それでも人の脳の動きとは違うという議論もあるであろう。当然であるし、それが望ましいのである。われわれがコンピュータに望むのは、象徴的な意味で「人のような知能」をもち、われわれの生活や仕事を助けてくれる存在であり、人と同じような知能（同時に馬鹿さ加減も）をもつ存在ではないであろう。

　鳥を見て飛行機をつくる、という工学的な飛躍は、飛行の本質を推力と揚力にあると見抜いたところに本質があり、鳥のように羽ばたくことにこだわった挑戦者は失意のなかで歴史から消えていった。

　知能にかかわる研究も同様である。コンピュータチェスの研究の初期には、大量の計算をするだけでは実現不可能で、人間の専門家の知識や経験を何らかのかたちで導入する必要があると考えられていた。しかし、歴史は、それとは逆の道をたどる。人間の知識や経験をコンピュータに導入する試みは、ことごとく失敗し、最後の目標を達成したのは、大量記憶と大規模計算と徹底した学習アルゴリズムをもつシステムだったのである。

　今回のチャレンジは、クイズ番組でチャンピオンになるというもので、どのような問題が出題されるかは事前にはわからない。いくつかのジャンルがあるものの、そのカテゴリーの中では何が聞かれるかわからない。チェスが、ルールなどを明確に定義されていたのに比べると、よりオープンな領域でのチャレンジとなる。

　もう一つ特徴的なのは、このクイズ番組は、誰が回答できるか早押しで決まるということである。つまり、ゆっくり考えている暇はなく、他の参加者よりも早く、しかし正確に答える必要があるのだ。この番組で回答者がボタンを押すまでの時間は平均で３秒である。チェスの場合は、それぞれ持ち時間が与えられているので、その時間配分に気をつける必要はあるものの、回答の早さを競う必要はなかった。また、間違いに対するペナルティーがあるので、やみくもにボタンを早押しするわけにはいかない。システムが、自信のある答えを探せなかったと判断することも非常に重要なポイントとなる。

　IBMのチームは過去の番組の解析から、最強のチャンピオンであるKen Jenningsは62％の質問に答え（つまり、一番早くボタンを押し）、その92％を正解していることを知った。つまり、幅広い質問に３秒以内に９割以上の正解率で答えるということである。WATSONの開発では、これが一つのベンチマークとなったと思われる。

　さらに、このクイズでは、掛け金を積み増しする局面がある。実は勝者は、最も多く正解した者ではなく、最も多く賞金を得た者である。よって、ここ一番のところで掛け金を積み増したり全てを掛けたりして、勝負をつけにいくという戦略の計算も必要になる。チェスに比べると、かなりわれわれの日常生活に必要とされる能力に近くなっている。

　WATSONの技術的な特徴は、多様な検索や知識抽出、解析の手法を使い、さまざまな仮説をつくりだし、それらを最終的に統合するという点にある。これは、非常に強力な一つのアルゴリズムを構築したチェスマシンであるDeepBlueとは対照的であり、むしろ四つの独立したシステムの答えから指し手を決めていくコンピュータ将棋のシステムに近い。

　全体の構成は、問題を理解する音声理解システム、画像解析システム、初期の仮説をつくる部分（数百の仮説が生成される）、仮説を絞り込む部分（百前後まで絞られる）、それぞれの仮説の証拠を見つけだす部分、最終回答の決定部分、回答の信頼度の評価部分、さらにこれらの背後に数千万件の情報（多くは構造化されていないままの文章など）を蓄積した巨大なデータベース、そして賭け金の積み増しなどする戦略部分など、多くのモジュールの集積になっている。

　これらの処理を平均３秒以内で完結するために、大型冷蔵庫10台分程度の大きさの大規模並列コンピュータを用いているらしい（技術的な詳細は限られた情報しか発表されていない）。とくに際だっているのは、仮説の生成に数百の違う手法を同時並行で実行している点にある。これは、従来の良く練り上げられた一つの手法を実行するアプローチとはまったく逆の方向である。

　このプロジェクトの意味するところは、日常的な問いに適切に答える能力は、「柔軟な思考（多くの仮説を作る能力）」「事実に基づく検証（仮説の深い知識での検証）」「客観的な評価能力（回答の信頼度の適切な評価と戦略評価）」によって達成されるということにあると思われる。この仮説、検証、評価という３点そのものは、目新しいことではない。しかし、これを極めて多様な方法を大規模並列処理で実現すると、クイズチャンピオン並みの能力を備えるシステムを構築できるということは新たな発見であり、「思考の多様性」ということがいかに重要かを示しているように思われる。そして、単なるインターネット検索以上の能力を提供する汎用性のあるシステムづくりが可能であると実証することになる。

　このようなチャレンジがあると、必ず「コンピュータ対人間」という図式の議論が行われる。しかし、これはまったく不毛かつ的外れな議論である。DeepBlue開発チームの中心人物は、「これは、一人の天才の能力を、多くの優秀なエンジニアの長年にわたる努力で凌駕することができるかという挑戦であり、いずれにしても勝者は人間である」という名言を残している。コンピュータを恐れることはない、それはある意味で我々自身の進歩の象徴である。WATSON君の健闘を祈ろうではないか。

・・・ログインして読む

コンピュータはクイズ王になれるか？ Googleの彼方をめざして

コンピュータはクイズ王になれるか？　　Googleの彼方をめざして