AIと報道(下)ビジネスとジャーナリズムの両立
アルゴリズムを使って社会の分断を何とか解消しようという試みも
松本一弥 朝日新聞夕刊企画編集長、Journalist
人工知能を用いたニュース原稿の自動生成に関する実験――NTT
NTTデータは2017年1月、人工知能を用いて、アナウンサーが読み上げる気象ニュース原稿を、気象電文から自動生成する実証実験を4カ月にわたって実施したと発表した。
発表資料によると、「本実証実験では、難易度が高い文書自動生成に挑戦し、自動生成された原稿の品質が実用に耐えるかの検証を行った」と指摘。具体的には、気象庁が過去に公開した気象電文と、過去にアナウンサーが読んだ気象ニュース原稿をセットにして学習する仕組みを構築し、過去4年分の気象電文から気象ニュース原稿を生成する規則を学習したという。
そうして出来上がった原稿を評価した結果、「日本語の文法は人が読んでも違和感の無いレベルで、意味の正しさにおいては多少の修正が必要なものの、概(おおむ)ね気象電文と同じ内容の文書を作成できることを確認」したとしている。
その後、現在は記事ではなく映像データに着目し、「映像に写っている人物や音声、テロップにフォーカスし、映像をAIに解析させて自動的にタグ情報をつけることで、映像の再利用の促進、編集作業の効率化、ダイジェスト自動生成を行う」ことに取り組んでいるという。
自動校正システム、高校野球戦評自動生成システムーー朝日新聞
朝日新聞社は2017年9月、社内組織であるメディアラボの自然言語処理チームがAIを利用した自動校正システムを開発、このシステムの基礎部分にあたる発明について特許を出願したことを明らかにした。「本システムでは、人工知能が文中の各単語をチェックし、文意を読み取ったうえで、必要かつ最適な置き換え候補を出力することができる」とした上で、「カギを握るのが、朝日新聞社が日々の新聞編集で蓄積してきた、ベテラン記者によるデスク作業(文章を整える仕事)における校閲履歴。記事化に要した実際の校正内容を大量に人工知能に読み込ませ、パターンを機械学習させることで、新しい文についても、単語単位なら複数の書き換え候補が考えられる場合にも文脈に応じて最適候補を絞り込むことが可能になった」とした。
また、株式会社ミンカブ・ジ・インフォノイドと共同開発した「高校野球戦評自動生成システム」では、スコアブックを読み込んで勝敗を分けたポイントを読み解く戦評記事を素早く書くAI記者「おーとりぃ」が登場。「過去にスポーツ面や地域面に載った約8万の高校野球の戦評記事と、スコアデータを組み合わせたデータを用いて『このゲーム展開になったらこういう戦評になることが多い』という傾向を分析。テンプレートを作成し、エキスパートシステムを用いて記事を生成」すると説明した。
さらに「自動要約・見出し生成研究」では、「過去30年分の見出しと本文の組み合わせをディープラーニング(深層学習)技術で学習させることによる自動見出し生成の研究」に取り組み中だ。「人間がつける見出しに比べて遜色ないレベルを目指して」いるとしている。配信先のメディアのレイアウトや雰囲気に合うよう、様々な文字数の見出しを生成できるのが特徴だという。