メインメニューをとばして、このページの本文エリアへ

スパコン「京」が1位を取り続けるランキングとは

多様化するAI時代のスパコン戦略(3)

伊藤智義 千葉大学大学院工学研究院教授

「京」が9期連続、通算10期も1位

 スパコンランキングTop500で20位に後退した「京」コンピューターだが、別のスパコンランキングであるGraph500では9期連続(通算10期)で1位を獲得した。これだけの期間、トップの座についていることは歴史的な偉業である。関係者の努力を称賛したい。

理化学研究所のスーパーコンピューター「京」
 ただ、Graph500というランキングをどう評価するかは難しい問題である。ランキング表を精査するほど、わからなくなってくる。本稿では、筆者自身の困惑ぶり(?)をご紹介したい。

 スパコンランキングは2009年までTop500しかなかった。科学計算でよく使われる密行列計算の速さで競われる。解くべき方程式がぎっしり詰まっているような計算である。具体的にはLINPACKと呼ばれる数値ライブラリを使った演算性能で評価される。

 しかし、LINPACKでの計算がいくら速くても実際の問題を解くのは遅いということはあり得る。さらには、LINPACKの計算だけが速くなるようにシステムを作れば、上位にランキングされることになる。そのため、一つの指標でスパコンの性能を評価するのは間違っているのではないか、という批判が常につきまとった。そして、2010年から始まったのがグラフ解析を指標とするGraph500である。

グラフとは何か?

 近年、インターネットが爆発的に普及し、ビッグデータの解析が社会的に重要になってきている。身近な例としては、ネット検索をしているとさりげなく現れる広告がある。普段の使い方からその人の嗜好を解析して興味のありそうな広告を紐付けるのである。膨大な情報が様々な形で解析され、いろいろなところで利用されている。その良し悪しは別の機会で議論するとして、ビッグデータの解析は年々盛んになってきている。

 その解析の基本は、データの関連性を調べることである。そのため、各データを頂点(ノード)とし、ノード間を辺(エッジ)でつなぐ。これがグラフである。交通網やWebの通信網を想像してもらうとわかりやすいかもしれない。渋滞を抜ける道筋が瞬時にわかれば便利である。

 こうした「一番早く着ける道筋」のような「最適な解」を探す課題は「最適化問題」と呼ばれる。ところが、最適化問題は計算負荷が非常に大きく、解くことが困難であることが知られている。

A〜Eの5都市の巡回セールスマン問題
 例えば、巡回セールスマン問題というものがある。セールスマンがいろいろな都市を回っていくときのもっとも有利な経路を調べる問題である。2都市AとBだけなら、A→BとB→Aの2通りを調べればよい。これが3都市だと6通りになり、4都市だと24通りになる。N都市だと、N×(N-1)×…×1(=N!)通りである。これは都市が増えるにつれて場合の数が急激に増えることを示している。10都市ですでに360万通りを超え、都市数が大きくなるとまともに扱うことが困難になる。

 様々な解法が体系化されているが、解が求まる問題もあれば、厳密解は求まらず、近い解を求めていく場合もある。

グラフ解析ではソフトウエアの性能が重要

 Graph500は、このようなグラフ解析の性能を競うランキングである。計算負荷が大きいことはスパコンに向いていそうである。社会実装の期待も大きい。

 計算技術のうえで重要なのは、

・・・ログインして読む
(残り:約1420文字/本文:約2822文字)