メインメニューをとばして、このページの本文エリアへ

新型コロナのデータ整備をできずしてデジタル庁を語るなかれ

新型コロナ「第3波」の日本で科学的感染拡大防止を実現するために必要なことは

大濱﨑卓真 選挙コンサルタント

 コロナ第3波が日本を襲っています。緊急事態宣言の発令によって押さえ込んだ春の第1波や、夏休みなどによって押さえ込んだと言われている第2波と異なり、気温が下がり、空気が乾燥する冬場の第3波をどう収束させるか、先行きは不透明です。

 私が代表を務めるジャッグジャパン株式会社では、今年2月から、新型コロナウイルス感染症の広がりを視覚的に確認できる「都道府県別新型コロナウイルス感染者数マップ」を公開しています。厚労省や各自治体の発表する資料をもとに収集した感染者情報個票データベースは、すでに累計10万人を超える巨大データセットとして、内閣官房新型コロナウイルス感染症対策推進室「COVID-19 AI・シミュレーションプロジェクト」に登録されているほか、国立大学をはじめ、学術機関、研究機関、民間企業などの研究に幅広く活用していただき、地理情報システム学会の学会賞を受賞することができました。

都道府県別新型コロナウイルス感染者数マップ

いまだに遅れているコロナに関する情報公開

 当社のデータが活用されている理由の一つに、我が国の感染者情報データベースが研究者などに提供されていないという実態があります。詳しくは後段で解説しますが、正確に言えば、「完全網羅的な感染者情報データベースが存在しない」状態とも言えます。

 欧米をはじめ世界各国で感染爆発が起きているなか、コロナに関連する論文が、日本は諸外国に比べて少ないと言われているのも、このデータベース整備の問題があると指摘されています。菅義偉内閣は発足早々「デジタル庁」の創設を掲げ、はんこの廃止や電子手続きの推進など、デジタルを活用する政策を打ち出していますが、現在進行形で進むこの大きな課題にも相対して取り組まない限り、科学的なコロナ感染拡大防止政策の実現は困難を極めると思います。

 コロナに関する情報公開の課題をめぐっては、論座でも早い時期に「新型コロナをめぐる日本の情報発信は“ガラパゴス”」(2020年02月23日「公開」)と題して寄稿しました。記事で提言した可視化された情報の提供は、内閣官房などの取り組みによってある程度実現したものの、オープンデータやデータリンクを意識した情報公開はいまだに遅れています。

 コロナにあけくれた2020年の年末が間近に迫るなか、9カ月にわたってデータの収集・公開をしてきた立場から、この課題の現状を考えてみます。

自治体ごとにまちまちな症例データの開示

 新型コロナと人類のたたかいが、長期に及ぶことは間違いありません。そこで対応する際に大切になるのが持続性です。

 ところが日本では、コロナに関するデータ収集・公開というプロセスにおいて、この持続性という観点が、感染拡大当初、厚生労働省に欠けていたと思います。厚労省ははじめ、国内の新型コロナ全症例に「通し番号」をつけ、同省のホームページで公開していました。しかし、輸入事案から国内発生事案へとコロナ感染の割合がシフトし、国立衛生研究所から地方の衛生研究所に検査がシフトした段階、国内感染者数で言えば1000人に満たない段階で、早々とこの形の公表形式を止めてしまったのです。

 それ以降、厚労省は自治体が公表する発生事案を、報道発表をベースに取りまとめて公表していますが、あくまで件数のみの発表であり、性別、年齢、確定日・発症日、重症度、リンク先といった個票のデータは、今も各自治体のホームページを閲覧するほかありません。

 各自治体の報道発表での症例データ開示の仕方は、項目や方法、時間などがまちまちです。保健所が設置された自治体ベースでの発表となりますから、例えば神奈川県の場合、神奈川県、横浜市、川崎市、相模原市、藤沢市、茅ヶ崎市、横須賀市の7地方自治体にわたり、しかも自治体ごとにフォーマットや項目構成が異なるのです。

 年代ひとつとっても、個人を特定されないための秘匿化の基準が異なるので、「未就学児」と「10歳未満」、「100歳代」と「90歳以上」といったように、表記のゆれが見られます。「2000個問題」(注)に象徴される個人情報の取り扱いの違い、感染症法の解釈に対する自治体のゆれが、全国網羅的なデータ整備を阻害している現状は、今もほとんど変わりません。

〈注〉日本の個人情報保護は、民間を対象とした個人情報保護法、国の公的部門を対象とする「行政機関の保有する個人情報の保護に関する法律」(行政機関個人情報保護法)と「独立行政法人等の保有する個人情報の保護に関する法律」(独立行政法人等個人情報保護法)、更には自治体がそれぞれ制定した個人情報保護に関する「個人情報保護条例」など、2000個近い法律と条例によって構成されている。それぞれの法律や条例は個人情報の定義や解釈なども違いがあり、それが個人情報の利活用や自治体間の連携などを阻害する要因になっていることを指して「2000個問題」という。(コトバンク参照

不完全なデータベースシステム

 そもそも、報道発表資料をもとにしているから自治体ごとのゆらぎはしょうがない、という指摘もあります。皆さんは「疫学の専門家や政府の関係者は、感染者情報のデータベースにアクセスできるので、問題ないだろう」と思うかもしれません。

 しかしながら、厚労省の「新型コロナウイルス感染者等情報把握・管理支援システム」(HER-SYS)に代表されるデータベースシステムは不完全で、完全かつ網羅的なデータが揃っている状況とはとても言えません。

 “8割おじさん”として有名になった西浦博教授もインタビューで、「あちこちの行政のウェブサイトや論文から集めて自分たちでデータベースを作っています。(中略)私の研究室では大学院生が輪番で世界中のデータを集めていました。」と答えているように、我が国のコロナ対策をリードする疫学専門家も、実際は同様の作業をしている状況なのです。

・・・ログインして読む
(残り:約2323文字/本文:約4810文字)