メインメニューをとばして、このページの本文エリアへ

オープンデータと新たなプライバシー問題

まったく関係のない第三者を傷つけてしまいかねない諸刃の剣

小林啓倫 日立コンサルティング 経営コンサルタント

 9世紀から10世紀にかけて、現在のイランにあたる地域では、綿花栽培が一大産業として成立しており、北東部の都市ニーシャープールでは、綿花産業に携わる人は4割にまで達したそうである。

 といっても、現在の国勢調査のような記録が残っているわけではない。日本でいえば「糸屋」といった具合に、住民の名字に関する記録から、その人物の職業を推測することができるのだ。

 このようにデータは、加工されることで新たな情報を生み出すという性質を持つ。名字から職業を割り出すという程度であれば、誰でも思いつくことができるだろう。

 そしてそれを望まない人物は、公開を拒否することができる。しかし時には、予想外の形で隠されていた情報が明らかになる場合がある。

タクシーの稼働データからドライバーの宗教を推測

 2014年にクリス・ウォンという人物が、ニューヨーク州の情報自由法(FOIL)に基づいて、ニューヨーク市のタクシー・リムジン委員会からタクシーの走行データを入手した。

 得られたデータは、13年の1年間に行われた1億7300万回のタクシー利用に関するもので、いつどこで客が乗車し、下車したか、また料金はいくらだったかといった情報が含まれている。ファイル容量は合計で約20ギガバイトに達したが、ウォンはこのデータを自らのウェブサイト上でも公開した。

 こうしてネット上で共有されるようになったデータは、個人情報保護の観点から匿名化が施され、タクシーの識別番号といった情報は含まれていなかった。

 しかしこのデータを見たノア・ディノウという人物が、そこに隠された情報を引き出すことを思いつく。その情報とは、ドライバーの宗教は何か、特に「イスラム教徒か否か」である。

 イスラム教の戒律では、

・・・ログインして読む
(残り:約1439文字/本文:約2176文字)