2019年08月12日

AIはプライバシーを破壊する

個人情報を匿名化すればプライバシーは保護される、と言われてきましたがそれは幻想となりそうです。
ビッグデータなどで活用される匿名化された大量のデータの安全性に疑問を投げかける研究結果が、海外で発表された。プライバシー保護のために匿名化されていても、複数の断片的な情報を手がかりに高い確率で個人が特定されるというのだ』朝日新聞が報じました。、
イギリスとベルギーの大学の共同研究チームによると、『研究には匿名化して公開されている米国勢調査局のデータの属性情報を使った。生年月日、性別、郵便番号だけでは特定は困難だが、人種や市民権の状態、学歴などを組み合わせていくと特定の度合いは高くなった。さらに車の所有状況や住宅ローンの状態を含む計15の属性情報を使うと、マサチューセッツ州の全住民(約700万人)の99・98%について、こうした情報が特定の1人のものだと絞り込めた。人口が少ない場合はより簡単で、情報に不備がある不完全なデータでも特定できた』としています。
「匿名化」には限界があるといえます。

ビッグデータ、匿名化でも高確率で個人特定 海外で指摘

朝日新聞 2019年8月11日 
https://digital.asahi.com/articles/ASM8B213KM8BULBJ001.html?iref=comtop_8_03
ビッグデータなどで活用される匿名化された大量のデータの安全性に疑問を投げかける研究結果が、海外で発表された。プライバシー保護のために匿名化されていても、複数の断片的な情報を手がかりに高い確率で個人が特定されるというのだ。

 研究結果は英国とベルギーの研究チームが先月下旬、英科学誌ネイチャー・コミュニケーションズに発表した。

 ビッグデータはマーケティングなど幅広い分野で活用されつつあり、企業など第三者に提供・販売されている。その元となる個々のデータは、提供前に氏名、住所などを削除し、クレジットカードの購買履歴、鉄道の乗降履歴などから個人の特定につながる部分はあいまいにするなど、匿名化が行われる。

 しかし、現在の各国・地域の基準に基づいて匿名化しても、個人が特定されるのではという問題意識から、英インペリアルカレッジ・ロンドンと、ベルギーのルーバン・カトリック大の研究チームは、統計学などの計算手法を駆使して、その可能性を調べた。

 研究には匿名化して公開されている米国勢調査局のデータの属性情報を使った。生年月日、性別、郵便番号だけでは特定は困難だが、人種や市民権の状態、学歴などを組み合わせていくと特定の度合いは高くなった。さらに車の所有状況や住宅ローンの状態を含む計15の属性情報を使うと、マサチューセッツ州の全住民(約700万人)の99・98%について、こうした情報が特定の1人のものだと絞り込めた。人口が少ない場合はより簡単で、情報に不備がある不完全なデータでも特定できた。

 チームは欧州連合(EU)の一般データ保護規則(GDPR)などが求める現在の匿名化に疑問を投げかけ、「国や地域のデータ保護当局はこうした新たな脅威への対処が欠かせない」と主張している。

 日本では2017年に施行された改正個人情報保護法により、匿名化された「匿名加工情報」の第三者提供ができるようになった。事業者などが購入したデータをもとに、今回の研究と同様の絞り込みで個人を特定できる可能性はある。ただ、匿名の個人を特定する目的で、別に入手したデータと突き合わせることなどは禁じられている。

 論文はサイト(https://nature.com/articles/s41467-019-10933-3別ウインドウで開きます)で読める。(勝田敏彦)
ラベル:統計 ネット
posted by ichi3 at 00:22| 東京 ☀| Comment(0) | 日記 | このブログの読者になる | 更新情報をチェックする

2019年08月11日のつぶやき






posted by ichi3 at 00:01| 東京 ☀| Comment(0) | 日記 | このブログの読者になる | 更新情報をチェックする