日経メッセ > SECURITY SHOW > ニュース > 暗号のままデータ解析、NTTが秘密計算技術、情報流出のリスク減。

日経の紙面から

暗号のままデータ解析、NTTが秘密計算技術、情報流出のリスク減。

[ 2018年12月6日 / 日経産業新聞 ]

 自社のデータは公開したくないが、他社を含めてより多くのデータを集めて市場を分析したい――。そんな「虫の良い」ニーズを満たす技術をNTTが開発した。データを暗号化したまま「秘密計算」する。ビッグデータの重要性は広く認識されているが、プライバシーや機密保持などの観点からも思うようには利用が進んでいない。新技術は日本のデータ活用の新たな可能性を開く可能性がある。

 「計算の途中などでデータを盗まれることがありません」。NTTセキュアプラットフォーム研究所の五十嵐大研究主任は秘密計算の特徴をこう表現する。通常、暗号化されたデータを使って計算する場合、いったん暗号を解除して元データに戻してから計算する。その際にデータが流出するリスクがある。

詳細に市場分析

 これに対して、秘密計算は暗号化したデータをそのまま計算に使うため、仮にデータが流出しても暗号が解けなければ意味を持たない。例えば、競合する企業がお互いのデータの中身を開示しないまま持ち寄ることで、1社では難しい大量のデータによる市場分析などが可能になる。

 米国のグーグルやアマゾン・ドット・コムなどは、自社で手に入れた膨大なデータを生かして世界のビジネスをリードしようとしている。これに対して規模で劣る日本企業も連携して秘密計算を利用すれば、より精度の高いデータ分析が可能になる。

 五十嵐氏は「データの内容が競合を含めた外部に漏れる心配が小さくなり、企業はデータを出しやすくなる。日本のデータ活用の起爆剤にしたい」と意気込む。

 NTTの秘密計算システムは、データを持ち寄る企業などが共有するルールが組み込まれている。そこで使われるのは秘密分散という仕組みだ。まず、元となるデータを「シェア」と呼ばれる複数の断片に分割し、それを複数のサーバーに分けて計算する。その後、それぞれの計算結果を、共有するルールに従って復元することで最終的な結果を得る。

 1つのサーバーではデータの断片しか扱わない。データを持ち寄る企業はもちろん、システム管理者にも元データはわからないため、高い安全性を保てるのが大きな利点という。

 例えばA社が持つ「2」というデータと、B社が持つ「3」というデータを秘密分散を使って足し算し、データを秘密にしたまま「5」という結果を得るまでの過程を見てみよう。

 ポイントは元データの分割方法にある。秘密分散ではA社の2というデータから2つのシェアを作りだす。1つが0〜9までの数字が振られたサイコロを振って出た数字だ。例えば「5」という数字が出たら、これが1つ目のシェアになる。

 次に0〜9までの数字が書かれたルーレットをイメージする。ルーレットで元データである2の位置からサイコロの目の5個分、反時計回りに移動すると「7」という数字が得られる。これがもう1つのシェアだ。

 同様にB社の3というデータも共有するルールを使って分割する。サイコロを振って2が出たら、シェアは「2」と、ルーレットを使って得られる「1」ということになる。A社とB社のシェアをサイコロの目の数字とルーレットの数字同士で足すと、得られるのは「7」と「8」だ。

 ここまでのデータは暗号化されている。最終結果を得るには「7」と「8」を決まったルールで復元する。ここでもう一度、0〜9のルーレットを使う。

 8の位置から今度は時計回りで数字を7個分進めると結果は「5」。これは暗号化されていない数字だ。A社とB社の元データを秘密にしたまま「2+3=5」という計算が完成したわけだ。

 秘密計算は1980年代から世界的な研究が進められてきた。NTTも早い段階から研究に取り組んできたが、当初はコンピューターの計算速度が遅く、使い物にならなかったという。

80年代から研究

 しかし、ここに来て計算手法の改善が急速に進み、処理の高速化が進んだ。例えばNTTが開発した秘密計算技術を使えば、1000万回の足し算を実行するのにかかる時間は0・014秒。暗号化を用いないなど通常の計算処理に比べて1桁ほど時間がかかるだけで済む。

 NTTは秘密計算が実用レベルになったと判断。幅広く活用してもらおうと、今年8月から期間限定で無償での試用提供を始めた。すでに、ヘルスケアや製造業など幅広い業種で安全性の検証などが進んでいるほか、一部では実務での利用も始まっているという。NTTはこの技術を生かして、日本国内のデータ活用ビジネスの活性化を促したい考えだ。

(堀越功)

ニュースの最新記事

PAGE TOP