#ビッグデータ #プライバシー #連合学習 #Federated learning

今、最も求められているビッグデータ分析は知らないうちに我々のプライバシーを侵害するか。我々は知らずに自分の手で個人情報をテクノロジー会社や政府機関などに提供するか。

プライバシーの侵害を避けられる連合学習とは?

まず、連合学習というものが世に出てくる前にあったの機械学習というものです。機械学習では、分析に必要な情報とデータを中央サーバーに送って集約します。例えば、文字を入力している時、関連キーワードや候補キーワードに表示されることは、機械学習の結果によるものです。分析されるデータは使用者が入力したものです。

連合学習が登場する前の従来のビッグデータ分析では2つの問題点がありました。

第一に、サーバーに負担がかかっていたという問題です。一つの言語の利用者が2千万人の場合、2千万人分の大量なデータがあり、それが一つのサーバーにアップロードされるには時間、通信量やストレージがかかっていました。

第二に、プライバシーを侵害していたという問題です。入力したものがサーバーに送信されるということは、自分が何を打っているのかを見られているということになり、これがプライバシーを侵害しているのではないかということです。

以上の問題点がありました。それに加えて、GDPRというような個人情報を保護する法案において、詳細に個人情報の運用に関する規定がありますので、明確な同意をえなければ、個人情報の処理をできません。EU域内の事業者だけでなくEU域外の事業者もGDPRの規制対象になります。越境データ移転にも、「十分な個人データ保護の保障、BCR(Binding Corporate Rules:拘束的企業準則)の締結、SCC(Standard Contractual Clauses:標準契約条項)の締結、明確な本人同意等、一定の条件を満たさなくてはなりません。」https://www.ppc.go.jp/enforcement/infoprovision/laws/GDPR/

個人データ保護に対するヨーロッパの国々の意識は非常に高いものです。よって、世界の各国、十分なレベルの個人データ保護を保障しているということをヨーロッパの国々に認められるために、自分の国の法律を改正する動きをとろうとしています。

連合学習はGDPRを遵守して発明されたものです。全てのデータを一つのサーバーに送信するわけではなく、分散的なデータ分析を行います。分析に必要なデータをすべてサーバーに送っていたビッグデータ分析とは異なり、現在は、個々の中で学習が行われ、割り出した学習結果のみ(改善点とか、変更点などの情報)をサーバーに送信する仕組みになっているためサーバーに対する負荷が軽減されるとともに、個人情報に関するルールも守ることができるようになりました。

例:

1、関連キーワードなどのシステム

2、医療に関する病気の処置法

3、フィンテック