流出したGoogleのデータベースから、プライバシーやセキュリティに関する欠陥が明らかに

Image:YueStock / Shutterstock.com

先週、Googleの検索ランキングアルゴリズムに関する社内情報を記した大量の文書が、誤ってGitHubにアップロードされていたことが報じられた。

問題の「Google Content Warehouse API」ドキュメントは3月27日から5月7日に至るまで公開状態にされており、その内容を分析したSEO専門家は「Chromeブラウザーの閲覧履歴は検索ランキングに利用されない」など、Googleが以前に説明・主張してきた事柄と実際の検索アルゴリズムのランク決定プロセスには矛盾するところがあると指摘していた。

Googleは、この件に関して「コンテキストから外れた古く不完全な情報に基づいて不正確な推測をしないよう」SEOに携わる人々に呼びかけているが、SEO界隈の人たちの疑念は完全には晴れていないようだ。

そして今週月曜日、こんどは404 MediaにもたらされたGoogleの内部データベースに関するリーク情報から、2013年から2018年にかけて同社内で発生したプライバシーやセキュリティに関する事件や問題が報告されている。

Googleはメディアからの問い合わせに対して「404 Mediaが入手した報告は6年以上も前に報告された例であり、すべてその時点で確認、解決されている。場合によっては、従業員が報告したものがまったく問題ではなかったり、従業員がサードパーティのサービスで見つけた問題だったりすることもある」と説明した。

たしかに404 Mediaは、多くの個々のケースは影響が少数の人にしか及ばなかったか、すぐに解決されたとしている。しかし「全体として見れば、この内部データベースは、世界で最も強力で重要な企業のひとつが、人々の生活に関する膨大な量の個人情報や機密データを管理し、しばしば誤って管理していることを示している」と報じている。

たとえば、Googleのクラウドサービスの政府系クライアントの機密データが誤って消費者向け製品に移行されたという、ひとつ間違えば大事になっていた可能性もある潜在的なセキュリティ問題も、問題のリーク情報には含まれていた。Googleの内部報告ではその結果として「この顧客にはデータの保管場所が米国ベースであることが保証されなくなった」とされている。

Image:Em7 / Shutterstock.com

他の例としては、2016年に報告されたGoogleストリートビューの不具合が挙げられる。この問題では、Googleの文字おこし機能がストリートビューで撮影された自動車のナンバープレートを自動的に削除する機能がうまく働かず、ストリートビューで検出されたオブジェクトのデータベースに、位置情報とともにプライバシー追跡を可能にする自動車ナンバー情報のデータベースが構築されてしまったという(この情報は後に削除された)。

さらに、Googleの音声サービスのバグによって、推定1000人の子供の話し声がそれぞれ約1時間にわたりデータとして録音され、記録されたケースもあったという。これも内部の事後報告では、すべて削除したと主張されている。

Googleは今回のリーク情報に関し、ユーザーのセキュリティとプライバシー確保のため、過去6年間で数百件におよぶ新規または追加の保護対策を実施したと述べている。その一例として、2019年にはYouTubeを利用する子どものデータ保護に関するポリシーを更新し、子ども向け動画のデータ収集をサービスのサポートに必要なものだけに制限したとBusiness Insiderに述べた。

© 株式会社 音元出版