「AI記者に記事が書けるか?」やってみた 原稿千本読ませ学習、顔と声もそっくりに

AI記者(左)と澤野記者

 「サイバー攻撃の脅威について記事を作成して」。私(記者)が話し掛けると、もう1人の“ワタシ”が語り始めた。彼は、私が過去に執筆した記事のデータなどを大量に読み込ませ、最新の文章生成プログラムを搭載した「AI記者」だ。インターネット上の膨大な文章パターンを基にして、顔も声も私にそっくりに作ったアバター(分身)が、人間が書いたような記事を作成できるのか。やってみた。(共同通信=澤野林太郎)

 ▽AIはどっち?

 以下に2つの記事がある。一方は記者が、もう一方はAIが書いた。どちらがAIか当ててみてほしい。テーマは「サイバー攻撃の脅威について」だ。ちなみにAIの書いた記事には一切手を加えていない。

 【記事1】標的型攻撃は、特定の組織をターゲットとして高度なサイバー攻撃を行います。高度なサイバー攻撃を行うことにより、組織は深刻な被害を受けます。内部不正は、組織の情報流出に伴う顧客の業務を行いたい企業や企業からのリクエストに対して、マルウェアをメールとして添付することで感染させる攻撃です。被害を受けると、従業員に対する教育や研修の実施といった研修ニーズに対応できなくなり、勤務先を危険にさらしてしまうリスクがあります。

 内部不正によるメールのぎずそが付いたり、不用意に開かない方がよい場合があります。

 社内のIT資産をスムーズに一元管理することを目的に、システムやデータを改ざんしたり、システムを停止させたりするサイバー攻撃を行います。方法は多層的に存在します。

 【記事2】サイバー攻撃が近年再び増加しており、国や企業にとって大きな脅威となっています。特に最近はランサムウエアと呼ばれるコンピューターウイルスによる被害が激増しています。攻撃者は組織の機密データをサイバー攻撃で盗み取り、暗号化して使えなくします。その後データを復旧する見返りとして金銭を要求します。海外ではインフラ企業が狙われ、数億円もの身代金が支払われた例もあります。

 新型コロナウイルスの流行で、自宅などでパソコンを使って仕事をする機会が増えました。自宅のインターネットはセキュリティー対策が十分でない場合も多いため、注意が必要です。

画面をのぞき込む澤野記者

 ▽コピー

 AI記者の作成にはAIベンチャー企業「クリスタルメソッド」(東京)の協力を得た。私が10年間に書いた原稿約千本のデータを同社に入力してもらい、AIが文体や特徴を分析。原稿の文中の単語から関連する情報をAIがネット上で自動収集した。その上で近年開発された自然な文章を生成できる「GPT―3」と呼ばれる最新の文章生成言語モデルを参考に独自に開発したプログラムを使い、原稿を作成した。

 今回は記事だけではなく顔や声も記者そっくりなアバターを作ることも試みた。完成すれば、AIが作成した記事をアバターが読み上げてくれる。作成に当たっては、記者の顔と声のデータをAIに大量に学習させた。例文約400文を喜、怒、悲、普通のパターンに分け、記者がほほ笑んだり声を荒らげたりしながら読み上げ、約5時間収録した。これはさまざまなパターンの表情と発音した際の口角などの動きを忠実に再現するためだ。開発担当者に「精度を上げるためさらにデータを取得したい」と何度も読むように求められた。1人で何時間も読み上げる作業がつらく、ある程度の段階で諦めてもらった。

AIベンチャー企業「クリスタルメソッド」の河合継社長

 約2カ月かけ、AI記者の試作品「AI記者1・0」ができた。パソコンの画面には、私そっくりのAI記者がいた。顔や声は私。同じワイシャツを着てきた。写真や動画ではなく、小刻みに動いており、まるでオンラインで対面しているような感覚だ。

 早速、記事作成を指示してみる。記事は数秒で作成された。しかし内容は、どこかのサイトからコピペして、つぎはぎしたような文章。繰り返しや意味不明な例文、助詞の違和感なども混在して、とても記事とは言えない。文章というレベルにも達していなかった。記事の質を上げるように修正を依頼した。クリスタル社は、プログラムのバグを修正し、記事作成のテーマを絞り込んで、さらに学習データを増やした。

 2週間後「AI記者2・0」ができたと連絡があった。今度は、発音している音声と口の動きが微妙にずれていた。この違和感はロボットが話しているという感じを抱かせてしまう。さらなる修正をお願いした。

 同社の河合継社長は、AIの研究をしている大学教授に相談するなど改良を重ね、週末をつぶして修正をしてくれた。「だいぶ良くなりましたよ」。1週間後、再び東京・市ケ谷にある同社を訪れた。最初に来てからもう10回目になっていた。

「クリスタルメソッド」の河合継社長(左)と澤野記者

 「AI記者3・0」は、約300字の記事を作成するよう指示を出してから数秒後、あっという間に出来上がった。1分間に十数本の異なる内容の原稿を何本も作成できる。記者が原稿を書くスピードに比べると、とても人間が太刀打ちできるスピードではない。

 完成度はどうだったか。「1・0」や「2・0」は同じ内容を繰り返したり助詞や文章のつながりが変な部分もあったりしたが、「3・0」は自然な言い回しだ。私が過去に記事で取り上げたサイバーや人工知能などのテクノロジー分野については、違和感がない出来だった。ウィキペディアのコピペでもない。複数の関連する文章をひとつの文として生成しており、文と文のつながりもあまり違和感がない。最新のニュース記事も参考にしているとみられ、「ゼロデイ攻撃」と言われる最新のサイバー攻撃手法について言及している原稿もあった。内容に大きな間違いや矛盾も感じられない。

 一方で私が書いたことがない「自民党総裁選」や「アフガニスタン情勢」についても記事を作成させてみた。作成された記事は、文章としては読めないことはないが、同じような引用の繰り返しでこちらは質が低かった。理由は、この分野のデータ学習量が不足しているためだそうだ。

 「もっと多くの分野の記事を学習させれば完成度は上がりますよ」と河合社長。今回はテクノロジー分野の記事を中心に私1人分のデータを読み込んだだけだが、記者100人、1000人分のデータを読み込めば、もっと広いあらゆる分野の記事を作成できるという。「さらに記者が大切にしている価値観を教えてくれれば、記者の考え方に近づけることも可能です」。河合社長が話す。

 価値観をAIに搭載するとは、どういうことか。「人生で大切にしていることをできるだけ教えてください」と要求された。詳しい内容は企業秘密なので公表できないが、この作業は、47年の人生を振り返るとても労力がいる作業だった。2時間以上にわたり私の価値観を説明し、開発担当者はそれを記録した。

澤野記者のアバター

 数週間後、この価値観を搭載した「AI記者4・0」が出来上がった。簡単な会話も可能になった。主に決められた質問についてのやりとりにとどまるが、「一番大切にしているものは何?」「理由は?」などの問い掛けに、目の前で自分と同じ顔と声で話している自分を見るのは、生まれて初めてだ。録画した映像などで自分が話した姿を見るのとは異なり、自分が話したことがない内容を“自分”が勝手に話している光景は、不気味な感じといとおしい感じが両方わき上がってきて、不思議な感覚だった。

 ▽完成度

 AI記者は記事を作成できるのか。冒頭の、どちらの記事がAIかという質問の答えは、【記事1】がAI、【記事2】が人間(私)だ。AI作成の記事は、日本語の文章として違和感はほとんどないはずだ。誤字が1カ所あるが、人間でも誤字はする。全体像を捉え切れていないという点と結論は何を伝えたいのかという明確な意思が感じられない。AIに意思を求めるのは無理筋なのかもしれないが。

AI記者が作成した記事

 ただ可能性も感じる。記事を作成するときには取材をすることはもちろんだが、多くデータを集めることが求められる。過去にどのような事件があり、どのような結果になったのか。ほかにどのような論調があり世論や他のメディアはどのように書いているのかなど。AI記者は、データを瞬時にかき集め、文章にしてくれる。しかも数分もあれば100本以上の異なる記事を作ることが可能だ。利用の是非は議論があるだろうが、あるテーマについて記事を書く際に、最初にAIに数本記事を書かせて、そのデータを参考に全体像をつかみ、使えそうな記事をベースに事実を1次情報元に確認して、記者の意思を加えて自分の記事として、仕上げていく。しかし手抜きをしているような気もして気が引ける。そもそもAI記者が書いた記事を、読者は読みたいのだろうか。AI記者は、マスコミ側の論理で読者の視点ではないのかもしれない。

 人工知能学会の野田五十樹会長は「AIは過去のデータから最適解を提示することは可能だが、今何が問題で何について最適解を出すべきなのかについて『何』を切り取る能力はない」と指摘する。つまり、記者は何がニュースで何を伝えたいかということを森羅万象の中から切り取るという点が大切なのだ。これは人間にしかできない。

 将来、多くの仕事がAIに取って代わられるという。今後、多くのAIに囲まれていく日常が待ち受けている。そこで私たち人間は、人間にしかできないことは何かという根源的な問いに直面することになるだろう。

AIベンチャー企業「クリスタルメソッド」のスタッフ

 ▽永遠の命

 2019年のNHKの紅白歌合戦。AIを活用し美空ひばりの姿や声をコンピューターグラフィックス(CG)でよみがえらせた「AI美空ひばり」が“新曲”を披露した。過去の音源、映像から再現した。

 脳内出血で一時芸能活動を休止していた加山雄三も、民放のテレビ番組でAI技術による「バーチャル若大将」を作成し“熱唱”していた。

 もはやデータがあればAIは、コピーロボットにとどまらず、死者ですらよみがえらせてしまう。バーチャル空間では、「永遠の命」を手に入れることができるかもしれない。膨大なデータをのみ込みながら、AIは人間のすぐ後ろに近づいている。

   ×   ×   ×

関連の映像ニュースはこちら

https://www.youtube.com/watch?v=5qfDJuwumoE

© 一般社団法人共同通信社