オープンAIが「GPT─4o」発表、音声反応高速化 文字・画像も処理

Anna Tong Akash Sriram

[13日 ロイター] - 生成人工知能(AI)「チャットGPT」を手がける米オープンAIは13日、新たなAIモデル「GPT─4o」を発表した。人間相手のような会話を可能にしたほか、文字や画像を扱える機能を加え、AI分野でのリードを固める。

新しい音声機能は人間と同じような反応速度を実現し、チャットGPTが話している間に割り込むこともできる。いずれもリアルな会話の特徴で、従来の生成AIチャットボットでは再現が難しかった。

サム・アルトマン最高経営責任者(CEO)は「映画で見たAIのようだ。コンピューターと自然な会話をできていると感じたことはなかったが、それができるようになった」とブログに投稿した。

オープンAIはAI分野の競争が激しくなる中、チャットGPTの利用者ベースを広げることが課題となっていた。

ライブ配信した実演イベントでは、新たな音声アシスタント機能がさまざまな声や感情、トーンで物語を読み上げた。紙に書かれた数学の方程式を認識して、解く手順を音声で説明するデモや、リアルタイムの翻訳も行った。

オープンAIのミラ・ムラティ最高技術責任者(CTO)は、GPT─4oは従来モデルよりコスト効率が高いため、無料で提供すると述べた。有料サービスの利用者はより高度な機能が使える。数週間内にチャットGPT上で新モデルを導入する。

ムラティ氏は実演イベント後、チャットGPTでインターネット上の最新情報を閲覧するブラウザー機能を追加するとロイターに説明。また、無料サービスについて広告販売で売り上げを出す考えはないとした。

© ロイター