ＡＩ性能評価、業界団体が回答速度測る新たなベンチマーク追加

Max A. Cherney

[サンフランシスコ２７日ロイター] - 人工知能（ＡＩ）の能力を測定・比較するためのベンチマークを開発する業界コンソーシアムＭＬコモンズは２７日、最高級ハードウエアがＡＩアプリケーションを実行し、ユーザーに応答する速度を評価する新たなテストと結果を公表した。

ＭＬコモンズが新たに追加した２つのベンチマークは、ＡＩ半導体とシステムがＡＩモデルから応答を生成する速度を測定する。「チャットＧＰＴ」などのＡＩアプリがユーザーの質問にどれだけ速く答えを出せるかが分かる。

追加したベンチマークの一つは大規模言語モデルの応答の速さを測る「Ｌｌａｍａ２」で、メタ・プラットフォームズが開発した。もう一つは画像生成の「ＭＬＰｅｒｆ」で、スタビリティーＡＩの「ステーブル・ディフュージョンＸＬ」をベースとしている。

アルファベット傘下のグーグル、スーパーマイクロなどが構築したエヌビディアの半導体「Ｈ１００」を搭載したサーバーは、両方の新ベンチマークを大きく上回った。

インテルも自社のアクセラレーター半導体「ガウディ２」をベースにしたデザインを提出した。同社は良好な結果としている。