AI性能評価、業界団体が回答速度測る新たなベンチマーク追加

Max A. Cherney

[サンフランシスコ 27日 ロイター] - 人工知能(AI)の能力を測定・比較するためのベンチマークを開発する業界コンソーシアムMLコモンズは27日、最高級ハードウエアがAIアプリケーションを実行し、ユーザーに応答する速度を評価する新たなテストと結果を公表した。

MLコモンズが新たに追加した2つのベンチマークは、AI半導体とシステムがAIモデルから応答を生成する速度を測定する。「チャットGPT」などのAIアプリがユーザーの質問にどれだけ速く答えを出せるかが分かる。

追加したベンチマークの一つは大規模言語モデルの応答の速さを測る「Llama 2」で、メタ・プラットフォームズが開発した。もう一つは画像生成の「MLPerf」で、スタビリティーAIの「ステーブル・ディフュージョンXL」をベースとしている。

アルファベット傘下のグーグル、スーパーマイクロなどが構築したエヌビディアの半導体「H100」を搭載したサーバーは、両方の新ベンチマークを大きく上回った。

インテルも自社のアクセラレーター半導体「ガウディ2」をベースにしたデザインを提出した。同社は良好な結果としている。

© ロイター