Googleが新オープンAIモデル「Gemma 2」をリリース ~商用可能、提供は27Bと9Bモデル/初代「Gemma」よりも高い推論効率を実現

by 石山 裕規

Google、次世代AIモデル「Gemma 2」をリリース

米Googleは6月27日(現地時間)、次世代AIモデル「Gemma 2」を開発者および研究者向けにリリースした。第1世代「Gemma」と同様、商用利用可能。パラメーターサイズは「9B」と「27B」の2つのモデルが提供されており、初代よりもハイパフォーマンスで高い推論効率を実現しているという。

「Gemma 2」は、Googleが提供する軽量かつオープンな大規模言語モデル(LLM)シリーズ「Gemma」の最新モデル。ファミリーとしては、ほかにも「CodeGemma」や「RecurrentGemma」「PaliGemma」が展開されている。

「Gemma 2」の9B/27Bモデルは、同等クラスのモデルの中でもっとも優れたパフォーマンスを発揮するという。27Bモデルは2倍以上のサイズモデルにも匹敵する競争力を備えており、9Bモデルは「Llama 3 8B」などの他のオープンモデルを上回るパフォーマンスを実現したとしている。

また、27Bモデルは、単一ホストの「Google Cloud TPU」や「NVIDIA A100 80GB Tensor Core GPU」「NVIDIA H100 Tensor Core GPU」上において、フル精度で効率的に推論を実行するように設計されており、よりアクセスしやすくコストパフォーマンスに優れたAI展開が可能になる。

さらに「Gemma 2」は、ゲーミングノートPCからハイエンドデスクトップPC、クラウド環境まで、さまざまなハードウェア環境にて高速で実行できるよう最適化されている。「Google AI Studio」にてフル精度で試用してみたり、量子化バージョンを使用してローカルパフォーマンスを確認してみたりできる。

「Gemma 2」と他モデルとの性能比較
「Gemma」ファミリーでの比較

「Gemma 2」は現在「Google AI Studio」において無料で利用可能で、ハードウェア要件なしで27Bモデルのフルパフォーマンスをテストできる。ほかにも「Keras 3.0」や「Gemma.cpp」等を介して「Hugging Face Transformers」「TensorFlow」といった主要なAIフレームワークと互換性を有している。今後は「NVIDIA NeMo」にも最適化される予定。

また「Gemma 2」のモデルウェイトは「Kaggle」および「Hugging Face Models」よりダウンロード可能。「Vertex AI Model Garden」には近日中にリリースされる予定となっている。

© 株式会社インプレス