KDDI傘下のELYZAが新日本語LLM、「GPT-4」超える性能を達成

by 北川研斗

KDDI傘下でAIを手がけるELYZAは、新たな日本語LLM（大規模言語モデル）2種を公開した。700億パラメーターのモデルは「GPT-4」を上回る性能を持つとしており、80億パラメーターのモデルは今後、商用利用できるかたちで一般公開される。

700億/80億パラメーターの2種を開発

ELYZAが開発に成功したのは、米Metaのオープンモデル「Llama 3」をベースにしたもので80億パラメーターのモデル「Llama-3-ELYZA-JP-8B」と700億パラメーターのモデル「Llama-3-ELYZA-JP-70B」の2つ。700億パラメーターのモデルは、米OpenAIの「GPT-4」を上回る性能を達成したという。

ELYZAが新開発した2つのAIモデルのベースになっているのは、Metaが開発しオープンモデルとして公開されている「Llama 3」で、これに独自の追加事前学習やPost-trainingと呼ばれる作業を行うことで開発した。

700億パラメーターのモデルは、日本語のベンチマーク「ELYZA Tasks 100」と「Japanese MT-Bench」でともに国内最高精度を達成した。主要なグローバルプレイヤーが開発したLLMと比較しても性能が高く、いずれのベンチマークでもOpenAIの「GPT-4」が記録したスコアを上回った。数学はまだ発展の余地を残しているものの、全体で比較するとほとんど同等レベルの性能を発揮しており、推論能力はELYZA開発のモデルが優れているという。