AI受験生が上位大学の文系学部に「合格」、大きく進歩した技術―中国

2024年の中国大学統一入学試験が終了すると、中国内外のさまざまな大規模AIモデルが相次いで試験問題に挑戦した。

2024年の中国大学統一入学試験(通称「高考」)が終了すると、中国内外のさまざまな大規模AIモデルが相次いで試験問題に挑戦した。こうした「大規模AIモデル受験生」にはGPT-4o(オープンAI)、豆包(字節跳動)、文心4.0(百度)、百小応(百川智能)、通義千問2.5(阿里巴巴)などが含まれる。出題された試験問題は、幅広い地域で採用される「新課標I巻」(新指導要領I巻)に基づくもので、河南省の受験生に実際に出題されたものだ。

試験の成績を見ると、文系ではGPT-4oが562点を獲得して首位に立ち、中国製品では豆包が542.5点でトップだった。河南省の上位大学の文系合格ラインは521点で、中国製品は豆包、文心4.0、百小応が合格圏内に入った。

インターネットにアップされている資料を総合すると、文系の試験でAIたちはそろって優れた成績を上げ、特に言語類科目ではある程度の論理と言語を組み立てる能力の高さを示した。ところが、作文の面では、大規模AIモデルの文章は構成が明確で、筋も通っているものの、理性が勝ちすぎ感性が不足気味という傾向が軒並み存在し、感情的な色合いや訴えかけるものも足りなかった。

理系ではAIモデルの成績はどれも振るわず、大半の総合得点が400点以下で、河南省の合格ラインの511点とは開きがあった。9製品のうち、GTP-4o、文心4.0、豆包が数学の試験で60点以上を取れたが、満点は150点なのでいずれも不合格の成績だ。調査・実験・探求の能力に重点が置かれる化学と物理の試験では、各AIモデルの平均点は化学(100点満点)が34点、物理(110点満点)が39点だった。

今回の試験結果を見ると、AIは文系分野で一定の優位性を示し、特に言語処理と知識記憶の面で突出した成績を収めた。河南省の大学受験成績ランク統計データを見ると、GPT-4oは562点で文系受験生の中で8811番になり、実際の受験生なら上位2.45%に入る。中国製品では豆包が上位の約4.27%に入る。過去1年余りの間に、中国のAI技術の能力が大きく進歩したことが分かる。

理系分野では、深い論理的推論と臨機応変の柔軟な対応力が求められる問題は、AIモデルにとってなお非常に大きな課題だと言える。ここから分かるのは、AIは特定のタイプの任務に対処するときには高い能力を発揮するが、知識を総合的に運用して実際の複雑な問題を解決する場面では、人類の知的水準にはまだ開きがあるということだ。(提供/人民網日本語版・編集/KS)

© 株式会社 Record China