GPT-4でGPT-4のエラーを見つける「CriticGPT」

by 清宮信志

OpenAIは、ChatGPTが出力するエラーを発見するため、GPT-4をベースとした「CriticGPT」を開発した。

AIを使ってAIのミスを発見するのを支援するツール。GPT-4シリーズのモデルは、RLHF(人間からのフィードバックによる強化学習)を使って訓練されているが、AIモデルが高度化するのに伴い、その間違いを人間のAIトレーナーが指摘するのは困難になりつつある。

CriticGPTの指摘が常に正しいわけではないが、AIトレーナーがCriticGPTを活用することで、より多くの問題を見つけることが可能になる。たとえば、GPT-4が出力したコードのエラーを発見しようとする場合、CriticGPTを使ったほうが60％パフォーマンスが向上するとしている。

AIはトレーナーのスキルを補完し、人間が単独で作業するよりも包括的なレビューが可能で、モデルが単独で作業するよりもハルシネーション(誤ったもっともらしい回答)が少なくなる。実験では、AI無しで行なったレビューよりも、CriticGPTを使った人間が行なったレビューのほうが60％以上の人に支持されたという。

ただし、CriticGPTを使ってもハルシネーションを完全に排除することはできない。また、タスクが非常に複雑な場合は、CriticGPTの助けがあっても、正しいレビューを行なえるとは限らないという。今後、より複雑になるAIシステムを整合するためには、より良いツールが必要になるとしている。

GPT-4でGPT-4のエラーを見つける「CriticGPT」

関連記事

Slack、プロジェクトやタスクを管理できる新機能「リスト」

Notionがウェブサイトに 「Notionサイト」カスタムドメインなど強化

PayPay、「学園祭」導入を本格化 若年層利用を拡大へ

Liquid、iPhoneでアプリ不要のマイナカードIC本人確認

阪急阪神グループ共通IDによる決済サービス「HH cross PAY」

Notionがウェブサイトに　「Notionサイト」カスタムドメインなど強化

PayPay、「学園祭」導入を本格化　若年層利用を拡大へ