シナモン、生成AIを統合した定型・非定型対応AI-OCRプラットフォーム「Flax Scanner HUB」を販売

by 三柳 英樹

株式会社シナモンは23日、AI-OCRと生成AIを統合し、企業におけるデータ活用を拡張するAI-OCRプラットフォーム「Flax Scanner HUB」を販売開始した。

Flax Scanner HUBは、AI-OCRに生成AIのノーコード学習機能を統合することで、読み取りが難しいとされていた非定型帳票からの情報抽出を、事前の帳票定義なしで高精度に実現することが可能なAI-OCR。読み取り帳票の難易度に合わせ、帳票特化型AI-OCRモデルや、個社別のカスタマイズモデルなどが利用でき、さまざまなフォーマットの帳票を、ワンストップで高精度かつスピーディに活用できる。

非定型帳票から生成AIで情報抽出を行う際、「日付」や「注文番号」など項目を特定する記載がないと、生成AIによる正しい判断ができず、情報抽出を誤ることがある。シナモンではこの問題に対して、過去のAI-OCR実績を生成AIへ学習させることにより、情報抽出精度94%と、大幅な精度向上を実現したという。

これらの実現には、シナモンで独自に開発した、生成AI利用時に活用されるフューショット学習(Few-shot Learning)を取り入れたノーコード学習機能を活用。AI-OCR読み取り結果の正解データを生成AIに簡単に登録することで、読み取り精度を向上させている。

「Flax Scanner HUB」で、非定型帳票から情報抽出するイメージ

Flax Scanner HUBは、請求書に代表される幅広く利用される非定型帳票に加え、専門用語が頻出する業界特有の帳票や、顧客独自の帳票まで、帳票難易度に合わせた最適な情報抽出方式で、各種の定型・非定型帳票を高精度に読み取る。

請求書・注文書・決算書など、多くの企業で利用されているさまざまな非定型帳票は、事前のわずらわしい帳票定義なしでスピーディに情報抽出が可能。専門用語が多く、読み取り難易度が高いとされる貿易書類、医療用領収書/明細書、健康診断書なども、シナモンがこれまでに開発してきた帳票特化型AI-OCRモデルを活用することにより、事前設定なしで高精度に読み取れる。

より専門性の高い、顧客特有の帳票に対しては、AI-OCRモデルをファインチューニング(シナモンのオリジナルAI-OCRモデルに顧客特有の帳票を追加学習)することで、高精度に読み取れる。

Flax Scanner HUBは、低コストで手軽に利用できるマルチテナント型だけでなく、よりセキュアに利用可能なシングルテナントやオンプレミス環境での導入にも対応する。マルチテナントの生成AI抽出型の実装は6月頃を予定する。

提供プランと価格(税別)は、「Starter」プランが月額3万円、「Basic」プランが月額5万円から、「Pro」プランが個別見積もり。

© 株式会社インプレス