「くずし字」読めるぞ!古文書の解読サービスが話題 TOPPANが開発した『ふみのは』 アプリ利用者が増加

歴史研究に欠かせない古文書の解読。しかし、現代のような印刷技術や日本語フォントが普及し始めたのは明治以降のこと。手書きの、しかもくずし字の文書となると、興味はあってもほとんど読むことが出来ないという人が多いのではないだろうか。

くずし字の古文書を読むのはなかなか難しいですが…(TOPPAN株式会社提供)

今、研究者や歴史ファンの需要にこたえ、大きな注目を浴びているサービスがある。それは株式会社TOPPANが提供する『ふみのは』

古文書カメラ(TOPPAN株式会社提供)

同社が培ってきた自動文字認識の技術を応用した古文書解読サービスで、元々は研究機関のみへの提供だったが、今年6月からスマートフォン用アプリがリリースされ、利用者が格段に増加しているのだ。

サービス開発の経緯や反響について、TOPPAN株式会社情報コミュニケーション事業本部の大澤留次郎さん福井尚子さんにお話を聞いた。

ーーふみのは開発の経緯をお聞かせください。

大澤:発端となったのは2013年に電子書籍制作の需要に応えスタートした高精度全文テキスト化サービスでした。OCR(光学文字認識)により、現代の書籍から明治から戦前にかけての文献まで、さまざまな文書をテキスト化させていただいていたのですが、そうした中、江戸時代のくずし字で書かれた書物に関しても取り組んでほしいというリクエストがあったんですね。そこで2015年から「くずし字OCR」の研究開発を始めました。

サービスの提供が始まったのは2021年。その時点では大学や資料館などの研究機関に向けて提供していたのですが、一般にも広く活用できるようにしてほしいという声がありまして、今年6月からくずし字AI-OCRを搭載した古文書解読スマホアプリ「古文書カメラ」をリリースいたしました。

古文書にかざすとこの通り(TOPPAN株式会社提供)

ーー開発にあたってご苦労はありませんでしたか?

大澤:私たちは古文書解読についてはまったくの素人でした。まず自分がある程度くずし字を読めるようにならないとOCRが正確に認識できているかすらわからないので、入門書を買って勉強するところから始めています(笑)。

ーー一口に古文書と言っても年代や筆者によってかなりの差異があります。それらを正確にOCRに認識させるのはたいへんなことでしょうね。

大澤:公文書的なものは比較的、綺麗に書かれているのですが、個人の日記や手紙になってくると奔放なものも多く、難しかったです。また年代別では明治以降が難しい。まず筆記用具にいろんなバリエーションが出てきます。それに江戸時代は字のくずし方にもルールがあったのですが、明治以降は誰もそれを習わなくなってしまいました。なので、くずし方が人ぞれぞれ自己流になってしまうんですね。それらを読み解くのは途方もない作業でしたが、なるべくベーシックなものから情報を積み重ねることで対応力を付けていきました。

こちらは版本(TOPPAN株式会社提供)

ーー研究機関からテキスト化を依頼される古文書はどんなものが多いのでしょうか?

大澤:江戸時代の古文書、出版物、藩の公式記録などですね。手紙のご依頼も多いのですが、まだOCRでは難しい部分があるのでお断りすることもあります。

ーーこれまで数多くの古文書のテキスト化を手がける中で、「歴史的発見だ」と思うような出会いはありましたか?

大澤:大発見というようなものはありませんが、小さな驚きは多いです。江戸時代の落とし物の記録を読んで「昔の人はこんな落とし物をしてたんだ!」とか(笑)。

福井:「こんな怒られ方をするのか」というのもありましたね(笑)。歴史の知識のない我々にとっては、古文書から読み取れる当時の生活の様子などは、小さなことでも十分な驚きでした。これまでは既にある程度、整理された資料を手がけることが多かったのでまったく未知の大発見というものはありませんが、今後そういった古文書に接することができるといいですね。

ーーこれまでの反響はいかがでしょうか?

福井:7月に三重県津市にあるセントヨゼフ女子学園の中学校でワークショップをさせていただきました。アプリを使って江戸時代前期に描かれた県の指定文化財、『源氏物語図色紙貼交屏風』の解読にチャレンジしていただいたのですが、くずし字に初めて触れる生徒さんがほとんどでしたが、学芸員さんの解説もあってとても盛り上がりました。

ワークショップの様子(TOPPAN株式会社提供)
ワークショップの様子(TOPPAN株式会社提供)

弊社では市民や団体、企業向けにふみのはのワークショップイベントも手がけています。多くの方に、くずし字や古文書を身近に感じるきっかけを提供したいと思っています。

大澤:研究者の方からはまだまだ精度が甘いというお叱りがあります。また「こんなサービスが出ると人間が古文書を読む能力を失ってしまうじゃないか」というお叱りもありました。さまざまな声を真摯に受け止めて、社会にとって有益なサービスを提供できるよう努めたいと思います。

◇ ◇

専門知識や専門書がなくとも、スマホをかざせば誰もが古文書を解読できる時代が到来した。これまで解読されている古文書はまだまだほんの一部と言われている。ふみのはの普及により、歴史の解明や文学の研究が促進されることを期待したい。

ふみのは公式サイト:https://www.toppan.com/ja/joho/fuminoha/
ふみのは 公式X:https://twitter.com/fuminoha_jp
古文書カメラ公式サイト:https://camera.fuminoha.jp/
iOSアプリ:https://apps.apple.com/jp/app/古文書カメラ/id1604296512
Androidアプリ:https://play.google.com/store/apps/details?id=jp.co.toppan.fuminohacamera
自治体でのワークショップ事例:https://www.toppan.com/ja/joho/social/case/archive11.html

(よろず~ニュース特約・中将タカノリ)

© 株式会社神戸新聞社