国立国会図書館のNDLOCRを支えた技術

ディープラーニング 活用事例紹介 #7[株式会社モルフォAIソリューションズ]

2021年4月1日、国立国会図書館は今後5年間の方針を定めた「ビジョン 2021-2025 国立国会図書館のデジタルシフト」を策定した。将来にわたるすべての利用者に多様な情報資源を提供する「ユニバーサルアクセスの実現」のための事業と、そのための恒久的なインフラとなる「国のデジタル情報基盤の拡充」を図る事業が軸となる。

その一環として、国立国会図書館は2022年4月25日、NDLOCRをオープンソースとして公開した。NDLOCRとは、既存のOCRでは不可能だった、旧字仮名遣いや異体字といった文字の読み取りを可能とする日本語OCRプログラムだ。国立国会図書館はこれを活用し、今後デジタルデータ化を進める書籍や雑誌のテキスト化に取り組む。

このNDLOCRを開発したのが、株式会社モルフォAIソリューションズだ。NDLOCRをはじめとする「デジタルアーカイブ事業」に加え、画像認識技術を活用した「スマートシティ事業」にも取り組んでいる。同社が展開する事業やディープラーニングの活用事例について、同社代表取締役社長 兼 CEO 神田 武(かんだ たけし)氏、技術管掌執行役員 栗原 洸太(くりはら こうた)氏に話を聞いた。

株式会社モルフォAIソリューションズ

事業内容:AIコンサルティング、システムインテグレーション、SW・HW販売など
本社所在地:東京都千代田区
設立:2019年12月
https://www.morphoai.com/

事業領域は「デジタルアーカイブ事業」と「スマートシティ事業」

――御社の事業概要と創業の経緯を教えてください。

モルフォAIソリューションズは2019年12月に設立された会社です。グループ会社であるモルフォで培ったAI技術のさらなる事業化を目的として立ち上がりました。モルフォではスマートフォンベンダーや車載機器メーカーなどの顧客を持っており、すでに専門の営業・開発体制もありました。ただ、それ以外の業界向けの体制は手薄だったので、モルフォAIソリューションズではゼロから体制を立ち上げました。

事業領域は「デジタルアーカイブ事業」「スマートシティ事業」の2領域です。もともとモルフォで強みのあった画像認識技術を活用可能なセキュリティカメラ向けAIを提供するスマートシティ領域はもちろん、デジタルアーカイブ領域にも可能性を感じていました。

デジタルアーカイブとは、歴史的な資料や芸術品をデジタル化・テキスト化して再利用する取り組みを指します。テキスト化にはOCRが必要となってきますが、現在のOCRのユースケースは主に帳票上の手書き文字認識の読み取りであり、書籍や雑誌に特有のレイアウトや、明治期~昭和初期の近代書籍・雑誌に出てくる現代では使われない文字種に対応できないのです。こうした市場からのニーズや、SIerなどのパートナーとの関係構築の要素、当社の強みを鑑み、主要事業をこの2領域に定めました。

国立国会図書館「NDLOCR」開発の裏側

――デジタルアーカイブ事業について詳しく教えてください。

――神田

デジタルアーカイブの取り組みは、現在、国立国会図書館様向けの開発が主体となります。2021年、国立国会図書館が保有するデジタル化資料をテキスト化するためのOCR処理プログラムの入札があり、当社と凸版印刷のチームが受託に至りました。

出典:モルフォAIソリューションズ社プレスリリース

――神田

国立国会図書館が保有するデジタル化資料は画像点数にすると2億点以上存在し、今後もさらなるデジタル化が見込まれます。テキスト化には人力による入力では到底間に合いません。そこでOCRの出番ですが、前述の通り、現代のOCRでは旧字、旧仮名遣いや異体字といった近代書籍に利用されている文字種や特殊なレイアウトには対応できないという課題がありました。今後、新たにデジタル化する資料に対して、国立国会図書館が自由に活用し、改良できる自前のOCRを構築することを決められました。

そこで凸版印刷と共同で入札に臨み、凸版印刷が近代書籍に対応したデータセットの作成、当社が最新のディープラーニングを活用したOCR処理プログラムの開発という分担で入札に臨んだ結果、ご提案を受け入れていただきました。すでに開発は完了しており、2022年4月25日にはオープンソースとして国立国会図書館のGitHubでも公開されました。

出典:国立国会図書館NDLラボ「令和3年度OCR処理プログラム研究開発」

――神田

市販のOCRでは通常、近代書籍を読み取らせると40〜80%程度の認識精度しかありません。半分程度しか読み取れなくては、テキスト検索などの用途においてはほぼ使えないのと同義です。NDLOCRでは、市販のOCRより高い90%以上の精度で近代書籍の文字やレイアウトを認識可能です。特に1870年代の文系書籍においては、市販OCRの約2倍(約40%→90%以上)の読み取り精度を達成できました。オープンソースで公開されて以降、Twitterなどでも技術者の方々に好意的なコメントをいただいているほか、これまで古い書籍を調査する際に、資料のテキスト化や内容の検索に苦労されていた研究者の方々にも喜んでいただいています。

NDLOCRを起点として、我々としても本技術を商用化していきたいと考え、開発しているプロダクトが「FROG AI-OCR」です。

出典:モルフォAIソリューションズ社プレスリリース

――神田

クラウド上に画像をアップロードすることで、NDLOCRと同様のOCR機能を活用できることに加え、テキストの校正や出力機能も一つのパッケージとして利用可能です。地方図書館や研究機関、アカデミア、出版社、新聞社でのユースケースを想定しており、現在は一部のテストユーザーの方々にご使用いただいています。

画像認識技術を活用したスマートシティ事業

――スマートシティ事業について詳しく教えてください。

――神田

スマートシティ事業では、当社が強みを持つ画像認識技術をベースとし、群衆カウントや見守り、駅の安全管理や交通量計測などのセキュリティカメラをAIによってスマート化するソリューションを提供しています。

出典:モルフォAIソリューションズ社プレスリリース

――神田

直近ではドトールコーヒーショップ様の事例をプレスリリースとして出させていただきました。ドトールコーヒーショップ高知帯屋町店にて店内の混雑状況を計測し、店舗外からも視認できるサイネージに混雑状況を表示しています。こちらの店舗は3階建てですが、2、3階が空いているにも関わらず1階が混雑しているとお客様が入店しにくいという課題がありました。混雑状況をサイネージで表示し、お客様が1階から3階のフロアの混雑状況を事前に確認できることで、スムーズに空いている席へご案内することが可能になりました。

見守りAIソリューションでは、白杖や車椅子、転倒状態などを検知してアラートを出すシステムが、すでに国内のスマートシティなどで導入されています。駅の安全管理にも導入されており、駅のホームで黄色い点字ブロックの内側に人が立ち入った際、駅の管理システムと連携して黄色い線の内側に下がるようにアナウンスされます。

出典:モルフォAIソリューションズ社HP

――栗原

こちらの導入の決め手は推論処理速度でした。検知してからアナウンスを出すまではわずか1秒ほどで、他社サービスでは5秒から6秒ほどかかっていました。特に緊急を要する見守りAIについて言えることですが、AIの社会実装においては、検知してからアラートを出す速度が重要になることがあります。当社ではこのようなシーンでも実用に耐えうる高速で高精度なモデルの開発を日々行なっています。また、計算リソースの限られたエッジデバイスやAIチップを搭載したデバイス上にモデルを実装する場合、量子化などを使ってモデルを最適化したり、AIチップで対応されている処理のみでモデルを構成したりする必要がありますが、精度をキープしつつ速度を出すことができるAIモデルの選定を行い、デバイスに合わせたカスタマイズを要するところが、開発する立場として苦労するポイントです。

もちろん、近年デバイスの計算能力は上がり続けているため、最近はようやく精度が良いAIモデルをAIチップ上で動かせるようになってきました。GPUを使用すると予算が膨らみますし、電力消費も激しいために嫌うお客様もいらっしゃいます。当社としては、エッジデバイスでもGPUでもさまざまなケースに対応し、お客様の幅広いご要望に応えていければと考えています。

デジタル化されていない資料はまだまだ山のようにある

――御社の今後の展望について教えてください。

――神田

まず、スマートシティ事業においては、より幅広い業種業態のお客様に使っていただけるよう、他業種に展開していきたいですね。最近では警備会社がエンドユーザーになることも多く、安全な社会を実現する鍵になる業界でありながら、業界としては高齢化が進み人件費が高騰しています。そこにAIを提供することで業務が効率化できれば、大きな社会的意義があると考えています。その中で、ディープラーニングは間違いなく鍵になる技術であり、当社では今後もフル活用していくでしょう。

デジタルアーカイブ事業においても、まだまだ日本にはデジタル化されていない資料が文字通り山のように存在します。日本の良さを海外に伝えるといった取り組みでも、まだデジタル化されておらず、眠っているコンテンツを掘り起こすことができれば新たな可能性が広がります。デジタルアーカイブの取り組みは、現在は国主導で進んでいますが、そこに我々のようなテクノロジー企業が参画することで、さらに加速させることができると考えています。