「ディープラーニング×ビジネス」活用事例紹介 #3
TAKAO AIは、JDLA主催の高専生による事業創出コンテスト「第1回全国高等専門学校ディープラーニングコンテスト2020(DCON2020)」で最優秀賞を獲得したことをきっかけに、2021年2月に創業した高専ベンチャー企業。
現在、起業以前から開発に取り組んできた自動点字翻訳エンジン「:::doc(てんどっく)」の正式リリースを準備中で、2022年4月にはオープンβ版がリリースされる予定だ。「:::doc」を開発した経緯や、DCONでの経験、今後の取り組みなどについて、同社の板橋竜太(いたばし りゅうた) 代表取締役社長に聞いた。
TAKAO AI株式会社
事業内容:情報アクセシビテリティ改善のための文書変換サービス等の運営・開発事業
本社所在地:東京都八王子市
設立:2021年2月25日
https://takao.ai/
JDLA主催の事業創出コンテスト「DCON」をきっかけに創業
―:::docのサービス概要を教えてください。
ユーザーの方がスキャンしてアップロードしたデータを、ディープラーニングを使って自動で点字に翻訳するサービスです。視覚障害者の方だけでなく、視覚障害者の方向けに情報発信する企業や団体にも使っていただくことを想定したサブスクリプション型のサービスになります。
点訳(点字翻訳)の対象は、パソコンなどで作成・印刷したテキスト文章だけでなく、手書きの文字やスーパーのチラシ、カレンダーなど、紙に印刷・記載される可能性のある全てのものになります。
―:::docを開発された経緯を教えてください。
開発のきっかけは、2019年10月の「全国高等専門学校プログラミングコンテスト(高専プロコン)」への参加です。
私が通っている東京工業高等専門学校(東京高専)では、以前から視覚障害者の方向けのナビゲーションシステムの研究をしています。点字ブロックの下にRFIDを埋め込み、視覚障害者の方が持つデバイスと連動して目的地に案内する、という内容です。
そういった関係で、2019年5月に私も視覚障害者の方のお話をうかがう機会がありました。その方が、「子供が小学校でもらってくる保護者へのお知らせのプリントの内容が分からず、悩んでいる。簡単に分かるようになったら嬉しい」とおっしゃったんです。ちょうどその時、高専プロコンのためのテーマが思いつかず悩んでいたので、「これに取り組もう」と決めました。
―その時は「できそうだ」と感じて開発を決めたのですか。
そうですね。小学校のプリントはパソコンで作ったテキスト文章ですし、OCRでも十分な認識精度が得られます。漢字の読み仮名さえ正確に振ることができれば、後はそれを点訳するだけです。ですから、「ドキュメントを自動で翻訳できないなんてことがあるか。なんでまだ世の中にないのだろう」くらいの気持ちでした(笑)。ただ、実際にプログラムを作ったりビジネスモデルを考えるうちに、徐々に非常に大変な取り組みであることが分かってきました。
―どういったところが難しかったのでしょうか。
当初の目論見通り、学校からもらったプリントであれば高い精度で点字にできます。ですが問題は、視覚障害者の方が、読みたいと考えている紙の内容や体裁を、ご自身で把握できないことです。どういうことかと言うと、お子さんに学校のプリントを直接渡してもらう時であれば、それがプリントだと分かります。ですが、そういった場面は稀です。視覚障害者の方がご自身で私が最初に作った自動点訳プログラムを使おうとする場合、手に触れた紙の中から、文字がプリントされたものだけを選ぶことが必要になりますが、それは実際には難しい訳です。
自動点訳を効果的に使うには、例えば郵便受けに届いた複数の紙について、それぞれどういった類のものであるかを判定し、指定したものについてはその内容を詳しく知ることができる、といった形であることが必要です。実用を視野に入れるには、これらのことが避けて通れないことが、プログラムについて考えるうちに分かってきました。
高専プロコンに提出した、学校のプリントに限定した最初のバージョンの:::docについても、視覚障害者の方から「とても役に立ちます。何もないよりずっといいです」とおっしゃっていただくことはできました。ですが、本当に役立つものにするには更なる改良が必要だと考え、2020年のDCONに向けて試行錯誤を重ねていきました。
―高専プロコンに提出した段階で、もう:::docという名前があったのですね。
はい、そうです。点読と、ドキュメントの意味の「doc」を組み合わせた言葉です。ただ、当時も名前は共通しているのですが、現在とは想定する提供形態が大きく違っていました。最初は、スキャナーと点字プリンターをセットにした据え置き型のハードウエアの提供を考えていました。
この形にはいろいろ課題がありました。まず40万円もする高額なハードをどこに設置するかが大きな課題でした。盲学校では需要があると思いますが、それほど数が多い訳ではありませんし、視覚障害者の方の家庭に一台ずつ置いてもらうには高額で場所を取ります。仮に、導入が進んだとしても、それでは市場が小さすぎてビジネスとして成立させるには厳しい規模感でした。
AIと人力を組み合わせたサービスに
―高専プロコンの後、想定するサービス提供形態を変えたのですね。
DCONは本選までの期間中に、メンターの方にいろいろご相談することができるんです。その制度を利用してメンターの方と話すうちに、現在のビジネスモデルが固まっていきました。
―どのようなサービスを考えたのでしょうか。
予定が書きこんである卓上カレンダーを読みたい、というケースを例にご説明します。カレンダーは日ごとに罫線で区切られていて、予定がある日に書き込みがあります。これをOCRで認識した場合、曜日や日付、書き込みを適当な順番で認識するだけなので、結果は全く意味のない情報の羅列になってしまいます。また、点字は仮名に対応したものであり、罫線などの表や図形を表す手段がありません。
そこで、まずカレンダーがどういったものかを人間が言葉で説明するフォーマットを作ります。そして、そのフォーマットに則って人力で点訳を繰り返して作ったデータを、ディープラーニングの教師データとすることを考えました。
サービスとしては、翻訳の依頼があったものについて、最初の数年間は人が点字に翻訳する形を採ります。その作業はクラウドワーカーにお願いする計画です。十分な教師データが集まったら、AIがこの作業を自動で行えるようになるはずです。
―フォーマットを作る作業も大変そうですし、クラウドワーカーの方にも高度な作業が求められそうですね。
そうですね。前例がないものなのでフォーマットを作る作業は大変ですし、実際に運用がスタートしてからも、ユーザーの方からのフィードバックを基に変えていく必要があると思います。クラウドワーカーの方にお願いする作業については、できるだけ依頼内容を細分化し、単純な作業にしていくことが必要だと考えています。その細分化、切り分けは我々が担う重要な部分です。
―専用ハードも使わない形にしたのでしょうか。
はい、サブスクリプション型のサービスに変更しました。この形であれば、視覚障害者の方にも負担なく使っていただくことができますし、点字での情報発信を考えるあらゆる団体がサービスの対象になります。ビジネス拡大の可能性も十分にあると考えました。
JDLAや高専のサポートを受けて起業した
―そのようにして考えたビジネスモデルでDCONに臨まれ、優勝されたのですね。起業まではどういった流れだったのでしょうか。
元々は私は会社を作ることにこだわりがありませんでした。ただ、高専プロコンやDCONを通して視覚障害者の方からフィードバックをいただけたことはとても嬉しく感じていたので、サービスを社会実装してご提供したいと考えるようになっていました。
起業の決め手の1つはJDLAの松尾豊理事長に説得していただいたことです。大変熱意のこもったプレゼンをしていただき、「こういうアイデアは会社にして事業化してこそ意味がある」、「JDLAでもサポートするからリスクは少ないし、事業に集中できる」「会社としての名前と名刺ができると、営業活動ができるし、いろいろな人と繋がることができるので一気に世界が広がる」といったことをお話いただきました。1時間の予定の面談だったのですが、3時間半もお話いただいて(笑)。
そこで、DCONの優勝したときにいただいた起業資金100万円を元手に、高専プロコンの時からいろいろと手伝ってもらっていた大変優秀な後輩を誘って起業することを決めました。
―JDLAからは起業についてどのようなサポートがあったのでしょうか。
会社を作る際の事務手続きなどに関して、ほとんどの作業をサポートしていただきました。私達二人が、「会社を作りたい」と決断しさえすれば、いつでも作っていただけるような状態だったんです。
―プロフィールに高専内での起業、とありましたが東京高専からもサポートを受けたのでしょうか。
オフィスの提供など、様々なサポートをしていただいています。2019年に企業とコラボレーションをするための新しい建物ができまして、その一室を我々に貸していただいています。起業に伴って必要になる会計などの事務作業についても、書類の作成や市役所への相談などを代わっていただきました。
―東京高専には起業の支援プログラムが元々あったのでしょうか。
いえ、今回が東京高専として1例目の高専内起業です。全国の高専としても、DCONのプレ大会に優勝した二校の先行例があっただけなので、我々が全国で3番目になります。
―DCONや起業を通して、どのような学びがありましたか。
高専には、ものを作るのが大好きな人は多くいますが、作ったものをどう使ってもらうかまでを考えている人は少ないように感じます。私自身もそうでした。ですが、DCONを通じて、人に使ってもらったりフィードバックを得る楽しさを知りました。こうした経験によって考え方が大きく変わったなと感じていますし、大きな成長に繋がったと思っています。何らかの課題解決に取り組み、成功体験を得ることは非常に大切だと考えるようになりました。
点訳は本質的にDXだった
―現在、サービス開発はどのような状況なのでしょうか。
開発する内容が固まってきた段階です。2022年4月中にはクローズドβ版をリリースして、試験的に使っていただくことを考えています。
―正式なリリースはいつ頃を考えていますか。
個人的な話なのですが、9月から海外留学を予定しています。行きたい大学があることと、将来:::docの海外展開を考えていることが理由です。ですので、8月までには何とか正式リリースを達成できたら、と考えています。
―具体的なサービスの提供内容も既に固まっているのでしょうか。
大きく二つのサービスをご提供しようと考えています。1つは、紙に記載している内容の詳細な点訳です。これは結果の出力までにある程度時間がかかってもいいと考えています。
もう1つは、記載内容がどういった種類のものなのかお知らせするサービスです。書類なのか、カレンダーなのか、スーパーのチラシなのか、といったことですね。こちらは、すぐに結果が返ってきてこそ意味があると思うので、短時間で結果をお返しします。
どちらのサービスも点訳だけでなく、音声での出力も考えています。後者のサービスについては、視覚障害者の方に無料でご提供する予定です。
―「紙の内容を認識して、説明できる形でテキストにし、点字か音声で提供する」ということからすると、点訳以外にも様々な可能性がありそうですね。
そうなんです。点訳という、社会的にも意義の大きいサービスの提供が事業を始めた原動力になってはいますが、アナログの紙をデジタルなテキスト情報に置き換える、という技術にはそれ以外にも様々な可能性があると考えています。
―そのような考え方は、DXに悩んでいる企業にも参考になるように感じます。
点訳に取り組んでいて感じたのは、「これは本質的にDXである」ということです。紙だと読めないものが、デジタルなテキストにすると読めるようになります。このケースのように、デジタル化する便利さが正しく伝われば、DXの目的や取り組みについて悩むことはないのかなと感じます。いろいろなものがデジタルになったときに、今までは到達できないと思っていたことができるようになるはずですから。