2022.01.11
今、さまざまな業界で活用が進むAI技術。そのコアが、機械学習と呼ばれるAIにデータを学習させる行為。これには膨大なデータ構築が必要です。2010年に起業し、AIの最前線である国内外の大企業や研究機関に学習データを提供している株式会社バオバブ。異業種からこの世界に飛び込んだ代表取締役の相良美織さんが歩んだ道のり、今後のビジョンについてお話いただきました。
今、私たちが提供しているのは、AIの学習データと呼ばれるものです。これは、コンピュータの「学習ドリル」のようなもの。子どもが計算問題をひたすら解いて学ぶように、コンピュータが自分で予測したり判断したりできるように学習させる、質問と回答のセットのことを指します。
例えば、この画像には「ネコ」が映っているということを学習させる場合、その画像のどこにネコがいるのか、四角いカコミなどで指定して「ネコ」とラベルを付けます。これで初めて、学習データがひとつできるわけです。いろいろなネコを画像認識させるために、膨大な質問と回答のセットが必要になります。
活用方法はさまざまです。あるクライアントは、トマトの収穫に関する依頼でした。極端な例ですが、100個しかトマトが熟していないのに、収穫する人が20人来てしまったら、無駄になってしまいますよね。まだ硬いグリーン、もうすぐ熟すオレンジ色、収穫できる赤、それぞれのトマトの数がわかれば、一週間後には何人のスタッフが必要か、シフトの予測ができます。そこで、トマトの色の画像認識エンジンを構築するための学習データをつくってほしい、というのがそのときの依頼でした。
この案件の学習データは、数万件つくりました。この数字が特別多いわけではなく、普通です。学習データをつくっているのは、「バオパート」と呼んでいる、国内外に約900人いる優秀なスタッフたちです。
40歳を過ぎるまで、起業しようと思ったことは一切ありませんでした。でも、どうしてもやり遂げたいことがあった。起業は、そのために必要な手段でした。
大学は文系で、証券会社や銀行などを経て、運用会社の創業メンバーの一人となりました。その時に出資をしていたベンチャー企業を黒字にするため、取締役として出向したのが始まりです。ある大きな案件があり、これが来期も進めば黒字だと思っていた矢先に、2009年の政権交代。その案件が立ち消えてしまいました。
すると、一緒に事業を進めていた研究機関の先生方が、「これをやめてしまうのはもったいない。応援するから、やってみなさい」と言ってくださったんです。その案件は機械翻訳だったのですが、金融業界にいた私にとっては専門外。以前のボスである有名なファンドマネージャーからは、「失敗するからやめろ」と止められました。業界も違うし、もし起業しても、すぐに帰ってくるだろうと思われていたようです。
それまではまったく考えていなかった起業ですが、先生方の後押しで決心し、30分で定款を書き上げました。そのときはとにかくやりたい、誰もやる人がいないなら、私がやりたい!という一心でした。40歳を過ぎていることもまったく気にならず、2010年に起業しました。
多くの人がネット上などで使っている機械翻訳も、AI技術のひとつです。機械翻訳エンジンをつくるには、大量の「コーパス」が必要になります。コーパスとは、二つの言語間の文同士を対訳の形で大量に収集した資料のようなもの。例えば、「私はりんごを食べます。」と「I eat an apple.」の組み合わせのことです。正しい日本語ということだけでなく、アパレルに特化したエンジンなら、「デートに最適!ふわふわワンピース」など、業界で使う言葉のコーパスが求められます。
機械翻訳の事業を「応援するよ」と言ってくださった先生方でしたが、「しかし、ひとつ条件がある」と。この膨大な数のコーパスを安く作る方法を考えてください、と言われました。そこで思いついたのが、留学生にお願いすることです。大学へ行ってポスターを貼り、チラシを配り、学食で声をかけました。留学生の知り合いがまったくいなかったので、そこから始めるしかなかったんですね。
5人ほど集まると、彼らが友人に声をかけてくれて、ネットワークが広がっていきました。留学生がアクセスして仕事をするためのプラットフォームをツール化し、急に休講になった学生が1時間でも作業できる環境を整えたり、1から翻訳するのではなくて機械翻訳したものを留学生が修正するなどして、効率化とコストセーブを進めました。そしてひとつの事業を成し遂げることができた、このときの留学生ネットワークがバオパートの始まりです。
創業した翌年の2011年から2014年まで、総務省の所管の研究機関である独立行政法人(現:国立研究開発法人)情報通信研究機構に勤務しました。それまで金融や商社の世界にいたので、AIをきちんと学びたいと思ったためです。公募されていた新たなポストに入り、聴覚障がいのある方とのコミュニケーションツール「こえとら」の開発に携わりました。
そのとき、実証実験に協力してくださったのが、九州の特別支援学校でした。いくつもの学校を回りましたが、彼らの世界を広げるためにITやAIは有効なツールだと思うけれど、この方々が仕事を得て自立していくとなるとすごく大変だと身に沁みました。いつか彼らと仕事をする機会をつくりたいと、考えるようになりました。
学生や主婦など、世界中のさまざまな人が集まるバオパートに障がいのある方が入られたのは、2019年のことです。青森県の障がい者就労支援施設の社長さんとご縁があり、「絶対に向いているので、仕事をやらせて欲しい」とおっしゃってくださいました。「もちろん、協力します!」と答えましたが、クライアントさんがいる仕事なので、「健常者と同じ品質を求めます。そして報酬も同じ金額をお支払いします」と申し上げました。
仕事が始まってみると、皆さんのパフォーマンスが素晴らしくて驚きました。社長さんの言葉どおり、適正がすごく合っていたんですね。こうして、ずっと心の片隅にあったことが、ようやく実現できました。
理系のエリート男性ばかりのAI業界で、理不尽なことはたくさんあります。そもそも、創業時に公証役場へ定款を提出したとき、「どうせ女の子なんだから、会社を大きくするつもりなんてないんでしょ。なのに、なんで監査役を置くの?」と言われました。クライアントは法人が多くなるだろうと思って監査役をつけたんですが、「初日からこれか」と思いました。「いや、まだ初日にもなっていない、会社をつくる前だ」と(笑)。
そんなときは、「プレイ(遊び)」だと思うことにしています。これは、「公証役場プレイ」なんだと。そういう場だと思って、乗り切るんです。もうひとつの方法は、「幽体離脱」。頭上の2メートルあたりに魂を置いて、上から俯瞰します。すると、いろんな人が見えて、もちろん自分も見える。そこで、自分がかっこ悪いことをやったらダメだと思うわけです。理不尽なことがあっても、ふて腐れない。誰から見ても恥ずかしくない「王道」で行く、ということを大切にしてきました。
これからのビジョンは、2つあります。ひとつは、障がいのある方々とお仕事をするノウハウが蓄積されてきたので、海外の障がい者にもバオパートを展開していくこと。もうひとつは、事業の幅を広げることです。バオバブは創業以来、AIをつくる上での一番初めの学習データをつくるということに特化してきました、次は、モデルに学習させて、評価をするというところまで広げていきたいと考えています。今後は、さらにAIの社会実装化は進んでいくはず。バオバブは、ますます面白い方向へ進んでいくと思います。
2010年に株式会社バオバブを創業。2011~2014年、独立行政法人(現:国立研究開発法人)情報通信研究機構に「わくわく創造担当」として勤務。音声認識技術を採用した障聴者と健聴者とのコミュニケーション支援アプリ「こえとら」の研究開発などに携わる。
バオバブは創業以来、機械翻訳エンジン用対訳、画像アノテーション・タグ付け、音声タグ付け等学習データ構築サービスを、Carnegie Mellon UniversityやNTT東日本など日本/海外の法人・研究機関に提供。2013年、AAMT(Asia-Pacific Association for Machine Translation)長尾賞受賞。2015年、言語処理学会代議員就任。2017年、総務省情報通信審議会情報通信技術分科会技術戦略委員会次世代⼈⼯知能社会実装WG 構成員に就任。2019年12月、富士製薬工業株式会社 社外監査役就任。