• Interview
  • 運用ナビが取材させていただいた企業やイベントの情報を掲載
  • HOME
  • Interview
  • 「デジタル化された私」が広げる、人間の可能性とは?―オルツグループ様インタビュー
「デジタル化された私」が広げる、人間の可能性とは?―オルツグループ様インタビュー

「デジタル化された私」が広げる、人間の可能性とは?―オルツグループ様インタビュー

左から、オルツグループの長田さん、豊沢さん、米倉さん、浅井さん、IIJの福原

高精度で自然な日本語の対話エンジンや、表情や話し方、声のトーンまで再現したデジタルクローンなどAIの研究開発でリードする、オルツグループの皆さんにお話を伺いました。システム運用には縁遠いと思っているうちに、未来は確実に近づいているようです。

(株)オルツ/(株)オルツテクノロジーズ 代表取締役  米倉 千貴 さま
(株)オルツ/(株)オルツテクノロジーズ VPoE AI技術開発部 部長  長田 恭治 さま
(株)オルツテクノロジーズ 第二開発部 部長  豊沢 泰尚 さま
(株)オルツテクノロジーズ 第一営業部 部長  浅井 勝也 さま

(株)オルツ
https://alt.ai/

デジタルクローンが広げる、人間の可能性

IIJ 福原(以下、福原) AIといえば、一般の人には何だかイメージばかりが先行しているような面もありますが、実際、どうなんですか?

オルツ 長田(以下、長田) 最近、テレビドラマに出てくる適当な設定のAIが凄すぎて、ハードルが無茶苦茶上がっていますよ(笑)。作ってる登場人物もみんな天才ですし。

オルツ 米倉(以下、米倉) 弊社は元々「P.A.I.(Personal Artificial Intelligence)」という、自分自身の意思をデジタル化し、クラウド上に置くAIを開発してきました。これは、いわば「デジタル化された私」としての対話エンジンです。一般的に「対話エンジン」というと、メールやチャットのログ、文章などのテキストを機械学習させ、モデルを構築して、チャットボットのような仕組みを作ることが通常です。P.A.I.では、喋る内容だけでなく、表情や、声質や仕草まで、その人を再現できるデジタルクローンの実現を目指しています。

福原 そう、そのお話でした。初めて御社でお会いして『デジタルクローンを作ろうとしている』というお話を聞いた時は、私も正直『一体、何をいってるんだ、この人たちは!?』と(笑)。

米倉 今年の2月に、イーロン・マスクが共同会長を務めるAI研究企業OpenAIが「GPT-2」を発表しました。これは、自然言語の文章を生成するモデルです。2月時点では小型のモデルしか公開されませんでしたが、5月に続いて8月と、順次、より大きなモデルが公開されています。

福原 悪用のリスクが懸念されるほど、非常に高度な文章が作成できると、大きな話題になりましたよね。

米倉 はい。弊社はこれの日本語版を独自に作っているようなものです。テクノロジーが急速に進化する中で、膨大な数のシステムが稼働し複雑になっていますよね。それを一人の人間で扱うのはもはや限界です。そこで、デジタル化した自分のクローンに煩雑な処理を任せ、人間の可能性を広げていこうというのがP.A.I.です。

「デジタル化された私」が広げる、人間の可能性とは?―オルツグループ様インタビュー

「デジタル化された私」であるデジタルクローンの可能性。

オルツ 浅井(以下、浅井) 弊社は、研究開発を担うオルツと、より現実的なビジネス展開のためのオルツテクノロジーズという2社の体制なんですが、本体であるオルツは、確かに、一体何をやっている会社なんだろう?とは思われているかもしれません(笑)。
一般的なAI関連会社さんって、最終的なゴールをあまり示したがらない傾向があるんですが、明確なビジョンを語れるのが弊社のスタンスです。デジタルクローンがあれば、例えば芸術家が亡くなった後でも、その人の新作が作られるわけです。

福原 もう、SFの世界ですよ。確かに、ロボットによる自動化ツールであるRPAも、レベルが上がればAIとより高度な仕組みが不可欠です。UOMも『システム運用の自動化・最適化を目指してやり過ぎたかな?』とも思っていたんですが、そんなレベルじゃないですね。

データのセキュアな保存方法と、効率的な分散処理

「デジタル化された私」が広げる、人間の可能性とは?―オルツグループ様インタビュー

「ぶっ飛んでいる」話には、いつも興奮させられます。

福原 いろんなお話がぶっ飛んでて、実感がなかなか湧きませんが、システム運用畑の人間としては、セキュリティやシステムの負荷など、仕組みが気になるところです。

米倉 弊社システムのアーキテクチャとしては、個人のテキスト、顔写真、音声は、すべて弊社のサーバに保存されています。これらのデータからモデルを作るのも、弊社のサーバで処理されます。ただ、これをコンシューマ向けに提供すると、膨大なデータ管理や処理、セキュリティの面でいろいろな課題が出てきます。それに対する答えの一つが「al+ Stack(オルツ・スタック)」、そしてもう一つが「al+ Emeth(オルツ・エメス)」です。

長田 まず、Stackは、デジタルクローンの保存の仕組みです。Stackでは、個人がコミュニケーションに使っているスマホやPC、スマートデバイスから集めた、テキストや画像、ライフログ、ヘルスケア情報などを保存します。データは暗号化して分散ストレージに書き込むと同時に、改ざん防止のためにブロックチェーン上にハッシュ化して書き込まれます。これは、弊社が無くなったり、データがロックインされてしまう心配のない、いわば非中央集権型の情報銀行です。
個人が持っているハッシュ値のキーがないと解読できないので、個人情報の可用性や安全性の担保という点で非常にセキュアです。逆に、ご本人やご家族が秘密キーを持ってさえいれば解読できるので、将来、例えば『亡くなったおばあちゃんのデジタルクローンを、お孫さんが呼び出す』ようなことも可能になります。

福原 『何をいってんだ?』という感覚は、今も正しいのかも…(笑)。ただ、どれほどセキュアだといわれても、一般の人からすると、重要な個人情報の取り扱いについては心理的に強い抵抗があると思うんですが。

米倉 そうですね。ただ、人が新しいテクノロジーに対して抱く警戒感は昔からあるので、ネットが大好きで抵抗がない人 vs 保守的・否定的な考え方の人のように、今後はますます二極化していくと思います。今はとにかく、集められるだけの高精度データを集め、セキュアに管理できる仕組みを通じて、デジタルクローンが実現できることを目指しています。

福原 なるほど。『子供が小さかった頃に、4Kビデオカメラがあれば…』と思ったりしますよね。モデル生成の処理の方はどうですか?

米倉 今までは、言語処理モデルを作るのに必要なデータも限られ、費用もあまり掛からないといわれてきました。ただ、より人間らしく自然な学習モデルを作るのには、膨大なデータ量が必要で、費用も莫大です。そこで弊社は、全世界に眠っている余剰なコンピューティングパワーを集めて処理する、「al+ Emeth(オルツ・エメス)」というプロジェクトを進めています。

長田 現状、言語処理に使われている一般的なモデルは、分散処理に向いていません。そこで、弊社が開発するEmethによって、ニューラルネットワークを分散処理できるネットワークを構築します。余っているコンピューティングパワーを活用して、効率的かつ低コストでモデルを作ってアウトプットできれば、さらに新しいアイデアが実現できるはず。将来的には、例えば、家庭で余っている高性能ゲーム機なども使ったグリッドコンピューティングで処理できれば、さらに効率化できると思います。
また、コンピューティングパワーの提供側・利用側の双方に、経済的な合理性がなければ継続しないので、仮想通貨やトークンの発行を通じた価値と報酬の交換の仕組みも準備しています。

米倉 P.A.I.は、何兆円も使ってAWSでやる話じゃありません。とんでもない量になる人間一人あたりのデータをセキュアに管理するには、ストレージを分散しなければなりませんし、ニューラルネットワークの演算処理も同様です。効率的かつ継続的に稼働する、巨大なエコシステムが必要なんです。

日本語の文脈をより自然に解析

「デジタル化された私」が広げる、人間の可能性とは?―オルツグループ様インタビュー

複雑で難解な日本語の文脈を高度に解析し、より自然な対話を実現。

福原 最初の方で対話エンジンの話もされていましたが、御社で開発されているのは、どういったものなんですか?

人間のように自然な対話ができる「alt対話エンジン ver1」を発表
https://alt.ai/news/news-dialogue-engine/

豊沢 弊社が開発している対話エンジンは、元々P.A.I.を開発するために複数あるAIの一部です。5年ほど前から開発してきたんですが、P.A.Iと会話するために作りました。高度な意図解釈エンジンを搭載しているので、ユーザが喋った内容から、なぜそういう喋り方や単語を使うのか、どういう意図で語ったのかといった、微妙な表現の違いや細かい背景を解析し、ラベリングして抽出する仕組みです。一問一答の質疑応答や文脈を考慮した継続会話ができるため、繊細で高度な対話が実現できます。

米倉 固定された知識データベースを参照するやり方だと、どうしてもチャットボットのようになってしまいがちですよね。この対話エンジンでは、内容認識して記憶した内容を文脈に反映できます。例えば、会話の中で『僕は結婚しています』のような話が出たときには、その個人に対して「結婚している」というステータスのフラグを立てる必要がありますよね。その言い方も「結婚」だけでなく「既婚」だとか「妻は…」とかいろいろあります。対話エンジンは、対話を解析し、文脈から関係性を抽出して自然な対話を実現できる、かなり高い精度を実現できます。
将来的には、この対話エンジンがカーナビのようなシステムに搭載され、より自然で雑な話しかけ方でも機能するとか、コールセンターでのより迅速な回答や、聞き漏らし防止などに使っていただけると思います。

長田 コールセンターといえば、トレーニング用にAIトレーナーのような概念でも、実際に企画を進めているところです。このプロジェクトでは、対話エンジンの複数あるモジュールのうちの一つである、「Neo RMR(Rewritable Memory based Retrival)」というモジュールを利用しています。このNeo RMRは、Q&Aを記憶する質問回答エンジン「RMR」の最新版です。

福原 進化したBOTのようなイメージですか?

長田 いや、それとはちょっと違って、多分、福原さんがイメージしているのとは逆なんです。
一般的なトレーニングだと、責任者が一人ついて、新人たちをOJTなどで数週間から数ヶ月掛けて研修教育しますよね。これを、AIにお客さま役をやらせて、人を教育するやり方です。いろんな想定外の質問が飛んでくる中で、マニュアルを正しく参照し、漏れなくヒアリングできているか。
もちろん、テキストだけでなく電話を想定した音声対話もあります。ミスがあればポップアップを出すなどして、最後に点数を表示して評価します。これなら、PCさえあればいつでも実践的なトレーニングができます。

福原 一般によくある、受け答えをボット側にやらせるのではなく、逆転の発想で面白いですね。サービスデスクなんかの分野でも、人間はうかうかしていられません。

日本というニッチなマーケットだからこその強み

「デジタル化された私」が広げる、人間の可能性とは?―オルツグループ様インタビュー

大学とも最先端の研究開発。日本語のマーケットに特化する強みを活かす。

福原 今まで伺った内容だと、やはりAIは、ノウハウや人材、資金的な面から考えても、これから1社でどうにかできるレベルではないですね。

浅井 はい。よく聞くのは、『社内でAIチームを作ってやってみたが、自社でいろいろやるのは相当厳しいことがわかった』と。そこで、自社路線を諦めて、弊社のようなベンチャーと協業しプロダクトを生み出していきたい、というご相談はあります。

米倉 大企業は、業種を問わず、遅かれ早かれ何らかの形でAIを導入していかなければならない立場です。しかも、直近になればなるほど、現実にビジネスへどう活用するか判断する必要に迫られています。今後は、協業という形がさらに増えると思うので、我々のビジネス領域をそこにフォーカスし、他社とのシナジーを目指していきます。
また、弊社は、さまざまな大学のトップレベルの先生方にもご協力いただいています。お客さまからのオファーでも、『完全に研究開発なのでいつ終わるかわからないから、大学と組みたい』という話をいただくことがあります。弊社は、各専門分野における最高の大学教授はこの人だ、という情報と人脈を持っているので、コンサルティングでかかわらせていただいています。今は、日本語の言語処理で国内の大学が対象ですが、今後は、画像処理や音声認識では世界規模でパートナシップを構築していきたいと思っています。

福原 言語処理といえば、日本語だとマーケットがニッチじゃありませんか?英語や中国語など、世界規模のパイとは比較になりませんよね?

米倉 実は、日本語のニッチなマーケットに守られて研究開発できているというのも、重要なんです。英語や中国語は、確かにマーケットも大きいんですが、レッドオーシャンでもあります。研究開発にしても、GoogleやIBM、ワシントン大学などが先行していますが、大企業や有名大学では母体が大きく、わざわざ日本語を研究するとコストが掛かり過ぎるんです。また、海外の大企業が作るシステムは結局、ローカライズ(日本文化への最適化)なので、その現地で研究できているわけではないというのもポイントです。顔認識や音声認識、翻訳などについても同様で、アジア人に絞ったクラスタリングによって、『日本の環境で確かな実績を持っているのは、オルツしかない』というポジションが確保されています。

福原 なるほど。御社はベトナムにも拠点をお持ちですし、今後、成長が期待できるアジア・パシフィックのマーケットは熱いですね。

AIでは処理できない、人でなければならないのは?

「デジタル化された私」が広げる、人間の可能性とは?―オルツグループ様インタビュー

『必ず先端をやる』という、高いマインドでチャレンジし続ける。

米倉 僕がいつも思っているのは、『正確性が求められるものほど、人間がやるべきではない』ということです。AIは、士業や医療など、正確無比なことが求められる現場には向いていると思います。

長田 逆に、まったく0から1生み出すような、何かを作り出すイノベーションだとか、クリエイティブの領域はまだまだ人の力が必要です。先ほど浅井が言った、芸術家のデジタルクローンの話にも通じますが、例えば、手塚治虫の作品を読み込ませて指向性をAIに学習させれば、手塚風の新しいストーリーやコマ割り、背景、吹き出しなどを生成はできるでしょう。ただ、全く新しいアイデアを作れるか、というと一般論ではまだまだ難しいと思います。

福原 そうなると、本当に人でなければならないモノって…何が残るんですかね?

米倉 一般には、さまざまな目的に対応できる汎用AIは、まだ実現が難しいとは言われていますが、人でなければならないモノ…ですか。んー、哲学的ですね。愛、じゃないですかね(笑)。
僕たちはベンチャーとして、社会の進化に貢献するという思想の下、クローンを全ての人に届けるという目標を掲げて活動しています。弊社の強みは、『必ず先端をやる』というチャレンジのマインドで目指す、高いビジョンです。高すぎて、みんな苦労していますが(笑)。P.A.I.のようなパーソナライズしたAIを通じて、人の記憶や癖をどうやって残すかに焦点を当てて研究開発を続けています。一般的で単純な言語処理なら、簡単にこなせる優秀なエンジニアが揃っています。ただ、みんな頑固なんで、簡単だったり普通すぎるものにはとことん抵抗して、より高いレベルを目指しています。
頑固なメンバーが集まって、ランチでも延々とこういう話ばっかりしてます(笑)。

福原 それこそ、「AIへの愛」じゃないですか!最後はキレイに締めていただきました。ありがとうございました。

関連記事一覧