スキップしてメイン コンテンツに移動

NTT、車からの景色や周辺情報など

 これ、ローカルで完結するんですかね?

マイナビニュースにNTT、車からの景色や周辺情報などに基づいて雑談が可能な対話AIを実現という記事が。

景色を見て話しかける AI が実現だそうで。

対話モデルはルールや係り受け関係などの統計情報に基づく従来のモデルとは異なり、複雑な文脈の理解や自然な発話の生成が可能だという。
確かに今までの AI の会話ってどこか違和感を感じるタイミングもありますが、
NTT が実現したのは自然発生的な会話が可能になるものなんですね。

記事では会話例が載っていますが、通常人間が AI に話しかけて会話がスタートするものが多いですが、
この仕組だと、周りの景色を認識して AI から話しかけるって動作になるんです。

対話AIは人がどの時点の画像やスポット情報を話題としているのかを理解しつつ、新規に入力された情報にも触れながら対話する必要がある。今回の成果では、対話文脈からの話題画像推定と、逐次的に入力される画像に対する発話の話題強度の推定技術を開発し、それらを適切にタイミング制御に組み込むことでこうした課題を解決している。
会話しながら、カメラが捉えた映像を解析しつつ自然な会話をこなす。
あれ?これって、人間の目からの資格情報を脳で解析しながら、今話している内容とは別の事を考えて、
割り込めるタイミングで割り込んでくるっていう動作は、
まさに人間の脳が行っているような事のように思いますね。

また、記事中にもありますが、文脈発話候補の中の危険察知ってカメラで捉えた内容を解析して、
危険と判断した時に、警告を発するって事も可能になりますかね。

だたこれ、センターとやり取りしてたら間に合わないですよね?
あくまでローカルに実装されている AI が DB 情報とカメラからの映像情報と人間の発話情報から処理をして返事する。
みたいになってないと会話テンポずれるって事になりそうですが。

時代が下って、超高速回線(上り下り共に)が途切れずに利用出来る世の中になったら、
センター処理方式でも出来ると思いますが、
現在のインフラだと通常稼働時にはローカルで稼働して、
自宅に車輌が戻った時に高速回線で DB の更新って方法が現実的な所ですかね。

これ、実現出来たら K.I.T.T. の実用化にまた一つ近づくように思うのですが(^_^;)
自動運転レベル 4 と、この対話 AI が実装された車輌(ファイアーバードトランザム)が有ったら、
リアルナイト 2000 ですねぇ(^_^;)

コメント