スキップしてメイン コンテンツに移動

機械の読唇術精度が

HAL9000 もそうでしたもんね。

いつものインプレスに機械の読唇術精度が人間を遙かに上回る93.4%を達成という記事が。

読唇術の精度は、
人間の場合、プロでも平均52%程度だが、英オックスフォード大やGoogle DeepMindの研究者らによる共同チームが開発した機械学習を利用した「LipNet」がそれを遙かに上回る93.4%を達成した。
という物凄い精度が出るようになったんですね。

これも、ディープラーニングのお陰のようで、
しかも、単語ごとでの認識では無く、
世界で初めて単語レベルではなく文章レベルの読唇を実現した。LipNetは、話者に依存せず93.4%の精度で読唇を行なえるという。

もうこれって、ほぼ何言ってるのか分かるレベルですよね。

映画 2001 年宇宙の旅 で、HAL9000 がクルーの唇の動きを読み、
何を会話してるか理解するシーンが有りますが、
これって、まさに 2016 年になって実現してるって状態になってますね。

2010 年代に入ってから、ディープラーニングを使用した AI が、
驚異的なブレークスルーを生み出して来てるように思います。

この調子なら 10 年先とかには、AI と流暢な会話で話をしてたり、
音声認識か、唇の動きのみで何を欲しているか理解してもらえるようになる未来が来そうですねぇ。

何か、さすがは 21 世紀って感じのものが産まれてきてるように感じるのは、
物凄く楽しみなのですが。

コメント