斯坦福工程师:视频剪辑或像文本编辑一样简单—硅谷洞察( 二 )

斯坦福的博士后学者Ohad Fried说:“不幸的是,此类技术总会吸引那些不好的演员,但是考虑到该技术支持创造性视频剪辑与内容创建应用程序,这些努力是值得的。”

唇语阅读

该软件采用新型转写技术从不同视频片段中提取语言动作,并通过机器学习,转换为让观众看起来自然的成品视频——比如唇形同步等。

有关此项研究的论文第一作者Fried说:“从视觉上看,视频是无缝衔接的,所以也就没必要去重录了”,该论文发表在arXiv网站上,也将在《美国计算机学会图形学汇刊》上发表。Fried在Maneesh Agrawala的实验室工作,Agrawala是工程学院的Forest Baskett教授,也是该论文的资深作者。该项目从2年前Fried还是普林斯顿大学研究生的时候就开始了,他那时与计算机科学家Adam Finkelstein合作项目。

如果演员说错话,编辑可以只编辑文本,应用程序将从视频其他地方的不同单词或单词各部分中组合出正确的单词。这就相当于重写视频,就像作家重新输入拼写错误或不合适的单词一样。然而,该算法至少需要40分钟的原始视频作为输入源,所以它还不能处理视频序列。

推荐阅读