机翻功能迭代 本身累人的打字幕如今点几下鼠标就搞定
曾经,有个叫“字幕组”的东西,听起来他们干的活很简单,就是给视频加上字幕,实际上,以前给视频加字幕,跟如今比起来,就是一个技术活。你得会字幕软件,得会时间轴。而早期的字幕软件,即便是图形化的界面,我接触过,没有教程是完全不懂的…自己瞎摸索,也摸索不懂到底怎么折腾。
而如今的字幕软件,同样是图形界面,真正做到了傻瓜式的操作,我自己摸索了10分钟,已经会从嵌入文本到顺利出产字幕的全过程,简单方便易懂。
但是,在那个时候,并不是说精通了字幕软件的操作,就可以让效率事半功倍了。就算你精通字幕软件,一样需要一句话一句话的对轴,这是没有任何捷径可走的,因为你对轴的是视频的内容,也就是语音,你打的字幕和语音没办法靠着某种捷径关联,不如说打字幕本身就是这个对齐的过程,所以可以说是相当费时了。我自己制作视频,所以知道其中的痛苦。如果制作一个5分钟左右的解说视频,可以说有30分钟甚至更久的时间是花费在对齐字幕和时间轴的过程中。如果是填满1个小时30分钟的剧场版动画的字幕,加上校正,那的确是一个费时费力的工程。
而如今的字幕软件,结合了AI语音识别的功能,也就是说,把视频的内容中,声音的部分,和你的文本的部分打通了……把对齐字幕时间轴这个事情完全自动化完成。这就让我目瞪口呆了。也就是说,如今的字幕软件,只需要你嵌入已经写好的文本,利用语音识别,就能完成。原本需要一条条对轴的事情,现在,点几下鼠标就完成了。这大大节省了制作字幕的时间。
而且我试了,识别对轴的准确率非常高,基本只需要做一下轻微的调整,就能完成字幕的制作。看到这里我自己都傻了,都不知道为什么以前要花这么多时间在视频字幕的制作上……
不过你也肯定想问了,这个语音识别岂不是只能应用于语音和文本是同一国的语言情况下,才能对齐语音和文本的时间轴?话是没错,但这个软件ARCTIME PRO甚至还整合了翻译机的功能。比如说,有一段日文的内容,你想做翻译的字幕,它可以自动识别日语的语音,然后自动生成日文的字幕,再用机翻完成翻译。当然你会说 ,如今的机翻还是没有人工翻译这么流畅和准确,但我觉得机翻这个功能还是有使用场景的。如果语法特别正式,例如产品发布会、新闻报道等场合,用到的一些标准的词汇,那么机翻再稍加修饰基本就是可用的状态。而且随着机翻功能的迭代,它的效果一定会越来越好。
当然,这是机翻的不够成熟的导致的,而不是语音识别的或者说逻辑上的不合理导致的,目前的AI辅助字幕软件,我觉得已经消灭了字幕软件能想得到的所有痛点,并且给了你想要的一切功能……曾经在打字幕这件事上觉得备受折腾的我,此时泪流满面。
字幕软件的AI化辅助,是我最近在生活中对于AI改变生活的强感知。以前可能需要一支团队来完成的字幕注入,现在可能只需要翻译一个人就能操作。大幅节省了人员和时间成本的投入。
还有刚才提到的机翻。
以上是我用的机翻软件,Deep L2,以前的机翻给人的印象就是,填词造句生硬,甚至狗屁不通,但如今的机翻,我说了,只要有合适的场景,它就可以获得理想的效果,我用机翻去外文网站学习,和老外用英文进行交流,即便是硬核话题也可以做到互相理解。其实我自己也不知道我说的对不对,但从上下文来看,我觉得老外们肯定是读懂了我的意思…我有日语基础,也可以确信我和日本人用机翻可以顺利地沟通…我觉得这个世界都因为这些技术的跃腾,变得越来越近,没有距离。
AI技术的迭代,给生活带来的是飞跃式的递进。再打个比方,寄快递,或者说X宝发货,每次都要填写繁琐的姓名、地址、电话的信息,非常麻烦。如今的AI填写,你只需要把这些信息一股脑粘贴上去,AI算法会帮你自动填写到姓名栏、地址栏、城市、电话号码的不同栏目中,你需要做的只是确认一下信息就可以顺利下单。这种技术的应用大幅提升了发快递的体验,真的是“一键完成”。
AI技术的如此快速的发展,很多事情都是2-3年前都想不到的。AI技术大幅节约了人们的劳动时间,提升了劳动效率。但也会有人担心,照这个发展的速度,AI全面替代人们繁琐的劳动,社会的结构是否也会发生改变?我觉得,这事情还是留给布局的人们去思考,我们即便胡思乱想,也改变不了这个趋势,所以,享受AI带来的便利就是我们需要做的。