甘南新闻网
热点专题 当前位置:首页 > 热点专题 > 正文

AI 翻译的 30 部女频总裁文长什么样

此外,在训练人工智能模型时,网络直播的双方都增加了“翻译风格”选项,方便准确地呈现不同类型作品的男性频率、女性频率甚至风格。面对不同的风格要求,人工智能能够以不同的方式呈现相同的句子。

这是一个让人眼前一亮的功能。雷锋网(公开号码:雷锋网)了解到该功能目前尚未正式启动。这是一个“正在培训的模块”。

技术困难

剩余的“点”在哪里缺失?

正如人类译者的翻译能力受到他们知识的限制一样,人工智能模型能够达到的能力范围也受到语言材料范围的限制。语料库中罕见但相对简单的表达方式,人工智能可以根据所学的语料库“猜测”正确的翻译,但当涉及到更迂回的表达方式时,例如从未出现在语料库中的习语,人工智能更有可能猜错。

蔡云技术算法工程师毛诗倩提到,例如:“燃灯如豆”,这意味着灯的火焰很小,而不是像豆一样。如果该词没有出现在语料库中,人工智能只能翻译字面意义。

根据公共信息,阅读团队基于自然语言理解技术对在线内容进行了深入挖掘。通过对大量在线内容和高质量社区内容的清理、培训和标注,机器可以更好地理解在线内容,构建自己的内容大脑。

文悦似乎正试图向合作伙伴的人工智能模型“输入”更多语料库。

在建立这个人工智能模型的过程中,毛诗倩遇到了三个困难:

第一,句子结构的正确完成。

文学作品中有一些复杂的句子结构或缺省元素。人工智能需要找到主客体之间的正确关系。

‘我们早点回家吧’

艾未未看到这句话时可能会感到有点困惑,必须努力找出主题是我还是你。

第二,名字代表团结。

一个字符可能有多个标题。例如,一个角色可能有一个很大的名字“七月”,同时还有几个昵称,比如“小琪”和“岳跃”。人工智能需要知道这些昵称都是指同一个人,否则它会翻译三个在英语中似乎不相关的名字。人工智能并不困惑,但读者会立刻感到困惑。

(说实话,像我们这样神经紧张的读者在阅读身体里的文章时遇到这种情况时,也可能会“面盲”。)

人工智能还需要知道角色的性别,以便正确使用人称代词。

以“巴文综”为例:

冷半夏靠在顾金白的怀里,苍白的脸上带着灿烂的笑容,看着冷可欣,并比划道:你完了!

冷半夏靠在顾金白的怀里。当她看着冷可欣时,苍白的脸上带着放大的微笑。她脱口而出,“你完蛋了!”

以上黑体部分是基于人工智能对半夏为雌性的认识而正确翻译的结果。

第三,写作风格是统一的。

第一句是浪漫小说的风格,下一句是科幻小说的风格,读者几分钟后就可以玩了。人工智能需要确保作品的翻译风格是统一的,并且符合作品本身的类别。

人工智能翻译还有改进的余地。

毛诗倩表示,基于变压器模型,目前可以引入对抗训练、模型提炼等改进技术,以及利用错位语料库进行预训练,以提高翻译质量,如BERT、MASS等。然而,目前所有的翻译模型本质上都是基于大数据拟合,机器不能像人类一样真正理解文本。“人工智能”的强大帮助虽然人工智能翻译暂时不能像人类那样“机智”,但它已经为网络写作领域的出海产生了巨大的推动力。根据

iresearch consulting发布的《2019 年中国网络文学出海研究报告》,海外在线读者对在线翻译的质量感到满意,但更新速度仍需提高。

在这种背景下,85分人工智能翻译是满足需求的好方法。

看到这种需求后,国内内容平台加大了将在线文章投放到海里的力度。在文悦和蔡科技联合推出人工智能翻译的30部在线作品之前,2017年11月成立的公司推特科技(推特Technology)在经过9个月的数据整合后,于2018年7月推出了在线文学人工智能翻译系统

根据吐温科技(Tween Technology)对Small Table的采访,人工翻译1000个单词需要一个小时,每个人工智能芯片需要一秒钟。成本也降低到原来的1%。一个100万字的专业翻译需要20万元,而人工智能需要不到1000元。

毛诗倩向雷锋证实了这一说法。他说:“只要有足够的钱,买更多的显卡来部署翻译模型,速度可以是无限的。”。即使它是一张显卡,它的翻译速度也比人类快一千倍。

雷锋网发现目前推特科技和蔡科技只在人工智能翻译网站上进行汉英翻译。然而,这只是有多少语言材料可用的问题。张可欣说,要达到85分的准确率,需要大量的语言材料,很多小语言很难收集。

有了足够的语料库(数千万个句子),一种特定语言类型的人工智能翻译可以在几个月内得到训练。

然而,有趣的是,非常擅长人工智能翻译在线模型的毛诗倩是一名归国的男性算法工程师,他没有来自月读的300条在线文本。

在海外,有无数人在等待他的人工智能好友在线翻译。回到搜狐看更多

——



甘南新闻网 版权所有© www.scrape-box.com 技术支持:甘南新闻网 | 网站地图