自动翻译技术正以之前从未有过的速度,融入到我们的生活之中,它不单单是语言障碍的破壁器,更是全球信息自由流动的催化剂,从最初的规则翻译,到如今的神经网络模型,这项技术已经能够理解上下文,以及习语,乃至文化隐喻,虽然它还没有达到完美的境界,但是确实为跨国交流,还有学术研究,以及商务合作,提供了极大的便利,随着人工智能技术的迭代,自动翻译正在从单纯的工具,转变为智能助手,其价值不仅体现在文字转换,更体现在文化桥梁的构建。
自动翻译如何准确处理专业术语
高质量的专业语料库以及领域自适应技术,对专业术语的准确翻译起着依赖作用。就医疗翻译而言,系统要识别“myocardial infarction”对应“心肌梗塞”,而不是进行字面翻译。这需要模型在通用训练的基础之上,额外去学习医学论文、临床报告等专业文献。当前主流的做法是建立垂直领域术语库,并且采用迁移学习技术,以此让模型在保持通用语言能力之际,强化特定领域的翻译准确性。
实际运用当中,专业术语的翻译依旧面临着一词具有多个意思这般的挑战呢。举例来讲哦,“cell”在生物学期刊里应当被翻译为“细胞”,而在电子工程范畴之内却被翻译为“电池”。要解决这个事情是需要引进注意力机制的,借助剖析术语所在的完整句子的结构去判断具体的语义。某些专业的翻译系统还会结合知识图谱,当检测到“cell”跟“microscope”共同出现的时候,就会自动挑选生物学方面的释义,这样的上下文感知能力极大地提高了专业文献的翻译质量哟。
为什么文学作品的机器翻译仍然困难
当前算法的薄弱环节,在于文学翻译要处理诸多文化负载词以及修辞手法。举例来说,中文成语“朝三暮四”源自《庄子》,要是直接进行字面翻译,就会失去其典故内涵。诗歌里的平仄韵律、小说中的意识流表达,都对翻译系统提出了要求,即需具备文化解码与艺术再创造能力,而这已超出了现有技术的语义转换范畴。机器能够翻译字词,然而却难以传递文字背后的审美意境。
在实践的层面上,文学性质的机器翻译这种行为会产生一种“文化方面出现失真”的现象,当针对马尔克斯所著《百年孤独》的开篇那些著名语句进行翻译并转化成中文的时候,算法有可能没办法留存住拉美文学独具一格的魔幻现实主义所具有的那种韵味,测试表明,机器针对散文进行翻译的情况下会出现占据30%比例的文学性方面的损耗,其中涵盖了比喻变得僵化、节奏出现失衡等一系列问题,尽管已经有研究进行相关尝试,引入风格迁移模型,然而怎样从数量方面去评估文学性的保存程度,依旧是有待突破的技术方面的瓶颈。
神经网络翻译比统计翻译改进在哪里
一种神经网络架构的形式是端到端的编码器 – 解码器样态,它对传统统计机器翻译的范式造成了彻底改变的结果。统计方法有着需要人工去设计特征模板情形,还要借助平行语料来计算短语对应中出现概率的情况,并且神经网络凭借多层感知器达成自动学习到语言表征这般。这样的改变致使模型能够捕捉到更具复杂性的语言规律,例如涉及英语里“not only…but also…”这种长距离依赖情形下的结构,同时神经网络的翻译准确程度相较于统计方法提高了大约15% 。
译文流畅度有显著提升,此为具体改进的体现。统计模型常有机械化的直译,这般情况存在,举例说明,像把“胸有成竹”译为“have bamboo in chest”。不过,神经网络相结合上下文,能够生成“have a well-thought-out plan”,例如像这样的意译。在欧盟议会文本的测试当中,神经翻译的 BLEU 评分达成 74.2,相较于统计方法,提高了将近 20 个点。这种明显进步,主要归因于注意力机制,它能使模型动态聚焦关键源语言信息 。
自动翻译会取代人工翻译吗
确实,在标准化文本范畴之内,自动翻译的确是正在取代部分基础性人工翻译之举。比如说像产品的说明书,以及新闻简报这类程式化文本,现代的翻译系统能够达成超过85%的可用性。某些跨国企业已经把内部通讯的翻译工作交付给定制化的AI系统,人工翻译只是负责最后的质量检查工作。这样一种“机翻人校”的模式让翻译效率提高了3倍,成本降低了大约60%。
然而在那需要具备创造性思维的领域范围之内,人工翻译依旧是不可以被替代的。于文学翻译、品牌本地化以及法律合同等这些场景状况当中,译者所需要去开展进行的文化调适、情感传递还有创造性叛逆行为,乃是算法至今都还未曾掌握的技能本领。有实际的数据明确显示表明,在高端文学翻译项目之中,那种机器预翻译再加上人工精修的运作模式,反而使得优秀译者的日均处理量从原本的3000字提升到了5000字,进而形成了人机协同的全新生态局面。
如何评估不同翻译引擎的质量
进行横向对比测试,得去建立多维评估体系。除了BLEU、TER等自动评价指标之外的,还得把人工评估维度给包含进去。我们所设计的质量矩阵,有着四个核心指标:语义忠实度用来衡量信息传递的完整性,语言流畅度是去评估译文的可读性程度,文化适应度是考察本地化的程度,专业准确度是验证术语翻译的正确比率。借助于加权计算,得出综合评分,以此来避免因单一指标而导致的评价偏差。
评估案例于实践里表明,于科技文献翻译情形下,谷歌翻译于术语准确率层面处于领先位置,然而DeepL在长句处理方面更具优势。之于专为中文古诗英译所设的特殊测试当中,腾讯翻译君在押韵保持方面展现出突出表现。建议用户依据具体需求来进行选择:针对技术文档优先考量术语库匹配程度,对于商务信函着重关注句式规范程度,而娱乐内容则能够接纳更高的创造性改写范围。
怎样利用自动翻译提升工作效率
让人工翻译与机器翻译结合进而打造出工作流程可大幅使效率得到提升,提议运用“预先处理一下以后再进行机器翻译之后还要进行后期编辑”这样的三个阶段的流程,先借助术语提取工具去提前处理一下原文从而构建起领域词典,在机器翻译的时期要同时让两到三个引擎运行以此生成可供选择用的译文,在后期编辑之际要运用分层去进行改正的策略,首先着重去 tackle the key term errors,之后再去对句式结构加以调整,经过测试显示这种方式能够让翻译的速度提高百分之四十,与此同时确保质量方面的损失不会超过百分之五 。
对于实际应用情况里,跨国构建的团队能够去建立起共享的翻译记忆之库。在团队成员于协作平台递交外语文档之际,系统会自动调用定制化的翻译引擎来完成初次翻译,并且标记起所有不确定的片断。法务所给出的团队反馈表明,这样的一种方案致使合同本地化的周期从3周被缩短至10天。关键之处在于搭建质量反馈之内闭循环,把人工修正之后的结果实时回馈给翻译系统,从而形成持续得以优化的良性循环。
您于运用自动翻译之际碰到的最为令人感到困惑的错误翻译是啥呢,欢迎于评论区去分享您自身经历,要是觉得本文有帮助的话请点赞予以支持,同样地欢迎转发给那些需要处理多语言工作的朋友句号。
原创文章,作者:有道翻译,如若转载,请注明出处:https://fanyi-youdao.net/archives/675