学院新闻

当前位置: 首页 - 学院新闻 - 正文

第二期人工智能与翻译工作坊课程综述

时间:2022-01-10点击数:

如今,人工智能在翻译教学、科研及实践中发挥着越来越重要的作用。为提升广大师生的翻译技术应用能力和科研能力,广东外语外贸大学高级翻译学院于2022年1月6日至1月7日开设了第二期人工智能与翻译工作坊。

16日上午,高级翻译学院戴光荣教授主持开班仪式,蓝红军院长出席并致辞。蓝红军院长在讲话中表示,人工智能驱动人类的翻译行为发生了巨大变化,驱动着翻译行业的快速变革,翻译主体、翻译对象、翻译条件、翻译模式、翻译教育、翻译研究等发生巨大变化。人文学科需要面对人工智能时代,拥抱未来,让人工智能为我们所用,并感谢各位专家老师对本次人工智能与翻译工作坊的大力支持。

开幕式合照


开幕式之后,澳门大学李德凤教授为我们带来了第一讲——“翻译技术和翻译认知研究。李德凤教授首先对翻译技术和翻译认知研究进行了入门介绍。以应用在翻译研究的技术为引,李教授从概念和问题两个角度介绍了翻译认知研究的定义与必要性,并举例说明如何开展翻译认知研究。最后,李教授介绍了几种进行翻译过程研究的方法,使我们对翻译技术和翻译认知研究的概念、方法等有了全面的了解。

随后,北京师范大学--香港浸会大学联合国际学院John Corbett教授为我们带来了题为“The Historical Thesaurus of EnglishWhat is it and how can it be used?”的精彩讲座。Corbett教授讲解了《牛津英语历史同义词词典》(The Historical Thesaurus of English)的起源故事,并演示了如何在该词典的线上网站进行搜索。作为该词典的参与者之一,他介绍了该词典的特色、网页版检索界面结构设计及语义范畴分类等知识,为语言学家、翻译研究人员使用该词典提供了多种方案。Corbett教授指出,机器翻译面临的挑战是确定相关含义和选择最合适的词语,因此,该词典在机器翻译中也大有用处。

16日下午,福建工程学院计算机科学与数学院贺文武教授给大家讲授了神经网络语言模型与预训练课程。贺教授从五个维度为大家呈现了神经网络语言模型的内容和发展。贺教授详细讲解了机器学习和神经网络学习的基础知识,将机器学习中构建映射函数比作一个魔箱,深入浅出地解释神经网络学习中涉及的各种模型。贺教授从数学、模型以及机器学习的角度,鼓励大家关注机器翻译背后的原理和流程,帮助大家从根本上了解这一领域的发展。

上海外国语大学语料库研究院洪化清教授给大家带来了“聚焦学习分析技术,提升混合教学质量”的课程。他分析了目前新型教育方式的瓶颈和缺陷,并提供了基于真实教学场景所得数据的建议,为当前教学模式的发展提供了方向。洪教授提出了智慧教育模式三步骤:分析、预测和调试。具体而言,可以从实现学生和教材的互动、教学录像字幕的检索以及响应式课堂等方面,让信息技术赋能智慧教育。

东北大学自然语言处理实验室主任、小牛翻译联合创始人肖桐教授为我们讲述了机器翻译技术:从历史看未来的课程。肖教授结合众多实例,为我们讲解了什么是机器翻译、机器翻译中的难点以及训练改进机译的方法。自然语言翻译中有很多容易产生歧义的地方,早期的机器翻译使用的是基于规则的方法,数据驱动是基于实例的学习方法,机器学习的知识来源于数据。接着肖教授介绍了统计机器翻译以及神经网络机器翻译,后者借助大数据能够减少翻译错误率。肖教授表示,中国学者从未缺席机器翻译领域的研究。大家在评价机器翻译的性能时,要考虑每个人的角度问题,译者、开发者和企业往往对机器翻译提出不一样的评价。

17日上午,戴光荣教授讲授了“语料库在语言与翻译中的综合运用”的课程。戴教授介绍了当下人工智能技术的飞速发展,为高质量语料库的创建提供了便捷条件。语料库资源的创建,同时也助推了机器翻译质量的提升。通过简单回顾人工智能与机器翻译的发展历程,鼓励大家积极学习及利用语料库手段,提升语言学习与翻译实践的效果,并通过具体例证介绍了单语与双语语料库在语言与翻译中的运用。除此之外,还分享了日常翻译教学过程中如何创建多模态语料库的相关经验。戴教授鼓励学员动手收集双语语料,搭建高质量双语语料库,鼓励学员拥抱技术,静下心来创建及运用语料库,投入到翻译技术的学习中。

然后,Kizito Tewka博士讲授了“‘我们没学过’: Redefining the concept of ‘student’ in the translation technology age”的课程。他首先展示了技术与工具的进步和学习环境的改善,鼓励学员利用资源积极学习。Tewka博士强调,在翻译技术的学习中,学生不能单纯依靠老师,应该对自己负责,建立和保持自我学习的良好习惯。他以搜索引擎的使用和翻译工具自学为例,向学员们详细展示自主学习的过程并提出几点建议:谷歌和必应在英文关键词搜索上表现更佳;搜索引擎的选择,关键词与域名的的选取,国家地区的选择等等对搜索结果有不小影响;TradosMemoQCAT工具的官方网站的帮助或教学板块会提供详细的使用教程供同学们自学。

17日下午,科大讯飞辅助翻译产品总监黄宜鑫为我们带了人工智能技术辅助多语言视频翻译的课程。他首先介绍了人工智能技术的三大发展阶段,并聚焦人工智能技术在语言领域的应用场景,特别是在字幕翻译制作方面。黄老师围绕多语言视频翻译实践中繁琐、低效、多人协作困难的三个痛点,着重讲解并演示了如何运用讯飞听见译制软件字幕转写生成、AI机器翻译、在线校对编辑和团队写作四大功能进行多语言视频翻译。然后黄老师进一步指出字幕机器翻译引擎与一般机器翻译的区别、介绍了该视频译制平台热词库、术语库和翻译记忆库的特点,最后对比了讯飞听见译制相比其他视频译制平台的优势所在,向学员们全面地介绍了一款不可多得的多语言视频翻译软件。

接着,苏雯超博士为我们带来了“口译技术在口译实践中的应用”课程。苏老师指出,口译技术可以根据不同的场景,划分为口译应用技术和口译教学技术,前者应用在口译实践中,后者应用在口译教学中。随后,苏博士从自身经验与实践出发,强调口译技术的使用对口译活动的重要性,并为学员演示了资源型技术和术语提取与管理工具的使用,包括Sketch engine、语帆术语宝、中国特色话语对外翻译标准化术语库、TMXmall等等。课堂上也提供了材料供学员们进行实操,让学员们做到理论与实践相结合,真正学习并加强自身的实操能力。

最后,北京理工大学张华平博士为我们带来了多语种智能信息处理与应用的课程。张教授提出,多语种智能信息处理是大势所趋,我们当前面临低资源、语义知识不足以及深度学习的可解释性三大挑战。接着,张教授提出目前研究关键在于多语种语义表示与理解问题,并详细讲解了由这一科学问题演化而来的三个技术问题,即多语语义空间问题、多语语言演示问题与多语语义理解问题。随后张教授重点介绍了六项研究内容,包括多余词形态切分算法、多语语义组无监督自动发现、多语命名实体识别;基于语义组块的多语预训练模型;多语种持续学习可解释模型框架以及小语种机器翻译。最后,张教授在多语种部分应用实践方面介绍了数款产品,如NLPIR大数据语义智能分析平台和KGB知识图谱构建平台等。

结业仪式上,高级翻译学院李和民书记进行闭幕致辞。他总结道,本次工作坊历时两天,邀请了十多位专家学者,授课主题广泛,培训主题兼顾理论与实践,让学员们深入了解人工智能与自然语言领域相结合的相关知识,为学员们带来了人机交互的新观点。李书记鼓励学员在翻译学科和技术发展的前沿开拓创新、锐意进取,成长为符合国家需要的新时代高水平翻译人才,为翻译学科学术研究、语言服务行业贡献自己的力量。最后,厦门大学的洪捷老师和本学院的孔蓬琳同学作为优秀学员发言。洪捷老师高度肯定了本次工作坊的重要性,总结了工作坊的几个特征,包括师资阵容强大、理论与实践有机结合、理论与技术前沿探讨充分,认为本次工作坊真正让人觉得物有所值、收获满满。作为翻译教育研究方向的同学孔同学认为了解机器翻译、语料库等翻译技术与翻译教育的结合是大势所趋,了解技术如何应用在翻译教育当中具有重要意义,本次工作坊邀请到的教授和行业专家为她带来不小的启发与收获。优秀学员的发言为本次工作坊画上了一个完美的句点,学员们纷纷对课程质量予以肯定,也对本次工作坊的主办方、授课专家老师和助教们表达了诚挚的感谢。