2021年12月17日下午,第十期“上外-莱斯特翻译研究沙龙”在Microsoft Teams线上会议平台顺利举行,逾60位师生参与了本期云端国际学术研讨沙龙。
本期的主讲人为上外英语学院翻译学方向博士生钱家骏,广东外语外贸大学高级翻译学院的苏雯超博士受邀作为本期沙龙的点评嘉宾。钱家骏基于他正在开展的研究,进行了题为“Analyzing corpus and eye-movement data in Translation Studies using linear mixed-effects models in R”的汇报。
钱家骏首先介绍了统计建模的基本原理。他强调在翻译学研究的“预测转向”背景下,翻译认知过程研究中最为重要的是“解释和预测”译者行为,即James Holmes (1972)在The Name and Nature of Translation Studies一文中提到的翻译学研究的第二大目标。主讲人指出,这一目标可以通过建立合适的统计模型实现。钱家骏表示,自Baayen (2008)在Journal of Memory and Language的专栏发表以来,虽然已有一定数量的语言学研究者使用混合效应模型进行统计分析,但这一模型在翻译学研究中少有应用、甚至被误用。钱家骏细致讲解了数据分析过程中效应量、效应方向、显著性水平、交互效应等重要概念,介绍了适用于线性回归模型的自变量类型,以及不同自变量类型适用的检验类型,并指出在分析过程中如果将眼动指标中的注视次数(fixation count)或语料库中的词频作为因变量,建模时应使用泊松回归。钱家骏着重分析了混合效应模型相比于传统固定效应模型的优势,(例如,模型能够将疲劳/学习效应、将不可控的个体差异纳入统计模型中),还强调了随机截距与随机斜率纳入统计分析的必要性。在解释如何建模时,钱家骏强调,初始模型的确定和模型的选择(model selection)方法(例如backward selection或不进行模型选择),需要结合自己的实验设计来确定,他还分享了自己在削减随机效应和固定效应结构时的经验和注意事项。
在展示利用R语言构建模型时,钱家骏先回顾了自己的研究问题,并以“机器翻译错误类型对译者注意资源分配的影响”这一问题为例,梳理了构建混合效应模型的思路。钱家骏展示了自己的R语言代码,提到了利用R进行线性混合效应模型建模过程中的注意事项,例如在削减固定效应时需要将REML改为FALSE,削减完之后再改为TRUE。最后,钱家骏也分享了四点数据分析的心得:1)数据分析需要自己来做 ;2)建模步骤需要汇报全面;3)建模每一步都需要有理据;4)不要进行p-hacking。
在苏雯超博士的点评环节,她对钱家骏的汇报给予了高度肯定。她赞同钱家骏在汇报中对于效应量和显著性差异的严格区分,因为显著性差异只能说明统计的变量间是否存在差异,而效应量才能体现差异的大小。苏雯超博士也表示运用混合效应模型时,需要考虑因变量的类型,比如当因变量不为连续型变量时,需要使用glmer函数,而非lmer函数。苏雯超博士认可钱家骏研究中使用的随机变量剔除方法,同时也对这一方法进行了补充说明。她指出随机斜率的添加取决于数据量,当数据量过少时,复杂的模型不一定能得到更好的效果。此外,添加随机斜率时也需要考虑实验设计的特点。在讨论环节,东南大学的马星城副教授发表了简短感想,钱家骏对实验顺序是否应为随机变量、固定效应何时剔除等问题进行了解答。最后,上外英语学院的肖维青老师与莱斯特大学的应雁老师对本期沙龙进行了总结。
钱家骏在本期沙龙为大家分享了翻译认知过程研究的前沿思路,在与会师生中取得了热烈的反响。主讲人的这次汇报也肯定了混合效应模型在翻译实证研究中的优势性。本次沙龙在小范围内邀请了一些在外语学界对统计建模感兴趣的同行加入,也在一定程度上提升了“上外-莱斯特”翻译研究沙龙的声誉。
钱家骏也在沙龙上推荐了一些适用于分析语料库和眼动数据的相关文献,以飨读者:
主讲人简介
钱家骏,上海外国语大学英语学院翻译学方向博士生,美国肯特州立大学翻译与翻译技术研究与创新中心成员(CRITT)。研究方向为翻译技术、翻译过程和语料库翻译学。参与国家社科基金项目2项、上海市哲学社会科学项目1项。曾担任ESCI期刊Asia Pacific Translation and Intercultural Studies匿名评审。研究成果已发表或即将发表在《外国语》、《外语界》、《解放军外国语学院学报》和《西安外国语大学学报》。
我要评论 (网友评论仅供其表达个人看法,并不表明本站同意其观点或证实其描述)
全部评论 ( 条)