2024年7月30日,阿爾托大學(xué)的OtsoHaavisto和RobinWelsch發(fā)布的一篇研究論文中,介紹了一款旨在簡(jiǎn)化針對(duì)不同語(yǔ)言和文化調(diào)整問(wèn)卷過(guò)程的網(wǎng)絡(luò)應(yīng)用程序。
Haavisto和Welsch強(qiáng)調(diào),翻譯調(diào)查問(wèn)卷通常成本高昂且“資源密集”,需要多名獨(dú)立翻譯人員和大量驗(yàn)證流程。據(jù)作者稱,這種復(fù)雜性導(dǎo)致了研究中的不平等,特別是在非英語(yǔ)和低收入地區(qū),因?yàn)檫@些地區(qū)獲取優(yōu)質(zhì)問(wèn)卷的機(jī)會(huì)有限。
在問(wèn)卷翻譯中,保持語(yǔ)義相似性,確保翻譯版本與原文相同的含義至關(guān)重要。正如作者所指出的,“語(yǔ)義相似性比逐字匹配更重要。”據(jù)作者稱,文化細(xì)微差別和口語(yǔ)表達(dá)會(huì)使這一過(guò)程進(jìn)一步復(fù)雜化,從而難以實(shí)現(xiàn)準(zhǔn)確的翻譯。
為了應(yīng)對(duì)這些挑戰(zhàn),他們開(kāi)發(fā)了一個(gè)網(wǎng)絡(luò)應(yīng)用程序,允許用戶翻譯問(wèn)卷、編輯翻譯、回譯為源語(yǔ)言以與原文進(jìn)行比較,并接收大語(yǔ)言模型(LLM)生成的翻譯質(zhì)量評(píng)估。
該工具整合了DeepL(用于初始翻譯)和GPT-4(用于評(píng)估和建議)。使用翻譯工具是基于其在翻譯科學(xué)文本方面的“可靠輸出和良好結(jié)果”,作者表示這對(duì)于研究問(wèn)卷的準(zhǔn)確性至關(guān)重要。
他們說(shuō):“我們著手開(kāi)發(fā)一個(gè)問(wèn)卷翻譯工具的原型,該工具將充分利用法學(xué)碩士在自然語(yǔ)言處理任務(wù)中的多功能性,給跨文化的研究人員帶來(lái)幫助。
Haavisto和Welsch通過(guò)兩項(xiàng)在線研究測(cè)試了該工具的有效性:一項(xiàng)研究涉及10名參與者測(cè)試英語(yǔ)-德語(yǔ)語(yǔ)言對(duì),另一項(xiàng)研究涉及20名參與者測(cè)試英語(yǔ)-葡萄牙語(yǔ)語(yǔ)言對(duì)。作者表示,這兩項(xiàng)研究都表明“在問(wèn)卷翻譯過(guò)程中采用LLM取得了令人鼓舞的結(jié)果”。
研究結(jié)果表明,機(jī)器翻譯加上AI生成的質(zhì)量評(píng)分,其翻譯質(zhì)量和語(yǔ)義相似度可與傳統(tǒng)翻譯相媲美。參與者還發(fā)現(xiàn)AI生成的建議“有一定幫助”,并且能夠準(zhǔn)確反映翻譯質(zhì)量。
Haavisto和Welsch還指出,法學(xué)碩士生成的翻譯質(zhì)量評(píng)估可以幫助研究人員識(shí)別和解決翻譯中特定于上下文的問(wèn)題,并強(qiáng)調(diào)“這是邁向由人工智能驅(qū)動(dòng)的更公平的基于問(wèn)卷的研究的第一步。”
該工具目前支持英語(yǔ)、德語(yǔ)、葡萄牙語(yǔ)和芬蘭語(yǔ)的翻譯,不過(guò)芬蘭語(yǔ)尚未測(cè)試。原型代碼已在GitHub上公開(kāi),歡迎進(jìn)一步探索和貢獻(xiàn)。