多义词是指一个词具有两个以上词义要素的词语。在日语中,很多多义词都是基础词汇,经常使用。具有较多义项的多义词「掛ける」十分具有代表性。由于其词义的复杂性,无论是对于日语初学者还是中日机器翻译,都是难点。先行研究对「掛ける」主要从认知语言学、语义学等角度进行研究,但基于语料库的、从结合价语法视角的研究并不多见。在现在的机器翻译中,多义词「掛ける」的日中机器翻译也依旧存在较多问题。因此,对多义词「掛ける」进行进一步分析及其机器翻译角度的研究非常必要。「かける」的汉字表记一共有10种,其中使用频率最高的是汉字表记为「掛ける」。因此,本研究以「掛ける」为对象进行义项考察。先运用词典,对多义词「掛ける」的前接的名词意义用法进行考察和整理。再利用“现代日语书面语均衡语料库”(中纳言)提取例文1000句,考察字典中未出现的义项、各义项的使用频度、结合价的“价”类等。从上述考察的结果可知:「掛ける」的义项有72种,在1000句例文中义项使用频率最高的是「おくれるのは自分の責任、皆に迷惑を掛ける」(给他人带来麻烦,困扰)的义项,占比率为12.8%。使用频率最低的是「貴方はその設立さえ危まれ、それも箕面のような山の中に電車を掛けるというのであったから」(把交通工具停在某地方)的义项,类似这样的义项总计有9种,占全部的0.1%。(具体内容请参照第40-42页)「掛ける」作为一价动词的比例为8.2%、二价动词的比例为48.4%、三价动词的比例为43.2%、四价动词的比例分别为0.1%。其中作为二价动词使用的频度最高。然后,机器翻译的角度出发,基于结合价理论,根据前接名词的语义属性,制定「掛ける」的机器翻译规则。最后,为了验证「掛ける」的机器翻译规则,进行人工实验并分析翻译结果和问题点。通过实验的最终检验,本研究中提出的翻译规则正确率达74.8%,分别高于有道翻译的68.3%、腾讯翻译君的63.1%、彩云小译的59.3%、以及BING翻译56.9%的精度,证明了本翻译方法的有效性。 摘要译文
「掛ける」; 义项; 结合价模型; 语料库; 日中机器翻译; 翻译规则
050205[日语语言文学];050211[外国语言学及应用语言学]
10.27034/d.cnki.ggxiu.2022.001641