手机浏览器扫描二维码访问
林燃一副理所当然的样子:“当然,我都和科罗廖夫见了两面,我不会俄语怎么和他交流的?
我同时会俄语、德语、英语和汉语。”
多语言大师的身份,给林燃的理论增添了几分可信度。
在这个时代,科学家们会几门语言并不奇怪。
当然一些敏感部门会提高对你的怀疑。
以前面提到的约翰·麦卡锡为例,他就精通俄语,从小接受俄语教育长大,尽管他出生在阿美莉卡。
“另外翻译过程,应该是模块化设计,而不是简单的映射关系。
它应该分成预处理、翻译、后处理三部分。
预处理包括了分词和词形还原,翻译才是词典的映射,后处理是对语序进行调整。
这样来降低单次计算的复杂度,提高规则的复用率!”
林燃的话给了在座研究团队的成员们非常多的灵感。
就好像之前一直陷在百越的丛林里找不到出路,而现在天上出现一道光指引他们怎么样才能走出丛林迷宫。
大家都有点迫不及待去尝试了。
所有研究人员都疯狂在笔记本上记录下林燃所说的。
虽然不确定教授的方法是否管用,但有路总比之前没有好。
再者,如果你不好好记下来,到时候被开除只是教授一句话的事。
“好了刚才我们讲了一些简单的内容,现在才是最难的。
因为IBM的机器不是那么强大,我们只能引入一些比较简单的统计学方法来提高我们翻译的准确度。
我把它叫做基于频率的词对齐。
这也是我们引入统计模型的核。
我们先要手动分析平行句子,标注俄语词或短语与英语翻译的对应关系。
俄语句子Мыговоримомире
英语翻译:“Wespeakaboutpeace
对齐结果:“мы”
对应“we”
“говорим”
对应“speak”
“о”
对应“about”
“мире”
对应“peace”
然后我们需要对这种对齐的频率进行统计。
统计每个俄语词或短语在英语中的对应翻译出现的频率。
例如,在语料中,“говорим”
在80%的句子中翻译为“speak”
,20%翻译为“talk”
。
这样对于我们就可以构建概率表了。
将这些概率整理成表格,供机器进行查询。
平步亲芸 黄金年代从1977开始 女儿喜欢后爸,我成全他们一家三口 文圣天尊 重生后女帝拿了美强惨剧本 农门悍媳有空间,嫁猎户被宠不停 第四天灾:人在高武,游戏成神 反贼之路:开局抢了和亲公主! 重生的我只想追小姨子 亡国公主娇又软,糙汉可汗夜夜宠 蓄谋已久,强扭的白月光他又酸又涩 换亲后!带火婆家! 奥特曼:开门啊,是我,老人迦! 团宠小福星,扛着粮仓去逃荒 请天下赴死 出宫第四年,清冷摄政王夜夜求复合 我的化身正在成为最终BOSS 海贼:从捡到红发断臂开始 三年婚姻守空房,我独美你发疯 不许没收我的人籍
最强系统,我就是最强!还有谁?叶风看着众多的天骄,脸色淡定无比!获得最强系统,经验可复制对方的功法神通,可升级功法神通品阶无所不能,唯有最强!碾压苍穹,打爆世间一切不服者!...
一个浑浑噩噩的少年,在阳台吹风不小心掉了下去,死过一次的他,决定开始改变,故事从这里开始,他就是林浩...
...
...
余庆阳一个搬砖二十年的老工程,梦回世纪之交,海河大学毕业,接老爸的班继续搬砖。用两辈子的行动告诉老师,搬砖不是因为我学习不好!是我命中注定要搬砖已有两本百万字完本书超级村主任最强退伍兵,可以放心入坑!大国工程书友群,群聊号码492691021新书重生之大国工匠...
关于抢救大明朝朱慈烺此贼比汉奸还奸,比鞑子还凶,比额李自成还能蛊惑人心!闯王李自成立马九宫山,遥望东南,感慨万千。慈烺此子忤逆不孝,奸诈凶残,简直是曹操再世,司马复生,让他当了皇帝,全天下的...