首页 > 资讯列表 > 科技资讯 >> 互联网

互联网藏语词典如何“从0到1”

互联网 2015-05-05 10:12:05 转载来源: 网络整理/侵权必删

文/温泉4月17日,有道词典的藏汉互译功能正式上线,提供藏语和汉语之间的实时互译。这是中国互联网词典首次具备民族语言翻译功能

文/温泉

4月17日,有道词典的藏汉互译功能正式上线,提供藏语和汉语之间的实时互译。

这是中国互联网词典首次具备民族语言翻译功能。此前,互联网词典的藏汉互译一直是一个空白,其发展甚至不如藏英互译完善。有道词典i汉互译功能的上线填补了这个空白。

“为什么不做呢”

站长搜索公司董事局主席兼首席执行官丁磊一直对藏文化比较感兴趣,一个偶然的机会他听朋友讲,非常希望互联网词典能有汉藏互译的功能,现在市面上的电子词典鲜有此功能。

在丁磊的建议下,站长搜索旗下利用大数据技术提供移动互联网应用的子公司有道开始考虑互联网藏语词典的开发。有道词典有5亿用户,在词典翻译App市场,有道词典市场占有率超过70%,可是此前有道词典主要做多国语言的翻译,民族语言翻译,是有道从未涉足过的领域。

民族语言的翻译,之前在互联网词典中一直是个冷门。因为民族语言的用户相对较少,但是,每种语言的开发过程都需要较大的投入,耗时耗力,这些项目一般难以盈利。

可是与此相对的是,民族语言翻译的实际需要。在中国,目前在使用的少数民族语言有120余种,使用人口共有6000多万。翻译工具的缺乏,带来的后果可能是文化的隔阂。

藏传佛教发源于印度,印度曾经是英国的殖民地,国外很多人对藏文化感兴趣,藏语和英语之间的互译,甚至比藏语和汉语之间的互译发展得更为完善。

“既然有旺盛的需求,有道又有能力来做这件事,那么为什么不做呢?”站长搜索高级副总裁、站长搜索有道CEO周枫告诉站长搜索,2014年6月,互联网藏语词典正式立项。

“从未想到的困难”

立项之后,困难来了。

做互联网词典,一般来说要找到权威的翻译来源,同时进行互联网语义的挖掘。

藏语的权威来源首先就是个问题。有道团队中无一人懂藏语,更不知道上哪里去找权威的藏语翻译词典。

前期的调研结果是:现有的汉藏翻译的电子词典存在很多问题,比如需要付费、词库量小、解释不严谨、内容杂乱、界面设计不够专业等问题,很难满足藏语查阅、学习、交流等需求。

“前期调研完成后,有道尝试通过人工+机器的方式来编撰一本更加完善的互联网藏语词典。可是,词典编出来之后,我们才发现,不同来源的翻译五花八门,有时对同一个词,翻译的内容却大相径庭,很难判断哪个才更准确。”有道词典技术团队负责人陈虎告诉站长搜索,这让整个团队犯了难。

除了内容,技术也面临大问题。陈虎告诉站长搜索,占中国智能手机市场份额近60%的Android系统对藏文的输入和显示支持很差。这意味着,需要从系统应用级别解决藏文的输入和显示问题,而对于一个词典应用来讲,这不是一件那么容易的事,这给项目推进带来巨大的难度。

“原来都不是问题”

可是,关键时刻的机缘巧合,让互联网藏语词典绝处逢生。

2014年,正是北京市对口援藏工作20周年。有道团队向北京市互联网信息办公室(以下简称“北京市网信办”)求助,想尝试看看能否获得一些资源的支持。

“北京市网信办的支持,让问题迎刃而解。刚开始我们认为是巨大困难的,最后都不是问题。”陈虎回忆起当时的情形,还带着些兴奋。

北京市网信办为有道团队引荐了民族出版社。民族出版社的藏文编辑室曾经出版了《汉藏对照词典》、《汉藏大辞典》等多部汉藏翻译的巨著,不管是在藏文化研究领域的学者中,还是在普通藏区同胞中,都是最权威的汉藏翻译工具书的出版机构。至此,汉藏翻译项目找到了最核心的资源――权威的汉藏词条对照数据。

“我们找到民族出版社的时候,那里的负责人非常热情地接待我们!后来他们讲到,他们其实也想出版互联网藏语词典,就是一直没找着合适的团队来做这件事。在后面的工作中,民族出版社给了我们特别多的帮助!”陈虎告诉站长搜索。

至于技术的问题,有道团队在后期调研中发现,这根本不是个问题――在藏区,大多数人用的都是苹果手机。“不是因为藏族人民土豪,而是他们没得选,只有苹果的系统是支持藏文输入的。”陈虎告诉站长搜索。

关键问题解决之后,有道团队“边干边学”。互联网藏语词典的开发,需要对语言的规则有一定的了解,这样才能保证两种语言能够遵循一定的规则准确地对照起来。陈虎告诉站长搜索,在开发过程中,有道团队专门请北大梵文系博导做顾问,讲解汉语和藏语的对应规则,以保证有道互联网藏语词典的翻译质量,

“这只是起点”

2014年年底,原计划一个季度完成的互联网藏语词典的开发任务,在历经曲折、延长了一倍的时间之后终于竣工。

陈虎告诉站长搜索,4月17日互联网藏语词典上线之后,每天都有几万人在用。“这和我们之前想象的不太一样,我们没想到每天会有这么多用户。我们开发产品,就是怕开发出来没人用。现在真是觉得特别有成就感!”

然而,这只是一个起点。周枫告诉站长搜索,有道的计划是,后续会继续上线藏区的典籍、促进一些资料的电子化,以此来促进文化的交流。“这样,我们到一个地方,不仅仅看到它的风景,更能了解它的风土人情,这样才能产生真正的沟通。”周枫说,今后,民族语言的翻译,在有道会作为一个项目持续推进下去。

4月23日,有道词典宣布用户数达到5亿。周枫对站长搜索表示,开发互联网藏语词典,对有道来说是一种社会责任。有道作为在线教育平台,以后内容会朝广度和深度两个方向拓展。在广度上,有道将上线更多种类的语言;在深度上,有道希望不仅仅是一个查词的工具,而是提供更多、更好的学习内容。

标签: 互联网 藏语 词典 如何


声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!

站长搜索

http://www.adminso.com

Copyright @ 2007~2024 All Rights Reserved.

Powered By 站长搜索

打开手机扫描上面的二维码打开手机版


使用手机软件扫描微信二维码

关注我们可获取更多热点资讯

站长搜索目录系统技术支持