何燕龍(右三)和同事探討工作。 受訪者供圖
何燕龍,中國民族語文翻譯局信息處副處長、高級工程師,民族語文軟件研發(fā)基地負(fù)責(zé)人。入選國家民委領(lǐng)軍人才支持計劃、創(chuàng)新團(tuán)隊支持計劃,獲保密科學(xué)技術(shù)獎二等獎、錢偉長中文信息處理科學(xué)技術(shù)二等獎。
近年來,我國在國際自然語言處理領(lǐng)域的表現(xiàn)較為活躍,科研成果數(shù)量也在逼近美國,但就少數(shù)民族語文的信息化而言,還處在較低水平。
“我從事了26年的計算機應(yīng)用與民族語文軟件研發(fā)工作?!焙窝帻堈f,“民族語文翻譯軟件助力民族工作、服務(wù)國家大局的目標(biāo),始終引領(lǐng)著我工作的方向,并給予了我堅守這份事業(yè)的動力和信心?!?/p>
搭建民族語文翻譯的橋梁
1987年,何燕龍以優(yōu)異的成績考入北京信息工程學(xué)院計算機系(現(xiàn)北京信息科技大學(xué))。1991年畢業(yè)后,他被分配到航天部第一研究院101所,從事運載火箭自動控制工作。1993年7月,何燕龍調(diào)入中國民族語文翻譯局,從事計算機應(yīng)用與民族語文軟件研發(fā)工作。
調(diào)入中國民族語文翻譯局工作后,何燕龍每年都會參加全國兩會民族語文翻譯組的工作?!耙驗橐y(tǒng)一集中封閉辦公,那會兒我的同事們每次都要背著大本小本的辭書,擺在樓道里,以便查閱?!焙窝帻堈f,當(dāng)時他就想,如果能研發(fā)出一款軟件,可以讓大家不背這些書,只帶著軟件上會,那該多方便。
如今,20多年過去了,何燕龍實現(xiàn)了這個愿望?!拔业耐聜冊缇筒槐匙值?、辭典上會了。我們最新研發(fā)的翻譯軟件,在黨的十九大和近年來的全國兩會民族語文翻譯工作中都發(fā)揮了重要作用。”何燕龍說。
上世紀(jì)90年代末,民族語文信息化工作進(jìn)入詞處理階段。該階段的主要工作是構(gòu)建語料庫,搭建和訓(xùn)練自動加工處理模型。
2000年前后,何燕龍出版了著作《北大方正書版實用手冊》和《北大方正飛騰實用手冊》。2007年左右,他開始研究民族語文輸入法和校對軟件,隨后帶領(lǐng)翻譯局信息化團(tuán)隊,先后完成了多種民族語文翻譯輔助軟件的研發(fā),其中包括蒙古、藏、維吾爾、哈薩克、朝鮮、彝、壯7種民族文電子詞典及輔助翻譯軟件、校對軟件,蒙古文正音正形、哈薩克文與斯拉夫文、朝鮮文與韓文等6款編碼轉(zhuǎn)換軟件,漢文與7種民族語文對照查詢系統(tǒng),以及Windows7軟件等,為今后的機器翻譯打下了基礎(chǔ)。
2010年左右,民族語文信息化工作進(jìn)入智能化產(chǎn)品及應(yīng)用階段,特別是深度神經(jīng)網(wǎng)絡(luò)技術(shù)的成熟與應(yīng)用。這個階段,民族語文翻譯局建立了國內(nèi)首個民族文多語種智能翻譯及語音系統(tǒng)平臺,被國家民委列為“民族語文軟件研發(fā)基地”。
作為信息化平臺的工程師和研發(fā)基地的負(fù)責(zé)人,2013年以來,何燕龍主持研發(fā)了民漢對話通、語音轉(zhuǎn)寫通、民漢智能語音翻譯軟件、民漢實時翻譯軟件、民族文照相翻譯軟件、民族文手機輸入法軟件、民族文電子詞典和校對軟件等50多款民族文應(yīng)用軟件。
2012年、2018年,團(tuán)隊研發(fā)成果“彝文、壯文電子詞典及輔助翻譯軟件”和“維漢智能翻譯系統(tǒng)及其應(yīng)用”分別榮獲該年度錢偉長中文信息處理科學(xué)技術(shù)二等獎;2018年,“專用計算機民族語言應(yīng)用”項目榮獲國家保密局科學(xué)技術(shù)獎二等獎,“藏漢智能語音翻譯系統(tǒng)”和“藏漢語音轉(zhuǎn)寫通”榮獲中國網(wǎng)絡(luò)社會組織聯(lián)合會應(yīng)用工具類優(yōu)秀作品獎。
同時,在僅3年多的時間里,何燕龍還帶領(lǐng)專業(yè)數(shù)據(jù)整理團(tuán)隊,積累了5000多萬句多語種平行語料和上萬小時的語音數(shù)據(jù)。在研發(fā)過程中,他們克服重重困難,開拓探索出了翻譯局自有的語料收集方式。
2019年,7個語種語音識別軟件升級后,蒙古文語音數(shù)據(jù)從1200小時上升到3000小時,安多藏文從1500小時上升為2400小時,康巴藏文從1200小時上升到2000個小時,維吾爾文從2500個小時上升到4000個小時。此外,新收錄哈薩克文1000個小時,朝鮮文600個小時,彝文840個小時,壯文400個小時。
這些數(shù)據(jù)實現(xiàn)了民族語文信息化工作的飛躍,“翻譯局信息化工作能有今天的成績,要感恩中央對民族語文信息化工作的高度重視,也離不開各語文室同事們的大力支持和協(xié)助。”何燕龍說。
做好民族語文信息化工作是愛好
何燕龍認(rèn)為,完美的研發(fā)沒有捷徑,他關(guān)注所有的細(xì)節(jié)?!懊褡逭Z文信息化軟件的研發(fā)過程要求非常嚴(yán)格,不允許有任何的偏差,甚至小的瑕疵?!焙窝帻堈f。新入職的小伙子們,經(jīng)常會因為網(wǎng)線接口不牢固而被批評。在年輕人看來,有些松動的接口一樣可以使用,并不影響效果,但何燕龍卻要求盡善盡美。
身邊的少數(shù)民族同事曾這樣問何燕龍:“您是漢族,不會我們的母語,但您做起民族語文信息化研究,一點不遜色于我們本民族的專家學(xué)者,您是怎么做到的?”
“能夠做好民族語文信息化工作,不在于我是不是少數(shù)民族,這是我的愛好。做愛好的事,很幸福!”何燕龍這樣回答。
當(dāng)今世界,大數(shù)據(jù)、人工智能等現(xiàn)代信息技術(shù)不斷取得突破,數(shù)字經(jīng)濟蓬勃發(fā)展。近年來,中國民族語文翻譯局積極適應(yīng)民族工作和信息化時代新形勢,加大了民族語文翻譯應(yīng)用研究和基礎(chǔ)工程建設(shè),在民族語文信息化建設(shè)方面取得了突破性成果,并已應(yīng)用于國家安全、司法審判、新聞廣播、扶貧駐村、雙語學(xué)習(xí)與國家通用語言推廣等領(lǐng)域,為國家需要和民族地區(qū)實際需求提供了及時有力的支持。
“民族語文信息化建設(shè)前景廣闊,我為自己能夠從事這項事業(yè)感到榮幸?!焙窝帻堈f,“同時我們也要清醒地認(rèn)識到,民族語文信息化要跟上時代步伐,從跟跑實現(xiàn)并跑,再到領(lǐng)跑,還有很長的路要走,這需要我們加倍努力和更勤奮地付出?!?/p>
作者:樊焓希
資料來源:中國民族報