4月22日-24日,首屆數(shù)字中國(guó)建設(shè)峰會(huì)在福州舉行。隨著會(huì)議的進(jìn)行和企業(yè)最新成果的發(fā)布,記者發(fā)現(xiàn)在大屏幕上會(huì)不斷呈現(xiàn)出發(fā)言內(nèi)容的中英雙語字幕,隨著發(fā)言內(nèi)容的逐漸完整,屏幕上顯示的字幕也會(huì)根據(jù)語境自動(dòng)完善。
據(jù)工作人員介紹,在現(xiàn)場(chǎng)擔(dān)任機(jī)器同傳工作的“機(jī)器人”來自搜狗公司,通過機(jī)器同傳,嘉賓演講內(nèi)容可以實(shí)時(shí)以中英文字幕顯示在屏幕上。它能讓參會(huì)者無需佩戴同傳耳機(jī),而是通過字幕就能直觀的接收有效信息。并且“機(jī)器人”可以識(shí)別方言,降低由于普通話不標(biāo)準(zhǔn)而導(dǎo)致的分享內(nèi)容的折損,讓參會(huì)人員最大限度的理解發(fā)言內(nèi)容。
搜狗AI事業(yè)部總經(jīng)理張博告訴經(jīng)濟(jì)日?qǐng)?bào)-中國(guó)經(jīng)濟(jì)網(wǎng)記者,2011年,搜狗開始研究語音識(shí)別技術(shù),至今已有7年,搜狗采取“雙引擎”戰(zhàn)略,不斷加大人工智能技術(shù)、產(chǎn)品和服務(wù)的研發(fā)投入。
全球首家商用機(jī)器同傳系統(tǒng)
據(jù)了解,2016年11月,搜狗的機(jī)器同傳在第三屆世界互聯(lián)網(wǎng)大會(huì)“移動(dòng)互聯(lián)網(wǎng)論壇”亮相,成為全球首個(gè)商用機(jī)器同傳。
從首次亮相開始,搜狗同傳不斷升級(jí)。張博表示,在產(chǎn)品化的過程中,為了達(dá)到實(shí)時(shí)的效果,搜狗在速度和精度上做了很多嘗試,比如使用了GRU作為搜狗同傳的神經(jīng)元結(jié)構(gòu),使其可以在性能保持不變的前提下,降低運(yùn)算復(fù)雜度,在層數(shù)和參數(shù)量上也做了一定的精簡(jiǎn)。在提升翻譯效果方面,針對(duì)實(shí)體詞、集外詞、對(duì)齊效果的處理上也做了很多研發(fā)工作。目前,搜狗同傳語音識(shí)別的準(zhǔn)確率可以達(dá)到97%,支持最快400字每分的高速聽寫,翻譯的準(zhǔn)確率可以達(dá)到90%。方便了參會(huì)者更好地理解發(fā)布者所講述的內(nèi)容。
先進(jìn)的神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)
張博介紹,搜狗還支持語音實(shí)時(shí)翻譯技術(shù)SNMT(Sogou Neural Machine Translation),即搜狗同傳翻譯系統(tǒng),集成了語音識(shí)別、機(jī)器翻譯、語音合成等先進(jìn)技術(shù),運(yùn)行同傳翻譯時(shí),屏幕上會(huì)實(shí)時(shí)顯示出語音識(shí)別出的中文或英文,同時(shí)也會(huì)實(shí)時(shí)翻譯成對(duì)應(yīng)的英文或中文,此外,還可實(shí)現(xiàn)男、女聲或某特定個(gè)人的聲音輸出翻譯后的語言。
目前,市面上一些機(jī)器同傳系統(tǒng)在實(shí)際操作中會(huì)出現(xiàn)大面積單詞無意義重復(fù)、大小寫及字符混亂、中英夾雜翻譯混亂、帶口音普通話無法識(shí)別等現(xiàn)象。“搜狗作為全球首家商用機(jī)器同傳,兩年多的時(shí)間里已經(jīng)積累了無數(shù)場(chǎng)同傳的實(shí)戰(zhàn)經(jīng)驗(yàn),通過技術(shù)創(chuàng)新基本上克服了以上出現(xiàn)的所有問題,為機(jī)器同傳技術(shù)的大規(guī)模商用做了有益探索。”張博對(duì)經(jīng)濟(jì)日?qǐng)?bào)-中國(guó)經(jīng)濟(jì)網(wǎng)記者表示。 (經(jīng)濟(jì)日?qǐng)?bào)-中國(guó)經(jīng)濟(jì)網(wǎng)記者王婉瑩)
(責(zé)任編輯:王惠綿)