圖片源自:國(guó)際在線

  6月5-6日,由中國(guó)科學(xué)技術(shù)協(xié)會(huì)、中國(guó)科學(xué)院、中國(guó)工程院、浙江省人民政府指導(dǎo),中國(guó)人工智能學(xué)會(huì)、杭州市人民政府主辦的2021全球人工智能技術(shù)大會(huì)在杭州召開(kāi)。大會(huì)匯聚了來(lái)自世界各地的人工智能領(lǐng)域院士專(zhuān)家,共同為人工智能的發(fā)展建言獻(xiàn)策。本次大會(huì)采用線下線上同步直播方式,線上累計(jì)觀看超過(guò)1300萬(wàn)人次,其中多語(yǔ)種智能信息處理專(zhuān)題論壇在線觀看人數(shù)超過(guò)61萬(wàn)人次。
  6日下午,在多語(yǔ)種智能信息處理專(zhuān)題論壇上,中國(guó)人工智能學(xué)會(huì)(以下簡(jiǎn)稱(chēng):CAAI)多語(yǔ)種智能信息處理專(zhuān)業(yè)委員會(huì)正式成立。國(guó)務(wù)院參事、CAAI 理事長(zhǎng)、中國(guó)工程院院士戴瓊海,CAAI 名譽(yù)理事長(zhǎng)、中國(guó)工程院院士李德毅,中國(guó)工程院院士、新疆多語(yǔ)種信息技術(shù)重點(diǎn)實(shí)驗(yàn)室主任吾守爾·斯拉木發(fā)表致辭。來(lái)自學(xué)術(shù)界、產(chǎn)業(yè)界的多位重磅嘉賓如百度CTO王海峰、科大訊飛研究院執(zhí)行院長(zhǎng)劉聰、華為諾亞實(shí)驗(yàn)室語(yǔ)音語(yǔ)義首席科學(xué)家劉群等帶來(lái)了精彩演講。
國(guó)務(wù)院參事、CAAI 理事長(zhǎng)、中國(guó)工程院院士 戴瓊海(圖片源自:國(guó)際在線)
  愛(ài)數(shù)智慧創(chuàng)始人兼CEO張晴晴發(fā)表題為《多語(yǔ)種對(duì)話式AI技術(shù)及語(yǔ)料庫(kù)建設(shè)》的主題演講,介紹對(duì)話式AI技術(shù)的痛點(diǎn),愛(ài)數(shù)智慧在多語(yǔ)種語(yǔ)料庫(kù)建設(shè)的應(yīng)用。
愛(ài)數(shù)智慧創(chuàng)始人兼CEO張晴晴(圖片源自:國(guó)際在線)
  多語(yǔ)種對(duì)話式AI技術(shù)面臨的痛點(diǎn)
  對(duì)話式AI正在全面普及,在智能車(chē)載、智能家居、智能客服、智慧醫(yī)療、智能社交等場(chǎng)景中相繼落地。從技術(shù)角度看,對(duì)話式AI涉及語(yǔ)音識(shí)別、自然語(yǔ)言理解和語(yǔ)音合成等技術(shù),要想通過(guò)這些技術(shù)實(shí)現(xiàn)人和機(jī)器更自然的對(duì)話,需要克服哪些難題?
  日常生活中對(duì)話式口語(yǔ)和電腦打字交流最大的區(qū)別是,對(duì)話式口語(yǔ)會(huì)有語(yǔ)序顛倒、猶豫遲疑產(chǎn)生的停頓,多人同時(shí)交流甚至出現(xiàn)語(yǔ)句打斷、搶話、交疊音等復(fù)雜語(yǔ)音場(chǎng)景,這為AI建模帶來(lái)很大困難。
  隨著全球文化進(jìn)一步交流與融合,外語(yǔ)詞匯夾雜到母語(yǔ)中現(xiàn)象愈發(fā)頻繁,對(duì)話式口語(yǔ)在車(chē)載導(dǎo)航、音樂(lè)檢索等場(chǎng)景中存在多語(yǔ)種混合表達(dá)問(wèn)題,比如“播放Taylor Swift的love story”等對(duì)話語(yǔ)句夾帶個(gè)別英文單詞或英文縮寫(xiě)。針對(duì)這些技術(shù)難點(diǎn),愛(ài)數(shù)智慧從聲學(xué)角度進(jìn)行非母語(yǔ)發(fā)音字典建模和混合雙語(yǔ)聲學(xué)建模等,以此提高雙語(yǔ)識(shí)別系統(tǒng)性能。
  多語(yǔ)種語(yǔ)料庫(kù)建設(shè) 幫助開(kāi)發(fā)者重建“巴別塔”
  從聲學(xué)建模角度提高雙語(yǔ)混合語(yǔ)音識(shí)別性能上,愛(ài)數(shù)智慧在ASR,TTS和發(fā)音字典方面構(gòu)建統(tǒng)一的音素集,就是將中英文,以及其他語(yǔ)言里相似的音素集進(jìn)行一個(gè)聚類(lèi)。由于人類(lèi)器官發(fā)出的音素集是一個(gè)有限集,我們找到這些有限集后,能夠涵蓋所有的語(yǔ)言。這種方式能夠在資源受限情況下進(jìn)一步加大數(shù)據(jù)復(fù)用性,同時(shí)也增加了模型構(gòu)建過(guò)程中的穩(wěn)定性。
  作為提高雙語(yǔ)識(shí)別系統(tǒng)性能的另一重要模型——混合雙語(yǔ)聲學(xué)建模,我們使用什么樣數(shù)據(jù)來(lái)進(jìn)行對(duì)應(yīng)的聲學(xué)模型的訓(xùn)練,便會(huì)涉及到訓(xùn)練數(shù)據(jù)集。
  目前愛(ài)數(shù)智慧擁有超過(guò)150000小時(shí)數(shù)據(jù)集,其中超過(guò)90000小時(shí)對(duì)話式AI訓(xùn)練數(shù)據(jù)集,這些數(shù)據(jù)集經(jīng)過(guò)多維度的標(biāo)注,包括語(yǔ)音到文本的轉(zhuǎn)換,以及說(shuō)話人性別、年齡、情感等標(biāo)簽,這些標(biāo)簽?zāi)軌驇椭_(kāi)發(fā)者在解決多語(yǔ)言對(duì)話式AI上提供更多的信息,從而幫助優(yōu)化對(duì)應(yīng)的模型。
  此外,愛(ài)數(shù)智慧擁有超過(guò)60種語(yǔ)言的數(shù)據(jù)集,還有部分針對(duì)外語(yǔ)數(shù)據(jù)構(gòu)建的雙語(yǔ)混合數(shù)據(jù)集,如泰語(yǔ)英語(yǔ)混合數(shù)據(jù)集、馬來(lái)語(yǔ)英語(yǔ)混合數(shù)據(jù)集等,從而幫助開(kāi)發(fā)者解決混合語(yǔ)音識(shí)別的問(wèn)題。
  最后,多語(yǔ)種對(duì)話式AI研究非常困難也是必然趨勢(shì),要實(shí)現(xiàn)世界語(yǔ)言無(wú)縫溝通交流這一終極目標(biāo),張晴晴號(hào)召更多AI開(kāi)發(fā)者投身多語(yǔ)種對(duì)話式AI的研究領(lǐng)域,推動(dòng)對(duì)話式AI進(jìn)一步發(fā)展,重建巴別塔。
多語(yǔ)種智能信息專(zhuān)題論壇現(xiàn)場(chǎng)合影(圖片源自:國(guó)際在線)
  GAITC大會(huì)同期甄選51家優(yōu)秀企業(yè),參加全球人工智能技術(shù)博覽會(huì),愛(ài)數(shù)智慧與科大訊飛、阿里、百度、英偉達(dá)、快手、字節(jié)跳動(dòng)和東風(fēng)汽車(chē)等國(guó)內(nèi)外知名企業(yè)悉數(shù)亮相。
GAITC大會(huì)博覽會(huì)(圖片源自:國(guó)際在線)
  吾守爾·斯拉木蒞臨愛(ài)數(shù)智慧展臺(tái),了解愛(ài)數(shù)智慧核心技術(shù)及產(chǎn)品,并對(duì)MagicHub.io開(kāi)源社區(qū)非常感興趣,吾守爾鼓勵(lì)愛(ài)數(shù)智慧在多語(yǔ)種智能化研究和應(yīng)用上繼續(xù)努力,實(shí)現(xiàn)無(wú)縫交流。
愛(ài)數(shù)智慧市場(chǎng)總監(jiān)Helen在展臺(tái)介紹愛(ài)數(shù)智慧核心技術(shù)及產(chǎn)品(圖片源自:國(guó)際在線)
吾守爾·斯拉木參觀愛(ài)數(shù)智慧展位并關(guān)注MagicHub.io開(kāi)源社區(qū)(圖片源自:國(guó)際在線)