圖片源自:國際在線(xiàn)

  6月5-6日,由中國科學(xué)技術(shù)協(xié)會(huì )、中國科學(xué)院、中國工程院、浙江省人民政府指導,中國人工智能學(xué)會(huì )、杭州市人民政府主辦的2021全球人工智能技術(shù)大會(huì )在杭州召開(kāi)。大會(huì )匯聚了來(lái)自世界各地的人工智能領(lǐng)域院士專(zhuān)家,共同為人工智能的發(fā)展建言獻策。本次大會(huì )采用線(xiàn)下線(xiàn)上同步直播方式,線(xiàn)上累計觀(guān)看超過(guò)1300萬(wàn)人次,其中多語(yǔ)種智能信息處理專(zhuān)題論壇在線(xiàn)觀(guān)看人數超過(guò)61萬(wàn)人次。
  6日下午,在多語(yǔ)種智能信息處理專(zhuān)題論壇上,中國人工智能學(xué)會(huì )(以下簡(jiǎn)稱(chēng):CAAI)多語(yǔ)種智能信息處理專(zhuān)業(yè)委員會(huì )正式成立。國務(wù)院參事、CAAI 理事長(cháng)、中國工程院院士戴瓊海,CAAI 名譽(yù)理事長(cháng)、中國工程院院士李德毅,中國工程院院士、新疆多語(yǔ)種信息技術(shù)重點(diǎn)實(shí)驗室主任吾守爾·斯拉木發(fā)表致辭。來(lái)自學(xué)術(shù)界、產(chǎn)業(yè)界的多位重磅嘉賓如百度CTO王海峰、科大訊飛研究院執行院長(cháng)劉聰、華為諾亞實(shí)驗室語(yǔ)音語(yǔ)義首席科學(xué)家劉群等帶來(lái)了精彩演講。
國務(wù)院參事、CAAI 理事長(cháng)、中國工程院院士 戴瓊海(圖片源自:國際在線(xiàn))
  愛(ài)數智慧創(chuàng )始人兼CEO張晴晴發(fā)表題為《多語(yǔ)種對話(huà)式AI技術(shù)及語(yǔ)料庫建設》的主題演講,介紹對話(huà)式AI技術(shù)的痛點(diǎn),愛(ài)數智慧在多語(yǔ)種語(yǔ)料庫建設的應用。
愛(ài)數智慧創(chuàng )始人兼CEO張晴晴(圖片源自:國際在線(xiàn))
  多語(yǔ)種對話(huà)式AI技術(shù)面臨的痛點(diǎn)
  對話(huà)式AI正在全面普及,在智能車(chē)載、智能家居、智能客服、智慧醫療、智能社交等場(chǎng)景中相繼落地。從技術(shù)角度看,對話(huà)式AI涉及語(yǔ)音識別、自然語(yǔ)言理解和語(yǔ)音合成等技術(shù),要想通過(guò)這些技術(shù)實(shí)現人和機器更自然的對話(huà),需要克服哪些難題?
  日常生活中對話(huà)式口語(yǔ)和電腦打字交流最大的區別是,對話(huà)式口語(yǔ)會(huì )有語(yǔ)序顛倒、猶豫遲疑產(chǎn)生的停頓,多人同時(shí)交流甚至出現語(yǔ)句打斷、搶話(huà)、交疊音等復雜語(yǔ)音場(chǎng)景,這為AI建模帶來(lái)很大困難。
  隨著(zhù)全球文化進(jìn)一步交流與融合,外語(yǔ)詞匯夾雜到母語(yǔ)中現象愈發(fā)頻繁,對話(huà)式口語(yǔ)在車(chē)載導航、音樂(lè )檢索等場(chǎng)景中存在多語(yǔ)種混合表達問(wèn)題,比如“播放Taylor Swift的love story”等對話(huà)語(yǔ)句夾帶個(gè)別英文單詞或英文縮寫(xiě)。針對這些技術(shù)難點(diǎn),愛(ài)數智慧從聲學(xué)角度進(jìn)行非母語(yǔ)發(fā)音字典建模和混合雙語(yǔ)聲學(xué)建模等,以此提高雙語(yǔ)識別系統性能。
  多語(yǔ)種語(yǔ)料庫建設 幫助開(kāi)發(fā)者重建“巴別塔”
  從聲學(xué)建模角度提高雙語(yǔ)混合語(yǔ)音識別性能上,愛(ài)數智慧在A(yíng)SR,TTS和發(fā)音字典方面構建統一的音素集,就是將中英文,以及其他語(yǔ)言里相似的音素集進(jìn)行一個(gè)聚類(lèi)。由于人類(lèi)器官發(fā)出的音素集是一個(gè)有限集,我們找到這些有限集后,能夠涵蓋所有的語(yǔ)言。這種方式能夠在資源受限情況下進(jìn)一步加大數據復用性,同時(shí)也增加了模型構建過(guò)程中的穩定性。
  作為提高雙語(yǔ)識別系統性能的另一重要模型——混合雙語(yǔ)聲學(xué)建模,我們使用什么樣數據來(lái)進(jìn)行對應的聲學(xué)模型的訓練,便會(huì )涉及到訓練數據集。
  目前愛(ài)數智慧擁有超過(guò)150000小時(shí)數據集,其中超過(guò)90000小時(shí)對話(huà)式AI訓練數據集,這些數據集經(jīng)過(guò)多維度的標注,包括語(yǔ)音到文本的轉換,以及說(shuō)話(huà)人性別、年齡、情感等標簽,這些標簽能夠幫助開(kāi)發(fā)者在解決多語(yǔ)言對話(huà)式AI上提供更多的信息,從而幫助優(yōu)化對應的模型。
  此外,愛(ài)數智慧擁有超過(guò)60種語(yǔ)言的數據集,還有部分針對外語(yǔ)數據構建的雙語(yǔ)混合數據集,如泰語(yǔ)英語(yǔ)混合數據集、馬來(lái)語(yǔ)英語(yǔ)混合數據集等,從而幫助開(kāi)發(fā)者解決混合語(yǔ)音識別的問(wèn)題。
  最后,多語(yǔ)種對話(huà)式AI研究非常困難也是必然趨勢,要實(shí)現世界語(yǔ)言無(wú)縫溝通交流這一終極目標,張晴晴號召更多AI開(kāi)發(fā)者投身多語(yǔ)種對話(huà)式AI的研究領(lǐng)域,推動(dòng)對話(huà)式AI進(jìn)一步發(fā)展,重建巴別塔。
多語(yǔ)種智能信息專(zhuān)題論壇現場(chǎng)合影(圖片源自:國際在線(xiàn))
  GAITC大會(huì )同期甄選51家優(yōu)秀企業(yè),參加全球人工智能技術(shù)博覽會(huì ),愛(ài)數智慧與科大訊飛、阿里、百度、英偉達、快手、字節跳動(dòng)和東風(fēng)汽車(chē)等國內外知名企業(yè)悉數亮相。
GAITC大會(huì )博覽會(huì )(圖片源自:國際在線(xiàn))
  吾守爾·斯拉木蒞臨愛(ài)數智慧展臺,了解愛(ài)數智慧核心技術(shù)及產(chǎn)品,并對MagicHub.io開(kāi)源社區非常感興趣,吾守爾鼓勵?lèi)?ài)數智慧在多語(yǔ)種智能化研究和應用上繼續努力,實(shí)現無(wú)縫交流。
愛(ài)數智慧市場(chǎng)總監Helen在展臺介紹愛(ài)數智慧核心技術(shù)及產(chǎn)品(圖片源自:國際在線(xiàn))
吾守爾·斯拉木參觀(guān)愛(ài)數智慧展位并關(guān)注MagicHub.io開(kāi)源社區(圖片源自:國際在線(xiàn))