佳木斯湛栽影视文化发展公司

主頁(yè) > 知識(shí)庫(kù) > 對(duì)人工智能多點(diǎn)耐心百度漢語(yǔ)語(yǔ)音識(shí)別獲重大突

對(duì)人工智能多點(diǎn)耐心百度漢語(yǔ)語(yǔ)音識(shí)別獲重大突

熱門標(biāo)簽:攀枝花電銷 廊坊電銷 電銷卡無(wú)限打 百度競(jìng)價(jià)排名 畢節(jié)電銷 電銷防封線路代理 語(yǔ)音系統(tǒng) 通化電銷

蘋果、微軟、谷歌、百度,這些公司或許是提到語(yǔ)音識(shí)別,用戶腦海里會(huì)浮現(xiàn)出的名字。電影《Her》里,主人公西奧多不知不覺地愛上了幽默風(fēng)趣又善解人意的虛擬女友薩曼莎,盡管后者其實(shí)只是人工智能系統(tǒng)的一個(gè)化身。

近日舉行的中國(guó)人機(jī)語(yǔ)音交互領(lǐng)域權(quán)威的學(xué)術(shù)會(huì)議——全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC2015)上,百度透露其在漢語(yǔ)語(yǔ)音識(shí)別方面獲得重大突破。據(jù)悉,百度研發(fā)出了基于多層單向LSTM(長(zhǎng)短時(shí)記憶模型)的漢語(yǔ)聲韻母整體建模技術(shù),并成功把連接時(shí)序分類(CTC)訓(xùn)練技術(shù)嵌入到語(yǔ)音識(shí)別傳統(tǒng)技術(shù)建??蚣苤小T摷夹g(shù)能夠使機(jī)器的語(yǔ)音識(shí)別相對(duì)錯(cuò)誤率降低15%,使?jié)h語(yǔ)安靜環(huán)境普通話語(yǔ)音識(shí)別的準(zhǔn)確率接近97%,未來將大規(guī)模應(yīng)用在百度語(yǔ)音搜索等產(chǎn)品上。

日前,百度語(yǔ)音技術(shù)部負(fù)責(zé)人賈磊媒體專訪時(shí)稱,語(yǔ)音識(shí)別和大數(shù)據(jù)、機(jī)器學(xué)習(xí)、云計(jì)算等技術(shù)相輔相成,共同推進(jìn)人工智能發(fā)展。

他表示,機(jī)器成本、高效計(jì)算等問題,是阻礙語(yǔ)音識(shí)別技術(shù)發(fā)展的幾個(gè)重要因素。而百度研究的CTC模型在解碼部分的速度,比傳統(tǒng)模型快5倍到10倍。配合專業(yè)的深度學(xué)習(xí)計(jì)算硬件,使后臺(tái)消耗大大降低,有助于實(shí)現(xiàn)語(yǔ)音識(shí)別技術(shù)的大規(guī)模普及。

一次框架性創(chuàng)新

百度方面透露,該技術(shù)創(chuàng)新是一項(xiàng)框架性的創(chuàng)新。這一突破也標(biāo)志著,百度在世界范圍內(nèi)率先攻克了在漢語(yǔ)領(lǐng)域使用CTC技術(shù)訓(xùn)練單向多層LSTM的高精度建模難題。

據(jù)了解,2011年深度學(xué)習(xí)技術(shù)引入語(yǔ)音識(shí)別領(lǐng)域,推進(jìn)整個(gè)工業(yè)界的人工智能技術(shù)應(yīng)用進(jìn)入深度學(xué)習(xí)時(shí)代。隨后的幾年里,CNN(卷積神經(jīng)網(wǎng)絡(luò))、LSTM(長(zhǎng)短時(shí)記憶模型)、CNN混合LSTM的建模技術(shù)在語(yǔ)音識(shí)別工業(yè)產(chǎn)品中不停涌現(xiàn),并持續(xù)提升語(yǔ)音識(shí)別產(chǎn)品效果。

眼下,百度把語(yǔ)音識(shí)別的相對(duì)錯(cuò)誤率降低15%,又會(huì)帶來何種變化?對(duì)用戶而言,是識(shí)別率更準(zhǔn)、識(shí)別速度更快。對(duì)語(yǔ)音服務(wù)提供者來說,成本會(huì)降低很多。

“語(yǔ)音識(shí)別正處于產(chǎn)業(yè)化爆發(fā)的邊緣,但機(jī)器計(jì)算成本是一個(gè)很大的瓶頸。如果線上50%的搜索都由語(yǔ)音完成,而計(jì)算成本還和過去一樣,那么沒有公司能承擔(dān)得起?!辟Z磊表示,語(yǔ)音服務(wù)要想大規(guī)模普及,必須降低后臺(tái)服務(wù)器開銷。

他隨即說,百度語(yǔ)音識(shí)別研究的CTC模型在解碼部分的速度比傳統(tǒng)模型快5倍到10倍。配合專業(yè)的深度學(xué)習(xí)計(jì)算硬件,當(dāng)未來語(yǔ)音服務(wù)大規(guī)模普及時(shí),可以讓后臺(tái)計(jì)算成本大大降低。對(duì)新技術(shù)的追趕,需要大數(shù)據(jù)、大平臺(tái)、極致計(jì)算等結(jié)合做支撐,因此百度這樣的公司在未來有優(yōu)勢(shì)。

改善方言、口音和遠(yuǎn)場(chǎng)識(shí)別

媒體:既然將把此項(xiàng)技術(shù)用到百度語(yǔ)音搜索產(chǎn)品上,對(duì)應(yīng)用時(shí)間表、應(yīng)用前后的產(chǎn)品功能和用戶體驗(yàn)差別等,能否講講?

賈磊:我預(yù)計(jì)最早11月末、最遲12月末上線。因?yàn)槲覀冏龅臅r(shí)候都是比著工業(yè)產(chǎn)品的體量去做的,包括模型體積、計(jì)算量、訓(xùn)練速度,全部跟工業(yè)要求是一致的,所以可以很快應(yīng)用到產(chǎn)品中去。

用了之后,首先語(yǔ)音識(shí)別會(huì)更準(zhǔn),其次由于它的計(jì)算量會(huì)很小,解碼速度更快,后臺(tái)成本就會(huì)很低。這個(gè)模型對(duì)方言和口音的識(shí)別效果都有一定的改善,而且對(duì)遠(yuǎn)場(chǎng)識(shí)別也有一定改善。因?yàn)樗窃谝粋€(gè)建模單元的十幾幀數(shù)據(jù)中提取出來一幀最本質(zhì)最有代表性的特征來描述這個(gè)建模單元,而這個(gè)本質(zhì)特征的描述不容易隨著時(shí)間、地點(diǎn)而改變,所以對(duì)語(yǔ)音識(shí)別的穩(wěn)定性有很大的提升。

媒體:就您研究觀察,未來語(yǔ)音識(shí)別技術(shù)的發(fā)展趨勢(shì)以及應(yīng)用場(chǎng)景如何?

賈磊:第一,想解決口音、噪音的問題,訓(xùn)練數(shù)據(jù)還會(huì)繼續(xù)加大,現(xiàn)在幾萬(wàn)個(gè)小時(shí)訓(xùn)練數(shù)據(jù)是工業(yè)現(xiàn)狀,我相信在不久的未來一定是十萬(wàn)小時(shí)。如果出現(xiàn)這么大的計(jì)算量,對(duì)計(jì)算能力的需求會(huì)更加強(qiáng)烈。所以大數(shù)據(jù)和高性能計(jì)算,是語(yǔ)音識(shí)別發(fā)展到目前最明顯和清晰的趨勢(shì)。

第二,是基于深度學(xué)習(xí)的個(gè)性化識(shí)別。人的口音千差萬(wàn)別,不可能有一個(gè)語(yǔ)音識(shí)別器識(shí)別所有的聲音,一定要實(shí)現(xiàn)個(gè)性化。而這種基于深度學(xué)習(xí)的個(gè)性化識(shí)別,一定需要海量的存儲(chǔ)空間和很大的數(shù)據(jù)吞吐傳輸能力,這個(gè)也只有具有大數(shù)據(jù)和云計(jì)算這種服務(wù)能力的公司能夠提供。

第三個(gè)行業(yè)趨勢(shì),語(yǔ)音識(shí)別技術(shù)會(huì)和語(yǔ)意理解、交互技術(shù)等形成一整套語(yǔ)音的解決方案。因?yàn)槿耸褂谜Z(yǔ)音的目的不是把語(yǔ)音轉(zhuǎn)成文字,而是使用語(yǔ)音去進(jìn)行交互,并獲得其所需的服務(wù)結(jié)果。這是未來的工業(yè)發(fā)展趨勢(shì),單純的脫離了服務(wù)、脫離了平臺(tái)、脫離了計(jì)算能力去做語(yǔ)音技術(shù)的時(shí)代已經(jīng)過去了。百度有場(chǎng)景、有內(nèi)容、有需求,語(yǔ)音一定會(huì)做得越來越好。

媒體:語(yǔ)音識(shí)別技術(shù)要和其他技術(shù),比如大數(shù)據(jù)、機(jī)器學(xué)習(xí)和云計(jì)算等一起應(yīng)用,結(jié)合技術(shù)層面來講,現(xiàn)在時(shí)機(jī)是否成熟?

賈磊:這些技術(shù)是相輔相成的。作為人工智能學(xué)科的同業(yè)者,我的感覺是,短期去看人們傾向于高估技術(shù)的價(jià)值,從長(zhǎng)期去看人們傾向于低估技術(shù)的價(jià)值。

現(xiàn)在,人們可能傾向于覺得人工智能技術(shù)很牛,能夠解決一切問題。但是短期內(nèi)它沒有解決,因此人就會(huì)產(chǎn)生一個(gè)心理,這個(gè)技術(shù)沒用。但是,要對(duì)人工智能技術(shù)有信心,企業(yè)要敢于投入。當(dāng)然,初期商業(yè)上肯定會(huì)有一些損失,可能短時(shí)間里不會(huì)為公司帶來商業(yè)價(jià)值;但長(zhǎng)遠(yuǎn)來看,有助于研發(fā)新技術(shù),并獲得新的商業(yè)突破。

標(biāo)簽:青島 潛江 遼陽(yáng) 重慶 河南 淮北 漢中 百色

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《對(duì)人工智能多點(diǎn)耐心百度漢語(yǔ)語(yǔ)音識(shí)別獲重大突》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《對(duì)人工智能多點(diǎn)耐心百度漢語(yǔ)語(yǔ)音識(shí)別獲重大突》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于對(duì)人工智能多點(diǎn)耐心百度漢語(yǔ)語(yǔ)音識(shí)別獲重大突的相關(guān)信息資訊供網(wǎng)民參考!
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    全椒县| 麻阳| 志丹县| 东丰县| 静安区| 集贤县| 阳城县| 晋宁县| 肥乡县| 石门县| 保亭| 民权县| 罗城| 盐城市| 内黄县| 昌宁县| 蓝田县| 贵定县| 大英县| 晋宁县| 宜川县| 潼南县| 汉寿县| 濮阳市| 安吉县| 海安县| 丰台区| 特克斯县| 黔西县| 上栗县| 六枝特区| 葫芦岛市| 石屏县| 广东省| 皮山县| 磐安县| 漯河市| 汝州市| 青岛市| 禹城市| 通江县|