佳木斯湛栽影视文化发展公司

主頁 > 知識庫 > 呼叫中心:語音轉(zhuǎn)化成文字的應(yīng)用靠人工聽音輸入?

呼叫中心:語音轉(zhuǎn)化成文字的應(yīng)用靠人工聽音輸入?

熱門標(biāo)簽:蘋果 國美全國運(yùn)營中心 免費(fèi)建站 電銷機(jī)器人 太平洋壽險(xiǎn)電話營銷 萬科 電話機(jī)器人搭建 百度更新規(guī)律

看到一個(gè)很讓人驚喜的八卦故事。一位叫趙行德的人在豆瓣上發(fā)了一個(gè)消息,談到他在和聯(lián)想產(chǎn)品經(jīng)理聊天,了解到了一個(gè)手機(jī)應(yīng)用背后牛逼的故事。這個(gè)故事顯然把他擊倒了。而我,也被擊倒了。

先說說故事的引子樂助理 360,這是一個(gè)很省心的日程應(yīng)用。

來舉個(gè)例子吧。這個(gè)應(yīng)用,有三種方式為用戶設(shè)定手機(jī)日程,語音、文字和直接的電話。你對著手機(jī)說:后天 9 點(diǎn)飛北京,然后上傳,幾分鐘之內(nèi),iPhone 日歷就增加了一條在 9 點(diǎn)飛北京!”的日程。文字呢?當(dāng)然更好理解,你再也不需要在手機(jī)的日程管理軟件中反復(fù)輸入了,直接在這個(gè)應(yīng)用輸入你的計(jì)劃,和短信一樣發(fā)送,隨后,你的日程也如你所愿就自動添加到系統(tǒng)日程了。

你會發(fā)現(xiàn)它相當(dāng)方便。智能設(shè)備,特別是全觸屏的手機(jī),輸入一直是很多使用者的心頭痛。語音可以幫助用戶方便地跨越這類門檻。不過,這類應(yīng)用的成本還不僅僅在于單純的輸入,而是在于它需要你進(jìn)行太多的選擇。一個(gè)標(biāo)準(zhǔn)的場景是,拿出 iPhone,用拇指掃開屏幕,找到日程應(yīng)用,然后填充一堆的表單區(qū)域。完成一個(gè)簡單的日程,也需要點(diǎn)擊很多很多次,耗費(fèi)頗長時(shí)間。喜歡 GTD 的人,也許會樂于享受這種編輯歸類過程,但是對于普通人來說,這種體驗(yàn)實(shí)在太差了。

且慢,還不光是你簡單動動嘴皮的問題。你會發(fā)現(xiàn)它非常精確,它很聽話,它很懂你,它支持所有的自然語義。這可不簡單??!

為何語音識別可不簡單?它必須要解決各種場合下精確的識別處理問題。一方面,它需要對所識別語言規(guī)律和語句的高度理解,另外,它還需要解決各種噪音和干擾情況下(這是語音識別環(huán)境的常態(tài))的識別問題。語音識別技術(shù)在商業(yè)和人機(jī)交互上一直以來缺乏足夠的表現(xiàn),正是由于無法精確的識別人類語音的表達(dá)。蘋果去年 4 月耗巨資收購 Siri,看中的就是它就是可以很準(zhǔn)確地識別人們的語音,針對人們提出的問題進(jìn)行回答。人們認(rèn)為,這個(gè)在語音識別領(lǐng)域浸淫已久的 Nuance 開發(fā)的語音技術(shù),有可能讓蘋果開啟下一扇人機(jī)交互的大門。

但是一個(gè)來自聯(lián)想的應(yīng)用,解決了這個(gè)問題?是聯(lián)想在和科大迅飛搞的語音云合作項(xiàng)目?科大迅飛是聯(lián)想投資的一個(gè)項(xiàng)目,上市前就獲注資數(shù)千萬元,而 2010 年底科大迅飛發(fā)布語音云系統(tǒng)時(shí),柳傳志也親自出席了,這不得不讓你有這樣的聯(lián)系聯(lián)想。

反正我信了。馬上就要和朋友感慨現(xiàn)在科技的日新月異了,CPU 已經(jīng)可以代替人腦,云計(jì)算吧!腦海浮現(xiàn)出機(jī)器人統(tǒng)治世界的場景。

人工”智能

然后,趙行德告訴你讓人崩潰”的真相:它背后的故事是——它的高科技”,它的精確,它的人工智能”,就在于,它真的是人工的!——他們在遠(yuǎn)端用人聽這些語音消息,然后輸入進(jìn)去 ……

我不知道這個(gè)消息是否屬實(shí),但是我在測試中發(fā)現(xiàn),它確實(shí)有很強(qiáng)的人工”跡象。一是我試用這個(gè)軟件的時(shí)候,使用了粵語,然后這個(gè)應(yīng)用就在遠(yuǎn)端死機(jī)”了——日程記錄并沒有自動推送過來,聽聞?wù)f四川話是 ok 的。二是上傳了語音后,推送日程的處理時(shí)間差別蠻大,感覺不太象是計(jì)算機(jī)即時(shí)處理的。三是精確度確實(shí)很高,在不同噪音環(huán)境下和不同腔調(diào)下,效果都相當(dāng)不錯(cuò),很難讓你相信這是機(jī)器識別的。

不過,這只算一個(gè)八卦消息,真實(shí)的情況仍然待驗(yàn)證,特別是語音識別系統(tǒng)和呼叫中心的結(jié)合也有商用的案例。簡單粗暴的直接判斷它是完全人工的不太合適。但是真正有趣的,卻是這個(gè)八卦故事所折射出的創(chuàng)新”智慧。

初看,這個(gè)故事包括后續(xù)的回復(fù)都讓人忍俊不禁,但是,回頭一想,也許這真是一個(gè)非常棒的創(chuàng)新,一個(gè)非常聰明的商業(yè)模式的創(chuàng)新。

為何商業(yè)創(chuàng)新需要高科技呢?商業(yè)創(chuàng)新的意義在于更小的成本創(chuàng)造更大的價(jià)值。據(jù)說這個(gè)服務(wù)主意還是聯(lián)想呼叫中心的人想出來的。它利用到了現(xiàn)有的成熟模式,并在這個(gè)成熟的商業(yè)模式上派生出了另外一種創(chuàng)新價(jià)值。

這個(gè)服務(wù)的極其牛逼”之處,在于它把一個(gè)復(fù)雜的問題徹底的簡單化了——而簡單化,確實(shí)牛逼的商業(yè)模式最為寶貴的特質(zhì)。你不會看到真正可行的商業(yè)模式是復(fù)雜的,讓人看不懂的。

它用非常簡單的方法(人工聽),解決了語音識別精確度問題,解決了輸入問題(遠(yuǎn)端人工編輯推送),解決了隨時(shí)隨地服務(wù)的問題(24小時(shí)的呼叫中心)——至少,讓語音識別達(dá)到了非常好用的程度。它用超低廉的成本,完成了高科技”很難做到的效果。它還是可擴(kuò)展的。scalable 這個(gè)詞在互聯(lián)網(wǎng)模式中很熱呢。

而高科技的云計(jì)算,本質(zhì)和人腦簡單集合處理并無不同,也許只是成本問題??萍急緛硎且档统杀镜?,如果在一個(gè)可以用人工比科技更好的降低成本的場合,為何不使用人工呢?

轉(zhuǎn)播到騰訊微博

土而奇機(jī)器人”

這種智能眾包 這也并非是聯(lián)想呼叫中心的獨(dú)創(chuàng)。

亞馬遜就 2005 年推出一個(gè)叫土耳其機(jī)器人(Mechanical Turk)的服務(wù),其理念,就是讓人力眾包來完成電腦力有不逮的細(xì)碎、精確的智能工作。這種眾包讓計(jì)算機(jī)調(diào)用人的智慧智能,把人和電腦的角色顛倒過來,讓人成為任務(wù)的完成者,而電腦成為任務(wù)的分配者。起名叫土耳其機(jī)器人本身也映射了這個(gè)項(xiàng)目的性質(zhì):

這個(gè)名字源自于臭名遠(yuǎn)揚(yáng)的能下象棋的自動裝置”,它是匈牙利男爵沃爾夫?qū)?middot;馮·肯佩倫(Wolfgang Von Kempelen)1770年建造的。這個(gè)木制機(jī)器外形像一個(gè)坐在大機(jī)箱前的土耳其魔法師,它能自動而快速地下象棋,用復(fù)雜的齒輪和杠桿系統(tǒng)來移動棋子。在維也納皇宮的首次表演中,它就迅速擊敗了對手Cobenzl伯爵,讓在場的皇室成員看得十分高興。從此關(guān)于這個(gè)驚人聰明的機(jī)器人迅速聞名于世,于是肯佩倫帶著它在歐洲各地表演,擊敗了一系列著名的挑戰(zhàn)者,包括拿破侖和本杰明·富蘭克林。直到幾年之后,這個(gè)騙局才被揭穿。原來機(jī)箱里藏了一名象棋大師,他用一個(gè)磁鐵系統(tǒng)來跟蹤對手的舉動并移動自己的棋子,這個(gè)人實(shí)際是在模擬一種人工智能。(摘錄自 比特云)

這也是我們笑稱它為土”而奇”機(jī)器人的來歷。

可行性?

理論上的問題解決了,我們再來看看現(xiàn)實(shí)的商業(yè)問題。這得多大的人工成本?!別著急,看看趙行德的初步概算:

我測算了一下,平均每個(gè)活躍用戶每天提交0.5條語音,每個(gè)人每分鐘處理3條語音,每天工作7小時(shí),可以服務(wù)2500個(gè)活躍用戶,100人的數(shù)據(jù)中心可以服務(wù)25萬活躍用戶。

如果把數(shù)據(jù)中心建在西部貧困地區(qū),月薪800元估計(jì)就足夠了,25萬工資成本才8-10萬,100人的數(shù)據(jù)中心,每人2500元的電腦,投資25萬,數(shù)據(jù)中心投資30萬元,辦公家具設(shè)備5萬元,偏遠(yuǎn)貧困地區(qū)租個(gè)辦公室,月租不到5000元,100人工資8萬元,寬帶月租2萬元,10個(gè)產(chǎn)品開發(fā)人員,每月5萬元,5個(gè)打雜行政人員,1萬元。

總投資60萬元,每月運(yùn)營成本16.5萬,就能辦出給至少25萬活躍用戶,100萬注冊用戶服務(wù)。

可行嗎?

對的,它很土,很奇異,但是,它靠譜(it works),它可行。這個(gè)土而奇”機(jī)器人很棒。

這不正是商業(yè)創(chuàng)新的意義嗎?

目前,這個(gè)服務(wù)是免費(fèi)的。而且所定義的日程服務(wù)類型所限,用戶群也許并不算很大,每天下載量據(jù)說是 2000。但是它顯然是一個(gè)可行的商業(yè)模式,同樣的思路,你也許可以把它擴(kuò)展到其他的移動互聯(lián)網(wǎng)服務(wù)領(lǐng)域,有拾音功能的移動設(shè)備天然就是一個(gè)命令錄入裝置,天然就是一個(gè)可以收集多樣服務(wù)需求進(jìn)行集中處理的終端,智能手機(jī)已經(jīng)為很多云計(jì)算”的概念提供了堅(jiān)實(shí)的應(yīng)用基礎(chǔ)。

你會為這樣的管家類服務(wù)掏錢嗎?至少,我會的。我覺得,與其把時(shí)間浪費(fèi)在各種糾結(jié)上,還不如出錢讓自己在零碎的時(shí)間發(fā)發(fā)呆。

這正是服務(wù)的意義呢。(原文鏈接:ifanr.com/48600)

標(biāo)簽:日喀則 長白山 麗江 阿拉善盟 通遼 開封 雅安

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《呼叫中心:語音轉(zhuǎn)化成文字的應(yīng)用靠人工聽音輸入?》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《呼叫中心:語音轉(zhuǎn)化成文字的應(yīng)用靠人工聽音輸入?》相關(guān)的同類信息!
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    昭苏县| 民丰县| 新乡县| 太白县| 宣城市| 潜山县| 嘉荫县| 榆社县| 临泽县| 邛崃市| 长葛市| 于田县| 南昌市| 页游| 郎溪县| 中超| 宜阳县| 介休市| 谷城县| 黑水县| 芮城县| 繁昌县| 林周县| 西乡县| 奉贤区| 灌阳县| 福泉市| 华容县| 阳江市| 屏边| 松潘县| 裕民县| 平武县| 六盘水市| 定安县| 九江县| 专栏| 临邑县| 托克逊县| 饶平县| 疏勒县|