首頁(yè) > 智能 > 正文

    語(yǔ)音識(shí)別已成紅海,聲紋識(shí)別正成為AI領(lǐng)域新熱點(diǎn)

    2019-02-19 17:29:05來(lái)源:界面新聞  

    過(guò)去幾年有不少人工智能領(lǐng)域獨(dú)角獸企業(yè)崛起,比如視覺(jué)識(shí)別領(lǐng)域的商湯科技和曠視科技,語(yǔ)音識(shí)別領(lǐng)域的云知聲等。但在聲紋識(shí)別領(lǐng)域,還沒(méi)有明顯一些公司可以算是一馬當(dāng)先。

    這背后的原因在于,視覺(jué)識(shí)別和語(yǔ)音識(shí)別所解決的往往是一種有關(guān)共性的問(wèn)題,以語(yǔ)音識(shí)別為例,它所要做的只是將說(shuō)話人的語(yǔ)音內(nèi)容識(shí)別出來(lái)。然而聲紋識(shí)別除了要識(shí)別文本內(nèi)容之外,可能還要涉及到識(shí)別說(shuō)話人的身份等方面,多種因素的疊加使得這項(xiàng)技術(shù)的落地有更多的難度。

    不過(guò),隨著技術(shù)的逐步完善,已經(jīng)有一些初創(chuàng)企業(yè)開(kāi)始推出了相應(yīng)的技術(shù)解決方案,并且開(kāi)始在各個(gè)細(xì)分行業(yè)中落地。

    成立于2016年的聲揚(yáng)科技是聲紋識(shí)別這個(gè)賽道中的一家初創(chuàng)企業(yè)。公司創(chuàng)始人兼CEO李亞桐認(rèn)為,從最近整個(gè)行業(yè)展現(xiàn)出的狀況來(lái)看,聲紋識(shí)別的發(fā)展程度已經(jīng)類(lèi)似2014年前后的視覺(jué)識(shí)別,正處于一個(gè)早期階段,并且等待著爆發(fā)期的來(lái)臨。

    “目前市面上,以語(yǔ)音識(shí)別、轉(zhuǎn)寫(xiě)為主打方向的SaaS服務(wù)提供商已經(jīng)有很多;鑒于聲紋識(shí)別的技術(shù)難度要更為復(fù)雜,這個(gè)領(lǐng)域應(yīng)該還在剛起步階段,但隨著應(yīng)用場(chǎng)景的越來(lái)越多,它很快會(huì)迎來(lái)爆發(fā)。”李亞桐對(duì)界面新聞?dòng)浾叻治龇Q(chēng)。

    他認(rèn)為,相比于人臉識(shí)別和指紋識(shí)別,聲紋的采集只需要麥克風(fēng)模塊,成本相比于攝像頭或者指紋識(shí)別模塊而言要低,采集的方便性和安全性則要高,因此這項(xiàng)技術(shù)有著比較明確的市場(chǎng)前景。

    在國(guó)內(nèi),有助于聲紋識(shí)別落地的行業(yè)政策已經(jīng)出臺(tái)。2018年11月,中國(guó)人民銀行正式對(duì)外發(fā)布《移動(dòng)金融基于聲紋識(shí)別的安全應(yīng)用技術(shù)規(guī)范》金融行業(yè)標(biāo)準(zhǔn),這意味著聲紋識(shí)別技術(shù)得到金融監(jiān)管部門(mén)的認(rèn)可,也為聲紋識(shí)別技術(shù)進(jìn)入移動(dòng)金融領(lǐng)域解決了標(biāo)準(zhǔn)難題。

    此前,聲揚(yáng)科技也已經(jīng)在海外的金融相關(guān)業(yè)務(wù)落地。2018年,它們?cè)谟∧釣楫?dāng)?shù)氐酿B(yǎng)老基金項(xiàng)目打造了一套聲紋識(shí)別系統(tǒng),讓當(dāng)?shù)鼐用裢ㄟ^(guò)閱讀特定文本的方式來(lái)通過(guò)驗(yàn)證,申領(lǐng)養(yǎng)老金。

    以往,當(dāng)?shù)鼐用裆觐I(lǐng)養(yǎng)老金需要在線下的銀行機(jī)構(gòu)等排隊(duì)等候,這一方式的不便之處在于,既占用了居民的生活時(shí)間,也導(dǎo)致機(jī)構(gòu)需要投入額外的人力來(lái)進(jìn)行信息驗(yàn)證。目前,聲揚(yáng)科技的方案已經(jīng)覆蓋了當(dāng)?shù)?50萬(wàn)名居民。

    在打造技術(shù)方案的過(guò)程中,聲揚(yáng)科技的技術(shù)團(tuán)隊(duì)不可避免地會(huì)遇到語(yǔ)音方面的一些復(fù)雜問(wèn)題。比如說(shuō),作為一個(gè)多民族國(guó)家,印尼國(guó)內(nèi)居民口音的多樣性,以及文化水平的差異性,都會(huì)使得用戶在讀出同一段文字時(shí)有不同的效果。另外,當(dāng)?shù)鼐用裨诓杉暭y時(shí)使用的不同設(shè)備,如智能機(jī)和功能機(jī),也都會(huì)影響到聲音的真實(shí)性。

    為了解決這個(gè)問(wèn)題,聲揚(yáng)科技在復(fù)雜的場(chǎng)景下,基于自身的神經(jīng)網(wǎng)絡(luò)技術(shù)做了很多用戶測(cè)試;除此之外,養(yǎng)老基金的識(shí)別系統(tǒng)除了聲紋識(shí)別外,還有指紋識(shí)別和人臉識(shí)別模塊,三種方式之中的兩種通過(guò)了,驗(yàn)證才算正式完成。

    目前,聲揚(yáng)科技的方案已經(jīng)服務(wù)了印尼當(dāng)?shù)?50萬(wàn)名居民,并做到了99.5%以上的準(zhǔn)確率。如今在國(guó)內(nèi),聲揚(yáng)科技也已經(jīng)和一些金融機(jī)構(gòu)達(dá)成了合作。

    “人行的規(guī)范出來(lái)之后,需求也相應(yīng)起來(lái)了。”李亞桐表示,除了金融領(lǐng)域之外,機(jī)器人、車(chē)載、安放等領(lǐng)域,之后也都是聲紋識(shí)別首要的幾個(gè)的落地場(chǎng)景。

    除了聲紋識(shí)別的技術(shù)方案之外,聲揚(yáng)科技也在發(fā)展自己的語(yǔ)音識(shí)別方案,比如語(yǔ)音轉(zhuǎn)文字等。公司首席科學(xué)家張偉彬?qū)缑嫘侣動(dòng)浾弑硎荆瑔我坏募夹g(shù)儲(chǔ)備很容易帶來(lái)技術(shù)方案的不完整性,有的場(chǎng)景可能需要幾種技術(shù)一起結(jié)合;因此在語(yǔ)音識(shí)別方面進(jìn)行布局,也是構(gòu)建技術(shù)壁壘的必要舉措。

    就在最近,聲揚(yáng)科技也完成了香港X科技基金領(lǐng)投的Pre-A輪融資。在AI企業(yè)逐漸成為投資風(fēng)口的大背景下,李亞桐認(rèn)為,資本的活躍能夠加速技術(shù)的落地,并且為AI應(yīng)用帶來(lái)更多的新變革。

    “現(xiàn)在還只是一個(gè)弱人工智能時(shí)代,長(zhǎng)遠(yuǎn)來(lái)看,AI需要和行業(yè)以及場(chǎng)景結(jié)合,提升效率;可以說(shuō),有多少行業(yè)就需要多少個(gè)方向的AI,這個(gè)領(lǐng)域無(wú)疑需要更多資本的進(jìn)入。”張偉彬說(shuō)。相比于行業(yè)格局已經(jīng)趨向穩(wěn)定的語(yǔ)音識(shí)別和視覺(jué)識(shí)別而言,聲紋識(shí)別確實(shí)是一個(gè)潛力有待挖掘的賽道。記者 | 饒文怡

    標(biāo)簽:

    相關(guān)閱讀

    相關(guān)詞

    推薦閱讀

    亚洲人成精品久久久久| 亚洲国产av高清无码| 亚洲AV无码成人网站久久精品大 | 亚洲日韩在线中文字幕综合| 日韩亚洲国产高清免费视频| 亚洲国产精品yw在线观看| 亚洲成a人片在线观看中文!!! | 亚洲黄色免费在线观看| 亚洲人成影院在线| 亚洲色欲或者高潮影院| 亚洲综合国产精品| 亚洲综合亚洲国产尤物| 亚洲精品成人久久| 亚洲一区二区三区免费观看| 国产成人亚洲合集青青草原精品| 男人天堂2018亚洲男人天堂| 亚洲男人的天堂网站| 亚洲а∨精品天堂在线| 日本亚洲中午字幕乱码| 亚洲成av人片一区二区三区| 亚洲人成影院在线无码观看| 中文字幕专区在线亚洲| 日本亚洲欧洲免费天堂午夜看片女人员 | 亚洲中文字幕无码永久在线| 亚洲精品无码成人AAA片| 亚洲AV无码成人精品区在线观看| 亚洲精品综合一二三区在线| 亚洲自偷自拍另类图片二区| 亚洲专区中文字幕| 亚洲日本在线电影| 夜色阁亚洲一区二区三区| 在线亚洲精品自拍| 亚洲an天堂an在线观看| 亚洲国产精品网站久久| 亚洲人成在线免费观看| 亚洲AV永久无码精品一福利| 亚洲乱码中文字幕综合234| 亚洲成a人片在线观看无码| 亚洲视频免费在线播放| 亚洲综合在线一区二区三区 | 在线观看亚洲视频|