48752 ?當(dāng)大模型,開始“平民化”
服務(wù)熱線:400-858-9000 咨詢/投訴熱線:18658148790
國(guó)內(nèi)專業(yè)的一站式創(chuàng)業(yè)服務(wù)平臺(tái)
?當(dāng)大模型,開始“平民化”
2023/09/27
大模型在C端的“平民化”應(yīng)用,從強(qiáng)語(yǔ)音交互產(chǎn)品開始。
本文來(lái)自于微信公眾號(hào)“鋅產(chǎn)業(yè)”(ID:xinchanye2021),作者:金旺,投融界經(jīng)授權(quán)發(fā)布。

年初大模型剛剛熱鬧起來(lái),和智能家居領(lǐng)域一些朋友聊天時(shí),當(dāng)時(shí)大家聊得最多的是——大模型要如何在智能家居行業(yè)落地。

中國(guó)企業(yè)一個(gè)很重要的特性就是“務(wù)實(shí)”。

或許很多技術(shù)并不是由國(guó)內(nèi)企業(yè)或研究機(jī)構(gòu)最先研究出門道的,但要說(shuō)產(chǎn)業(yè)化速度,國(guó)內(nèi)企業(yè)毫不遜色。

那么,大模型究竟要怎么用到智能家居領(lǐng)域呢?

大家討論來(lái)討論去,最后發(fā)現(xiàn),大(語(yǔ)言)模型在智能家居、乃至整個(gè)C端的應(yīng)用,最契合的還是與智能語(yǔ)音交互結(jié)合。

畢竟,大模型(LLM)仍是自然語(yǔ)言處理(NLP)技術(shù)的一種。

而NLP是智能語(yǔ)音交互三大核心技術(shù)(ASR、NLP、TTL)中最重要的一環(huán),也是決定語(yǔ)音交互智能與否最重要的那項(xiàng)技術(shù)。

大模型在C端的“平民化”應(yīng)用,從強(qiáng)語(yǔ)音交互產(chǎn)品開始。

這其中,亟需新技術(shù)補(bǔ)充彈藥的小度、天貓(精靈)們,終于等到了一波新機(jī)會(huì)。

01

智能音箱的盛世與衰落

論及消費(fèi)級(jí)強(qiáng)語(yǔ)音交互產(chǎn)品,最為人熟知的,就是智能音箱。

無(wú)論是國(guó)外的蘋果、谷歌、亞馬遜,還是國(guó)內(nèi)的百度、阿里、華為、小米,都曾將智能音箱作為一個(gè)核心產(chǎn)品來(lái)大手筆投入。

亞馬遜自不必說(shuō),作為智能音箱全球熱潮的始作俑者,亞馬遜研發(fā)語(yǔ)音交互技術(shù)的團(tuán)隊(duì)在2017年超5000人,在2018年更是達(dá)到了萬(wàn)人規(guī)模。

也正是由于亞馬遜這樣大手筆的投入,截至2019年1月,Alexa已經(jīng)有超過(guò)70000項(xiàng)技能,搭載亞馬遜Alexa的智能硬件已經(jīng)超過(guò)1億臺(tái)。

這樣的規(guī)模,引得不怎么涉足硬件領(lǐng)域的谷歌,也基于Google Asistant推出了智能音箱。

當(dāng)時(shí)還沒(méi)退休的亞馬遜創(chuàng)始人貝索斯甚至多次指出,要將Alexa打造成亞馬遜繼電商、Prime、AWS后的第四大支柱產(chǎn)業(yè)。

國(guó)內(nèi)智能語(yǔ)音技術(shù)熱潮更瘋狂,尤其是在智能音箱領(lǐng)域。早在2017年國(guó)內(nèi)智能音箱市場(chǎng)混戰(zhàn)時(shí),曾一度涌現(xiàn)出上百家智能音箱廠商,也造就了中國(guó)智能音箱“百箱大戰(zhàn)”的慘烈局面。

在智能音箱市場(chǎng)即將觸頂?shù)?019年,全球智能音箱銷量達(dá)到了1.47億,其中中國(guó)智能音箱市場(chǎng)出貨量5200萬(wàn)臺(tái)。

中國(guó)市場(chǎng)占去了全球三分之一的智能音箱出貨量。

從Strategy Analytics的2019年Q4全球統(tǒng)計(jì)數(shù)據(jù)來(lái)看,全球3、4、5位分別為阿里、百度、小米,僅排在亞馬遜、谷歌之后,而上榜前六的廠商,均為全球科技巨頭。

?當(dāng)大模型,開始“平民化”

然而,智能語(yǔ)音技術(shù)并沒(méi)有想象得那么好做。

一邊是消費(fèi)者既享受著價(jià)格戰(zhàn)帶來(lái)的平民級(jí)AI產(chǎn)品,又因智能音箱不智能而苦不堪言;

另一邊是科技巨頭既要大手筆投入推動(dòng)技術(shù)研發(fā),又要兼顧安全風(fēng)險(xiǎn)。

亞馬遜就曾因在全球雇傭數(shù)千人團(tuán)隊(duì)為Alexa做數(shù)據(jù)標(biāo)注,引發(fā)了2019年全社會(huì)關(guān)注的智能音箱“監(jiān)聽”事件。

智能音箱生意在走過(guò)第一個(gè)瘋漲的五年后,最終開始轉(zhuǎn)頭向下,銷量一路下滑。

就最近兩年來(lái)看,即便當(dāng)初一年要辦多場(chǎng)智能音箱新品發(fā)布會(huì)的百度和阿里,現(xiàn)在也很少會(huì)花精力單獨(dú)為某款智能音箱出世舉辦大型發(fā)布會(huì)。

一則是頭部效應(yīng)已經(jīng)成形,二則是智能音箱已經(jīng)盛世不再。

行業(yè)從業(yè)者能夠明顯感受到的是,智能音箱賽道已經(jīng)不再性感、不再有趣。

直到大模型的出現(xiàn)。

02

舊瓶裝新酒

2022年年底,ChatGPT問(wèn)世,兩個(gè)月破億活躍用戶,刷新了最快用戶增長(zhǎng)紀(jì)錄,也引起了全球的關(guān)注。

紅杉沈南鵬是在ChatGPT發(fā)布前見(jiàn)到位于硅谷的OpenAI團(tuán)隊(duì),之后便開始在AI領(lǐng)域下重注。

在ChatGPT發(fā)布前三個(gè)月,紅杉已經(jīng)在官網(wǎng)上發(fā)布了名為《Generative AI: A Creative New World》的文章,文章中預(yù)言,生成式AI將在未來(lái)進(jìn)入到每個(gè)人的工作、娛樂(lè)、生活中。

在ChatGPT正式問(wèn)世后,也就是2023年年初的兩個(gè)月里,無(wú)論是國(guó)內(nèi)媒體,還是AI領(lǐng)域的投資人、從業(yè)者,都開始高度關(guān)注著大洋彼岸這款產(chǎn)品的問(wèn)世、成長(zhǎng)。

越來(lái)越多投資圈、科技圈大佬親自跑到硅谷,只為親身感受這波AI浪潮,探究背后究竟有無(wú)逆天機(jī)遇。

出門問(wèn)問(wèn)創(chuàng)始人李志飛,也是在2023年年初親身到硅谷考察后,決心要做大模型。

在上一個(gè)智能語(yǔ)音技術(shù)狂潮的智能音箱百箱大戰(zhàn)中,出門問(wèn)問(wèn)也曾做過(guò)智能音箱,而且是其中明星創(chuàng)業(yè)團(tuán)隊(duì)之一。

只不過(guò)后來(lái)在巨頭價(jià)格戰(zhàn)的擠壓下,出門問(wèn)問(wèn)和其他大多數(shù)創(chuàng)業(yè)團(tuán)隊(duì)一樣,在國(guó)內(nèi)將這塊業(yè)務(wù)早早轉(zhuǎn)向了B端市場(chǎng)。

之后,李志飛和他的出門問(wèn)問(wèn),依然一直留在智能語(yǔ)音技術(shù)這片熱土上。

大模型的出現(xiàn),讓李志飛們嗅到了機(jī)會(huì),只是,2023年的大模型還存在一個(gè)公認(rèn)的缺陷——“編瞎話”。

這一特性決定了大模型最先商業(yè)化落地的場(chǎng)景,會(huì)有這樣兩個(gè)特性:

第一,對(duì)自然語(yǔ)言處理技術(shù)有強(qiáng)需求;

第二,場(chǎng)景容錯(cuò)率要高。

這其實(shí)也是過(guò)去這些年人工智能技術(shù)商業(yè)化落地普遍存在的兩個(gè)需求。

語(yǔ)音助手在智能手機(jī)沒(méi)有得到廣泛應(yīng)用,卻催生了智能音箱這一“新物種”,正是因?yàn)楹笳邔?duì)自然語(yǔ)音處理技術(shù)有較強(qiáng)的需求;

產(chǎn)業(yè)性需求更高的AI質(zhì)檢,即便已有落地應(yīng)用,仍需要有人工做二次復(fù)判,而娛樂(lè)性更強(qiáng)的下棋機(jī)器人卻更容易直接落地,正是因?yàn)楹笳叩膱?chǎng)景容錯(cuò)率更高。

再看如今的大模型賽道。

雖然行業(yè)大模型潛力巨大,也通過(guò)具身智能帶火了人形機(jī)器人,然而,一位機(jī)器人領(lǐng)域資深從業(yè)者告訴鋅產(chǎn)業(yè),將大模型與機(jī)器人技術(shù)結(jié)合,現(xiàn)在仍處于探索階段。

“在解決大模型邊界問(wèn)題(什么時(shí)候開始編瞎話)之前,沒(méi)人敢將搭載大模型的機(jī)器人批量應(yīng)用到工廠核心業(yè)務(wù)中?!?/span>

因而,當(dāng)ChatGPT問(wèn)世后,最先用到大模型的,同樣是是兼具上述兩個(gè)特性的搜索引擎。

微軟不惜130億美元投資OpenAI,盤活了微軟Bing搜索引擎,也讓搜索引擎市場(chǎng)有了新的變數(shù)。

與此同時(shí),智能音箱,成了具備上述兩個(gè)特性,也極度渴望新變數(shù)的另一類消費(fèi)產(chǎn)品。

03

登船AIGC

2023年,經(jīng)歷了三年銷量下行后的智能音箱市場(chǎng),重新燃起了生機(jī)。

2023年2月9日,距離百度大模型——文心一言正式發(fā)布還要35天,然而,小度已經(jīng)等不及文心一言發(fā)布,在這一天正式官宣將融合文心一言能力打造面向智能設(shè)備場(chǎng)景的大模型——小度靈機(jī)。

彼時(shí),小度官方稱,小度靈機(jī)將會(huì)應(yīng)用到小度全系產(chǎn)品中。

之后我們看到,小度陸續(xù)對(duì)外公布了“小度靈機(jī)”的測(cè)試結(jié)果,并率先應(yīng)用到了5月發(fā)布的小度手機(jī)上,成了小度首款面向教育領(lǐng)域的智能手機(jī)最大的亮點(diǎn)。

今年7月在接受媒體采訪時(shí),小度科技CEO景鯤再次強(qiáng)調(diào),“我們會(huì)將大模型的能力逐步應(yīng)用到小度更多產(chǎn)品上,并會(huì)針對(duì)使用場(chǎng)景不斷調(diào)優(yōu)。 ”

不過(guò),景鯤也指出,“它短期內(nèi)不會(huì)有太大改變,3個(gè)月、6個(gè)月后,可能還是原來(lái)那些服務(wù)。”

阿里的語(yǔ)音交互系統(tǒng)接入大模型,同樣是在阿里大模型發(fā)布之前。

2023年4月11日,在這一年的阿里云峰會(huì)上,阿里正式對(duì)外發(fā)布大模型通義千問(wèn),當(dāng)時(shí)還是阿里CEO的張勇稱,未來(lái)阿里旗下所有產(chǎn)品將接入通義千問(wèn)。

實(shí)際上,在阿里通義千問(wèn)大模型發(fā)布之前,網(wǎng)上就已經(jīng)出現(xiàn)了接入大模型的天貓精靈的內(nèi)測(cè)視頻,官方當(dāng)時(shí)確認(rèn)了這一消息,并稱這背后的是“個(gè)性化大模型?!?/span>

阿里大模型在天貓精靈智能音箱上對(duì)外的內(nèi)測(cè)招募是在通義千問(wèn)大模型發(fā)布之后,與此同時(shí),天貓精靈在今年4月對(duì)外發(fā)布了首款搭載大模型的消費(fèi)級(jí)產(chǎn)品——智能眼鏡。

相較于百度、阿里,小米大模型正式對(duì)外亮相要更晚一些。

2023年8月14日,在今年雷軍年度演講上,雷軍對(duì)外公布了小米大模型研發(fā)近況,并宣布小愛(ài)同學(xué)正式接入小米AI大模型。

隨后,接入大模型的小愛(ài)同學(xué)正式開啟邀請(qǐng),當(dāng)時(shí)邀測(cè)的主要是多個(gè)型號(hào)的智能手機(jī),以及小米Sound智能音箱。

至此,國(guó)內(nèi)音箱三巨頭再次齊上陣,一并跨入了AIGC新戰(zhàn)場(chǎng)。

04

當(dāng)大模型,開始“平民化”

2023年,“百模大戰(zhàn)”溢于紙面。

在經(jīng)歷了第一波通用大模型之戰(zhàn)后,如今更多團(tuán)隊(duì)尋找實(shí)際場(chǎng)景進(jìn)行大模型的應(yīng)用落地。

鮮為人知的是,大模型并不是什么新鮮事物,阿里通義、百度文心、華為盤古等現(xiàn)在市面上知名度較高的這些大模型,早幾年就已經(jīng)在各公司內(nèi)部立項(xiàng)推進(jìn),甚至嘗試進(jìn)入應(yīng)用場(chǎng)景。

例如,華為盤古大模型早在2021年就與中科院上海藥物研究所合作訓(xùn)練出了盤古藥物分子大模型,并用在了藥物研發(fā)上。

ChatGPT更多是讓大模型從幕后走到臺(tái)前,并成為人工智能幾條技術(shù)路線中出奇制勝的一條路線。

在進(jìn)入實(shí)際應(yīng)用側(cè)時(shí),大模型又一分為二,有了面向商業(yè)領(lǐng)域(To B)的行業(yè)大模型,以及面向消費(fèi)市場(chǎng)(To C)的大模型和AIGC。

就在上周,天貓精靈換上了一個(gè)新的主品牌——未來(lái)精靈,這一品牌的掌舵人彭超用一場(chǎng)線上發(fā)布會(huì)宣告了天貓精靈全面駛?cè)階IGC新時(shí)期。

迅速卷入這一戰(zhàn)場(chǎng)的不只有天貓精靈,甚至不只有BAT在內(nèi)的幾家大廠,國(guó)內(nèi)學(xué)術(shù)圈、產(chǎn)業(yè)圈眾多大佬都已經(jīng)跑步入場(chǎng)。

只不過(guò),如今已經(jīng)擁有億級(jí)市場(chǎng)保有量的智能音箱,必將又一次成為大模型的絕佳試驗(yàn)場(chǎng)。

而在智能音箱上的普及應(yīng)用,也將是大模型這一人工智能技術(shù)再一次直面數(shù)億挑剔的民眾。

更值得關(guān)注的或許是:

在經(jīng)歷過(guò)亞馬遜“監(jiān)聽”事件全球熱議后,這一次,大佬們能多留些精力兼顧隱私安全問(wèn)題。

大模型 數(shù)字 安全
評(píng)論
還可輸入300個(gè)字
專欄介紹
鋅產(chǎn)業(yè)
20篇文章
用技術(shù)范式,給未來(lái)一個(gè)解釋。
+關(guān)注
400-858-9000
免費(fèi)服務(wù)熱線
kefu@trjcn.com
郵箱
09:00--20:00
服務(wù)時(shí)間
18658148790
投訴電話
投融界App下載
官方微信公眾號(hào)
官方微信小程序
Copyright ? 2024 浙江投融界科技有限公司(ghy2.cn) 版權(quán)所有 | ICP經(jīng)營(yíng)許可證:浙B2-20190547 | 浙ICP備10204252號(hào)-1 | 浙公網(wǎng)安備33010602000759號(hào)
地址:浙江省杭州市西湖區(qū)留下街道西溪路740號(hào)7號(hào)樓301室
浙江投融界科技有限公司trjcn.com版權(quán)所有 | 用戶協(xié)議 | 隱私條款 | 用戶權(quán)限
應(yīng)用版本:V2.7.8 | 更新日期:2022-01-21
 安全聯(lián)盟
在線客服
手機(jī)APP
微信訂閱