導(dǎo)讀:人形機(jī)器人火爆,具身智能成了當(dāng)下最激動人心的科技賽道之一。
近日,一家成立于2023年5月的公司——銀河通用,最新宣布完成天使輪融資,共計(jì)7億元,投資方包括美團(tuán)點(diǎn)評戰(zhàn)投、北汽產(chǎn)投、商湯國香基金、訊飛基金。此前,啟明創(chuàng)投、藍(lán)馳創(chuàng)投、經(jīng)緯創(chuàng)投、源碼資本、IDG資本、光源資本等也參與了早期投資。
銀河通用所處的具身智能賽道,近來一筆筆融資正在涌現(xiàn),比如,
1月份,人形機(jī)器人公司星動紀(jì)元宣布完成超億元天使輪融資;
2月份,宇樹科技宣布完成近10億元B2輪融資;
3月份,成立于2023年2月的智元機(jī)器人已拿下6輪融資,公司估值達(dá)70億元;
5月份,跨維智能完成由聯(lián)想創(chuàng)投領(lǐng)投的戰(zhàn)略輪融資;
5月份,逐際動力也宣布完成新一輪戰(zhàn)略融資;
最近一個月,斯帝爾宣布獲得近億元A輪融資;
而更早之前,帕西尼感知科技、達(dá)闥機(jī)器人、傅利葉智能、樂森機(jī)器人等也紛紛宣布了融資。
其實(shí),除了融資以外,具身智能這個賽道還跑出一個超級IPO。2023年12月,優(yōu)必選正式登陸港股,成為“人形機(jī)器人第一股”。作為具身智能的終極形態(tài),人形機(jī)器人火爆,如今優(yōu)必選市值已660億港元。
毫無疑問,具身智能成了當(dāng)下最激動人心的科技賽道之一。
具身智能賽道爆火,離不開AI大模型的橫空出世
所謂具身智能,是指一種智能系統(tǒng)或機(jī)器,能夠通過感知和交互與環(huán)境進(jìn)行實(shí)時互動通常具備感知、認(rèn)知、決策和行動的能力,被視為AI的終極形態(tài)。
得益于近兩年來AI的爆發(fā),機(jī)器人有了“大腦”,具身智能市場充滿著想象空間。據(jù)Markets and Markets預(yù)測,2023年全球具身智能市場規(guī)模為18億美元,預(yù)計(jì)2028年將達(dá)到138億美元。
那么,為何具身智能會突然爆火?這一切都離不開AI大模型的橫空出世。搭配了AI大模型的具身智能機(jī)器人,則猶如擁有了一個超強(qiáng)“大腦”,在理解力、連續(xù)決策力、人機(jī)交互能力等方面均有重大突破,即能夠理解外界的聲音、視頻、文本等多模態(tài)信息,進(jìn)一步分析任務(wù)、進(jìn)行決策、分解步驟執(zhí)行,從而與人類及現(xiàn)實(shí)環(huán)境形成高效、自然的互動。
關(guān)于AI大模型,《2024年中國物聯(lián)網(wǎng)產(chǎn)業(yè)創(chuàng)新白皮書》這么說
人工智能的發(fā)展經(jīng)歷了3個階段,大模型將人工智能的關(guān)注點(diǎn)從感知智能轉(zhuǎn)向生成式內(nèi)容,解決了以前技術(shù)無法解決的問題。
當(dāng)前正處于第三個階段——大模型時代。其起源是2017年谷歌發(fā)表的一篇論文《Attention Is All You need》,里面提出了革命性的Transformer深度神經(jīng)網(wǎng)絡(luò),一舉將深度學(xué)習(xí)的模型參數(shù)提高到了上億級別,并且在之后的迭代發(fā)展中,模型參數(shù)被逐步提升到了幾十億、幾百億甚至幾千億,意味著模型的復(fù)雜程度和學(xué)習(xí)能力逐步提高,越來越有接近人的表現(xiàn)。
也就是說,大模型產(chǎn)品并非采用上個時代模型參數(shù)受限的CNN、RNN架構(gòu),而是借助Transformer另起爐灶,達(dá)到了一種類似“小孩開竅”的「涌現(xiàn)」現(xiàn)象——當(dāng)模型突破某個規(guī)模時,能力水平直線上升。這也就是技術(shù)積累到一定程度后,近年我們尤其覺得AI能做的事情更多了,并且效果更好,比如文本生成、語言理解、知識對話、邏輯推理等等。
無論是Sora、Suno V3、Kimi還是ChatGPT,它們都是基于AI大模型的變革性的、軟件形態(tài)的生產(chǎn)效率工具,屬于生成式AI的范疇。適用的行業(yè)并非是單純的互聯(lián)網(wǎng)或移動互聯(lián)網(wǎng),而是一個個正在生成內(nèi)容并且早有固化知識庫的行業(yè),無論內(nèi)容形態(tài)是文字、圖像、視頻或者其他。
那么同樣的,物聯(lián)網(wǎng)場景里有內(nèi)容產(chǎn)生的地方,比如說跟人有反復(fù)交互的產(chǎn)品類型,不管是語言還是圖像形式,大模型就會有突出的應(yīng)用價(jià)值。
物聯(lián)網(wǎng)大模型產(chǎn)業(yè)格局及運(yùn)營方式
由于Transformer是一項(xiàng)新技術(shù),無論是傳統(tǒng)玩家還是新興企業(yè)都處在接近的起跑線,業(yè)界參與大模型的玩家就非常多、類型非常廣,各方都希望通過大模型抓住新一輪產(chǎn)業(yè)機(jī)會。但業(yè)內(nèi)對大模型、生成式AI也有清醒的認(rèn)知。
首先,生成式AI很難完全取代人類,更強(qiáng)調(diào)對智力工作進(jìn)行替代或加強(qiáng),衡量標(biāo)準(zhǔn)可以是對人類工作的替代率達(dá)到10%還是20%甚至30%、40%,但無論如何,更高要求的工作可能還需人類完成;其次,大模型能力可分為知識、推理、執(zhí)行三層結(jié)構(gòu),現(xiàn)在很多生產(chǎn)力工具解決的是知識層的問題,推理層還鮮少進(jìn)入,執(zhí)行層的想象空間最大;另外,有些大模型的商業(yè)化可能是形成標(biāo)準(zhǔn)化的產(chǎn)品,但也有些大模型商業(yè)模式是“產(chǎn)品+服務(wù)”,其服務(wù)階段要完成對企業(yè)業(yè)務(wù)的咨詢、對數(shù)據(jù)的理解、對模型的訓(xùn)練/部署/調(diào)優(yōu)等工作,實(shí)現(xiàn)起來更加復(fù)雜。
這也是為什么,除了存在追逐熱點(diǎn)的一批企業(yè),也存在另一批直白表達(dá)對生成式AI保持觀望的公司,相比于成為技術(shù)的創(chuàng)新者,行業(yè)中的大多數(shù)應(yīng)該在等待著成熟的AI應(yīng)用,為真正的核心業(yè)務(wù)發(fā)展帶來增益。至于在AI浪潮中受益最早并且最大的公司,極有可能是英偉達(dá)。因?yàn)榇竽P偷募夹g(shù)壁壘在于數(shù)據(jù)、算力和算法,而英偉達(dá)可稱為是全球算力市場金字塔尖的企業(yè)。
細(xì)化到物聯(lián)網(wǎng)行業(yè),大模型行業(yè)也還處在早期階段,從技術(shù)到產(chǎn)品、從產(chǎn)品到市場還有一段過程,計(jì)劃將大模型產(chǎn)品廣泛落地到物聯(lián)網(wǎng)細(xì)分行業(yè)可能也需要時間。
而且大模型行業(yè)發(fā)展到最后,通用模型可能只會剩下幾個,但是在垂直行業(yè)領(lǐng)域,面向不同的數(shù)據(jù)基礎(chǔ)會存在很多的領(lǐng)域模型。其中領(lǐng)域模型與通用模型的區(qū)別,就好像??漆t(yī)生與普科大夫,??漆t(yī)生勢必在專業(yè)領(lǐng)域里能力更強(qiáng),并且會有非常多類型的專科醫(yī)生。
物聯(lián)網(wǎng)大模型發(fā)展趨勢
從產(chǎn)品角度來看,大模型就是一個軟件形態(tài)的生產(chǎn)效率工具,把它用上去了,工作效率有望大幅提升。從更產(chǎn)業(yè)化的角度來說,市面上好多需求都是由新技術(shù)來驅(qū)動的,因?yàn)闆]有新技術(shù),用戶沒有替換的動力。大模型就是一項(xiàng)新技術(shù)。
比如現(xiàn)在一些品牌在醞釀、研發(fā)大模型手機(jī),原因是用戶換機(jī)的意愿已經(jīng)大幅降低,當(dāng)未來大模型手機(jī)產(chǎn)品出來并且切中用戶痛點(diǎn)、爽點(diǎn)的時候,那就會驅(qū)動整個行業(yè)都用上大模型。
物聯(lián)網(wǎng)行業(yè)也與此相似,大模型技術(shù)具有非常大的發(fā)展空間,比如未來多模態(tài)產(chǎn)品會出來,到時不止覆蓋語言,也會覆蓋圖像類應(yīng)用,這些產(chǎn)品也將逐步應(yīng)用在設(shè)備邊緣端、機(jī)器人等領(lǐng)域。
更多精彩內(nèi)容,請參見《2024年中國物聯(lián)網(wǎng)產(chǎn)業(yè)創(chuàng)新白皮書》完整版。