技術(shù)
導(dǎo)讀:?3月16日14:00,百度于北京舉行新一代大語(yǔ)言模型、生成式AI產(chǎn)品“文心一言”發(fā)布會(huì)。
3月16日14:00,百度于北京舉行新一代大語(yǔ)言模型、生成式AI產(chǎn)品“文心一言”發(fā)布會(huì)。
經(jīng)過(guò)近一個(gè)小時(shí)的介紹,文心一言的面紗終于被掀開(kāi),雖然李彥宏嘴里說(shuō)這是“第一個(gè)同類產(chǎn)品”,但心里明顯不自信,甚至自己也承認(rèn)文心一言的“不成熟”。
發(fā)布會(huì)上,百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏以及百度首席技術(shù)官王海峰分別對(duì)文心一言的功能和技術(shù)進(jìn)行了介紹,而介紹的過(guò)程僅僅是一個(gè)加了五段demo視頻的PPT,沒(méi)有想象中的現(xiàn)場(chǎng)演示,更沒(méi)有值得大呼wocao的亮點(diǎn),也不對(duì)外開(kāi)放使用。發(fā)布會(huì)一開(kāi)始,百度港股便直線跳水,最大跌幅超過(guò)10%。
這種感覺(jué)就像一群饑餓的人等著開(kāi)飯,結(jié)果廚師端出來(lái)一盤(pán)食品模型!
好吧,即使是模型,我們也來(lái)品嘗下吧。
前邊說(shuō)的這五段demo對(duì)應(yīng)了文心一言的五個(gè)使用場(chǎng)景,分別是:文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成。
從表面上看,文言一心的內(nèi)容生成方面的自然語(yǔ)言處理能力如果真如demo演示那樣,倒也算是達(dá)到了常規(guī)水平,但其中還是讓我們發(fā)現(xiàn)了一個(gè)有意思的地方。
也就是在中文理解的介紹上,發(fā)布會(huì)直播中共提了四個(gè)問(wèn)題,分別是:
“洛陽(yáng)紙貴是什么意思?”
“當(dāng)時(shí)的洛陽(yáng)紙到底有多貴?”
“這個(gè)成語(yǔ)在現(xiàn)在的經(jīng)濟(jì)學(xué)原理里,對(duì)應(yīng)的理論是什么?”
“用洛陽(yáng)紙貴四個(gè)字寫(xiě)一首藏頭詩(shī)”
但是在后續(xù)的新聞稿截圖中,第二個(gè)問(wèn)題莫名消失,并且該題的答案替代了第一個(gè)問(wèn)題的答案。
如此詭異,不免讓人懷疑這demo的真實(shí)性。
沒(méi)有現(xiàn)場(chǎng)演示,所謂的demo又出現(xiàn)這樣的問(wèn)題,作為用戶,只能聽(tīng)一聽(tīng)現(xiàn)場(chǎng)李彥宏和王海峰的介紹了。
關(guān)于文心一言,李彥宏在發(fā)布會(huì)坦言,大家難免會(huì)拿來(lái)與ChatGPT進(jìn)行對(duì)比,這個(gè)門(mén)檻還是很高的。另外,從其本人在內(nèi)測(cè)過(guò)程中體驗(yàn)到的文心一言的能力來(lái)說(shuō),確實(shí)并不完美。
“并不完美”,是真正的不完美,還是不自信呢?也許很多人要問(wèn),既然不完美,為什么要現(xiàn)在發(fā)布呢?
李彥宏也現(xiàn)場(chǎng)表示,是因?yàn)橛惺袌?chǎng)需求。對(duì)于這樣的回答,大家可以自己品一品。
然后是在文心一言的技術(shù)方面。
王海峰介紹,文心一言是新一代知識(shí)增強(qiáng)大語(yǔ)言模型,是在ERNIE、PLATO系列模型的基礎(chǔ)上研發(fā)的。其關(guān)鍵技術(shù)包括:監(jiān)督精調(diào)、人類反饋的強(qiáng)化學(xué)習(xí)、提示、知識(shí)增強(qiáng)、檢索增強(qiáng)和對(duì)話增強(qiáng)。
我們知道,對(duì)于生成式AI產(chǎn)品來(lái)說(shuō),人類反饋的強(qiáng)化學(xué)習(xí)是技術(shù)中至關(guān)重要的一個(gè),但現(xiàn)場(chǎng)王海峰表示,文言一心在該方面的訓(xùn)練不夠充分,需要在后續(xù)的應(yīng)用中優(yōu)化。
可以說(shuō)這是坦誠(chéng),但也印證了不成熟的事實(shí)確確實(shí)實(shí)存在。
一直以來(lái),人們對(duì)百度的AI技術(shù)期望值較高,在ChatGPT大火后,百度首個(gè)宣稱將推出“對(duì)標(biāo)”產(chǎn)品“文心一言”。
在多模態(tài)生成等方面,文言一心確實(shí)展示出可用性,雖然PPT確實(shí)有問(wèn)題,但通過(guò)李彥宏與王海峰的介紹不難發(fā)現(xiàn),文言一心并不成熟,此時(shí)發(fā)布也是與市場(chǎng)需求有關(guān)。有人將李彥宏口中所謂的“市場(chǎng)需求”作為解釋,大概意思是:
ChatGPT的發(fā)布對(duì)搜索引擎沖擊最大,百度必須盡快發(fā)布類ChatGPT產(chǎn)品,即使是搜索引擎套個(gè)殼子,也要硬著頭皮上。因?yàn)橛脩糁灰冒俣鹊漠a(chǎn)品提問(wèn)和搜索,百度都有機(jī)會(huì)把流量變成金錢(qián)。這次發(fā)布會(huì)上,李彥宏也宣布已經(jīng)有650家生態(tài)伙伴接入文心一言。
有網(wǎng)友調(diào)侃,文心一言有沒(méi)有和6.5萬(wàn)莆田醫(yī)院簽約?
巧合的是,在文言一心發(fā)布前一天,GPT-4突然發(fā)布, 強(qiáng)大的識(shí)圖能力,更高的回答準(zhǔn)確性都將讓升級(jí)了GPT-4的ChatGPT更加強(qiáng)大,這不免刺痛了國(guó)內(nèi)用戶的心!
希望越大,失望越大。
對(duì)百度文言一心有高期待的用戶可能看過(guò)這場(chǎng)發(fā)布會(huì)后真的要失望了,甚至發(fā)布會(huì)結(jié)束普通用戶還無(wú)法體驗(yàn),這更難讓人接受。所以,在發(fā)布會(huì)剛開(kāi)始沒(méi)多久,百度港股變出現(xiàn)直線下跌,最高跌幅超過(guò)10%。
只想跟百度說(shuō),趕超ChatGPT需要做的著實(shí)還有很多,而對(duì)于用戶,希望百度能拿出更多的誠(chéng)意!