技術(shù)
導(dǎo)讀:新型冠狀病毒肺炎疫情爆發(fā)以來(lái),相關(guān)話題熱度持續(xù)高漲。如何在紛繁蕪雜的信息中理清頭緒?
新型冠狀病毒肺炎疫情爆發(fā)以來(lái),相關(guān)話題熱度持續(xù)高漲。如何在紛繁蕪雜的信息中理清頭緒?為便于疫情防控和宣傳工作的開(kāi)展,近日,清華大學(xué)人工智能研究院、RealAI共同研發(fā)推出“新冠肺炎疫情AI話題分析平臺(tái)”,幫助相關(guān)部門和公眾更好地了解疫情實(shí)時(shí)動(dòng)態(tài)。
據(jù)介紹,該平臺(tái)通過(guò)對(duì)多渠道海量媒體信息進(jìn)行自動(dòng)抓取采集、識(shí)別分析,解決了傳統(tǒng)信息檢索過(guò)程中因消息源頭繁雜、消息過(guò)多、檢索意圖不明確而產(chǎn)生的困擾。同時(shí),基于大數(shù)據(jù)分析和AI建模,自動(dòng)識(shí)別出近期熱點(diǎn)話題、新聞追蹤和話題導(dǎo)向、地區(qū)關(guān)注度變化,第一時(shí)間展示全網(wǎng)話題最新動(dòng)態(tài),滿足用戶對(duì)疫情輿情監(jiān)測(cè)的需求。
在底層算法支持上,該平臺(tái)基于清華大學(xué)人工智能研究院、計(jì)算機(jī)系推出的WarpLDA主題提取算法研發(fā)?;诿商乜錏M算法,WarpLDA在訪存效率、并行度方面相比傳統(tǒng)的Gibbs采樣算法更有優(yōu)勢(shì),可用于上億級(jí)別文本的主題提取。該成果最早首發(fā)于數(shù)據(jù)庫(kù)領(lǐng)域頂級(jí)國(guó)際學(xué)術(shù)會(huì)議VLDB上。
RealAI首席執(zhí)行官田天認(rèn)為,不同于2003年非典等重大公共衛(wèi)生突發(fā)事件,互聯(lián)網(wǎng)成為這次疫情主要的“信息源”平臺(tái),傳播模式更是基于人手一機(jī)的“自媒體”,信息流的爆發(fā)不僅降低了大眾獲取信息的“信噪比”,更是滋生了不同程度的謠言??梢哉f(shuō),傳播速度之快、話題數(shù)量之大、更新變化之迅速都對(duì)疫情信息的有效傳達(dá)提出了更高的要求。
“在這場(chǎng)沒(méi)有硝煙的戰(zhàn)爭(zhēng)中,我們每個(gè)人、每個(gè)組織都無(wú)法獨(dú)善其身?!碧锾毂硎?,RealAI希望以自身算法、優(yōu)勢(shì)技術(shù)為依托,從內(nèi)容側(cè)打造防疫戰(zhàn)線,發(fā)揮信息戰(zhàn)“疫”價(jià)值,為抗擊疫情貢獻(xiàn)力所能及的力量。