導(dǎo)讀:據(jù)“小米公司”官方微博,小米大語言模型MiLM正式通過大模型備案,相關(guān)模型據(jù)稱將逐步應(yīng)用于小米汽車、手機、智能家居等產(chǎn)品中,后續(xù)“將面向更多用戶開放體驗”。
5 月 16 日消息,據(jù)“小米公司”官方微博,小米大語言模型MiLM正式通過大模型備案,相關(guān)模型據(jù)稱將逐步應(yīng)用于小米汽車、手機、智能家居等產(chǎn)品中,后續(xù)“將面向更多用戶開放體驗”。
小米公司MiLM大模型在去年8月首度現(xiàn)身 C-Eval、CMMLU大模型評測榜單,當時這款模型在 C-Eval總榜單排名第10、同參數(shù)量級排名第1。
IT之家根據(jù)GitHub項目頁給出的信息得知,MiLM-6B 是由小米公司開發(fā)的一個大規(guī)模預(yù)訓(xùn)練語言模型,參數(shù)規(guī)模達 64 億。
▲ 圖源 MiLM-6B 的 GitHub 頁面
而根據(jù) C-Eval 給出的信息,MiLM-6B 模型在具體各科目成績上,在 STEM(科學(xué)、技術(shù)、工程和數(shù)學(xué)教育)全部 20 個科目中,計量師、物理、化學(xué)、生物等多個項目獲得了較高的準確率。
▲ 圖源C-Eval
據(jù)悉,MiLM-6B 模型目前已經(jīng)在大多數(shù)文科科目中表現(xiàn)出了相對良好的準確度,不過在“法學(xué)、數(shù)學(xué)、編程、概率論、離散數(shù)學(xué)”等涉及“抽象思維”的科目中,還有一定進步空間。
在 10 個“社會科學(xué)”測試科目中,除“教育學(xué)和地理”外,該模型在其他 8 個科目中都獲得了較為理想的準確率。在人文科學(xué)的 11 個科目中,MiLM-6B 則在“歷史與法律”基礎(chǔ)上有著不錯的準確率表現(xiàn)。