技術(shù)
導(dǎo)讀:人工智能的出現(xiàn),讓業(yè)務(wù)邏輯層開(kāi)始發(fā)生翻天覆地變化。如何讓新技術(shù)從研究到研發(fā)逐環(huán)節(jié)培育轉(zhuǎn)移?如何讓新技術(shù)從原型到創(chuàng)新產(chǎn)品到核心產(chǎn)品逐層吸收應(yīng)用?
圖片來(lái)自“123rf.com.cn”
先來(lái)想想未來(lái)。
未來(lái)的企業(yè)應(yīng)用特征是社會(huì)化商業(yè)、網(wǎng)絡(luò)連接、數(shù)據(jù)智能
未來(lái)的信息化場(chǎng)景是企業(yè)互聯(lián)網(wǎng)-產(chǎn)業(yè)互聯(lián)網(wǎng)-社會(huì)化商業(yè)
未來(lái)的信息化產(chǎn)品體系是產(chǎn)業(yè)互聯(lián)網(wǎng)云服務(wù)、中臺(tái)與平臺(tái)、企業(yè)級(jí)云ERP
未來(lái)的數(shù)字化場(chǎng)景是智能零售、智能倉(cāng)儲(chǔ)物流運(yùn)輸、智能車間、智能辦公、智能城市
未來(lái)的數(shù)字化產(chǎn)品體系是智能硬件芯片、智能OS、IoT物聯(lián)網(wǎng)接入平臺(tái)、可視屏音箱助手
1.網(wǎng)絡(luò)連接:互聯(lián)網(wǎng)服務(wù)連接平臺(tái)、物聯(lián)網(wǎng)連接平臺(tái)、SaaS服務(wù)連接平臺(tái)、ERP集成平臺(tái)
2.數(shù)據(jù):數(shù)據(jù)中臺(tái)、大數(shù)據(jù)技術(shù)平臺(tái)
3.智能:人工智能技術(shù)平臺(tái)、人工智能應(yīng)用中臺(tái)
未來(lái)的技術(shù)棧是:
用戶交互層:傳感器、人工智能視覺(jué)識(shí)別/語(yǔ)音交互
邏輯層:Open API Mesh、人工智能關(guān)聯(lián)推薦算法
數(shù)據(jù)層:人工智能精準(zhǔn)搜索/關(guān)系圖譜、區(qū)塊鏈
1.IT服務(wù):云訂閱服務(wù)、智能硬件
2.金融服務(wù):大數(shù)據(jù)+AI驅(qū)動(dòng)的金融信貸服務(wù)、大數(shù)據(jù)+AI驅(qū)動(dòng)的金融科技服務(wù)(聚合支付服務(wù)、反欺詐服務(wù)、信用服務(wù)、實(shí)時(shí)風(fēng)控服務(wù))
3.業(yè)務(wù)服務(wù):大數(shù)據(jù)+AI驅(qū)動(dòng)的:社會(huì)化財(cái)稅自動(dòng)化服務(wù)、社會(huì)化用工調(diào)度服務(wù)、社會(huì)化營(yíng)銷數(shù)字化服務(wù)、社會(huì)化供應(yīng)鏈資源調(diào)度服務(wù)
看,從客戶需求,到產(chǎn)品,到技術(shù),到商業(yè)模式,全不一樣了。面對(duì)未來(lái),不管是中國(guó)BAT互聯(lián)網(wǎng)公司,還是中國(guó)企業(yè)軟件公司,還是國(guó)外的企業(yè)軟件巨頭公司,還是實(shí)業(yè)企業(yè)的科技公司,大家全都同一個(gè)起跑線,全都懵逼探索,就看誰(shuí)從研究、戰(zhàn)略合作、資本融資與投資并購(gòu)、組織與人才、激勵(lì)多方組合,誰(shuí)能做到:選準(zhǔn)、做對(duì)、跑得快,誰(shuí)就能贏得未來(lái)。
人工智能專業(yè)發(fā)展了60年,一共折翼兩次。一次是剛剛發(fā)展起來(lái),想通用解決問(wèn)題,太樂(lè)觀,當(dāng)然折翼。一次是90年代,吸收了第一次的經(jīng)驗(yàn)教訓(xùn)不搞通用了,專門(mén)做細(xì)分專業(yè)領(lǐng)域的專業(yè)系統(tǒng),但太依賴專業(yè)領(lǐng)域知識(shí)加工,還是沒(méi)法做成商業(yè)。
如何不強(qiáng)依賴專業(yè)領(lǐng)域知識(shí)呢?嘿嘿嘿,這就是這一次的發(fā)力重點(diǎn):深度學(xué)習(xí)。這會(huì)對(duì)上層視覺(jué)識(shí)別、語(yǔ)音交互、自然語(yǔ)言處理三大應(yīng)用領(lǐng)域都有加持助推效能。
而在深度學(xué)習(xí)領(lǐng)域,Google收購(gòu)的英國(guó)DeepMind公司在這塊有兩個(gè)重大突破:神經(jīng)網(wǎng)絡(luò)(質(zhì)量)、TransFormer(性能)。所以,各種CNN(卷積神經(jīng)網(wǎng)絡(luò))、MTCNN(多任務(wù)卷積神經(jīng)網(wǎng)絡(luò))、RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))、DNN(深度神經(jīng)網(wǎng)絡(luò))、ResNet(深度殘差網(wǎng)絡(luò))、LSTM(時(shí)間序列長(zhǎng)短期記憶網(wǎng)絡(luò))、GAN(生成式對(duì)抗網(wǎng)絡(luò))。
模型改進(jìn):大規(guī)模無(wú)監(jiān)督模型GPT-2,并且結(jié)合了Attention機(jī)制,頗適合圖像生成質(zhì)量?jī)?yōu)化。
算法改進(jìn):如BERT算法,頗適合NLP訓(xùn)練質(zhì)量?jī)?yōu)化。
當(dāng)然,這些網(wǎng)絡(luò)結(jié)構(gòu)、算法、模型、機(jī)制都已經(jīng)被開(kāi)源成深度學(xué)習(xí)平臺(tái),這讓高深的人工智能走入普通IT公司:
Google:Tensorflow/Koras
Facebook:Caffe/Pytorch
微軟:CNTK/DMTK
AWS:MXNet
OpenAI:Open AI(目前尚無(wú)完全開(kāi)源)
Apache:OpenNLP
百度:PaddlePaddle
Salesforce:TransmogrifAI
除了在算法模型平臺(tái)層有開(kāi)源外,在其他幾個(gè)方面也湊在了一起:
算力芯片層:英偉達(dá)借助區(qū)塊鏈比特幣大風(fēng)發(fā)展起來(lái)專用芯片GPU,也可用于人工智能。Google發(fā)布了TPU。
算力資源層:AWS、Azure云計(jì)算廠商都提供了人工智能訓(xùn)練所需的IaaS服務(wù),正好適合人工智能訓(xùn)練這種波峰波谷的工作。
數(shù)據(jù)存儲(chǔ)層:AWS、Azure云計(jì)算廠商都提供了云分布式對(duì)象存儲(chǔ)服務(wù)、大數(shù)據(jù)存儲(chǔ)平臺(tái)、大數(shù)據(jù)計(jì)算平臺(tái)
數(shù)據(jù)集層:4G、智能手機(jī)/高清攝像頭、照片相冊(cè)云盤(pán)這三樣的普及,讓圖像數(shù)據(jù)積累快速膨脹。
所以說(shuō),這是學(xué)術(shù)界(算法模型)、工程界(開(kāi)源)、云計(jì)算、智能手機(jī)移動(dòng)互聯(lián)網(wǎng)四者疊加的效果。所以,為啥這次學(xué)術(shù)界的人紛紛加入產(chǎn)業(yè)界,就是因?yàn)檫@個(gè)原因,沒(méi)有數(shù)據(jù)沒(méi)有算力沒(méi)有應(yīng)用場(chǎng)景,就沒(méi)法改進(jìn)算法模型。
開(kāi)源是個(gè)好東西。
我這里就是列了一些通用的、大面的。至于更詳細(xì)的,大家可以看:paperswithcode這個(gè)網(wǎng)站,浩如煙海的論文和代碼,你想要的都在這里。
一、視覺(jué)
OpenCV(Intel) DeepDream (Google)
人臉識(shí)別:InSightFace
物體檢測(cè):Detectron(Facebook)
二、語(yǔ)音
語(yǔ)音到文字:wav2Letter(Facebook)
語(yǔ)音識(shí)別:kaldi(約翰霍普金斯大)
文字到語(yǔ)音:VoiceLoop(Facebook)、Merlin(英國(guó)愛(ài)丁堡大學(xué))
三、NLP
搜索:Apache的Nutch、Luence、ElasticSearch
關(guān)聯(lián)推薦:PredictionIO (Salesforce) 關(guān)聯(lián)推薦算法庫(kù)LibRec (中國(guó)東北大學(xué))
對(duì)話系統(tǒng):如DeepPavlov(莫斯科物理學(xué)院)、ParlAI(Facebook)、Texar(卡耐基梅隆大學(xué))
通用NLP:Pytext(Facebook)、OpenNLP(Apache)、Spacy、AllenNLP、NLTK(賓夕法尼亞大學(xué))、CoreNLP(斯坦福大學(xué))、HaNLP(中國(guó)哈工大)、FastNLP(中國(guó)復(fù)旦大學(xué))
四、深度學(xué)習(xí)
深度學(xué)習(xí):Tensorflow/Koras(Google)、Coffe/Pytorch(Facebook)、微軟CNTK/DMTK、AWS的MXNet、百度的PaddlePaddle。Salesforce還針對(duì)Tensorflow出了一套簡(jiǎn)化封裝的流水線TransmogrifAI
增強(qiáng)學(xué)習(xí):Dopamine(Google)
五、機(jī)器學(xué)習(xí)/數(shù)據(jù)挖掘
算法庫(kù):Spark MLlib、Numpy、Pandas
最早我們寫(xiě)應(yīng)用,是UI、邏輯、數(shù)據(jù)一體化,如DBaseIII。
后來(lái)出現(xiàn)了大型關(guān)系數(shù)據(jù)庫(kù),我們才有了C/S結(jié)構(gòu),數(shù)據(jù)和應(yīng)用分離。這是VB、PB、Delphi的輝煌時(shí)期。
后來(lái)又有了組件、容器中間件,所以我們才有了三層結(jié)構(gòu):UI層、業(yè)務(wù)邏輯層、數(shù)據(jù)層三者物理分離,而且三個(gè)層使用的技術(shù)也都不一樣。尤其是出現(xiàn)了多端的時(shí)候,萬(wàn)金油程序員終于頂不住了,開(kāi)始分離出專門(mén)的前端程序員(Web/移動(dòng)App/小程序)。在數(shù)據(jù)層也是對(duì)象存儲(chǔ)、SQL、NOSQL、數(shù)據(jù)倉(cāng)庫(kù)、大數(shù)據(jù)計(jì)算平臺(tái)各種技術(shù)組合,就出現(xiàn)了數(shù)據(jù)層的專門(mén)程序員。反而業(yè)務(wù)邏輯層的技術(shù)變化并不大,編程語(yǔ)言也基本就是JAVA了。
但人工智能的出現(xiàn),讓業(yè)務(wù)邏輯層開(kāi)始發(fā)生翻天覆地變化。如何讓新技術(shù)從研究到研發(fā)逐環(huán)節(jié)培育轉(zhuǎn)移?如何讓新技術(shù)從原型到創(chuàng)新產(chǎn)品到核心產(chǎn)品逐層吸收應(yīng)用?
對(duì)于前沿技術(shù),最佳的研發(fā)組織分工應(yīng)該是:
1. 戰(zhàn)略合作:云計(jì)算廠商合作、開(kāi)源社區(qū)界合作、學(xué)術(shù)界合作。從云計(jì)算廠商來(lái)看,微軟Azure很牛,開(kāi)源社區(qū)Google很牛,學(xué)術(shù)界看了看香港很牛,港大、香港理工大、香港科技大、香港中文大學(xué)、香港城市大學(xué)都是榜上有名的??磥?lái)布局大灣區(qū)很有必要。
2. 科學(xué)家研究實(shí)驗(yàn)室:戰(zhàn)略合作、論文閱讀理解、技術(shù)平臺(tái)選擇、原型算法原型模型原型應(yīng)用快速突破驗(yàn)證
3. 技術(shù)平臺(tái)研發(fā)中心:人工智能技術(shù)平臺(tái)正式研發(fā)、與科學(xué)家研究實(shí)驗(yàn)室合作開(kāi)發(fā)技術(shù)算法模型、對(duì)人工智能應(yīng)用平臺(tái)暴露簡(jiǎn)化后的API
4. 應(yīng)用平臺(tái)研發(fā)中心:開(kāi)發(fā)人工智能應(yīng)用平臺(tái)、與應(yīng)用雅畈中心合作開(kāi)發(fā)應(yīng)用算法模型、通過(guò)Open API平臺(tái)對(duì)外暴露簡(jiǎn)化后的API
5. 應(yīng)用研發(fā)中心:微調(diào)節(jié)應(yīng)用模型、調(diào)用Open API平臺(tái)的一個(gè)API就直接應(yīng)用了人工智能能力
6. 大客戶定制研發(fā)中心:微調(diào)節(jié)應(yīng)用模型
最佳的研發(fā)流程應(yīng)該是:
第一步 科學(xué)家研究實(shí)驗(yàn)室(特種部隊(duì)尖刀連):搭建快而臟的原型,快速技術(shù)+應(yīng)用驗(yàn)證應(yīng)用價(jià)值場(chǎng)景、技術(shù)使用性和技術(shù)成熟度,然后把成果轉(zhuǎn)移給創(chuàng)新產(chǎn)品研發(fā)中心
第二步 創(chuàng)新產(chǎn)品研發(fā)中心:創(chuàng)新產(chǎn)品研發(fā)中心接到成果,當(dāng)做最佳實(shí)踐案例進(jìn)行產(chǎn)品分析,然后對(duì)新技術(shù)模塊、新產(chǎn)品模塊,按照產(chǎn)品管理流程與質(zhì)量保證進(jìn)行正式的微服務(wù)化設(shè)計(jì)(如可擴(kuò)展、可定制、高性能、高可用、可實(shí)施、可運(yùn)維)
第三步 核心產(chǎn)品研發(fā)中心:在創(chuàng)新產(chǎn)品商業(yè)推廣一年后,核心產(chǎn)品研發(fā)中心對(duì)核心產(chǎn)品進(jìn)行新技術(shù)的吸收與利用,升級(jí)核心產(chǎn)品