導讀:近年來,對于跨攝像頭、跨空間的目標人物檢索,行人重識別技術Re-ID正作為新興研究方向受到越來越多的關注。
圖片來自“Unsplash”
當前階段,標準場景下的人臉識別已經能夠實現非常成熟地應用,但在一些非標場景,人臉的應用效果仍有待提升。由于人臉信息相對單一且容易受到外界環(huán)境干擾影響識別結果,因此,近年來,對于跨攝像頭、跨空間的目標人物檢索,行人重識別技術Re-ID正作為新興研究方向受到越來越多的關注。
行人重識別(Person Re-Identification,簡稱 Re-ID)也稱為跨鏡追蹤技術,是利用計算機視覺技術判斷圖像或者視頻序列中是否存在特定行人的技術,指通過穿著、體態(tài)、發(fā)型等在不確定的場景中能夠再次識別是同一個人,并以此描繪出個體行進軌跡的AI視覺技術,簡而言之,就是通過計算機視覺技術檢索不同攝像頭下的同一個目標人物。
Re-ID不同于人臉識別,人臉識別是用來認證一個人的身份,而Re-ID是將同一個人在不同攝像設備下的影像匹配起來,生成跨攝像頭時空軌跡。典型的基于行人ReID的應用是以圖搜圖。
這幾年來隨著行人重識別技術在公安、交通、零售等行業(yè)領域的需求的日趨廣泛,不少廠商也陸續(xù)發(fā)布了在相關數據集測試的結果以此來彰顯企業(yè)在Re-ID技術研究方面的成果。其中Market 1501、DukeMTMC-reID、CUHK03這三個衡量Re-ID技術的數據集測試也是業(yè)內最常用的行人重識別權威數據集測試。在Re-ID技術研究領域,首位命中率(Rank-1Accuracy)和平均精度均值(Mean Average Precision,mAP)是衡量算法水平的核心指標。
安防知識網編輯梳理了近兩年來國內部分企業(yè)在三大公開數據集的測試結果,如下圖所示,在算法技術不斷迭代之下,以Market 1501數據集為例,首位命中率和平均精度均值都陸續(xù)超越了97%、94%的水平值,推動著行人重識別算法水平迎來新的突破。 近兩年國內部分企業(yè)在三大公開數據集上的測試結果
而除了智能安防和人工智能領域的部分企業(yè)之外,阿里和騰訊優(yōu)圖的刷榜也讓業(yè)界更多的注意到了Re-ID這項技術,為后續(xù)這項技術的商用化落地鋪墊了前期基礎。
行人重識別Re-ID技術研究幾大現實難點:
現階段,Re-ID的技術研究仍然面臨著很多現實問題和技術難點,這些問題主要包括數據獲取難度大、算法訓練難度高以及一些實用角度的投入產出比問題。
數據獲取難度大:相比于人臉數據,Re-ID中行人數據嚴重稀缺,行人最主流的數據集(Market1501)才1000-3000個行人ID,而人臉的公開數據集ID規(guī)模已超100萬,企業(yè)私有的ID規(guī)??赡芨?。造成這一現象的主要原因是由于行人數據集需要采集自同一個人在一段時間內同時出現在多個攝像頭下,這樣嚴苛條件限制了行人數據集的構建。正因為數據的缺失,對跨鏡追蹤技術的算法研究提出了更高的要求。
算法訓練難度高:數據的稀缺本身就是一個大問題,在這個基礎之上,現有的視頻監(jiān)控由于受成像質量、分辨率等因素的制約,還會導致抓取的圖像信息模糊不清。當然還有相機拍攝角度差異大、室內室外環(huán)境變化、行人服裝配飾更換、季節(jié)性穿衣風格差別大、白天晚上光線差異等等因素的影響,讓跨攝像頭、跨地區(qū)、跨時間的Re-ID分析變得更加困難,要解決的實際問題非常復雜。除此之外,在很多安防系統(tǒng)中,視頻監(jiān)控探頭的碼流帶寬以及攝像頭部署的密度也都會限制Re-ID算法準確度的提升。
同時,用戶對于投入產出比的顧慮也比較大。要在產品上應用、在項目中落地、只提高幾個百分點的準確度,而計算量和內存開銷、存儲開銷嚴重增加,客戶肯定不愿意買單。在準確度不完美的情況下,把技術應用到產品上,就要花很多功夫做應用創(chuàng)新,比如計算速度和內存開銷。
針對上述提到的數據采集和算法訓練的相關問題,目前業(yè)內部分企業(yè)已經相繼推出了一些技術突破手段:
阿里:通過局部信息的挖掘,專注于解決行人在識別過程中表觀姿態(tài)變化劇烈,不容易對齊的問題。一方面,通過人體得到具有強語義信息的部件,并利用在其中尋找最具有區(qū)分性的區(qū)域。另一方面,使用了基于金字塔的水平分塊策略,得到行人固定區(qū)域的可辨識信息。在訓練中,同時采用兩種策略相結合的方式,達到行人圖片的對齊,從而實現更精準的匹配識別。
中興通訊:創(chuàng)新性地提出多模塊多粒度聯合的特征提取網絡,有效的解決了因攝像機拍攝角度、色差、光照強度等引起的側臉、遮擋及缺失等復雜情況,顯著提升了網絡特征匹配性能。
澎思科技: 用全局特征來度量每一幀圖片的權重往往會損失掉許多重要的信息。采用分割重組策略將特定局部特征重組成多個視頻序列進行學習,進而極大減少局部特征損失對最終特征的影響;其次,提出了全新的雙向圖注意力機制模塊。將圖卷積神經網絡和SENet完美結合,在整個序列上進行通道域的模式選擇學習。同時通過雙向網絡進行空間域的注意力區(qū)域學習。由于圖卷積網絡的特性,每一幀圖片的注意力特征都是與其他幀相互學習結合的結果,從而極大提高特征的代表性;最終,利用幀間相似度進行序列融合,這樣,數據的類內相似度得到了極大的提高。在結合三元損失函數進行訓練后,類間相似度得到了降低,進而提高重識別效果。
大華股份:應用圖像數據增強方法,其主要包括隨機模糊和隨機截補等策略,能夠有效地模擬各種環(huán)境下的人體遮擋、模糊和不完整等復雜情況;其次,針對多分支部件網絡中特征粒度差異問題,采用一種遞進式部件網絡模型PPM(Progressive Part Model),各分支之間除了共享的基礎卷積網絡部分,還存在一種級聯的語義關系;最后,在設計的PPM網絡中,通過重疊采樣操作促進各部件分支提取更顯著的特征信息,應用改進的損失函數學習出基于球面約束的特征嵌入空間。
千視通:基于多年實戰(zhàn)經驗,提出一種卡視聯動技戰(zhàn)法,結合人臉識別和跨鏡追蹤(Re-ID)各自的特點及優(yōu)勢,以少量的人臉卡口加大量的普通監(jiān)控探頭的部署,既可鎖定嫌疑人身份,又能重現嫌疑人軌跡,這種創(chuàng)新的綜合型技戰(zhàn)法可以較大概率對監(jiān)控范圍進行覆蓋,具有極強的實戰(zhàn)價值。
奇點云:重點攻克行人重識別算法的兩項核心技術:基于分塊的隨機丟棄利用率較低的子空間特征增強attention機制,多種loss融合提高精確度,使得原先Re-ID93%的準確率得到提升。
騰訊優(yōu)圖:多任務框架的交替訓練、基于分塊的金字塔模型。通過這兩項核心技術的成功應用,騰訊優(yōu)圖在三個主流數據庫上都獲得了相對原始基線模型至少6.34%的指標提升。
云從科技:全局特征跟多粒度局部特征結合,既抓大一統(tǒng)特征,也抓細節(jié),如衣服LOGO 、背包掛飾等,增加檢索識別的特征元素,提升準確性。
可以說,Re-ID行人重識別技術將人工智能的認知水平從“識臉”提升到了“識人”的新階段,在跨空間、時間、地域的人物目標檢索應用場景之下,可以發(fā)揮比人臉識別更重要的作用。
比如,走失人員尋回、嫌犯追蹤等典型的AI尋人的應用。另一個比較典型的應用場景在于商超場所的客流熱力圖統(tǒng)計,通過實時動態(tài)跟蹤用戶軌跡(隱私保護前提之下)來助力商場完善店鋪陳列和購物體驗。而隨著相關技術的日趨成熟,相信未來Re-ID技術將改善更多場景下傳統(tǒng)的“找人"”尋物“模式,帶來作業(yè)效率的顯著提升。