導讀:麻省理工學院的一組研究人員利用人工智能來緩解交通擁堵,他們將這一領域的想法應用于解決倉庫中多個機器人的問題。通過將難以解決的問題分解成更小的塊,一種深度學習技術(shù)確定了倉庫中疏導流量的最佳區(qū)域。
麻省理工學院的一組研究人員利用人工智能來緩解交通擁堵,他們將這一領域的想法應用于解決倉庫中多個機器人的問題。通過將難以解決的問題分解成更小的塊,一種深度學習技術(shù)確定了倉庫中疏導流量的最佳區(qū)域。
在一個巨大的機器人倉庫里,數(shù)百個機器人在地面上來回穿梭,抓取物品并交付給人類工人進行包裝和運輸。這種倉庫正日益成為從電子商務到汽車生產(chǎn)等許多行業(yè)供應鏈的一部分。
然而,要讓 800 個機器人高效地往返于目的地,同時又要防止它們相互碰撞,并非易事。這個問題非常復雜,即使是最好的路徑搜索算法,也很難跟上電子商務或制造業(yè)的飛速發(fā)展。
人工智能驅(qū)動的高效解決方案
從某種意義上說,這些機器人就像試圖在擁擠的市中心穿梭的汽車。因此,一群利用人工智能緩解交通擁堵的麻省理工學院研究人員運用了這一領域的理念來解決這一問題。
他們建立了一個深度學習模型,對倉庫的重要信息(包括機器人、計劃路徑、任務和障礙物)進行編碼,并利用這些信息預測倉庫的最佳疏導區(qū)域,以提高整體效率。
他們的技術(shù)將倉庫中的機器人分成若干組,因此這些較小的機器人組可以用協(xié)調(diào)機器人的傳統(tǒng)算法更快地消除擁堵。最終,與強隨機搜索法相比,他們的方法疏導機器人的速度快了近四倍。
除了簡化倉庫作業(yè),這種深度學習方法還可用于其他復雜的規(guī)劃任務,如計算機芯片設計或大型建筑的管道布線。
尖端的神經(jīng)網(wǎng)絡架構(gòu)
"我們設計了一種新的神經(jīng)網(wǎng)絡架構(gòu),它實際上適用于這些倉庫這種規(guī)模和復雜程度的實時操作。它可以對數(shù)百個機器人的軌跡、出發(fā)地、目的地以及與其他機器人的關(guān)系進行編碼,而且能以一種高效的方式在各組機器人之間重復使用計算,"土木與環(huán)境工程(CEE)專業(yè)吉爾伯特-W-溫斯洛職業(yè)發(fā)展助理教授、信息與決策系統(tǒng)實驗室(LIDS)和數(shù)據(jù)、系統(tǒng)與社會研究所(IDSS)成員凱茜-吳(Cathy Wu)說。
該技術(shù)論文的資深作者 Wu 和第一作者、電子工程和計算機科學專業(yè)研究生 Zhongxia Yan 共同完成了這項研究。這項研究成果將在學習表征國際會議(International Conference on Learning Representations)上發(fā)表。
機器人俄羅斯方塊
從鳥瞰圖上看,機器人電子商務倉庫的地面有點像快節(jié)奏的"俄羅斯方塊"游戲。
當客戶下訂單時,機器人會前往倉庫的某一區(qū)域,抓起放置所需物品的貨架,然后將其交給人類操作員,由其揀選和包裝物品。數(shù)百個機器人同時進行這項工作,如果兩個機器人在穿過巨大的倉庫時發(fā)生路徑?jīng)_突,就可能會撞車。
傳統(tǒng)的搜索算法可以避免潛在的碰撞,方法是保持一個機器人的運行軌跡,并為另一個機器人重新規(guī)劃軌跡。但由于機器人數(shù)量眾多,可能發(fā)生碰撞,問題很快就會呈指數(shù)級增長。
"由于倉庫是在線運行的,機器人大約每 100 毫秒重新掃描一次。也就是說,每秒鐘,機器人要重新掃描 10 次。因此,這些操作必須非??焖?,"Wu 說。
由于在重新規(guī)劃過程中時間非常關(guān)鍵,麻省理工學院的研究人員利用機器學習將重新規(guī)劃的重點放在最有可能減少機器人總行駛時間的擁堵區(qū)域。
Wu 和 Yan 建立的神經(jīng)網(wǎng)絡架構(gòu)可同時考慮較小的機器人群組。例如,在一個擁有 800 個機器人的倉庫中,網(wǎng)絡可能會將倉庫地面切割成更小的組,每組包含 40 個機器人。
然后,如果使用基于搜索的求解器來協(xié)調(diào)該組機器人的軌跡,它就會預測出哪一組最有可能改進整體解決方案。整個算法是一個迭代過程,先用神經(jīng)網(wǎng)絡選出最有希望的機器人組,再用基于搜索的求解器解散機器人組,然后用神經(jīng)網(wǎng)絡選出下一個最有希望的機器人組,依此類推。
簡化復雜系統(tǒng)
神經(jīng)網(wǎng)絡能有效地推理機器人群,因為它能捕捉到單個機器人之間存在的復雜關(guān)系。例如,即使一個機器人一開始離另一個機器人很遠,它們在行進過程中的路徑仍有可能交叉。
該技術(shù)還能簡化計算,只需對約束條件進行一次編碼,而無需對每個子問題重復編碼。例如,在一個擁有 800 個機器人的倉庫中,要消除一組 40 個機器人的擁堵,需要將其他 760 個機器人作為約束條件。其他方法則需要在每次迭代中對每組所有 800 個機器人推理一次。相反,研究人員的方法只需要在每次迭代中對所有小組的 800 個機器人進行一次推理。
她補充說:"倉庫是一個大的環(huán)境,因此這些機器人群組中的很多都會在更大的問題上有一些共同點。我們設計的架構(gòu)就是為了利用這些共同的信息。"
研究人員在幾個模擬環(huán)境中測試了他們的技術(shù),包括一些像倉庫一樣的環(huán)境,一些帶有隨機障礙物的環(huán)境,甚至還有模擬建筑物內(nèi)部的迷宮設置。通過識別出更有效的疏導群組,他們基于學習的方法疏導倉庫的速度比強大的、非基于學習的方法快四倍。即使考慮到運行神經(jīng)網(wǎng)絡的額外計算開銷,他們的方法解決問題的速度仍然快 3.5 倍。
未來方向與同行認可
未來,研究人員希望從他們的神經(jīng)模型中獲得簡單、基于規(guī)則的見解,因為神經(jīng)網(wǎng)絡的決策可能不透明,難以解讀。更簡單、基于規(guī)則的方法也更容易在實際機器人倉庫環(huán)境中實施和維護。
"這種方法基于一種新穎的架構(gòu),在這種架構(gòu)中,卷積和注意力機制能夠有效地相互作用。令人印象深刻的是,它能夠考慮到所構(gòu)建路徑的時空成分,而無需針對具體問題進行特征工程。結(jié)果非常出色。"康奈爾理工學院安德魯-H.和安-R.-蒂施教授 Andrea Lodi 說:"我們不僅能在求解質(zhì)量和速度方面改進最先進的大型鄰域搜索方法,而且該模型還能很好地推廣到未見過的案例中。"cnBeta