導讀:機器學習作為一個概念,與提高計算機使用算法和神經網絡模型學習的能力有關,并能更快更有效地執(zhí)行各種任務。機器學習或ML通過使用數據或數據集來幫助建立模型來做出決策。
機器學習的概念分析
機器學習作為一個概念,與提高計算機使用算法和神經網絡模型學習的能力有關,并能更快更有效地執(zhí)行各種任務。機器學習或ML通過使用數據或數據集來幫助建立模型來做出決策。它可用于精簡組織的決策和執(zhí)行績效。這個詞是1959年由美國人阿瑟·塞繆爾(ArthurSamuel)首創(chuàng)的,他精通人工智能和電腦游戲。
從概念上講,機器學習模擬了人類的腦細胞交互模式。在大腦活動中,當神經元相互交流時,這些神經元反過來使人類能夠輕松地執(zhí)行各種功能和任務,而不需要任何其他外部形式的支持。就像人類大腦中的神經元根據情況來解剖每個任務一樣,在ML中,數據按照各種算法來預測、分類和表示,解決一個復雜問題并提出解決方案。
機器學習中的神經網絡模型也是基于DonaldHebb博士在TheOrganizationofBehavior中的理論。在制定機器學習概念方面的一些顯著貢獻是基于1950年代IBM的ArthurSamuel的進化工作的逐步實施,他開發(fā)了一個計算機程序。該計算機程序涉及alpha-beta剪枝,用于測量跳棋游戲中每一方獲勝的機會。緊隨其后的是由FrankRosenblatt于1957年開發(fā)的定制機器感知器,專為圖像識別而構建,導致了MercelloPelillo于1967年開發(fā)的用于基本模式識別的最近鄰算法。
機器學習算法和模型
機器學習是基于算法和模型的校準功能。簡單地說,算法可以稱為利用結構化或非結構化數據產生輸出的簡單過程。同時,機器學習模型表示程序和程序(算法)的結合,即使用程序來達到預期的結果,完成預期的任務。
算法是一個公式,通過它可以做出預測;機器學習模型是實現算法后產生的輸出的更廣泛的方面。因此,在技術層面上,可以引用機器學習算法導致ML模型,而不是反之。為了理解ML算法的功能,讓我們先看看機器學習中的模型。
機器學習模型分為三大類:
監(jiān)督學習:在監(jiān)督學習中,在不確定的情況下,通過計算證據,從已知的數據集(輸入)和已知的數據響應(輸出)做出預測,以開發(fā)新的數據或數據集作為響應。監(jiān)督學習進一步使用分類和回歸等技術來提出其他機器學習模型。無監(jiān)督學習:無監(jiān)督學習包括從輸入數據中得出推論,而不從具有內在數據集或結構的隱藏模式中標記出響應。強化學習:在機器學習的強化學習模型中,基于試錯法,在復雜環(huán)境下做出一系列決策。根據所做決定的結果,獎勵和懲罰有助于最終引出回應。
現在為了詳細說明機器算法做了什么,讓我們以一個基于聚類的機器學習算法K-means為例。考慮了幾個聚類,以k為變量。識別每個簇的中心或質心,并在其基礎上定義一個數據點。在幾次迭代中,數據點和集群被重新識別,一旦定義了所有中心,數據點將與每個集群對齊,并與集群中心相接近。該算法在訓練數據上表現出色,有助于分類各種人工智能程序的音頻檢測和圖像分割等復雜任務。
使機器學習成為一個進步的領域,根據業(yè)務需求探索和發(fā)展的另一個方面是它對數據處理的需求。各種形式的訓練數據是機器學習的基礎。從檢測用于安全目的的對象到預測業(yè)務趨勢,高效和高性能的算法本質上是以數據為中心的;數據集越精確,算法產生的輸出就越準確。
機器學習中數據驅動的算法
在物理世界中,人類互動的大部分方面都是基于與各種無形數據的動態(tài)關系,人類的大腦每天都會執(zhí)行許多簡單的數據驅動計算。類似地,計算是基于機器學習中的數據或標記訓練數據,這有助于基于人工智能(AI)的程序工作來增加價值。與編寫程序代碼自動化處理過程或對大量數據進行深入調查相比,算法的使用要可靠得多,速度也快得多。
機器學習算法是一種數學方法,在提供的數據的幫助下產生一組結果。因此,在機器學習的過程中,數據的重要性是至關重要的。由ML驅動的人工智能程序的效率取決于輸入算法代碼的訓練數據的質量。不準確的數據集也會降低性能。
對于一個ML算法產生高價值的輸出,可用性的高質量的訓練數據集是必須的。訓練數據集是根據人工智能應用程序的目標開發(fā)的注釋或說明數據。
主要是兩種類型的數據推動了機器學習算法的工作。
1.手工數據標簽
2.自動數據標簽
3.人工智能輔助的數據標注
在自動、手動和人工輔助數據標注方面有一些關鍵的區(qū)別。在手動數據標簽,人群強制標簽的原始數據按照共享的指導方針或技術定義附加標簽。而在自動數據標注中,訓練數據由程序標注,并在加載執(zhí)行前檢查其準確性。而且,人工智能輔助的數據標記需要自動程序和人工努力來產生高質量的訓練數據。
基于數據的算法在現實世界中的應用
算法和技術適用于各行業(yè)和經濟部門。在數字技術和數據驅動的生態(tài)系統(tǒng)時代,復雜的需求面臨著高效數據創(chuàng)建和開發(fā)的挑戰(zhàn),在智慧城市、網絡安全、智能醫(yī)療、社交媒體和商業(yè)等領域,ML也在不斷實現數據結構化和可用數據處理,以更好地做出決策。提高績效,增強業(yè)務可持續(xù)性。
在衛(wèi)生部門,人工智能程序正在執(zhí)行由高度可用的訓練數據驅動的任務。這些數據使諸如二十億等健康應用程序通過檢測對象、動作、屬性、視聽輸入、語音輸入、神經網絡、語音輸出、身體控制等來幫助客戶跟蹤他們的健康訓練計劃的進度。,正在幫助支持AI的應用程序解碼復雜的任務,例如:
了解現場理解口語理解對象和動作通過聊天機器人生成口語控制助理的身體理解人類的姿勢將視覺概念與文字等聯(lián)系起來行為
在金融等領域,機器學習算法正在幫助企業(yè)發(fā)現未來的投資機會;同時,對于政府部門,ML算法通過簡單地處理來自多個來源的復雜數據,幫助處理欺詐、身份盜竊和提高公共工程的效率。此外,隨著數據量越來越大,機器學習(ML)正通過使用復雜的數據集來增加價值,幫助垂直企業(yè)應對未來的諸多挑戰(zhàn)。
尾注
理想情況下,機器學習被用于處理涉及大量數據的復雜計算任務,而沒有靜態(tài)公式來得出結果。多年來,隨著機器學習領域的不斷研究和發(fā)展,醫(yī)療、能源生產、汽車、航空航天、制造業(yè)和金融等商業(yè)部門都從機器學習模式中獲益。機器學習模型和算法正在幫助解決特定行業(yè)的問題,并通過對象檢測、信用評分、交易預測、DNA測序和預測性維護提供未來的全行業(yè)解決方案。
在未來幾年,隨著數據的持續(xù)增長和對可變數據的需求進一步攀升,我們可以希望看到許多其他任務使用由機器學習算法支持的人工智能程序來執(zhí)行,這些程序的模型有助于閱讀和處理數據,并為全球企業(yè)部門提供均衡的可持續(xù)性。