更新時間:2020年04月23日14時10分 來源:傳智播客 瀏覽次數(shù):
隨著互聯(lián)網(wǎng)的高速發(fā)展,被收集并應(yīng)用于分析的數(shù)據(jù)量呈現(xiàn)出爆發(fā)式增長,面對如此量級的數(shù)據(jù),以及常見的實時利用該數(shù)據(jù)的需求,僅依靠人工處理難免力不從心,這就催生了所謂的大數(shù)據(jù)和機器學(xué)習(xí)系統(tǒng)。
機器學(xué)習(xí)是一門多領(lǐng)域的交叉學(xué)科,涉及概率論、統(tǒng)計學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門學(xué)科,專門研究計算機如何模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識或技能,重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能。通俗地講,傳統(tǒng)計算機工作時需要接收指令,并按照指令逐步執(zhí)行,最終得到計算結(jié)果;機器學(xué)習(xí)是通過某種算法,將歷史數(shù)據(jù)進(jìn)行訓(xùn)練得出某種模型,當(dāng)有新的數(shù)據(jù)提供時,可以使用訓(xùn)練產(chǎn)生的模型對未來進(jìn)行預(yù)測。機器學(xué)習(xí)是一種能夠賦予機器進(jìn)行自主學(xué)習(xí),不依靠人工進(jìn)行自主判斷的技術(shù),它和人類對歷史經(jīng)驗歸納的過程有著相似之處,接下來,通過圖1和圖2對機器學(xué)習(xí)和人類思考過程進(jìn)行對比。
圖1
圖2
圖1是機器學(xué)習(xí)的過程,圖2圖則是人類思考的過程。人類在學(xué)習(xí)成長的過程中,積累了很多歷史經(jīng)驗,將經(jīng)驗進(jìn)行歸納總結(jié),得到規(guī)律,因此當(dāng)人類遇到些問題時,總能從事物的發(fā)展規(guī)律找到方向,進(jìn)行推測;而機器學(xué)習(xí)中的訓(xùn)練和預(yù)測過程可以近似看作人類的歸納和推測的過程。從圖1中可以發(fā)現(xiàn),機器學(xué)習(xí)思想并不復(fù)雜,僅僅是對人類學(xué)習(xí)成長過程的一個模擬,由于機器學(xué)習(xí)不是通過編程的形式得出結(jié)果,因此它的處理過程不是因果的邏輯,而是通過歸納思想得出相關(guān)結(jié)論。這也可以聯(lián)想到人類為什么要學(xué)習(xí)歷史,歷史實際上是人類對過往經(jīng)驗的總結(jié),俗話說“歷史總是驚人的相似”,通過學(xué)習(xí)歷史,可以從中歸納出事物發(fā)展的規(guī)律,從而指導(dǎo)今后的工作。如根據(jù)數(shù)據(jù)類型和需求的不同,建模方式也會不同。在機器學(xué)習(xí)領(lǐng)域中,按照學(xué)習(xí)方式分類,可以讓研究人員在建模和算法選擇的時候,根據(jù)輸入數(shù)據(jù)來選擇合適的算法,從而得到更好的效果,通常機器學(xué)習(xí)可以分為下面兩類。
(1)有監(jiān)督學(xué)習(xí)。通過已有的訓(xùn)練樣本(即已知數(shù)據(jù)以及其對應(yīng)的輸出)訓(xùn)練得到一個最優(yōu)模型,再利用這個模型將所有的輸入映射為相應(yīng)的輸出,對輸出進(jìn)行簡單的判斷從而實現(xiàn)分類的目的。如分類、回歸和推薦算法都屬于有監(jiān)督學(xué)習(xí)。
(2)無監(jiān)督學(xué)習(xí)。針對類別未知(沒有被標(biāo)記)的訓(xùn)練樣本,需要直接對數(shù)據(jù)進(jìn)行建模,人們無法知道要預(yù)測的答案。如聚類、降維和文本處理的某些特征提取都屬于無監(jiān)督學(xué)習(xí)。
以上我們介紹了“機器學(xué)習(xí)的相關(guān)知識”,希望對您有所幫助,如果想了解更多機器學(xué)習(xí)相關(guān)知識可以關(guān)注傳智播客大數(shù)據(jù)課程。
猜你喜歡: