機器學習與深度學習中,我們介紹了人工智慧的機器學習與深度學習。而在其實際的應用案例中,影像辨識就是深度學習其中的一個應用範例。不過深度學習是如何結合資訊科學、數學與腦神經科學的技術,從大量的資料中依循規則,找出最佳解答的呢?影像辨識又是如何運算?麗臺科技將在此篇為大家簡單解說。

 

在探討影像辨識原理前,大家有沒有想過大腦是如何辨識圖像、影像的呢?其實深度學習的影像辨識原理就是人工神經網絡,說穿了就是模仿人類的腦神經科學,效法神經元的多層次學習網絡。只要了解了人類的腦神經是如何運作進行影像辨識,就能夠比較好理解深度學習的影像辨識原理。


人類的腦神經是由許多神經元所組成,雖然每個神經元都只能接收簡單的訊號,但神經元會將其接收到的訊號傳遞給其他神經元,而後其他神經元接連被傳遞的訊號觸發,再結合訊號轉發給其他神經元,形成一個龐大、可處理複雜訊號的訊息處理網路;也因此,人類的視神經具有強大的圖像辨識能力。

影像辨識的原理就在於模仿人類視神經,先透過對邊界的認識強化,再逐步組合出圖像識別的運作方式。套用在深度學習的影像辨識作法就會變成先將圖片分解成許多小像素,做為第一層的輸入資料,接著再經過多層次的演算法處理,從個別像素擷取特徵、組合特徵,再到最後的輸出層結果來完成影像辨識。

 



深度學習是需要大量資料來訓練演算法模型的,以影像辨識為例,通常會需要數百萬張圖片資料來訓練模型,才能找出演算法最合適的權重參數,達到最佳的準確率。當神經網路收到越多數據後,重新調整後就能產生更精確的預測。拜2000年後網路風行以及2012年後GPU的輔助所賜,影像辨識的應用和準確度有了突飛猛進的突破。


舉幾個常見的影像辨識應用案例吧!臉書上的相片自動標籤功能、Google相簿內的人臉辨識、手寫文字辨識等,現在更有其他公司研究將深度學習的影像辨識應用在車內影像辨識裝置內,藉由監測駕駛的臉部表情,推算其脈搏與呼吸頻率,再依據結果判斷駕駛的健康或精神狀態,防止車禍事件產生。

除此之外,深度學習的影像辨識還可透過深度神經網路演算,彙整識別各種屬性,增加辨識個人更多的特徵,例如性別、年齡層、髮型、服裝、裝飾等,讓系統能在各種不同情況下找出特定人物,而不光只是透過臉部的影像辨識;如此一來,就有機會作為警備或防盜系統的追蹤利用。

> 更多麗臺高效能運算(HPC)工作站繪圖卡

 
 
 

麗臺科技(LEADTEK Research Inc.)成立於1986年,秉持誠信篤實的精神,堅持以「研究創新、品質至上」的信念提供消費者最完善的服務品質。麗臺科技是全球知名的繪圖卡研發製造專業廠商,長期致力於全方位多媒體通訊解決方案,主要產品線包括桌面虛擬化Zero Client與Thin Client、電腦遊戲及工作站繪圖卡、多媒體電話、全球衛星導航系統、數位監控系統及雲端超級運算工作站等多項領域,現在更跨足軟體產業。期望以多元化的創新技術與優異的品質服務全球市場。

麗臺科技股票代號 2465
麗臺科技全球資訊網

媒體連絡人
黃韻潔 Linda_Huang / +886 2 8226-5800 # 887/linda_huang@leadtek.com.tw