深度學習大潮中的工業(yè)視覺檢測
深圳市聯(lián)優(yōu)視覺技術有限公司
在2010年以前,機器視覺技術廣泛應用于工業(yè)檢測中。通常,算法工程師從自己對當前問題的理解和知識,對問題進行模型近似,然后結合自己的理論和技術進行問題求解。每個解決方案的性能與工程師的能力息息相關,很容易就可以看到解決方案的上限。而且,由于當時圖像算法技術和理論所限,解決方案中通常會有很大一部分努力是在于如何通過光照(要求視覺光源)、相機和鏡頭選型(要求工業(yè)相機和工業(yè)鏡頭的性能)來優(yōu)化成像方案的方式來簡化問題,縮小問題邊界,來降低算法適用性過小的不利影響。
進入2010年后,深度學習理論席卷學術圈,也對機器視覺理論和技術帶來了深遠的影響。很多機器視覺的領頭企業(yè)也在這個方面進行發(fā)力,例如Cognex。深度學習的主要影響體現(xiàn)在以下方面:1.數(shù)據(jù)與模型的關系發(fā)生質的變化。傳統(tǒng)理論和技術中,模型為主,數(shù)據(jù)為輔,模型在設計時通常都假定能夠適用大多數(shù)情況,例外發(fā)生時,收集數(shù)據(jù),再由工程師進行模型修正;基于深度學習的理論和技術,數(shù)據(jù)為主,模型隱藏于數(shù)據(jù)當中,或者說由數(shù)據(jù)訓練而來。2.技術適用性大大增強。在數(shù)據(jù)足夠的情況下,基于深度學習的技術或者解決方案,具備很強的魯棒性,其所能帶來的性能大大超出算法工程師的能力邊界。因此,對于光照、成像環(huán)節(jié)的要求大大降低。3.系統(tǒng)行為的可預測性大大降低,由于訓練數(shù)據(jù)的龐大與前向網(wǎng)絡的高度非線性,想要對該系統(tǒng)進行較詳盡的分析已經(jīng)沒有可能。因此,使用中出現(xiàn)的問題,很難分析其根由,不像傳統(tǒng)技術,review代碼即可知道在模型在哪一方面有不足或者是因為什么代碼BUG引起的。
但是,需要指出的是,基于深度學習理論和技術也是有其邊界,也有其不擅長的領域。深度學習理論和技術比較適合用來解決判斷邏輯,譬如“檢測當前圖像是否有缺陷?”,“更像何種類型的缺陷?”等檢測與分類問題。但是對于測量等應用,則會不太適用。其根由在于,作為對標人類智能的理論和技術,在大多數(shù)應用領域中,深度學習理論技術還是以模仿或者逼近人類智能為其目標。而人類智能對識別擅長,但是對于測量等問題并不擅長,因此以學習人類為目標的深度學習理論和技術也依然受此限制。同時,深度學習理論和技術的出現(xiàn),并不意味著傳統(tǒng)打光、成像技術就沒有用武之地。而且,在比較大型的應用中(例如人臉識別),也經(jīng)常能看到同時集成了傳統(tǒng)算法技術和深度學習理論技術的解決方案。一個設計合理的方案與系統(tǒng),會大大簡化我們待解決問題的維度與復雜度,從而大大縮短我們訓練網(wǎng)絡的數(shù)據(jù)量和時間,也同時大大降低網(wǎng)絡的復雜度(網(wǎng)絡規(guī)模和參數(shù)量),從而會大大降低我們解決方案所需的計算資源要求,這對于IOT等場合無疑是我們優(yōu)先考慮的選項。
總之,深度學習理論和技術給機器視覺領域帶來沖擊,并產生了深遠的影響,這種技術與傳統(tǒng)技術之間的融合將會大大推進機器視覺領域的發(fā)展。
相關推薦