【導(dǎo)讀】機(jī)器視覺(MV)是一種使機(jī)器人和自動駕駛汽車等其他機(jī)器能夠看到和識別周圍環(huán)境中物體的技術(shù)。在過去幾年里,機(jī)器視覺的進(jìn)步使得許多機(jī)器人和自動駕駛汽車擁有了幾乎與人類相似的感知水平。這個(gè)過程主要是通過將光學(xué)傳感器與人工智能和可以分析和處理圖像數(shù)據(jù)的機(jī)器學(xué)習(xí)工具進(jìn)行配對,此時(shí)搭載了機(jī)器視覺系統(tǒng)的機(jī)器人和自動駕駛汽車就能夠執(zhí)行非常復(fù)雜的任務(wù)了。
眼睛和大腦:
機(jī)器視覺和計(jì)算機(jī)視覺的主要區(qū)別
很多時(shí)候,機(jī)器視覺會與計(jì)算機(jī)視覺一詞混為一談。然而,事實(shí)上二者還是有區(qū)別的。對機(jī)器視覺而言,它通常與具備計(jì)算機(jī)視覺能力的工業(yè)應(yīng)用聯(lián)系在一起,需要攝像頭來捕捉和提供圖像數(shù)據(jù)。計(jì)算機(jī)視覺的任務(wù)則是將已有的圖像數(shù)字化,處理其中包含的數(shù)據(jù)并采取某種行動。
一般來講,機(jī)器視覺系統(tǒng)的處理能力相對較小,主要用于精益制造環(huán)境,通過高速執(zhí)行實(shí)際任務(wù)以獲取完成指定作業(yè)所需的數(shù)據(jù)。計(jì)算機(jī)視覺系統(tǒng)是處理視覺數(shù)據(jù)的人工智能(AI)和機(jī)器學(xué)習(xí)(ML)算法的所在,它需要收集盡可能多的關(guān)于物體或場景的數(shù)據(jù)并充分理解它們。因此,計(jì)算機(jī)視覺既要能夠分析來自運(yùn)動檢測器、紅外傳感器等來源的圖像,又可以在沒有相機(jī)的情況下執(zhí)行任務(wù),掃描數(shù)字網(wǎng)絡(luò)照片或視頻,處理來自任何來源(包括互聯(lián)網(wǎng))的圖像。從本質(zhì)上講,機(jī)器視覺就是系統(tǒng)的眼睛,而計(jì)算機(jī)視覺則相當(dāng)于系統(tǒng)的大腦。
相機(jī):
機(jī)器視覺系統(tǒng)中的重要組件
機(jī)器視覺是一項(xiàng)看似簡單但實(shí)際上相當(dāng)復(fù)雜的技術(shù)。首先,它需要使用專門的光學(xué)器件來捕捉周圍環(huán)境中的視覺信息。然后,再借助硬件和軟件的組合對圖像的某些特征進(jìn)行處理、分析和測量。例如,作為制造系統(tǒng)的一部分的機(jī)器視覺應(yīng)用程序可以用于分析在裝配線上制造的零件的特定特性,確定零件是否符合質(zhì)量標(biāo)準(zhǔn)。
在實(shí)際應(yīng)用中,機(jī)器視覺常常被看作是計(jì)算機(jī)的一種視覺能力,其系統(tǒng)由一個(gè)或多個(gè)光學(xué)傳感器(如高分辨率相機(jī))、模數(shù)轉(zhuǎn)換(ADC)和數(shù)字信號處理(DSP)等器件組成。相機(jī)和傳感器用于收集感光形式的圖像,并將其轉(zhuǎn)化為電信號,所產(chǎn)生的電信號經(jīng)數(shù)字化處理后被傳輸?shù)接?jì)算機(jī)進(jìn)行分析并提供所需的輸出。在技術(shù)復(fù)雜性上,機(jī)器視覺與語音識別相似。
目前,用于制造業(yè)的機(jī)器視覺主要采用兩種類型的相機(jī),即:面陣掃描相機(jī)和線陣掃描相機(jī)。
面陣掃描相機(jī)使用矩形傳感器在單個(gè)幀中拍攝照片,傳感器中的像素?cái)?shù)量對應(yīng)于圖像的寬度和高度。線陣掃描相機(jī)是逐個(gè)像素地構(gòu)建圖像,它們適用于拍攝運(yùn)動中或尺寸不規(guī)則的物品的圖像。在拍攝照片時(shí),傳感器在物體上以線性運(yùn)動通過,因此,線陣掃描相機(jī)不像面陣掃描相機(jī)那樣局限于特定的分辨率。
相機(jī)的靈敏度和分辨率是機(jī)器視覺系統(tǒng)的兩個(gè)重要參數(shù),其中,分辨率負(fù)責(zé)區(qū)分物體,而靈敏度是機(jī)器在光線昏暗或波長不可見的情況下檢測物體或微弱脈沖的能力。一般來說,分辨率越大,視野就越有限。靈敏度和分辨率是相互依存的,如果其他因素不變,增加靈敏度就會降低分辨率,而增加分辨率則會降低靈敏度。面陣相機(jī)的分辨率和掃描頻率一般均低于線陣相機(jī)。
許多機(jī)器視覺相機(jī)的分辨率超過4,500萬像素,這些相機(jī)能以極高的速度拍攝物體而不會失真。推動機(jī)器視覺功能的另一個(gè)進(jìn)步是基于事件的視覺傳感器。這些傳感器處理圖像的方式與人眼的視神經(jīng)處理信息的方式類似。更具體地說,這些基于事件的視覺傳感器檢測每個(gè)像素的亮度變化。這種能力使機(jī)器視覺能夠在比傳統(tǒng)的基于幀的視覺傳感器暗得多的環(huán)境中使用。
Sony Spresense的ISX012是一款有效像素達(dá)到511萬像素的圖像傳感器,相機(jī)板在Spreseense的主板上使用了這款結(jié)構(gòu)緊湊、高分辨率的傳感器來擴(kuò)展主板的功能。板載編碼器可以采集JPEG、RAW、Y/C或RGB格式的圖片。相機(jī)板通過專用的并行接口直接連接到主板,當(dāng)與主板上CXD5602微控制器的AI功能相結(jié)合時(shí),可為物聯(lián)網(wǎng)設(shè)備提供先進(jìn)的視覺功能。
圖1:可提供先進(jìn)的視覺功能的
Sony Spresense相機(jī)板(圖源:Mouser)
當(dāng)然,出于應(yīng)用成本的考慮,機(jī)器視覺系統(tǒng)不是越復(fù)雜越好,而應(yīng)選擇適合的。一維(1D)視覺、二維(2D)視覺以及三維(3D)視覺這三種類型是常用的、面向不同任務(wù)的機(jī)器視覺系統(tǒng)。
01 1D視覺
1D視覺不會一次性完成整個(gè)物體圖像的分析,而是一次讀取一行,通常采用線陣掃描相機(jī),這種類型的機(jī)器視覺常常用在制造過程中的產(chǎn)品檢測,比如用來發(fā)現(xiàn)傳送帶上產(chǎn)品中的缺陷;
02 2D視覺
2D視覺主要使用數(shù)碼相機(jī)收集圖像數(shù)據(jù),通過比較一幅圖像與下一幅圖像的變化來確定下一步應(yīng)采取的處理措施,這種類型的機(jī)器視覺通常用于物體跟蹤以及產(chǎn)品的類型驗(yàn)證等;
03 3D視覺
3D視覺通常在不同位置使用多個(gè)數(shù)碼相機(jī)和其他傳感器來捕捉物體的數(shù)字模型或圖像,從而對其位置、大小和特征進(jìn)行準(zhǔn)確的評估,因此,3D機(jī)器視覺非常適合幫助機(jī)器人導(dǎo)航周圍環(huán)境并執(zhí)行與訂單相關(guān)的任務(wù)。
隨著不同垂直行業(yè)對質(zhì)量檢測和自動化的需求不斷增加,3D機(jī)器視覺市場將以高于行業(yè)平均水平的速度實(shí)現(xiàn)快速增長。Grand View Research的分析數(shù)據(jù)表明,2022年,全球3D機(jī)器視覺市場規(guī)模為58.1億美元,預(yù)計(jì)2023年至2030年的復(fù)合年增長率(CAGR)將達(dá)到13.5%。
ams OSRAM公司的Mira220全局快門圖像傳感器是一款體積小巧、專為工業(yè)機(jī)器視覺應(yīng)用而設(shè)計(jì)的2D和3D解決方案,有效分辨率為1,600(H)x 1,400(V),幀速率可高達(dá)90fps,深度為12位。Mira220采用的先進(jìn)背面照明(BSI)技術(shù)將傳感器層堆疊在數(shù)字/讀出層的頂部,這種設(shè)計(jì)產(chǎn)生了占位面積僅為5.3毫米×5.3毫米的芯片級封裝,特別適合空間受限產(chǎn)品的設(shè)計(jì)。
Mira220的功耗非常低,在睡眠模式下僅需4mW,在空閑模式下功耗40mW,而在90fps的全分辨率下也僅僅需要350mW。此外,Mira220傳感器還可以利用MIPI CSI-2接口方便地與處理器和FPGA進(jìn)行交互。
圖2:專為工業(yè)機(jī)器視覺應(yīng)用而設(shè)計(jì)的ams OSRAM的Mira220全局快門圖像傳感器(圖源:ams OSRAM)
工業(yè):
機(jī)器視覺應(yīng)用的主戰(zhàn)場
機(jī)器人之所以能與人類做同樣的工作,主要?dú)w功于機(jī)器視覺。機(jī)器人手臂用它來檢查從裝配線上下來的零件和產(chǎn)品,確定哪些符合質(zhì)量標(biāo)準(zhǔn)。此外,機(jī)器視覺還使機(jī)器人和人類之間的協(xié)作更加高效和安全?,F(xiàn)在,機(jī)器視覺已經(jīng)成為工業(yè)4.0過程自動化的關(guān)鍵技術(shù),其中汽車、制藥、包裝、食品和飲料等垂直行業(yè)是使用機(jī)器人系統(tǒng)比較突出的領(lǐng)域。
據(jù)Grand View Research的分析,2022年,全球機(jī)器視覺市場規(guī)模為168.9億美元,預(yù)計(jì)2023年至2030年將以12.3%的復(fù)合年增長率(CAGR)增長,到2030年,市場規(guī)模將達(dá)到416億美元。按照產(chǎn)品劃分,機(jī)器視覺產(chǎn)品可細(xì)分為基于PC的和基于智能攝像頭的系統(tǒng)。2022年,基于PC的細(xì)分市場在全球的市場份額超過54.92%,接下來的幾年里預(yù)計(jì)這一趨勢仍將得到延續(xù)。
與機(jī)構(gòu)或教育應(yīng)用中使用的機(jī)器視覺系統(tǒng)相比,工業(yè)機(jī)器視覺系統(tǒng)通常更耐用,并要求較高的可靠性、穩(wěn)定性和準(zhǔn)確性,而它們的成本則比在軍事、航空航天、國防和政府應(yīng)用中使用的系統(tǒng)要低很多。這也是近些年機(jī)器視覺在工業(yè)領(lǐng)域日益普及的重要原因。
在工業(yè)應(yīng)用中,機(jī)器視覺常常被用于執(zhí)行各種任務(wù),下面我們就列舉一些:
01 電子元件的識別和分析。對元器件的準(zhǔn)確識別及跟蹤是整個(gè)制造或物流過程控制的重要環(huán)節(jié)。例如,將機(jī)器視覺用于電路板的焊接過程監(jiān)控,除了完成焊接質(zhì)量檢查,還能同步檢查元器件的放置是否正確。
02 印刷缺陷識別。印刷缺陷識別的目的是定位印刷異常,如不正確的色調(diào)或印刷品的缺失或有缺陷的部分,機(jī)器視覺的應(yīng)用大幅降低了人為因素可能出現(xiàn)的錯(cuò)誤。
03 材料檢查。材料檢測系統(tǒng)中的機(jī)器視覺功能確保了產(chǎn)品的質(zhì)量控制,它能準(zhǔn)確識別產(chǎn)品中的缺陷甚至污染物。例如,可將機(jī)器視覺系統(tǒng)用于藥丸和片劑的過程監(jiān)控。
04 物體定位。在機(jī)器人制導(dǎo)等應(yīng)用中,機(jī)器視覺通常被用來尋找東西,其目的是確定目標(biāo)物體的坐標(biāo)和位置。這也是機(jī)器視覺普遍的應(yīng)用之一。
05 模式識別。機(jī)器視覺在當(dāng)今的醫(yī)學(xué)診斷方面發(fā)揮了重要作用。醫(yī)學(xué)成像分析使用基于機(jī)器視覺的模式識別、磁共振成像、血液掃描和大腦掃描等技術(shù)可對疾病進(jìn)行準(zhǔn)確的診斷。
06 物體識別。在汽車行業(yè),自動駕駛汽車使用機(jī)器視覺系統(tǒng)中的攝像頭拍攝的圖像進(jìn)行物體識別,得以準(zhǔn)確地分析出道路上的障礙物類型。隨著自動駕駛技術(shù)的不斷演進(jìn),這一領(lǐng)域?qū)⒊蔀闄C(jī)器視覺極具發(fā)展前景的應(yīng)用之一。
人工智能:
工業(yè)機(jī)器視覺技術(shù)發(fā)展的加速器
現(xiàn)代機(jī)器視覺系統(tǒng)開始越來越多地使用人工智能(AI)方法與技術(shù),如機(jī)器學(xué)習(xí)或深度學(xué)習(xí),以及人工神經(jīng)網(wǎng)絡(luò)。AI能夠處理大量以前難以收集的圖像和數(shù)據(jù)信息,加快了決策過程。例如,簽名和字符識別,有了人工智能的加持,機(jī)器視覺系統(tǒng)可以快速甄別其中的細(xì)微差別。
在制造業(yè)中,AI有助于物體識別和材料檢查,使機(jī)器視覺系統(tǒng)能夠理解物體或材料形狀和紋理的變化。在質(zhì)量保證方面,AI系統(tǒng)可以分析出現(xiàn)的異?,F(xiàn)象,而不是單純地檢出和拒絕不符合規(guī)范的產(chǎn)品。機(jī)器視覺與AI和深度學(xué)習(xí)相結(jié)合,擴(kuò)大了機(jī)器人在執(zhí)行生產(chǎn)線任務(wù)中的作用,如挑選、分揀、放置和執(zhí)行生產(chǎn)線掃描。這種技術(shù)組合還使機(jī)器人能夠在其他環(huán)境中運(yùn)行,如超市、醫(yī)院和餐館等?;贏I的機(jī)器視覺還可以在更廣泛的背景和照明設(shè)置中識別缺陷,并靈活應(yīng)對產(chǎn)品外觀和缺陷類型的變化,例如凹痕或變色。
深度學(xué)習(xí)是人工智能中一個(gè)更復(fù)雜、更強(qiáng)大的子集,在機(jī)器視覺應(yīng)用中也越來越多地被采用。在人工智能的支持下,機(jī)器視覺系統(tǒng)常常被用來執(zhí)行復(fù)雜的任務(wù),比如質(zhì)量控制、裝配控制、過程控制和機(jī)器人操控等。在過去幾年里,將人工智能融入機(jī)器視覺應(yīng)用是工業(yè)機(jī)器視覺技術(shù)發(fā)展的主要加速器。在“未來的工廠”中,機(jī)器視覺和AI技術(shù)將是過程自動化和提高效率的關(guān)鍵組成部分。
機(jī)器視覺與AI的技術(shù)進(jìn)步離不開芯片組的支持。新一代嵌入式芯片的功能更強(qiáng)大,成本合理,適用于處理圖像和運(yùn)行基于AI的機(jī)器視覺算法,可將深度學(xué)習(xí)訓(xùn)練時(shí)間從數(shù)周減少到數(shù)小時(shí)。
NXP的i.MX 95系列應(yīng)用處理器將eIQ Neutron神經(jīng)處理單元(NPU)、Arm Mali沉浸式3D圖形處理、異構(gòu)安全分區(qū)和網(wǎng)絡(luò)功能組合在一起,可實(shí)現(xiàn)機(jī)器學(xué)習(xí)和先進(jìn)的邊緣應(yīng)用。此外,i.MX95還集成了NXP的圖像信號處理器(ISP),支持多種不同的圖像傳感器,從而實(shí)現(xiàn)工業(yè)、機(jī)器人、醫(yī)療和汽車等領(lǐng)域廣泛的視覺應(yīng)用。為此,NXP專門針對機(jī)器視覺應(yīng)用對這個(gè)ISP進(jìn)行了優(yōu)化,能支持兩個(gè)目標(biāo)區(qū)域、兩個(gè)曝光的HDR合成、先進(jìn)降噪和邊緣增強(qiáng),支持彩色、單色和RGB-IR攝像頭傳感器。
在i.MX95 SoC中,主要通過集成的eIQ Neutron NPU實(shí)現(xiàn)機(jī)器視覺,在這里,NPU作為視覺處理通路的一部分,連通多個(gè)攝像頭傳感器和網(wǎng)絡(luò)連接的智能攝像頭。
圖3:NXP i.MX95系統(tǒng)框圖
(圖源:NXP)
本文小結(jié)
工業(yè)機(jī)器視覺是使用相機(jī)、鏡頭和照明設(shè)備對制成品進(jìn)行自動視覺檢查。這是一種實(shí)時(shí)檢測部件的方法,既快速又準(zhǔn)確,它可以對高速生產(chǎn)線上的每一件產(chǎn)品進(jìn)行拍攝和分析,通過復(fù)雜的算法來檢查和評估在工業(yè)環(huán)境中獲取的圖像,確保100%的質(zhì)量控制。它還可以自動化許多工業(yè)檢查,包括缺陷和問題的目視檢查、產(chǎn)品存在與否檢查、產(chǎn)品類型驗(yàn)證、測量和產(chǎn)品代碼讀取等。今天,工業(yè)自動化正在以驚人的速度發(fā)展,機(jī)器視覺技術(shù)在其發(fā)展和擴(kuò)張中發(fā)揮著至關(guān)重要的作用。
在剛剛過去幾年里,融入了人工智能的機(jī)器視覺技術(shù)幫助許多機(jī)器人和自動駕駛汽車實(shí)現(xiàn)了幾乎與人類相似的感知水平。通過使用大量先進(jìn)的光學(xué)傳感器,如高分辨率相機(jī),這些機(jī)器人和汽車最終能夠以自己的方式擁有“看”的能力。多種技術(shù)的融合和飛速發(fā)展使得新應(yīng)用的潛力顯著增加,這意味著未來的機(jī)器視覺技術(shù)將與更多的行業(yè)相關(guān),所創(chuàng)建的解決方案也將更加通用和智能。
免責(zé)聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請聯(lián)系小編進(jìn)行處理。
推薦閱讀: