機(jī)器視覺(jué)是指利用相機(jī)、攝像機(jī)等傳感器,配合機(jī)器視覺(jué)算法賦予智能設(shè)備人眼的功能,從而進(jìn)行物體的識(shí)別、檢測(cè)、測(cè)量等功能。按照應(yīng)用的領(lǐng)域與細(xì)分技術(shù)的特點(diǎn),機(jī)器視覺(jué)進(jìn)一步可以分為工業(yè)視覺(jué)、計(jì)算機(jī)視覺(jué)兩類,相應(yīng)地,其應(yīng)用領(lǐng)域可以劃分為智能制造和智能生活兩類。
在功能目標(biāo)上,工業(yè)視覺(jué)主要解決以往需要人眼進(jìn)行的工件的定位、測(cè)量、檢測(cè)等重復(fù)性勞動(dòng);計(jì)算機(jī)視覺(jué)的主要任務(wù)是賦予智能機(jī)器人視覺(jué),利用測(cè)距、物體標(biāo)定與識(shí)別等功能實(shí)現(xiàn)對(duì)于外界位置信息、圖像信息等的識(shí)別與判斷。
在硬件需求上,工業(yè)視覺(jué)相對(duì)較高,需要對(duì)工業(yè)相機(jī)的幀頻、分辨率等指標(biāo)依據(jù)自身的需求進(jìn)行篩選;而計(jì)算機(jī)視覺(jué)則除少部分特殊情況外,大部分對(duì)于相機(jī)或攝像頭的要求并不高。
在算法側(cè)重上,工業(yè)視覺(jué)的算法往往側(cè)重于精確度的提高;而計(jì)算機(jī)視覺(jué)的算法難度相對(duì)較高,側(cè)重于或采用數(shù)學(xué)邏輯或采用深度學(xué)習(xí)方法進(jìn)行物體的標(biāo)定與識(shí)別。
在產(chǎn)業(yè)成熟度上,工業(yè)視覺(jué)已經(jīng)相對(duì)較為成熟,在半導(dǎo)體、包裝等行業(yè)的測(cè)量檢測(cè)已有較為廣泛的應(yīng)用;而計(jì)算機(jī)視覺(jué)整體來(lái)講還是一個(gè)剛起步的狀態(tài),初創(chuàng)企業(yè)層出不窮。
事實(shí)上,機(jī)器視覺(jué)作為人工智能領(lǐng)域的重要分支,已經(jīng)協(xié)同其他技術(shù)開(kāi)始對(duì)社會(huì)產(chǎn)生重大影響。雖然人工智能領(lǐng)域內(nèi)的各個(gè)前沿技術(shù)存在著不同程度的交叉,難以細(xì)分,但依據(jù)主要采用的技術(shù)類別,可以將人工智能行業(yè)分為:深度學(xué)習(xí)、機(jī)器視覺(jué)、自然語(yǔ)言處理、語(yǔ)音識(shí)別、情境感知計(jì)算、模式識(shí)別等等。其中,深度學(xué)習(xí)、機(jī)器視覺(jué)、自然語(yǔ)言處理是優(yōu)質(zhì)企業(yè)參與最多的三大領(lǐng)域,也是人們?cè)谌斯ぶ悄茴I(lǐng)域付諸探索實(shí)踐最多、獲得應(yīng)用成果最為豐厚的主要領(lǐng)域。
深度學(xué)習(xí)、機(jī)器視覺(jué)、自然語(yǔ)言處理這三大方向是計(jì)算機(jī)智能化發(fā)展的三大功能,分別代表著教會(huì)機(jī)器思考、教會(huì)機(jī)器觀察外界、教會(huì)機(jī)器理解文字。機(jī)器視覺(jué)作為一種基礎(chǔ)功能性技術(shù),是機(jī)器人自主行動(dòng)的前提,能夠?qū)崿F(xiàn)計(jì)算機(jī)系統(tǒng)對(duì)于外界環(huán)境的觀察、識(shí)別以及判斷等功能,相當(dāng)于賦予了機(jī)器人視覺(jué),對(duì)于人工智能的發(fā)展具有極其重要的作用。
在功能目標(biāo)上,工業(yè)視覺(jué)主要解決以往需要人眼進(jìn)行的工件的定位、測(cè)量、檢測(cè)等重復(fù)性勞動(dòng);計(jì)算機(jī)視覺(jué)的主要任務(wù)是賦予智能機(jī)器人視覺(jué),利用測(cè)距、物體標(biāo)定與識(shí)別等功能實(shí)現(xiàn)對(duì)于外界位置信息、圖像信息等的識(shí)別與判斷。
在硬件需求上,工業(yè)視覺(jué)相對(duì)較高,需要對(duì)工業(yè)相機(jī)的幀頻、分辨率等指標(biāo)依據(jù)自身的需求進(jìn)行篩選;而計(jì)算機(jī)視覺(jué)則除少部分特殊情況外,大部分對(duì)于相機(jī)或攝像頭的要求并不高。
在算法側(cè)重上,工業(yè)視覺(jué)的算法往往側(cè)重于精確度的提高;而計(jì)算機(jī)視覺(jué)的算法難度相對(duì)較高,側(cè)重于或采用數(shù)學(xué)邏輯或采用深度學(xué)習(xí)方法進(jìn)行物體的標(biāo)定與識(shí)別。
在產(chǎn)業(yè)成熟度上,工業(yè)視覺(jué)已經(jīng)相對(duì)較為成熟,在半導(dǎo)體、包裝等行業(yè)的測(cè)量檢測(cè)已有較為廣泛的應(yīng)用;而計(jì)算機(jī)視覺(jué)整體來(lái)講還是一個(gè)剛起步的狀態(tài),初創(chuàng)企業(yè)層出不窮。
事實(shí)上,機(jī)器視覺(jué)作為人工智能領(lǐng)域的重要分支,已經(jīng)協(xié)同其他技術(shù)開(kāi)始對(duì)社會(huì)產(chǎn)生重大影響。雖然人工智能領(lǐng)域內(nèi)的各個(gè)前沿技術(shù)存在著不同程度的交叉,難以細(xì)分,但依據(jù)主要采用的技術(shù)類別,可以將人工智能行業(yè)分為:深度學(xué)習(xí)、機(jī)器視覺(jué)、自然語(yǔ)言處理、語(yǔ)音識(shí)別、情境感知計(jì)算、模式識(shí)別等等。其中,深度學(xué)習(xí)、機(jī)器視覺(jué)、自然語(yǔ)言處理是優(yōu)質(zhì)企業(yè)參與最多的三大領(lǐng)域,也是人們?cè)谌斯ぶ悄茴I(lǐng)域付諸探索實(shí)踐最多、獲得應(yīng)用成果最為豐厚的主要領(lǐng)域。
深度學(xué)習(xí)、機(jī)器視覺(jué)、自然語(yǔ)言處理這三大方向是計(jì)算機(jī)智能化發(fā)展的三大功能,分別代表著教會(huì)機(jī)器思考、教會(huì)機(jī)器觀察外界、教會(huì)機(jī)器理解文字。機(jī)器視覺(jué)作為一種基礎(chǔ)功能性技術(shù),是機(jī)器人自主行動(dòng)的前提,能夠?qū)崿F(xiàn)計(jì)算機(jī)系統(tǒng)對(duì)于外界環(huán)境的觀察、識(shí)別以及判斷等功能,相當(dāng)于賦予了機(jī)器人視覺(jué),對(duì)于人工智能的發(fā)展具有極其重要的作用。