A gépi látás célja, hogy számítógépek vizuális információkat értelmezzenek, dolgozzanak fel. A kihívást az jelenti, hogy a rendszernek számok millióiból kell értékes adatokat kinyerni, azok alapján döntéseket hozni.
\begin{bmatrix} 80 & 7 & 28 & \dots & 35\\ 85 & 87 & 45 & \dots & 7\\ 96 & 66 & 40 & \dots & 83\\ 75 & 57 & 81 & \dots & 5 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 35 & 26 & 27 & \dots & 74 \end{bmatrix}
Mi történik a képen?
Milyen a kép hangulata?
Merre megy a másik autó?
Milyen az időjárás jelenleg?
Karakterfelismerés (OCR)
Arcfelismerés (Detection, Recognition)
Követés (Tracking)
Vizuális effektek (VFX)
Vezetéstámogató rendszerek (ADAS)
Képelemzés (pl. Orvostudomány)
Kiterjesztett valóság (AR)
Biztonsági rendszerek
A mesterséges intelligencia, mint fogalom, napjainkban inkább marketing eszközként szolgál, szinte bármire rámondható, nem lehet pontosan meghatározni jelentését. A gépi tanulás viszont olyan fogalom, amely az AI része, de egyértelmű jelentése van. Képfeldolgozásban klasszikus módszerekkel alkotható egy sávelhagyásra figyelmeztető rendszer, közel ugyan azt a mintát kell keresni a kamerakép adott területén. Egy táblafelismerő program viszont már tanítást igényel, hiszen a különböző táblák eltérő alakúak, színűek, méretűek lehetnek a rögzített képen, így a programnak meg kell tanulnia felismerni ezeket a variációkat.
Ma már könnyen alkotható olyan gépi látást használó rendszer, amely az embernél gyorsabban és nagyobb pontossággal el tudja végezni az adott feladatokat. Azonban még elég távoli jövő, hogy olyan szerteágazó legyen egy mesterségesen alkotott rendszer, mint az emberi látás.