Hogyan válassz optikát?

A gépi látást bemutató cikkeink közül a legutóbbiban a kamera hátulját néztük meg, az interfészeket bemutatva, most pedig előre megyünk, és az optikákat, és a kameránkhoz való megfelelő optika kiválasztását mutatjuk be.

Egy szép és éles képhez nem elég jó kamerát választani, legalább ugyanilyen fontos a megfelelő optika is. A kompakt digitális kamerák általában nem cserélhető optikával kerülnek forgalomba, míg a profi tükörreflexes gépekre mindig a szituációnak megfelelő cserélhető objektíveket lehet feltenni. Ezek az önálló lencsék nem csak a felbontásukban, fókusztávolságukban, méretükben hanem a kivitelükben is különböznek, melyre a gépi látás kameráknál is külön figyelmet kell fordítani.

Mindenekelőtt szót kell ejteni a különböző elérhető optika típusokról. A legelterjedtebb hagyományos optikák mellett jelen vannak a gépi látás rendszerekben még a telecentrikus optikák, más területeken pedig a széles látószögű és halszem optikák, illetve különleges, közel infravörös tartományra fejlesztett (NIR) optikák is. Azonban az alábbiakban csupán a leginkább használt hagyományos optikákkal fogunk foglalkozni. Ezek legfőbb jellemzője, hogy az emberi látásnak megfelelően működnek, a távoli tárgyak kisebbnek, a közeliek nagyobbnak látszódnak.

Ha sikerült kiválasztani a projektünknek megfelelő gépi látás kamerát, meg kell találnunk az ahhoz ideális optikát a tökéletes eredmény eléréséhez. Öt fő szempontot kell figyelembe venni a kiválasztás során:

  • A szenzorméretnek megfelelő legyen a lencse méret (Image circle diameter)
  • Megfelelő legyen a menettípus
  • Az optika felbontása elegendő legyen a szenzor felbontásához
  • A szenzornak és az alkalmazásnak megfelelő legyen a fókusztávolság
  • A világításnak megfelelő méretű legyen a rekesznyílás

A kamera szenzormérete döntő szempont az optikaválasztás során. A szenzorméretet a gyártók inch-ben szokták megadni, de ez az inch nem a megszokott 25,4 mm, hanem 16 mm. A pontos szenzorméret meghatározható még a felbontás és pixelméret segítségével is. Jellemzően a nagy felbontású area scan és line scan kamerák szenzora nagyobb is mint a kisebb felbontásúaké.

Az ipari kamerákhoz kapható optikák menettípusukban is eltérhetnek, ha nem jót választunk, akkor könnyen előfordulhat, hogy egyáltalán nem, vagy csak speciális átalakítóval tudjuk a kameránkra feltenni. Az iparban a C menetes optikák a legelterjedtebbek, ezek a nagyjából maximum 20 mm-es – 1,5 inch-es – szenzorokhoz elegendőek. Nagyobb szenzorokra F menetes optikák, míg kisebbekre CS vagy S menetesek valóak. Fontos tudni, hogy CS menetes kamerára lehet tenni C menetes optikát, de fordított irányba nincs átjárás.

A menettípus közvetetten meghatározza a képkört (image circle), azaz a szenzornak azt a felületét, ahova az optika el tudja juttatni az összegyűjtött fényt a széleken való sötétedés (vignettálás) nélkül. Ha a kamera szenzoránál kisebb átmérőjű lencsét használunk, az nem fog fényt juttatni a szenzor széleihez, sarkaihoz, azok feketék fognak maradni, ezt hívjuk vignettálásnak. Tehát mindig a szenzorméretnek megfelelő, vagy annál nagyobb optikát kell választani. Nagyobb optika nagyobb képkört is jelent, aminek köszönhetően az élesség változatlan marad a kép közepétől a széléig. Azonban a a nagyobb optika nagyobb lencséket, több megmunkálást, anyagot is igényel, ezért drágábbak is. Kis szenzorokhoz tehát érdemes megfelelően kis optikát választani.

Selecting the Right Lens   Vision Campus

Azonban még ez után is oda kell figyelni, ugyanis hiába van papíron nagy felbontású kameránk, ha nem megfelelő az optika, nem fogjuk a várt eredményt kapni. Az optikáknak is megvan a saját felbontásuk, és ha ez kisebb mint a kamera szenzoráé, akkor a gyengébb felbontást fogjuk viszontlátni a képeinken. Az optikák felbontását vonalpár/mm-ben (line pair/mm, lp/mm) szokták megadni, ami azt takarja, hogy egy milliméteren belül hány vonalpárt tud elkülöníthetően megjeleníteni. Az optikák felbontását a modulációs átviteli függvény (modulation transfer function – MTF) jellemzi, ami a lencse felbontási kapacitását írja le a kép középpontjától a széle felé. Az MTF értéket egy fekete-fehér csíkokat ábrázoló teszt diagrammal mérik, ezzel meghatározható az lp/mm értéke. Az optika felbontása ezáltal meghatározza, hogy mekkora lehet a szenzor pixelmérete ahhoz, hogy mindegyikre más képrészlet jusson

Ahhoz, hogy a szép kép mellet pontosan azt a területet is lássuk, ami az alkalmazásunkhoz szükséges, az optikák fókusztávolságát kell figyelembe venni. A fókusztávolság a lencse optikai középpontja és a fókuszpont távolsága. A fókuszpontban találkoznak az optika által begyűjtött fénysugarak, a fókusztávolság tehát gyakorlatilag a lencsék fénytörő képességétől függ, és mm-ben szokták megadni. Minél nagyobb a fókusztávolság, annál nagyobb lesz a kép telefotó jellege. A sporteseményeken és paparazziknál látható óriási objektívek lényege is a nagy fókusztávolság, a hétköznapi objektívekhez képest. A nagy látószögű, és halszem optikák ennek megfelelően pedig kisebb fókusztávúak.

Selecting the Right Lens   Vision Campus2

A tökéletes képhez még egy dolgot kell figyelembe venni, mégpedig az üzemeltetés helyén lévő világítást, és az optikák ehhez kapcsolódó rekesznyílás méretét. A rekesznyílással lehet szabályozni a szenzorra jutó fény mennyiségét, és az úgynevezett F számmal szokták jelölni. Minél nagyobb az F szám, annál kisebb a rekesznyílás és annál kevesebb fény jut a szenzorra. A rekesznyílás mértékével a szenzorra jutó fénymennyiségen kívül a mélységélességet is szabályozni lehet. A kis rekesznyílás – tehát nagy F szám – nagy mélységélességet tesz lehetővé, míg nagy rekesznyílásnál csak a fókuszpontban lévő részlet lesz éles.

Selecting the Right Lens   Vision Campus3

Tehát még egyszer, az öt kulcstényező a jó optika választásához: lencseméret, menettípus, felbontás, fókusztávolság és rekesznyílás. Ha mindegyikre megtaláljuk a megfelelő értéket nyugodtak lehetünk, a kameránk az elvárt képminőséget fogja nyújtani.

Hogyan működnek a digitális kamerák?

Az előző cikkünkben végigvettük hogyan épül fel egy gépi látás rendszer, most pedig annak legfontosabb egységét, azaz a kamerát vesszük górcső alá.

Manapság már mindenhol digitális kamerák vesznek minket körül, a telefonunktól kezdve, a laptopunkban, tabletünkben, az utcán biztonsági kamerák képében, vagy a közlekedést figyelve, és sok más iparág között a gyártósorok automatizálása is digitális kamerák segítségével történik.

A camera obscurától az analóg filmes kamerákon át fokozatosan jutottunk el a ma már minden részében digitális kamerákig. Ezekben az eszközökben nem csak a képalkotás digitális, hanem az elkészült képek tárolása, vagy továbbítása is.

Az első digitális kamerát a Kodak mutatta be az 1970-es években, na de hogyan is működik ez az alapjaiban azóta is változatlan technológia?

A camera obscura apró lyukához képest, az analóg és digitális kamerákon is optikát használnak a beérkező fény összegyűjtésére. Az optika teszi lehetővé a megfigyelt tárgyra való fókuszálást, közelítést vagy távolítást. A digitális kamera lelke azonban a képalkotó szenzor, ez végzi az optikán át érkező fény digitális képpé való alakítását. Az elkészült képeket a hétköznapokban használt kamerák  memória kártyákon tárolják, azonban az ipari digitális kamerák nagy tárhelyigényű tömörítetlen felvételeit egyből továbbítani kell a feldolgozást vagy tárolást végző PC felé, mely folyamat a kamerák interfészén keresztül történik.

Untitled-7.fw

A kamera legfontosabb része a képalkotó szenzor. Ezek a szenzorok nagyon sok apró, fényre érzékeny területből, azaz pixelből állnak. Minél több fény, azaz foton érkezik adott pixelre, az annál világosabb lesz az elkészülő képen. Színes képeknél azonban nem csak a fény mennyisége, hanem a hullámhossza is számít. A kép minden egyes képpontjára meg kell tudni adni annak egyedi színértékét. Erre a feladatra két módszer terjedt el a digitális képalkotásban.

A leggyakrabban használt az úgynevezett Bayer filter eljárás, ami azt takarja, hogy a szenzor minden egyes pixelén az RGB színtérnek megfelelő színszűrők találhatóak, 50%-ban zöld és 25-25%-ban piros valamint kék színben. Képalkotás során a fény mennyisége és a szín függvényében különböző módszerekkel történő interpolálással tudják meghatározni a kép egy-egy pontjának valós színét.

Screenshot 2015-12-10 13.35.16

A hétköznapok során használt kamerákban jellemzően nem számít ha egy kép elkészítése, és elmentése negyed vagy fél másodpercet is igénybe vesz, azonban ipari alkalmazás során ennél gyorsabb működésre van szükség. Egy gyorsan mozgó tárgyról való éles kép készítéséhez nagyon gyorsnak kell lenni, így egyes ipari kamerák kamerák másodpercenként akár 750 kép (sőt van ami, még ennél  is több) készítésére képes.

További infók és érdekességek angolul tudóknak a Basler alábbi videójában:

Miből is áll egy gépi látás rendszer?

Szinte minden cikkünkben szerepel, és a blog címe is az, hogy gépi látás, de az alkalmazási területein kívül nem igazán néztünk eddig mögé, hogy mit is jelent ez a technológia. Most induló cikksorozatunkban ezt fogjuk bepótolni, bemutatva a gépi látás rendszerek felépítését, alkotó elemeiket, tehát mindazt, ami a használhatóság alapjait adja.

A gépi látás rendszerek központi eleme természetesen maga a kamera, azonban a megfelelő rendszerelemek használata nélkül hiába a legjobb kamera, nem fogjuk elérni a kívánt eredményt.

A gépi látás rendszerek feladata gyakorlatilag az emberi látás “imitálása”, nagy sebesség mellett. A két dolog működése is szinte ugyanaz, hiszen a minden fajta látáshoz kell egy képalkotó egység, valami, ami a feldolgozást végzi és egy harmadik rész, ami a kettőt összeköti. Ezen kívül az embernek és a gépnek is szüksége van fényre, hiszen anélkül az egész nem ér semmit.

Vision_system

Az emberi látás képalkotó egysége a szem, míg gépi látás rendszerekben ezt a feladatot látja el a kamera és az optika. Az így előállt képek a szemből idegeken keresztül jutnak el a feldolgozást végző agyhoz, és az ugyanitt továbbítja az utasításokat a szemnek. Mesterséges rendszerekben a kommunikáció különböző, úgynevezett interfaceken keresztül történik a kamera és a számítógép között. Egy számítógép persze önmagában még nem képes elvégezni a képfeldolgozást, kell a hardver mellé egy szoftver is, ami megmondja a számítógépnek, hogy milyen számításokat végezzen el a feladat teljesítéséhez. Megvilágítás tekintetében a gépi látás rendszerek nagy előnye, hogy a kamerák nem csak az ember számára látható fényben tudnak működni, hanem például infravörös megvilágításban is képesek a képalkotásra.

Az alábbi Basleres videón további érdekességeket és tanácsokat láthattok a gépi látás rendszerekről, melyeken a további részekben itt a blogon is végig fogunk menni.

Gépi lássál a Stanfordon!

Aki még nem ismerné: a Coursera.org egy online oktatófelület, ahol a világ legjobb egyetemeinek jelentkezhetünk különböző előadásaira – ráadásul ingyen. A lehetőség gyorsan meghódította a világot, a 2012-ben indult oldal egy év alatt 196 országból, másfél millió felhasználót szerzett. A hatalmas érdeklődés nem meglepő, több mint 30 egyetem kínál 200 kurzust hétről hétre, a felsőoktatási intézmények pedig olyan neveket viselnek, mint például Princeton vagy Stanford.

Mindenki találhat kedvére való kurzust, humán- és reál beállítottságúak egyaránt, bár utóbbiak azért bőségesebb kínálatból válogathatnak. Akik a gépi látás területére szeretnének némi betekintést nyerni, azoknak is érdemes figyelni az oldalt, a Stanfordon lehetőség van „Computer Vision: From 3D Reconstruction to Visual Recognition” nevezetű órát hallgatni, mely nagyjából annyit jelent, hogy Gépi látás: a 3D-s rekonstrukciótól a vizuális felismerésig.

A videó-előadásokon, írásos tananyagokon és házi feladatokon alapuló kurzus 5-10 óra erőforrást igényel egy héten, és a sikeres befejezést követően – amennyiben teszünk záróvizsgát (szintén online) – az oktatók által aláírt tanúsítványt kapunk a tantárgy elvégzéséről.

Continue reading