Beágyazott gépi látás – Mit jelent, és miért lesz jó?

Mindennapi életünket meghatározzák az egyre kisebbé és erősebbé váló elektronikus eszközeink, és e trend alól a gépi látás hardverek és technológia sem lett kivétel.

A klasszikus gépi látás rendszerek két fő komponense az ipari kamera és a PC. A technológia hajnalán, az itt használt kamerák mérete egy literes tejesdoboz dimenzióihoz közelített, a képfeldolgozó ipari számítógépek pedig a tornatermekből ismerős zsámolyok súlyával és méretével büszkélkedhettek. Mondani se kell, hogy ezek a rendszerek akkoriban rendkívül költségesnek számítottak.

Az idő múlásával ezek az eszközök egyre kisebbé és olcsóbbá váltak. Ma az ipari PC már kiváltható mini PC-vel vagy akár egykártyás számítógéppel, a tejesdoboz méretű kamerák pedig összezsugorodtak egy postai bélyeg szintjére, köszönhetően a már burkolat nélkül kapható, board level kameráknak. Ez a két fejlődési irány tette lehetővé a rendkívül kompakt rendszerek megalkotását specifikus gépi látás alkalmazásokhoz. Az ilyen rendszereket nevezzük beágyazott gépi látás rendszereknek.

pc-vs-embedded

Ezek a rendszerek a PC alapú elődjeikhez képest nem általános képfeldolgozó feladatokat látnak el, hanem minden rendszer egy-egy specifikus gép látás feladatot. Ezt az tesz lehetővé, hogy  míg a standard PC-k általános képességeik miatt sok felesleges kapacitással rendelkeznek, ezek a rendszerek csak annyival és azzal, amit a feladat igényel. Ezzel az optimalizálással érhető el a kis méret és súly, az alacsony darabköltség és energiafogyasztás.

És hogy hol találkozhatunk majd ezekkel a rendszerekkel? Az önvezető autóknak már ma is elengedhetetlen eleme a beágyazott gépi látás, a jövőben pedig ilyen rendszerek kerülhetnek a boltok automoata mérlegeibe, mobil orvosi eszközökbe, például szem és bőrvizsgáló készülékekbe. További méretcsökkenést követően pedig a hordható rendszerekre is széles körű elterjedés vár.

Advertisements

A jövő ABC-je: kassza, kasszás és sorok nélkül

Az Amazon az online kereskedelem után az offline boltokra fordítja vigyázó tekintetét, ennek legújabb bizonyítéka a Seattle-ben most nyílt Amazon Go élelmiszerbolt. Persze  ne egy sima sarki abc-t képzeljünk magunk elé, hiszen mégiscsak az egyik legnagyobb újításokkal szolgáló vállalatról beszélünk.

Az egyelőre csak béta teszt alatt lévő, Amazon alkalmazottak számára elérhető boltban ugyanis hiába keresnénk kosarunkkal a kasszasort, csak zavartan forgólódnánk, mert úgy néz ki, hogy a gépi látás technológiával és egyéb szenzorok segítségével sikerült kiváltani a pénztárakat, ezáltal pedig megszűntetni  az időrabló sorban állást és a búval bélelt pénztárasokat.

Az újításoknak köszönhetően belépéskor mindössze az Amazon Go app által generált egyedi QR kódot kell beszkennelni, utána már csak a táskánkba kell bepakolni a kiválasztott cikkeket, majd lazán kisétálni a boltból. Persze a fizetés nem marad el, a vásárolt termékek árát távozás után terhelik rá Amazon fiókunkra.

Természetesen a kényelemnek ára is van, a vásárlók minden egyes lépését és mozdulatát kamerák tucatjai figyeli és elemzi, mellyel egyrészt azonosítani tudják a kiválasztott cikeket, másrészt az Amazon adatokat tud gyűjteni rólunk, hogy még inkább személyre szabott hirdetéseket kapjunk, amint újra online leszünk.

Az üzletet 2017 elején tervezik megnyitni a nagyközönség előtt, és használatához elég lesz egy Amazon fiók, és egy megfelelő mobilra letöltött ingyenes app.

Imaginghub – online közösség a beágyazott gépi látás rendszerek érdeklődőinek

Idén ősszel indult útjára a beágyazott gépi látás érdeklődői számára készített új online közösségi tér, az Imaginghub.

Az oldal készítőinek célja, hogy egy fiatalos, pezsgő közösségi teret biztosítsanak a beágyazott gépi látás rendszerek után érdeklődő mérnököknek, szoftver fejlesztőknek, vagy akár az egyszerű hobbi építőknek, a kezdőktől egészen a profi szinten lévőkig. Az oldal egyre bővülő partner és projekt listájának segítségével biztosítja a terepet közös megoldáskeresésre, projekt partnerek egymásra találására, tudásmegosztásra és az elért eredmények bemutatására.

A dinamikusan bővölő partnerlista segítségével könnyen lehet technológiai vagy integrációs partnert találni a világ minden pontjáról, legyen szó akár kamerákról, képfeldolgozó egységről vagy a gépi látás szoftveres részéről. A listában már most olyan elismert vállalatok találhatóak, mint az Advantech, a Basler vagy az NVIDIA.

Az oldalon könnyen kapcsolatba lehet lépni más tervezőkkel, fejlesztőkkel, lehetőséget adva közös ötletelésre, munkára egy jobb alkalmazás megalkotása érdekében.

Ha érdekelnek a beágyazott gépi látás rendszerek és megoldások, vagy máris egy ilyen jellegű feladattal állsz szemben, itt az ideje regisztrálnod!

Tükröm tükrom mondd meg nékem…

Sok “okos” dologról esett már szó a blogon, írtunk okos raktárról, a jövő okos kütyüjeiről, és persze volt számtalan oksabbnál okosabb posztunk is.

Az egyik legújabb újdonság ezen a téren a Panasonic okos tükör prototípusa, ami nem csak okos, de interaktív is. Röviden összefoglalva: a tükör először beszkenneli az arcot, elemzi, eldönti, hogy hol szükséges egy kis kozmetikai segítség, majd “kinyomtatja” az arcunknak megfelelő smink kombinációt, amit egyszerűen felhelyezhetünk a segítségre ítélt területre. A technológiával nem csak a bőrhibák, de akár kisebb sérülések nyomai, hegek is egyszerűen és feltűnésmentesen eltüntethetőek lehetnek a jövőben, nagy segítséget nyújtva sokaknak.

Az eszköz még erősen prototítpus állapotban van – a sminknyomtató által készített smink maszkoknak még akár egy napot is pihennie kell a felhelyezés előtt – de közel járunk már, hogy mindenki a legjobb arcát mutathassa a világnak.

Legalábbis Homer Simpson smink gépénél biztos közelebb.

simpsons_10_03_p3

Már megint savanyú a szőlő, éretlen a barack? Segít a kamerád!

Abba már egy ideje beletörődhettünk, hogy eszközeink számítási kapacitásukkal kenterbe vernek bennünket, de lassan ott tartunk, hogy látásbeli képeségeikkel is messze elhúznak az emberi szemtől.

Mára elfogadtuk, hogy telefonunk kamerájának is nagyobb felbontása van, mint szemünknek, és, hogy egyes speciális kamerák gyorsabban, vagy a sötétben is jobban látnak nálunk. Ma már viszont csak egy lépésre vagyunk attól, hogy a zsebünkben lévő kamerával a dolgok mélyére láthassunk.

Ebben a hiperspektrális képalkotás technológiája fog majd segíteni, amit a tudományos kutatások során már 1-2 évtizede ugyan használnak, de csak mostanra került közel hozzá, hogy a mindennapi élet során is hasznát vegyük.

A technológia rövid lényege, hogy az alkalmazott kamera a fény szabad szemmel és a hagyományosnak tekinthető kamerákkal láthatatlan spektrumait is érzékelni képes.

Ennek segítségével aznnal megállípítható egy gyümölcsről, hogy elég érett-e már, vagy akár gyógyszerekről (sőt egyéb pirulákról is), hogy valódiak-e. Ugyanis a gyümölcsök kölönböző érettségi szintje, vagy a tabletták összetevői más-más mértékben nyelik el a hullámokat.

hyperspectralimaging
Forrás: MIT Technology Review

A technológiával kapcsolatos legfrissebb hír, hogy Alex Hegyi ezzel a technológiával került fel az MIT Technology Review lap legtehetségesebb 35 év alatti feltalálókat összegyűjtő listájára, melyen korábban többek között Mark Zuckerberg és a Google alapítók is megfordultak. Az ő megoldásának legfőbb újdonsága, hogy fejlesztésével az eddigi megolásoknál kisebb, és kevésbé költséges eszközt tudott összerakni: egy egyszerű monokróm kamera szenzora elé helyezett polarizációs gyűrűk közé tett folyadékkristály cella segítségével sikerült elérnie a kívánt eredményt. A prototípus egyelőre egy tablethez kapcsolódik, és ezen fut a képfeldolgozó szoftver, de a fejlesztő szerint 3-5 éven belül a technológia már a mobilokban is megjelenhet. Az elképzelések szerint a felhasználóknak szerencsére nem kell majd ismerniük a különböző hullámhosszok és frekvenciatartományok jellemzőit, hiszen az alkalmazások egyszerűen ki fogják tudni írni a kamera elé tett gyümölcsről, hogy  az elég érett vagy sem.

Okos raktár az Ipar 4.0 szellemében- A gépi látás alapú intelligens targonca

A raktározásban használt vezető nélküli járművek jelenlegi generációi meglehetősen korlátozott tudásúak az előre definiált útvonalaik miatt, hiszen nem tudnak rugalmasan reagálni a változásokra. Magyarul, ha akadályba ütközik az útvonalán, nem képes kikerülni azt, egyetlen opcióként egy vészmegállást tud produkálni a váratlan kihívás előtt. Más példával élve, ha az elszállításra váró tárgy nincs pontosan az előre megadott helyre helyezve, a jármű nem képes felvenni azt, nem tudja a helyzetnek megfelelően módosítani mozgását. Hogy még rosszabb legyen a helyzet, ezek az járművek költséges orientációt segítő eszközöket igényelnek – mágneses szenzorokat, padlón lévő jelölő sávokat -, hogy tudják éppen merre járnak a raktárban

Ezek a korlátok időigényessé és költségessé is teszik a vezető nélküli szállító rendszerek bevezetését. Az ipar 4.0 új ígérete viszont az, hogy képes lesz felruházni a gépeket az ember azon veleszületett képességével, hogy önnállóan képesek irányítani magukat, mindenféle drága segédeszköz nélkül.

E koncepció szerint került fejlesztésre egy intelligens, vezető nélküli targonca, ami képes iránytítani magát az őt körbevevő környezet alapján. Ehhez szükséges egy kezdeti, ember vezette bemutató túra a létesítményben, ahol megtanulhatja környzezete minden részletét. Hang és gesztusvezérléssel is irányítható a jármű, ami megbízhatóan tudja megkülönböztetni a különböző rakodásra váró tárgyakat.

BAS1606_Success_Story_Industry_4.0_EN.pdf

Mivel a járművek irányítása meglehetősen egyszerű, akár egyetlen raktári munkás is elég több jármű együttes koordinálásához.

Alapvető elemei ennek az okos eszköznek a Basler kameragyár Time of Flight (ToF) technológiájú 3D kamerái, amikből 3 darab található minden járművön. Minden egyes kamera három dimenzóban rögzíti környezetét, ezzel biztosítva a helyes térlátást az eszköznek. Két kamera a targonca tetején kapott helyet, ezek szolgálják a jármű tájékozódását. Az intelligens targonca rögzíti a környzetében lévő tájékozódási pontokat, elkészítve a saját belső térképét, majd működés közben a fedélzeti ToF kamerák segítségével érzékelik az környezeti változásokat, például ha egy polcrendszer eleme más pozícióban van, akadály került a haladási útvonalára, és ezeknek megfelelő rakcióra képes, például kikerüli az akadályt és folytatja szokásos útját. A harmadik ToF kamera a targonca villáján kapott helyett, a polcokon lévő raklapok precíz felvételéhez. A kamera által biztosított 3D adat biztosítja, hogy a targonca villája első próbálkozásra fel tudja emelni a megcélzott raklapot, emberi segítség nélkül.

A korábbi rendszerekhez képest már nem lesz szükség a  rugalmatlan nyomkövetés miatti költség és időigényes kezdetei majd folyamatos konfigurációkra, ezzel jelentős megtakarítást tesz lehetővé a vásárlók számára. Ennek köszönhetően a vezető nélküli komissiózás hamarosan betörhet a kis és középvállalatok eddig még érintetlen piacára is.

Pepper, a robotpincér

Téged is szolgált már ki unott vagy bunkó pincér az étteremben? Ma már ez is elkerülhető, ha a feladataikat átadjuk  robotoknak, ahogy azt nemrég az ázsiai Pizza Hut éttermek is tették.

26653783415_6f71860afe_z

A humanoid robotok köszöntik a beérkező vendégeket, felveszik a rendelést és a fizetést is náluk lehet intézni. Ezekben a feladatokban egy fejlett gépi látás rendszer segíti a gépeket, kamerák vannak a robot szemében, homlokán, szájában, és alakfelismerő algoritmusok segítik az arc és tárgyfelismerésben. A akmerákon kívül természetesen számos szenzor, gyorsulásmérő és egyéb érzékelő is helyet kapott a testben az önálló működés érdekében.

Persze a jövőt senki sem tudja biztosan, a McDonalds egy korábbi vezetője például nem ért egyet a robotok ilyen szintű alaklmazásával, de azt ő se tudná megmondani, hogy az elkövetkező évek a robotok és csálingerek háborúját hozzák majd, vagy nemsokára már mi is egy mesterséges intelligánciával megáldott robotnak adjuk le a ránott hús megrendelésünket a sarki kifőzdében.