Pepper, a robotpincér

Téged is szolgált már ki unott vagy bunkó pincér az étteremben? Ma már ez is elkerülhető, ha a feladataikat átadjuk  robotoknak, ahogy azt nemrég az ázsiai Pizza Hut éttermek is tették.

26653783415_6f71860afe_z

A humanoid robotok köszöntik a beérkező vendégeket, felveszik a rendelést és a fizetést is náluk lehet intézni. Ezekben a feladatokban egy fejlett gépi látás rendszer segíti a gépeket, kamerák vannak a robot szemében, homlokán, szájában, és alakfelismerő algoritmusok segítik az arc és tárgyfelismerésben. A akmerákon kívül természetesen számos szenzor, gyorsulásmérő és egyéb érzékelő is helyet kapott a testben az önálló működés érdekében.

Persze a jövőt senki sem tudja biztosan, a McDonalds egy korábbi vezetője például nem ért egyet a robotok ilyen szintű alaklmazásával, de azt ő se tudná megmondani, hogy az elkövetkező évek a robotok és csálingerek háborúját hozzák majd, vagy nemsokára már mi is egy mesterséges intelligánciával megáldott robotnak adjuk le a ránott hús megrendelésünket a sarki kifőzdében.

Jibo, a mesemondó robot

Bár a gyártó százezer dollárt szeretett volna összegyűjteni az Indiegogo-n, már a nyáron megvolt az egymillió. Sok Kickstarter-es és hasonló kezdeményezésű projekttel ellentétben – úgy fest – a rajzfilmfigurákat felidéző robot nem csupán elkészült, de alaposan felkeltette a világ figyelmét.

Bár ez részben a kiváló promóciós videónak is köszönhető, de ha igaz, amit látunk, akkor Jibo az egyszerűségével igyekszik tarolni. A kis robot nem próbál humanoid lenni, nem tud járni, se tonnákat megmozgatni, és a mérete is mindössze 28 centiméter.

Talán a családi robot a legjobb kifejezés a kis Jibo-ra, aki gyenge akkumulátora miatt leginkább hálózatról való működésre lett kitalálva.  Jibo képes felismerni a családtagok arcát és azokat személyre szabott információkkal ellátni. Feje bármilyen irányba el tud fordulni, minden irányból érzékeli a hangokat, reagál az ölelésre és mesét mond a gyerekeknek, amiket még képekkel is illusztrál.

Az ügyintézést és mindennapokat segítő robotocska 2016 elején kerül forgalomba, de az előrendelők már 1 év múlva kézhez kaphatják Jobo-t.

Egyre menőbb a gépi látás

Az idei Large Scale Visualisation Challange-en elsősorban az internetről származó képeket kellett felismerni, elhelyezni és rendszerezni. Mindezt gépeknek, és kijelenthetjük, hogy a nemzetközi versenyen bemutatott eredmények rendkívüli fejlődést mutattak.

images
Jobban látnak, mint mi

A szervezők egyenesen kijelentették, hogy az eddigi versenyek közül az idei bizonyult a legjobbnak: az egy évvel ezelőtti helyzethez képest felére csökkent a hibák száma. Külön kiemelték a biológiai látás modellezését és a gépi tanulást, melyben Yann LeCun deep learningben jártas kutató módszerét találták a legizgalmasabbnak.

Az úgynevezett konvolúciós neurális hálózat digitális idegsejtekre épül, így a hagyományos módszereknél sokkal hatékonyabban ismeri fel a képeket, arcfelismerésben például 97,6%-os eredményt ért el, ami rendkívülinek számít.

Gépi látást eddig is számos területen használtak, az autóiparon át az orvostudományig (korábban például mi is interjút készítettünk a 4D Anatomy magyar kitalálójával), azonban a csökkenő árak miatt a technológia még tovább terjedhet. Különösen, ha az olyan gesztusokat nézzük, mint amit az idei gépi látás verseny győztesei mutattak be: technológiáik minden részletét nyilvánossá tették, ezzel is gyorsítva a kutatási folyamatokat.

Végre elkattinthatunk 300ezret okosszemüvegre

gglassPersze csak ha az Egyesült Államokban lakunk. A lényeg azonban, hogy bármennyire is támadták a Google Glass okosszemüveget – vagy épp viccet csináltak belőle –, a termék piacra került, és 1500 dollárért egy kattintással online megrendelhető.

És mielőtt kapkodnánk a fejünket, ugye az autószerelő sem azért kér el  ötezret, mert meghúzott egyetlenegy csavart a motorban, hanem mert tudta, hol van az az egy, amit meg kellett húzni. Most, hogy ezt elfogadtuk, még mindig fájdalmas tény, hogy a Google Glass mindössze 150 dollárnyi hardvert tartalmaz, az ár jelentős részét a tudásért fizetjük, amivel kifejlesztették.

Ráadásul a mobilunkkal összehangolható okosszemüveg még közel sem tökéletes: nagyon gyorsan lemerül, simán le lehet lopni a fejről és még a szoftver is kezdetleges. Gombok híján ugye hanggal tudjuk vezérelni a kütyüt, mely aztán kérésünkre navigál, fotóz vagy videót készít.

Különvélemény

A Uniqul finn startup cég a világ első arcfelismerési technológián alapuló fizetési megoldásával készül előrukkolni, mellyel a bolti fizetéseket akár 5 másodperc alatt is el lehet majd intézni.

A projekt még csak a kezdeti fázisban tart, de a fogadtatása már most vegyes. Ezt a technológiát promotáló látványos videó alatti hozzászólások is mutatják. A „nagytestvérnek tetszeni fog”, „az egész olyan, mint egy ijesztő sci-fi”, „a kormány ismét támad” vagy a „könnyen vissza lehet vele élni” megjegyzések arról tanúskodnak, hogy egyelőre nem nagyon vannak ilyesmire felkészülve az emberek, és darabig még nem is lesznek.

A terv szerint a bolthoz közeledő vásárló arcáról egy kamera felvételt készít, majd egy “katonai minőségű algoritmus” azonosítja az illetőt. A fizetés elő-engedélyezése egy Uniqul számlához kapcsolt kártyával történik, a pénztáraknál már egy csak egy “ok” gomb megnyomás szükséges a tranzakció befejezéséhez.

A rendszer jelenleg 96 százalékos pontossággal ismeri fel a vásárlókat, ami azt jelenti, hogy az esetek 4 százalékában egy PIN-kód megadása szükséges a fizetések lebonyolításához. A cég ígérete szerint 99,6 százalékos pontosságot érnek el már idén ősszel.

A fizetések még kényelmesebbé tételéért a Uniqul havi díjat számít majd fel. 99 eurócentet kell fizetnie azoknak, akik csak egy előre meghatározott 1-2 kilométeres körzetben akarják használni a megoldást, havi 1,99 euróba kerül majd, ha egy városra vonatkozó arcfizetési-jogosultságot vásárol egy ügyfél. Az egész világra kiterjedő használati díj pedig várhatóan 6,99 eurót tesz majd ki. A kereskedőknek felszámítandó díjakról még nem döntött a cég. A fizetések lebonyolítására viszont már leszerződött a startup vállalkozás egy meg nem nevezett fizetési processzor céggel.

Nagy kérdés, hogy pár másodperces spórolás kinek ér majd pénzt, illetve ki akar fizetni azért, hogy fizethessen, mindezt olyan áron, hogy folyamatosan kamerákkal monitorozzák az ember arcát? A különböző biztonsági és technológiai problémákat egyelőre kár firtatni, hiszen kezdeti fázisban van a rendszer, így az egyetlen releváns kérdést jelenleg nem az előállítónak, hanem a potenciális felhasználóknak lehet feltenni: valóban megéri a kényelem a teljes kontrolt?

Három Magyarországnyi ember 1mp alatt

Cpu vision

A japánok nagyot durrantanak: a Hitachi leányvállalata, a Kokusai Electric befejezte óriás teljesítményű arcfelismerő rendszerének fejlesztését, mely lényegében valós időben – egy másodperc alatt – 36 millió arcot képes azonosítani.

A technológia lehetővé teszi – egy kamerákkal lefedett – közterületen mozgó emberek követését, és a beérkező képek elenyésző emberi erőforrással való feldolgozását – köszönhetően a háttérben munkálkodó szoftveres algoritmusnak. A szuperteljesítményű rendszer állítólag már jövőre kereskedelmi forgalomba lesz hozva, legalábbis erről ír a Geekosystem nevű blog.

Ahhoz, hogy a szoftver képes legyen felismerni egy arcot, az szükséges, hogy arra függőleges és vízszintes irányban egyaránt legfeljebb harminc fokos szögből legyen rálátása, a rögzített felvételen pedig legalább 40×40 képpont legyen az arc képének részletessége.

Arra is lehetőséget ad a rendszer, hogy manuálisan tápláljanak be egy fotót valakiről, és azt az embert pillanatok alatt megkeresse a tömegben. A Hitachi szerint a megoldás ideálisan alkalmazható tömegközlekedési járatokon, bevásárlóközpontokban, de akár a hatóságok által is, például egy tüntetés vagy futballmecs résztvevőinek vizsgálatához.

Kíváncsian várjuk a fejleményeket, amikről természetesen be is számolunk.

Arcfelismerés hatékonyan

Motion_capture_facial

Míg az ember a rossz látási viszonyok között, különböző szögekből is képes felismerni egy arcot, addig a gépi látást sokszor megzavarja az erős mimikai játék, az árnyék vagy az alulvilágítottság.

De miért is jó, ha felismernek minket a „gépek”? Az alkalmazási területeknek széles a skálája: az internetes barátkereső alkalmazásoktól kezdve, az áruházi – nemet és elégedettséget vizsgáló – kamerákon át egészen a terrorelhárítók rendszeréig kiemelt szerepet kap a gépi látás (computer vision).

A gépek antropológiai mérőpontok alapján (például a homlok magassága, az orr és a száj formája, valamin ezek egymáshoz viszonyított aránya stb.) dolgoznak. Charlie Frowd brit pszichológus szerint az emberi agy nagy előnye ezzel a mechanizmussal szemben, hogy az eltárolja az arcokat, azoknak egyes vonalait, mint egy karikatúrát. Tehát az ember asszociációs módszerrel ismer fel, míg az arcfelismerő programok adatbázisból dolgoznak.

2011-ben a Google megvásárolta a Pittsburgh Pattern Recognition PittPatt arcfelismerő szoftverét miután a Google Plus elindításával részese lett a közösségi oldalak piacának. Az új fejlesztés már-már alkalmazza az emberi agyra jellemző módszereket, és az igazolványképeket állítólag 70-80 százalékos pontossággal fel is ismeri. Ez azonban még nem jelent különösebb áttörést, az emberi agy – még a csecsemőké is – óriási előnnyel bírnak a jelenlegi technológiákhoz képest. Azonban a kutatások pár éve új irányokat vettek fel, így karikaturisták és rendőrségi fantomkép-rajzolók agyát vizsgálják a terület tudósai, akik az emberi arcot az átlagosnál hatékonyabban tárolják és elevenítik fel újra. Kíváncsian várjuk a fejleményeket.