Egyre menőbb a gépi látás

Az idei Large Scale Visualisation Challange-en elsősorban az internetről származó képeket kellett felismerni, elhelyezni és rendszerezni. Mindezt gépeknek, és kijelenthetjük, hogy a nemzetközi versenyen bemutatott eredmények rendkívüli fejlődést mutattak.

images
Jobban látnak, mint mi

A szervezők egyenesen kijelentették, hogy az eddigi versenyek közül az idei bizonyult a legjobbnak: az egy évvel ezelőtti helyzethez képest felére csökkent a hibák száma. Külön kiemelték a biológiai látás modellezését és a gépi tanulást, melyben Yann LeCun deep learningben jártas kutató módszerét találták a legizgalmasabbnak.

Az úgynevezett konvolúciós neurális hálózat digitális idegsejtekre épül, így a hagyományos módszereknél sokkal hatékonyabban ismeri fel a képeket, arcfelismerésben például 97,6%-os eredményt ért el, ami rendkívülinek számít.

Gépi látást eddig is számos területen használtak, az autóiparon át az orvostudományig (korábban például mi is interjút készítettünk a 4D Anatomy magyar kitalálójával), azonban a csökkenő árak miatt a technológia még tovább terjedhet. Különösen, ha az olyan gesztusokat nézzük, mint amit az idei gépi látás verseny győztesei mutattak be: technológiáik minden részletét nyilvánossá tették, ezzel is gyorsítva a kutatási folyamatokat.