De opkomst van image-/ video recognition

Spraakherkenning stond al een tijdje op de radar, mede door de mooie AI-film “Her” (de hoofdpersonage  raakt verliefd op een algoritme)  en natuurlijk de opkomst van Alexa en Siri, die ons misschien wel van het smartphonescherm gaan bevrijden. Zeker nu ook andere sectoren meer en meer spraakherkenning gaan integreren zoals Sonos.

Wat wat minder op de radar (bij mij althans) stond, is image- en video recognition even los van facial recognition. Toeval of niet,  de laatste weken vormde, op welke event ik ook was, image recognotion de leidraad. Twee weken geleden bij een interessante rondleiding op IBC waren Google en Facebook nog er een beetje geheimzinnig over. Maar IBM Watson onthulde al veel meer de mogelijkheden en techniek achter image en video recognition. Zo kan via hun algoritme niet alleen een tennisspeler herkend worden, maar kan ook een dubbelhandige backhand onderscheiden worden van een enkelhandige. Samen met onder andere emotie, juichgebaren en geluid van het publiek kunnen de highlights automatisch worden geslecteerd. Heel goed in te zetten om de highlights de volgende dag klaar te hebben op online platformen en aan te bieden als bite size chunk of media, zonder menselijke tussenhandeling.

Op een ander event liet Bol.com zien hoe zij image recognition gebruiken om bijna automatisch de juiste productafbeelding toe te wijzen aan de juiste categorie. Ook dit gaat al met een lage foutmarge tot op gedetailleerd niveau.

Algoritmes en creatie 

Vorige week viel mijn oog op mijn eigen software met een extra functionaliteit binnen onze regressie analysetool genaamd image embedding. Tot mijn verbaz7441ing had ik zelf ook image recognition analyse tot mijn beschikking, weliswaar op microniveau. Al vrij snel kon ook deze tool ook automatisch advertenties met auto’s onderscheiden van advertenties met producten en mensen. Deze advertenties waren al eerder verzameld voor een grootschalig eyetrackingproject waar per advertenties de aandachtswaarden waren vastgesteld en in database zijn bijgehouden.

Mijn nieuwsgierigheid ging verder. Zou het de opvalwaarden kunnen voorspellen op basis van de eigenschappen zoals de image embeditor deze automatisch toebedeelt? Na het trainen van het trainingsmodel en de eigenschappen te koppelen aan de opvalwaarden in een regressiemodel, moest ik al vrij snel de hypothese verwerpen.

Later kwam met het gezonde verstand de verklaring bovendrijven. De grootste voorspeller van aandacht binnen reclame is nog altijd creativiteit en originaliteit, ingegeven door dat ene mooie idee. Juist deze ingevingen worden door het publiek ontvangen met verrassing en bewondering, wat vervolgens een trigger is voor onze ogen er langer naar te kijken. Een kleine nuance in creatie kan al een multiplier effect hebben op aandacht. Deze nuances zijn nog niet te vangen in de droge nullen en eenen van een algoritme. Een beetje vergelijkbaar met een sentimentanalyse op tekst, waar nog moeilijk de mate van ironie kan worden vastgesteld.

De opkomst van image recognition is er zeker en wordt meer en meer voor iedereen toegankelijk, net zoals spraakherkenning. Zo is er ook al een app, Vocaleyes, die van elke foto die je maakt de objecten daarbinnen identificeert en ook teksten herkent en voorleest. Vooral leuk als eerste kennismaking met image recognition .

Voor de grote techreuzen is het serious business, zijn de voordelen er overduidelijk en is het misschien wel cruciaal om met deze ontwikkeling mee te gaan. Maar om vooraf te kunnen bepalen in hoeverre de scenes/afbeeldingen tot meer emotie/engagement zullen leiden, zal voorlopig nog een stap te ver zijn. Maar de ontwikkelingen gaan snel en misschien komen de liefde en algoritmes, zoals in de film “Her”, sneller bijelkaar dan je denkt.

 

 

 


Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s