Als de Chinese regering met deze software anderhalf miljard Chinezen uit mekaar kan houden, kan het dan ook Brigitte Macron herkennen?

Pressibus begon al heel vroeg met het vergelijken van foto’s door middel van de Betaface software.
Een tijdje later kocht Xavier Poussard voor zijn eigen vergelijkingen Megvii’s  Face++ software, één van de beste producten toen op de markt, en gebruikt door de Chinese overheid.

De twee programma’s geven verschillende resultaten voor dezelfde vergelijkingen, maar er kunnen toch duidelijk conclusies getrokken worden, zeker van de Face++  vergelijkingen. Natuurlijk zijn het geen toverstokjes waarmee de hele waarheid ineens bewezen is, en om hun waarde te begrijpen moeten we hetvolgende voor ogen houden:

  • gezichtsherkenning werkt door de afstanden tussen een heel aantal gezichtspunten te vergelijken, vooral de punten die de botstructuur laten zien, omdat die alleen door ingrijpende operaties of ernstige ongevallen gewijzigd wordt
  • de resultaten zijn erg afhankelijk van de kwaliteit van de foto: de beste manier om gezichtsherkenning te gebruiken is door recht in de camera te kijken, zoals voor pasfoto’s verplicht is
  • dat betekent dus dat hoe meer we iemand in profiel zien, hoe minder de foto geschikt is voor gezichtsherkenning
  • het betekent ook dat wanneer iemand een bril draagt, de foto bijna niet meer te gebruiken is: de bril bedekt een heel groot deel van het gezicht, en vooral de jukbeenderen, de oogkassen, de wenkbrouwen, de ogen en de neusbasis, die cruciale punten zijn voor een goeie herkenning
  • vergelijkingen tussen volwassenen de beste resultaten geven, wat nogal vanzelfsprekend is: de schedel is dan volledig gevormd en verandert dan normaal niet meer
  • de resultaten zijn geen sluitend bewijs maar een duidelijke indicatie, en eerder in de negatieve zin: het is gemakkelijker aan te tonen dat iemand niet de persoon op een andere foto is, dan dat hij of zij daadwerkelijk dezelfde persoon in een andere foto is
  • het is geweten dat Brigitte Macron een chirurgische ingreep heeft gehad door een chirurg die gespecialiseerd is in “vervrouwelijking van het gezicht”, wat vermoedelijk de vorm van haar schedelbeenderen heeft gewijzigd

De Betaface resultaten zijn minder betrouwbaar dan de resulaten met Face++ .
Xavier Poussard gaat ervan uit dat deze resultaten vaststaan:

Pressibus stelt terecht vragen bij het feit dat Xavier Poussard beweert dat Face++ geen gezichten met brillen kan herkennen, terwijl het gebruikt wordt door de Chinses regering om anderhalf miljard Chinezen te herkennen. Als dit programma gebruikt wordt om te weten wie er op de alomtegenwoordige bewakingscamera’s te zien is, dan kunnen brillen natuurlijk geen probleem zijn. Want miljoenen Chinezen dragen een bril, en kunnen die dan niet herkend worden? Dat zou dan ook meteen betekenen dat het genoeg is om een bril op te zetten om niet meer door het systeem herkend te worden. Dat is duidelijk absurd. De informatie op het internet geeft Pressibus gelijk en zegt dat het dragen van een bril het programma niet onbruikbaar maakt, en dat het effectief mensen met een bril kan herkennen.

Maar bij een doorsnee prikklok met gezichtsherkenning moeten mensen inderdaad hun bril afdoen om gemakkelijk herkend te worden door de machine. Natuurlijk is de software in die machines niet van hetzelfde niveau als Face++.

Misschien is het belangrijkste punt hier dat we verschillende taken aan het vergelijken zijn. Gezichtsherkenning wordt eigenlijk altijd ‘in levenden lijve’ gebruikt, of met videobeelden. Met andere woorden: het wordt gebruikt met bewegende gezichten, die verschillende kanten van het gezicht van één enkele persoon laten zien. We kunnen veronderstellen dat de Chinese overheid een database heeft met daarin de gezichten van de overgrote meerderheid van de burgers, opgeslagen als 3D modellen. Deze database is dan de basis om wat er op de camera’s te zien is te vergelijken.

Foto’s geven daarentegen maar één vast beeld van een bepaald gezicht, waardoor de software het gezicht niet van verschillende kanten kan bekijken.
Hoe men het ook draait of keert, dat blijft een groot verschil. Bij het toevoegen van een nieuw gezicht in de prikklok moet de persoon zijn hoofd zachtjes in alle richtingen bewegen zodat het vanuit verschillende gezichtshoeken bekeken kan worden en een soort van 3D model opgeslagen kan worden, dat dan later gebruikt wordt om de persoon te herkennen met verschillende belichtingen of in andere houdingen.

Wanneer die software dan gebruikt wordt om twee foto’s te vergelijken, zonder enige database met referentiefoto’s of een 3D model, dan is dat wel een heel andere taak. En eigenlijk niet de taak waarvoor de software gemaakt was. Het lijkt dus normaal om aan te nemen dat hoe een programma functioneert wanneer het foto’s vergelijkt of wanneer het bewegende gezichten vergelijkt met een bepaald gegevensbestand.

Al deze aspekten moeten meegerekend worden, en ieder mag voor zichzelf beslissen welke waarde hij of zij aan de resultaten van de gezichtsherkenningsvergelijkingen wil hechten.
Logischerwijs zou het het best zijn te beginnen met heel veel testen van foto’s van gekende personen waarvan men dan op voorhand weet wie ze zijn, om zo ervaring op te doen met de vergelijkingsresultaten: wanneer men een hele reeks resultaten heeft gezien van vergelijkingen met heel verschillende foto’s (zwart/wit tov kleur, profiel tov rechtaan, jong tov oud, bril tov geen bril enz.) zou men moeten kunnen inschatten wat de software kan herkennen en wat niet, en de percentages dus beter kunnen valideren.