Bennie Mols - Wetenschapsjournalist, schrijver, spreker, moderator @ ClearScience42: April 2021

Friday, April 2, 2021

Miljoenen gezichten zijn weggegeven aan het Wilde Westen

In vijftig jaar tijd zijn we de controle over onze digitale gezichten kwijtgeraakt. Veel gebruikte dataverzamelingen leiden tot fouten, discriminatie en privacyschending bij automatische gezichtsherkenning.

Dit artikel is gepubliceerd in NRC Handelsblad van zaterdag 3 april 2021 (online reeds op 2 april)

Heb je tussen 2004 en 2020 foto’s van je vakantie of je feest geüpload naar de populaire website Flickr, dan is de kans groot dat de gezichten op die foto’s zijn gebruikt voor het verbeteren van AI-technologie die automatisch gezichten herkent. En die technologie kan door universiteiten, bedrijven en zelfs voor defensie- of surveillance-gerelateerde toepassingen zijn gebruikt. Het toont een van de vele problemen met dataverzamelingen die worden gebruikt voor het trainen van gezichtsherkenningssoftware.

Afgelopen januari lanceerden de onderzoekers en kunstenaars Adam Harvey en Jules LaPlace het project Exposing.ai om het probleem met de Flickr-foto’s aan de kaak te stellen. Exposing.ai is een zoekmachine waarmee je kunt kijken of jouw Flickr-foto’s zijn gebruikt in enkele van de wereldwijd meest gebruikte gezichtsdataverzamelingen. Zo ontdekte de Amerikaanse documentaire filmmaker Brett Gaylor dat honderden van zijn trouwfoto’s die hij in 2006 op Flickr had geplaatst anno 2021 ongevraagd in talloze veel gebruikte dataverzamelingen rondspoken. Gaylor kwam er zelfs achter dat zijn foto’s gebruikt zijn voor het trainen van gezichtsherkenningssystemen die de Chinese overheid inzet voor het in de gaten houden van de Oeigoerse moslimminderheid. De Amerikaan maakt nu een documentaire over het onverwachte lot van zijn trouwfoto’s.

Vorig jaar ontstond opschudding over het Amerikaanse bedrijf Clearview.AI dat zonder toestemming miljarden foto’s van gezichten van sociale media haalde en beweert bijna iedereen die ooit foto’s heeft geüpload te kunnen herkennen, ongeacht afkomst. Inmiddels lopen in de VS diverse rechtszaken tegen het bedrijf. Harvey en LaPlace hopen dat hun project bijdraagt aan het stoppen van het zonder toestemming verzamelen van gezichtsfoto’s van internet.

Hoe omvangrijk zijn de problemen bij het verzamelen van data voor het trainen automatische gezichtsherkenning? Hoe zijn de problemen ontstaan? En vooral: hoe zijn ze op te lossen?

Lees het hele artikel op de website van NRC Handelsblad.

------------------------------------------------------------------------------------------------------------------

Een korte geschiedenis van gezichtsherkenning

Fase 1: Academische pioniersfase (1964-1995): Handmatig aanleggen van databases met toestemming van de gefotografeerde personen.

Fase 2: Begin van commerciële toepassingen (1996-2006): De in 1996 vrijgegeven gezichtsdatabase FERET (gefinancierd door het Amerikaanse Ministerie van Defensie) vormt een stimulans voor academische en commerciële gezichtsherkenning.

2001 — De terroristische aanslagen van 11 september geven een grote impuls aan automatische gezichtsherkenning. De stad New York installeert kort na de aanslagen duizenden camera’s in de publieke ruimte.

Fase 3: Gezichtsherkenning wordt mainstream (2007-2013): In 2007 wordt de dataset ‘Labeled Faces in the Wild’ (University of Massachusetts, Amherst) publiek gemaakt. Voor het aanleggen van LFW werd het web afgestruind en werden zonder toestemming foto’s verzameld van o.a. Google, Flickr en Yahoo. Begin van een wildwestperiode van dataverzameling.

2010 — Facebook introduceert de functie ‘tag suggestions’ die de namen van vrienden voorstelt die voorkomen op Facebook-foto’s

Fase 4: Doorbraak van Deep Learning op willekeurige datasets (2014-nu): Het DeepFace-model van Facebook, gebaseerd op de toen net doorgebroken deep learning-technologie, verbetert gezichtsherkenning sterk. Toenemende zorgen over schending van privacy, bias en discriminatie in de toepassing van gezichtsherkenning.

2015 — Google Photos labelt een foto van een zwarte jongen en een zwart meisje als ‘gorilla’s’.

2018 — Joy Buolamwini en Timnit Gebru ontdekken dat een veel gebruikte dataverzameling voor 75% mannelijke gezichten bevat en voor 80% gezichten van witte mensen. Dat leidt tot discriminatie van zwarte mensen.

2018 — In een test van Amazon Rekognition worden 28 Amerikaanse congresleden onterecht voor gearresteerde criminelen aangezien.

2019 — Als eerste stad in de VS verbiedt San Francisco het gebruik van gezichtsherkenning in het publieke domein.

2020 — Opschudding over het bedrijf Clearview.AI, dat zonder toestemming miljarden foto’s van gezichten van sociale mediaplatforms als Facebook en Instagram haalde. Het bedrijf beweert dat zijn algoritme veel beter is dan alle andere op de markt.

2020 — IBM, Amazon en Microsoft besluiten de ontwikkeling van gezichtsherkenningssoftware op een laag pitje te zetten totdat er een wettelijke basis bestaat die de mensenrechten waarborgt.

2020 — Opschudding rond de toepassing PULSE die korrelige foto’s omzet in scherpe foto’s maar daarbij van zwarte mensen witte mensen maakt.

2021 — Onderzoekers vervagen uit privacy-overwegingen 243.000 gezichten in de veel gebruikte beelddataset ImageNet, bestaande uit 1,5 miljoen foto’s.

2021 — De Raad van Europa pleit voor strikte regulering gezichtsherkenning in de EU-landen. Toepassing van gezichtsherkenning door bedrijven in winkelcentra, voor marketing en voor beveiliging zou verboden moeten worden.

Subscribe to: Posts (Atom)

Honors and Awards

Nomination Eureka book Prize 2008
My book OPGELOST - Toepassingen van wiskunde en informatica (which translates as SOLVED - Applications of mathematics and informatics) was nominated for the Eureka book Prize 2008, for the best popular science book.

Amundsen Competition 2007
In december 2007 I was one of fourteen winners in the Amundsen Competition, an essay competiton organised by the World Federation of Science Journalists for the International Polar Year 2007/2008. The price is a two-weeks trip on board of the Arctic Polar Icebreaker ‘Amundsen’ to the North Pole Area (April 24 - May 8, 2008).

See my weblog: in Dutch or in English

Eureka!-award 2003 for the 2002-editorial board of Natuur & Techniek, for the best media achievement in the field of the public understanding of science in the Netherlands. I was part of the board at that time.

‘Friend of Poland’-award 2003 for two articles: a travel article about Krakow in the ANWB-monthly travel magazine Reizen (july/august 2002) and a biology-article on the primeval forest Bialowieza in the east of Poland, for the scientific monthly Natuur & Techniek (march 2003). The international contest for journalists was organised by Radio Polonia and the Polish Organisation for Tourism in Warsaw.

Quotes

The world looks so different after learning science

Richard Feynman

Science is a way of trying not to fool yourself. The first principle is that you must not fool yourself, and you are the easiest person to fool.

Richard Feynman

Wat is wetenschap? Wetenschap is de titanische poging van het menselijk intellect zich uit zijn kosmische isolement te verlossen door te begrijpen!

Professor Nummedal in de roman Nooit meer slapen van W.F. Hermans

We cook the facts. There are many different techniques for collecting, interpreting and analysing facts, and different techniques often lead to different conclusions, which is why scientists can disagree...When facts challenge our favoured conclusions, we scrutinize them more carefully and subject them to more rigourous analysis.

Psychologist Daniel Gilbert in Stumbling on happiness

The brain is wider than the sky,
For, put them side by side,
The one the other will include
With ease, and you beside.

Emily Dickinson

‘Who are YOU?’ said the Caterpillar. This was not an encouraging opening for a conversation. Alice replied, rather shyly, ‘I – I hardly know, sir, just at present – at least I know who I WAS when I got up this morning, but I think I must have been changed several times since then.’

Alice in Wonderland, Lewis Carroll

Want de ruimte en hij die er vrij doorheen trekt, die zijn de enige ware, dat is het leven, en alles wat op een plaats is versteend en langzaam tot stof vergaat, is dood van den beginne af aan.

J. Slauerhoff

Don't see the world as a market, but rather a place that people live in - you are designing for people, not machines.

Red Burns

Van alle dingen die de mensheid zich sinds haar ontstaan eigen heeft gemaakt, is wetenschap verreweg de meest succesvolle en productieve.

Michio Kaku