En toen ging de computer zelf leren

Sunday, May 1, 2016

En toen ging de computer zelf leren

Dit artikel is gepubliceerd in NRC Handelsblad van 30 april 2016.

In maart versloeg computer AlphaGo de beste menselijke go-speler van de afgelopen tien jaar met

4-1. Waar de go-wereld stomverbaasd was, was de wereld van de kunstmatige intelligentie (artificial intelligence, kortweg A.I.) dat veel minder. “Als AI-wetenschappers snappen wij dat zelflerende computers in korte tijd veel vooruitgang kunnen boeken”, zegt hoogleraar machine learning Max Welling van de Universiteit van Amsterdam. “AlphaGo heeft razendsnel geleerd van partijen tussen menselijke top-spelers, maar vooral ook van het eindeloos spelen tegen zichzelf.”

Computers die zelf leren van informatie die wij ze geven, zijn hot. Google, Facebook, Apple, Amazon, Netflix, Yahoo, IBM…allemaal gebruiken ze zelflerende computeralgoritmen. “Zelflerende algoritmen zitten in zoveel producten die gewone mensen dagelijks gebruiken, dat het in ons eigen belang is om te weten hoe ze werken”, zegt de Amerikaanse hoogleraar informatica Pedro Domingos van de Universiteit van Washington. Met dat doel voor ogen publiceerde Domingos eind vorig jaar het populair-wetenschappelijke boek The Master Algorithm - How the quest for the ultimate machine learning will remake our world.

“Het is net als met auto rijden”, vertelt hij aan de telefoon. “Je hoeft niet te weten hoe de motor precies werkt, maar je moet wel weten waar het stuur en de pedalen zitten en hoe je ze moet gebruiken. Maar helaas, als het om lerende algoritmen gaat, weten mensen niet eens waar het stuur en de pedalen zitten. Hoeveel mensen weten dat de Google Chrome-browser een incognito modus heeft waarmee je op het web kunt zoeken zonder dat je zoekgedrag wordt gevolgd?”

Genoeg reden om zowel Domingos als Welling zes vragen over zelflerende computers voor te leggen.

Hebben zelflerende computers voor een revolutie in de kunstmatige intelligentie gezorgd of is het eerder evolutie?

“Revolutie”, antwoordt Domingos resoluut. “Dankzij de grote hoeveelheden beschikbare data, de grote computerkracht en betere algoritmen is de laatste jaren veel vooruitgang geboekt. Lerende algoritmen automatiseren de automatisering. Dat is revolutionair. Daarnaast zien bedrijven de grote economische waarde. Zij vragen om de beste onderzoekers en dat stimuleert het vakgebied. Volgens Bill Gates heeft een grote doorbraak in machine learning de waarde van tien Microsofts.”

Welling beaamt dat de ontwikkelingen in een stroomversnelling zitten, maar aarzelt bij het woord ‘revolutie’. “Voor de buitenwereld zien de ontwikkelingen er sneller uit dan wanneer je als onderzoeker in het veld zit. Het idee van neurale netwerken gaat al terug tot 1943. In de decennia daarna zijn ze door opeenvolgende fasen van hoop en teleurstelling gegaan. In de vorm van Deep Learning maken ze nu een succesvolle comeback, onder andere door de go-spelende computer. Deep Learning is nu de hype. Maar straks is het laag hangende fruit geplukt en dan gaat de vooruitgang wellicht een stuk minder snel. Het grote verschil met vroeger is echter dat zelflerende algoritmen nu ook door de industrie worden omarmd. Daardoor zullen ze niet meer verdwijnen zoals eerder wel is gebeurd. Bedrijven zullen er in blijven investeren.”

Wat kunnen zelflerende computers al?

“Zelflerende algoritmen zijn goed in het classificeren van dingen”, zegt Welling. “Ze worden nu succesvol toegepast in het herkennen van spraak, het herkennen en segmenteren van foto’s en in het omgaan met natuurlijke taal. Denk aan automatisch vertalen en vraag-antwoord-systemen.”

Domingos voegt daar nog drie voorbeelden aan toe: het aanbevelen van producten, zoals Amazon en Netflix doen, maar ook het stellen van medische diagnoses en het voorspellen van beurskoersen. “In het algemeen zijn zelflerende algoritmen goed voor problemen die mensen niet met exact geformuleerde regels kunnen oplossen”, zegt Domingos. “We kunnen heel moeilijk in regels vatten hoe we auto rijden, maar we kunnen computers wel leren om auto te rijden door te kijken hoe mensen dat doen. Medische diagnoses worden gesteld door hooggekwalificeerde artsen, maar zelflerende algoritmen kunnen dat op veel terreinen nu al sneller en beter. Dat de medische wereld ze nog niet massaal gebruikt, komt vooral door terughoudendheid van artsen.”

AlphaGo gebruikte Deep Learning om de beste menselijke speler te verslaan. Is Deep Learning dé oplossing voor zelflerende computers?

“Nee”, zegt Domingos. “Deep Learning heeft fundamentele beperkingen. Het kan niet redeneren met symbolen. Het heeft geen gezond verstand. Het kan geen kennis combineren op een manier die nooit eerder is gedaan. Deep Learning is goed voor waarnemingsproblemen op een basaal niveau, maar niet voor hogere niveaus van intelligentie. Behalve Deep Learning zijn er nog andere manieren om computers te laten leren. Deep Learning boekt momenteel de snelste vooruitgang en de meest indrukwekkende resultaten. Maar als we op de geschiedenis afgaan, dan kan over tien jaar net zo goed een ander leeralgoritme aan de winnende hand lijken. Ik ben ervan overtuigd dat er een Grand Unified Theorie van de diverse lerende algoritmen bestaat, een Master Algorithm.”

Ook Welling ziet in Deep Learning niet de ultieme oplossing. “AlphaGo versloeg dan wel de beste menselijke speler, maar de computer heeft Deep Learning heel specifiek voor go toegepast. Ik geloof ook niet zozeer in één enkel algoritmen dat alle problemen efficiënt oplost. Deep Learning werkt goed bij de analyse van beeld en spraak, maar voor het begrijpen van enorme hoeveelheden tekst zijn symbolische representaties weer erg nuttig. Bijvoorbeeld IBM Watson gebruikt deze technologie.”

Wat kunnen zelflerende computers nu nog niet, maar wel over tien jaar?

“Ik verwacht dat zelflerende computers ons gaan helpen bij het razendsnel zoeken en analyseren van jurisprudentie en medische literatuur”, zegt Welling. “Straks kan ik aan een computer vragen: ‘Dit is mijn juridische zaak. Zoek daar de juiste jurisprudentie bij’. Een zelflerende computer kan straks op basis van alle beschikbare medische literatuur ook sneller dan een menselijke arts de diagnose van een zeldzame ziekte stellen.”

Daarnaast verwacht Welling steeds betere vraag-antwoordsystemen die bijvoorbeeld een gesprek met een consument kunnen aangaan wanneer een bepaald product het niet blijkt te doen. “Zulke systemen zullen vakkennis combineren met het begrijpen van de vragen die de consument ze stelt.”

“Ik verwacht ook dat de zelfrijdende auto steeds meer een zelflerende auto wordt. Nu al kan een zelfrijdende auto bijvoorbeeld herkennen wanneer hij wel of niet kan inhalen, maar straks zal een zelfrijdende auto ook de intenties van andere weggebruikers herkennen. Wil die voetganger oversteken of niet? Heeft die fietser mij wel of niet gezien? Dat soort inschattingen.”

“In de financiële dienstensector zullen computers steeds vaker zelf beslissingen gaan nemen: Wat is de kans dat jij een bepaalde lening gaat terugbetalen? Op basis daarvan beslist het systeem welke lening jij kunt krijgen.”

Pedro Domingos ziet een toekomst voor zich waarin iedereen zijn eigen zelflerende digitale assistent heeft: “Zoiets als Google Now, maar dan veel slimmer. Zo’n virtuele assistent leert van alle data die jij genereert en helpt je bij het zoeken naar alles wat je maar wilt: films, boeken, huizen, vakanties, dates, banen, opleidingen…Alle grote bedrijven zoals Google, Amazon en Facebook werken hier aan. Ik zou graag zo’n 360-graden-model van mijzelf willen hebben, maar ik wil tegelijkertijd ook dat ik daar zelf controle over heb.”

Wat is de heilige graal van zelflerende computers?

“Wat computers echt nog niet kunnen”, zegt Welling, “is het zelf formuleren van vragen en hypothesen over de wereld en dan de acties plannen die nodig zijn om deze informatie te vergaren. Met andere woorden: het autonoom de wereld leren ontdekken en deze op een diep semantisch niveau begrijpen.”

Een andere heilige graal is voor Welling het leren van alle medische gegevens. “De gezondheidszorg zou een sprong voorwaarts maken wanneer zelflerende algoritmen alle gezondheidsdata ter wereld zouden kunnen gebruiken. Om de privacy van mensen te beschermen, kunnen we daar nu niet bij. Maar dat houdt de vooruitgang tegen. Daarom denk ik dat de volgende revolutie gaat komen van algoritmen die geen informatie over het individu prijsgeven maar toch alle data kunnen gebruiken.”

Pedro Domingos noemt de thuisrobot en het genezen van kanker als heilige gralen. “Een robot voor in huis moet alle vaardigheden hebben die een mens ook heeft. Dat is een heel diep leerprobleem dat we nog lang niet hebben opgelost.”

“Voor het genezen van kanker hebben we een gedetailleerd model nodig van de werking van het lichaam. Kanker is niet één ziekte, omdat elke tumor anders is. Uiteindelijk zullen computers in staat zijn om op basis van alle data over tumoren, cellen en genen te leren welk geneesmiddel welke patiënt kan genezen. De spannendste ontwikkeling vind ik lerende algoritmen die zelf nieuwe wetenschappelijke kennis ontdekken, zoals in de biologie al aan het gebeuren is.”

Wat zijn de gevaren van computers die beter kunnen leren dan mensen?

“Google zegt dat ze de derde helft van ons brein willen worden”, zegt Domingos, “maar ik wil niet dat die derde helft me alleen maar advertenties laat zien. Als één bedrijf zoveel data van je bezit, wordt het ook heel moeilijk om over te stappen naar een ander bedrijf. Want wat gebeurt er dan met je data? In het huidige model ben je die kwijt. We hebben behoefte aan een nieuw soort bedrijven aan wie we onze data kunnen toevertrouwen, zoals we geld aan een bank toevertrouwen. Zo’n bedrijf bouwt een virtueel model van jou op basis van je data, maar je kunt het wel zelf corrigeren en beslissen wat er wel en niet met de data mag gebeuren. In de komende vijf tot tien jaar hebben we de kans om het huidige model te veranderen. Consumenten moeten op veranderingen aandringen, bedrijven moeten transparanter worden wat ze met onze data doen en wetenschappers en ingenieurs moeten technologie ontwikkelen die consumenten meer controle over hun data geven.”

Welling denkt dat we het privacy-probleem wel gaan oplossen maar maakt zich de grootste zorgen over de werkgelegenheid. “Banen komen op de tocht te staan, zelfs die van hoogopgeleide mensen als advocaten en artsen. De maatschappij zal snel veranderen. Daar moet het onderwijs en de arbeidsmarkt op inspelen. We moeten leren om met de nieuwe mogelijkheden ons eigen werk te creëren, maar dat zal niet iedereen lukken. Daarom ben ik ook een voorstander van een basisinkomen. Dat geeft ze de ruimte om nieuwe initiatieven te ontplooien.”

De kans dat een Master Algorithm de wereld overneemt, noemt Domingos overigens “nul”. “Computers hebben geen eigen wil. Ze zijn de producten van ingenieurs en wetenschappers, niet van de evolutie. Iedereen is zo bang dat computers heel slim worden en de wereld overnemen, terwijl de realiteit is dat computers heel dom zijn en de wereld hebben overgenomen. Het zou beter zijn wanneer ze slimmer zouden zijn. Zelfs een extreem krachtige computer is nog steeds een verlengstuk van onze wil. Het is niet mens versus machine, het is ‘mens met machine’ versus ‘mens zonder machine’. De toekomst is aan degenen die het beste van hun eigen expertise combineren met wat computeralgoritmen het beste kunnen.”

--------------------------------------------------------

Hoe leren computers?

Grofweg gezegd kunnen computers op vijf verschillende manieren zelf leren van data die wij ze geven, zo beschrijft Pedro Domingos in zijn boek The Master Algorithm. Elke manier heeft zijn eigen voor- en nadelen. Welke aanpak in de praktijk het beste werkt, hangt van het type leerprobleem af.

Redeneren op basis van symbolen

Symbolisten geloven dat leren gebeurt door het manipuleren van symbolen, op dezelfde manier als wiskundigen en logici met symbolen redeneren.

Brein nabootsen
Connectionisten geloven dat leren gebeurt zoals onze hersenen dat doen: het trainen van een netwerk van neuronen waarbij verbindingen tussen neuronen sterker of zwakker worden. De grote computerkracht van tegenwoordig maakt neurale netwerken met tientallen tot wel duizend lagen mogelijk, zogeheten diepe neurale netwerken. Deze blijken veel succesvoller dan neurale netwerken met slechts enkele lagen. Deep Learning is daarom op het moment de belangrijkste troef van deze stroming.

Evolutie nabootsen

Evolutionisten geloven dat natuurlijke selectie aan de basis ligt van leren. Genetische algoritmen laten computerprogramma’s evolueren net zoals natuurlijke selectie organismen laat evolueren.

Bayesiaans redeneren

Bayesianen geloven dat alle kennis een bepaalde mate van onzekerheid heeft en dat leren een vorm is van redeneren met onzekerheid. Het theorema van Bayes drukt wiskundig uit hoeveel sterker of zwakker nieuwe gegevens een redenering maken.

Redeneren op basis van analogieën

Volgens aanhangers van deze stroming leren we op basis van het herkennen van overeenkomsten tussen verschillende situaties: als twee patiënten dezelfde symptomen hebben, hebben ze waarschijnlijk ook dezelfde ziekte.

Tussen deze vijf stromingen vindt ook kruisbestuiving plaats. Zo kan bijvoorbeeld Deep Learning met Bayesiaans redeneren worden gecombineerd. Pedro Domingos denkt dat er een Master Algorithm bestaat dat alle vijf de verschillende aanpakken in zich verenigt, een soort Theorie van Alles op het terrein van zelflerende computers. Het doel van zo’n Master Algorithm is om uit de beschikbare informatie alles te leren wat er maar te leren valt.

Honors and Awards

Nomination Eureka book Prize 2008
My book OPGELOST - Toepassingen van wiskunde en informatica (which translates as SOLVED - Applications of mathematics and informatics) was nominated for the Eureka book Prize 2008, for the best popular science book.

Amundsen Competition 2007
In december 2007 I was one of fourteen winners in the Amundsen Competition, an essay competiton organised by the World Federation of Science Journalists for the International Polar Year 2007/2008. The price is a two-weeks trip on board of the Arctic Polar Icebreaker ‘Amundsen’ to the North Pole Area (April 24 - May 8, 2008).

See my weblog: in Dutch or in English

Eureka!-award 2003 for the 2002-editorial board of Natuur & Techniek, for the best media achievement in the field of the public understanding of science in the Netherlands. I was part of the board at that time.

‘Friend of Poland’-award 2003 for two articles: a travel article about Krakow in the ANWB-monthly travel magazine Reizen (july/august 2002) and a biology-article on the primeval forest Bialowieza in the east of Poland, for the scientific monthly Natuur & Techniek (march 2003). The international contest for journalists was organised by Radio Polonia and the Polish Organisation for Tourism in Warsaw.

Quotes

The world looks so different after learning science

Richard Feynman

Science is a way of trying not to fool yourself. The first principle is that you must not fool yourself, and you are the easiest person to fool.

Richard Feynman

Wat is wetenschap? Wetenschap is de titanische poging van het menselijk intellect zich uit zijn kosmische isolement te verlossen door te begrijpen!

Professor Nummedal in de roman Nooit meer slapen van W.F. Hermans

We cook the facts. There are many different techniques for collecting, interpreting and analysing facts, and different techniques often lead to different conclusions, which is why scientists can disagree...When facts challenge our favoured conclusions, we scrutinize them more carefully and subject them to more rigourous analysis.

Psychologist Daniel Gilbert in Stumbling on happiness

The brain is wider than the sky,
For, put them side by side,
The one the other will include
With ease, and you beside.

Emily Dickinson

‘Who are YOU?’ said the Caterpillar. This was not an encouraging opening for a conversation. Alice replied, rather shyly, ‘I – I hardly know, sir, just at present – at least I know who I WAS when I got up this morning, but I think I must have been changed several times since then.’

Alice in Wonderland, Lewis Carroll

Want de ruimte en hij die er vrij doorheen trekt, die zijn de enige ware, dat is het leven, en alles wat op een plaats is versteend en langzaam tot stof vergaat, is dood van den beginne af aan.

J. Slauerhoff

Don't see the world as a market, but rather a place that people live in - you are designing for people, not machines.

Red Burns

Van alle dingen die de mensheid zich sinds haar ontstaan eigen heeft gemaakt, is wetenschap verreweg de meest succesvolle en productieve.

Michio Kaku