Sunday, May 1, 2016

En toen ging de computer zelf leren

Dit artikel is gepubliceerd in NRC Handelsblad van 30 april 2016.


In maart versloeg computer AlphaGo de beste menselijke go-speler van de afgelopen tien jaar met 
4-1. Waar de go-wereld stomverbaasd was, was de wereld van de kunstmatige intelligentie (artificial intelligence, kortweg A.I.) dat veel minder. “Als AI-wetenschappers snappen wij dat zelflerende computers in korte tijd veel vooruitgang kunnen boeken”, zegt hoogleraar machine learning Max Welling van de Universiteit van Amsterdam. “AlphaGo heeft razendsnel geleerd van partijen tussen menselijke top-spelers, maar vooral ook van het eindeloos spelen tegen zichzelf.”

Computers die zelf leren van informatie die wij ze geven, zijn hot. Google, Facebook, Apple, Amazon, Netflix, Yahoo, IBM…allemaal gebruiken ze zelflerende computeralgoritmen. “Zelflerende algoritmen zitten in zoveel producten die gewone mensen dagelijks gebruiken, dat het in ons eigen belang is om te weten hoe ze werken”, zegt de Amerikaanse hoogleraar informatica Pedro Domingos van de Universiteit van Washington. Met dat doel voor ogen publiceerde Domingos eind vorig jaar het populair-wetenschappelijke boek The Master Algorithm - How the quest for the ultimate machine learning will remake our world.

“Het is net als met auto rijden”, vertelt hij aan de telefoon. “Je hoeft niet te weten hoe de motor precies werkt, maar je moet wel weten waar het stuur en de pedalen zitten en hoe je ze moet gebruiken. Maar helaas, als het om lerende algoritmen gaat, weten mensen niet eens waar het stuur en de pedalen zitten. Hoeveel mensen weten dat de Google Chrome-browser een incognito modus heeft waarmee je op het web kunt zoeken zonder dat je zoekgedrag wordt gevolgd?”

Genoeg reden om zowel Domingos als Welling zes vragen over zelflerende computers voor te leggen.

Hebben zelflerende computers voor een revolutie in de kunstmatige intelligentie gezorgd of is het eerder evolutie?

“Revolutie”, antwoordt Domingos resoluut. “Dankzij de grote hoeveelheden beschikbare data, de grote computerkracht en betere algoritmen is de laatste jaren veel vooruitgang geboekt. Lerende algoritmen automatiseren de automatisering. Dat is revolutionair. Daarnaast zien bedrijven de grote economische waarde. Zij vragen om de beste onderzoekers en dat stimuleert het vakgebied. Volgens Bill Gates heeft een grote doorbraak in machine learning de waarde van tien Microsofts.”

Welling beaamt dat de ontwikkelingen in een stroomversnelling zitten, maar aarzelt bij het woord ‘revolutie’. “Voor de buitenwereld zien de ontwikkelingen er sneller uit dan wanneer je als onderzoeker in het veld zit. Het idee van neurale netwerken gaat al terug tot 1943. In de decennia daarna zijn ze door opeenvolgende fasen van hoop en teleurstelling gegaan. In de vorm van Deep Learning maken ze nu een succesvolle comeback, onder andere door de go-spelende computer. Deep Learning is nu de hype. Maar straks is het laag hangende fruit geplukt en dan gaat de vooruitgang wellicht een stuk minder snel. Het grote verschil met vroeger is echter dat zelflerende algoritmen nu ook door de industrie worden omarmd. Daardoor zullen ze niet meer verdwijnen zoals eerder wel is gebeurd. Bedrijven zullen er in blijven investeren.”

Wat kunnen zelflerende computers al?

“Zelflerende algoritmen zijn goed in het classificeren van dingen”, zegt Welling. “Ze worden nu succesvol toegepast in het herkennen van spraak, het herkennen en segmenteren van foto’s en in het omgaan met natuurlijke taal. Denk aan automatisch vertalen en vraag-antwoord-systemen.”

Domingos voegt daar nog drie voorbeelden aan toe: het aanbevelen van producten, zoals Amazon en Netflix doen, maar ook het stellen van medische diagnoses en het voorspellen van beurskoersen. “In het algemeen zijn zelflerende algoritmen goed voor problemen die mensen niet met exact geformuleerde regels kunnen oplossen”, zegt Domingos. “We kunnen heel moeilijk in regels vatten hoe we auto rijden, maar we kunnen computers wel leren om auto te rijden door te kijken hoe mensen dat doen. Medische diagnoses worden gesteld door hooggekwalificeerde artsen, maar zelflerende algoritmen kunnen dat op veel terreinen nu al sneller en beter. Dat de medische wereld ze nog niet massaal gebruikt, komt vooral door terughoudendheid van artsen.”

AlphaGo gebruikte Deep Learning om de beste menselijke speler te verslaan. Is Deep Learning dé oplossing voor zelflerende computers?

“Nee”, zegt Domingos. “Deep Learning heeft fundamentele beperkingen. Het kan niet redeneren met symbolen. Het heeft geen gezond verstand. Het kan geen kennis combineren op een manier die nooit eerder is gedaan. Deep Learning is goed voor waarnemingsproblemen op een basaal niveau, maar niet voor hogere niveaus van intelligentie. Behalve Deep Learning zijn er nog andere manieren om computers te laten leren. Deep Learning boekt momenteel de snelste vooruitgang en de meest indrukwekkende resultaten. Maar als we op de geschiedenis afgaan, dan kan over tien jaar net zo goed een ander leeralgoritme aan de winnende hand lijken. Ik ben ervan overtuigd dat er een Grand Unified Theorie van de diverse lerende algoritmen bestaat, een Master Algorithm.”

Ook Welling ziet in Deep Learning niet de ultieme oplossing. “AlphaGo versloeg dan wel de beste menselijke speler, maar de computer heeft Deep Learning heel specifiek voor go toegepast. Ik geloof ook niet zozeer in één enkel algoritmen dat alle problemen efficiënt oplost. Deep Learning werkt goed bij de analyse van beeld en spraak, maar voor het begrijpen van enorme hoeveelheden tekst zijn symbolische representaties weer erg nuttig. Bijvoorbeeld IBM Watson gebruikt deze technologie.”

Wat kunnen zelflerende computers nu nog niet, maar wel over tien jaar?

“Ik verwacht dat zelflerende computers ons gaan helpen bij het razendsnel zoeken en analyseren van jurisprudentie en medische literatuur”, zegt Welling. “Straks kan ik aan een computer vragen: ‘Dit is mijn juridische zaak. Zoek daar de juiste jurisprudentie bij’. Een zelflerende computer kan straks op basis van alle beschikbare medische literatuur ook sneller dan een menselijke arts de diagnose van een zeldzame ziekte stellen.”

Daarnaast verwacht Welling steeds betere vraag-antwoordsystemen die bijvoorbeeld een gesprek met een consument kunnen aangaan wanneer een bepaald product het niet blijkt te doen. “Zulke systemen zullen vakkennis combineren met het begrijpen van de vragen die de consument ze stelt.”

“Ik verwacht ook dat de zelfrijdende auto steeds meer een zelflerende auto wordt. Nu al kan een zelfrijdende auto bijvoorbeeld herkennen wanneer hij wel of niet kan inhalen, maar straks zal een zelfrijdende auto ook de intenties van andere weggebruikers herkennen. Wil die voetganger oversteken of niet? Heeft die fietser mij wel of niet gezien? Dat soort inschattingen.”

“In de financiële dienstensector zullen computers steeds vaker zelf beslissingen gaan nemen: Wat is de kans dat jij een bepaalde lening gaat terugbetalen? Op basis daarvan beslist het systeem welke lening jij kunt krijgen.”

Pedro Domingos ziet een toekomst voor zich waarin iedereen zijn eigen zelflerende digitale assistent heeft: “Zoiets als Google Now, maar dan veel slimmer. Zo’n virtuele assistent leert van alle data die jij genereert en helpt je bij het zoeken naar alles wat je maar wilt: films, boeken, huizen, vakanties, dates, banen, opleidingen…Alle grote bedrijven zoals Google, Amazon en Facebook werken hier aan. Ik zou graag zo’n 360-graden-model van mijzelf willen hebben, maar ik wil tegelijkertijd ook dat ik daar zelf controle over heb.”

Wat is de heilige graal van zelflerende computers?

“Wat computers echt nog niet kunnen”, zegt Welling, “is het zelf formuleren van vragen en hypothesen over de wereld en dan de acties plannen die nodig zijn om deze informatie te vergaren. Met andere woorden: het autonoom de wereld leren ontdekken en deze op een diep semantisch niveau begrijpen.”

Een andere heilige graal is voor Welling het leren van alle medische gegevens. “De gezondheidszorg zou een sprong voorwaarts maken wanneer zelflerende algoritmen alle gezondheidsdata ter wereld zouden kunnen gebruiken. Om de privacy van mensen te beschermen, kunnen we daar nu niet bij. Maar dat houdt de vooruitgang tegen. Daarom denk ik dat de volgende revolutie gaat komen van algoritmen die geen informatie over het individu prijsgeven maar toch alle data kunnen gebruiken.”

Pedro Domingos noemt de thuisrobot en het genezen van kanker als heilige gralen. “Een robot voor in huis moet alle vaardigheden hebben die een mens ook heeft. Dat is een heel diep leerprobleem dat we nog lang niet hebben opgelost.”

“Voor het genezen van kanker hebben we een gedetailleerd model nodig van de werking van het lichaam. Kanker is niet één ziekte, omdat elke tumor anders is. Uiteindelijk zullen computers in staat zijn om op basis van alle data over tumoren, cellen en genen te leren welk geneesmiddel welke patiënt kan genezen. De spannendste ontwikkeling vind ik lerende algoritmen die zelf nieuwe wetenschappelijke kennis ontdekken, zoals in de biologie al aan het gebeuren is.”

Wat zijn de gevaren van computers die beter kunnen leren dan mensen?

“Google zegt dat ze de derde helft van ons brein willen worden”, zegt Domingos, “maar ik wil niet dat die derde helft me alleen maar advertenties laat zien. Als één bedrijf zoveel data van je bezit, wordt het ook heel moeilijk om over te stappen naar een ander bedrijf. Want wat gebeurt er dan met je data? In het huidige model ben je die kwijt. We hebben behoefte aan een nieuw soort bedrijven aan wie we onze data kunnen toevertrouwen, zoals we geld aan een bank toevertrouwen. Zo’n bedrijf bouwt een virtueel model van jou op basis van je data, maar je kunt het wel zelf corrigeren en beslissen wat er wel en niet met de data mag gebeuren. In de komende vijf tot tien jaar hebben we de kans om het huidige model te veranderen. Consumenten moeten op veranderingen aandringen, bedrijven moeten transparanter worden wat ze met onze data doen en wetenschappers en ingenieurs moeten technologie ontwikkelen die consumenten meer controle over hun data geven.”

Welling denkt dat we het privacy-probleem wel gaan oplossen maar maakt zich de grootste zorgen over de werkgelegenheid. “Banen komen op de tocht te staan, zelfs die van hoogopgeleide mensen als advocaten en artsen. De maatschappij zal snel veranderen. Daar moet het onderwijs en de arbeidsmarkt op inspelen. We moeten leren om met de nieuwe mogelijkheden ons eigen werk te creëren, maar dat zal niet iedereen lukken. Daarom ben ik ook een voorstander van een basisinkomen. Dat geeft ze de ruimte om nieuwe initiatieven te ontplooien.”

De kans dat een Master Algorithm de wereld overneemt, noemt Domingos overigens “nul”. “Computers hebben geen eigen wil. Ze zijn de producten van ingenieurs en wetenschappers, niet van de evolutie. Iedereen is zo bang dat computers heel slim worden en de wereld overnemen, terwijl de realiteit is dat computers heel dom zijn en de wereld hebben overgenomen. Het zou beter zijn wanneer ze slimmer zouden zijn. Zelfs een extreem krachtige computer is nog steeds een verlengstuk van onze wil. Het is niet mens versus machine, het is ‘mens met machine’ versus ‘mens zonder machine’. De toekomst is aan degenen die het beste van hun eigen expertise combineren met wat computeralgoritmen het beste kunnen.”

--------------------------------------------------------



Hoe leren computers?

Grofweg gezegd kunnen computers op vijf verschillende manieren zelf leren van data die wij ze geven, zo beschrijft Pedro Domingos in zijn boek The Master Algorithm. Elke manier heeft zijn eigen voor- en nadelen. Welke aanpak in de praktijk het beste werkt, hangt van het type leerprobleem af.

Redeneren op basis van symbolen 
Symbolisten geloven dat leren gebeurt door het manipuleren van symbolen, op dezelfde manier als wiskundigen en logici met symbolen redeneren.

Brein nabootsen
Connectionisten geloven dat leren gebeurt zoals onze hersenen dat doen: het trainen van een netwerk van neuronen waarbij verbindingen tussen neuronen sterker of zwakker worden. De grote computerkracht van tegenwoordig maakt neurale netwerken met tientallen tot wel duizend lagen mogelijk, zogeheten diepe neurale netwerken. Deze blijken veel succesvoller dan neurale netwerken met slechts enkele lagen. Deep Learning is daarom op het moment de belangrijkste troef van deze stroming.

Evolutie nabootsen
Evolutionisten geloven dat natuurlijke selectie aan de basis ligt van leren. Genetische algoritmen laten computerprogramma’s evolueren net zoals natuurlijke selectie organismen laat evolueren.

Bayesiaans redeneren
Bayesianen geloven dat alle kennis een bepaalde mate van onzekerheid heeft en dat leren een vorm is van redeneren met onzekerheid. Het theorema van Bayes drukt wiskundig uit hoeveel sterker of zwakker nieuwe gegevens een redenering maken.

Redeneren op basis van analogieën
Volgens aanhangers van deze stroming leren we op basis van het herkennen van overeenkomsten tussen verschillende situaties: als twee patiënten dezelfde symptomen hebben, hebben ze waarschijnlijk ook dezelfde ziekte.

Tussen deze vijf stromingen vindt ook kruisbestuiving plaats. Zo kan bijvoorbeeld Deep Learning met Bayesiaans redeneren worden gecombineerd. Pedro Domingos denkt dat er een Master Algorithm bestaat dat alle vijf de verschillende aanpakken in zich verenigt, een soort Theorie van Alles op het terrein van zelflerende computers. Het doel van zo’n Master Algorithm is om uit de beschikbare informatie alles te leren wat er maar te leren valt.