Over Machines
die Leren
Luc De Raedt
De Kunstmatige
Intelligentie
1956: de eerste meeting rond
kunstmatige intelligentie in Dartmouth
de kernvraag:
•
Kunnen we intelligente machines bouwen?Intelligentie
Heeft veel aspecten en facettenHet onderzoek richt zich meestal op deelproblemen Wij : machinaal leren
•
Kunnen machines leren ?Overzicht
A. Wat is machinaal leren ?
B. Waarom is het interessant ? C. Hoe werkt het ?
A. Wat is Machinaal
Leren ?
Machinaal Leren
Een machine leert wanneer
•
zijn performantie (zijn prestaties)•
op een bepaalde taakDammen
http://www.cs.ualberta.ca/~chinook/project/legacy.html
Dammen
Machine = computerprogramma Taak = dammen
Performantie = percentage gewonnen partijen Ervaring = gespeelde partijen
Spam
Machine = e-mail programma, spamfilter Taak = e-mails classificeren
Performantie = nauwkeurigheid van classificaties Ervaring = voorbeelden van spam en niet-spam
Recommender Systeem
Machine = website (en programma)Taak = boeken aanbevelen
Performantie = behaalde omzet
Machinaal Leren
Een machine leert wanneer
•
zijn performantie (zijn prestaties)•
op een bepaalde taakB. Waarom Machinaal
Leren ?
Waarom ?
Kunstmatige intelligentie
Machinaal leren is gewoon erg praktisch
•
sommige programma’s (software) kunnen niet met de hand geprogrammeerd worden•
analyse van data (data mining)Inzicht in de aard van het leren en het verwerven van kennis
•
welke wetten gelden voor lerende systemen ?Data Mining
Machinaal leren analyseert gegevens/ervaring Nauw verwant met data mining
•
zoekt naar nieuwe nuttige kennis in mogelijk complexe datasetsData mining is erg populair
•
Het is makkelijk om data te genereren maar moeilijk om ze te interpreterenPrincipes van Leren
Een functie wordt geleerd
•
Dammen•
f( ) = 9-13•
P( ,9-13) = kans dat zet gespeeld wordt•
Q( ,9-13) = verwachte beloning•
Spam•
f(e-mail) = spam of geen spam•
Recommender systeemDe Ervaring
Dammen
•
leren uit voorbeelden•
goede/slechte zetten uit tekstboeken of van damleraar ?•
leren uit imitatie (Eng. behavioral cloning)•
imiteer de wereldkampioen•
leren uit beloningen•
speel het spel, beloning = gewonnen stukken/partijenDrie Leertechnieken
1. Het leren uit beloningen 2. Het leren van associaties
3. Het leren van beslissingsbomen + toepassingen en inzichten
C. Hoe werkt het ?
Donald Michie’s
Menace
Donald Michie (2007) Menace (1961)
X
X
O
O
X
X
O
O
X
Kies doosje op basis van huidige positie X aan Zet
Kies at random een parel uit het doosje
Voer de zet uit
Slide naar Johannes Fuernkranz
Menace
Menace
Machine = 287 luciferdoosjes + parels Codeert probabilistische functie
•
P(doosje, kleur) geeft kans weer op zetLeren van functie
•
bij verlies: bewaar alle gebruikte parels•
bij winst: stop gebruikt parels terug en voeg extra parel van zelfde kleur toeQ∗(s, a) = R(s, a) + γ! s! P (s"|s, a) max a! Q ∗(s", a") Q∗(s, a) = R(s, a) + γ ! s! P (s"|s, a) max a! Q ∗(s", a") Richard Belmann
Exploratie versus
Exploitatie
Exploratie :
•
de ruimte van mogelijke strategieën voldoende doorzoekenExploitatie :
•
de geleerde kennis zoveel mogelijk gebruiken “Two armed-bandit” probleemLeren uit Beloningen
AI en Games
AI is meer dan Spelletjes
Die worden vooral gebruikt omdat ze makkelijk te controleren omgevingen opleveren
Tal van andere toepassingen
•
robotica, controle, internet, ...C. Hoe werkt het ?
Associaties
Welke producten worden frequent samen gekocht ?
4/5=80% 4/5=80%
Associaties
ALS DAN met KANS 4/5=80%
3/5=60%
60%
Toepassingen
Dit zijn lokale patronen, ze zeggen iets over
sommige gegevens
Marketing, o.a. supermarkt, bank, ...
Data mining in wetenschappelijke domeinen Analyse van (sociale) netwerken
Structuur-Activiteits-Relaties
Figuur: Siegfried Nijssen
C. Hoe werkt het ?
Classificatie en
Regressieproblemen
Classificatie
•
voorspel de klasse•
bvb. spam of niet spam bij e-mail Regressie•
voorspel een numerieke waarde•
bvb. de temperatuur morgenBelangrijkste probleem in machinaal leren en data mining Tal van technieken; wij: beslissingbomen
Illustratie
fortis dexia kbc ... Bel20
nee nee nee ... stijgt
nee nee ja ... daalt
ja nee nee ... stijgt
nee ja ja ... daalt
ja ja nee ... daalt
nee ja nee ... stijgt
nee ja nee ... stijgt
ja nee nee ... stijgt
nee nee ja ... daalt
Kan ik voorspellen of de BEL 20 morgen stijgt of daalt ?
Een Beslissingsboom
kbc fortis
nee ja
stijgt daalt stijgt daalt
Een Illustratie
Voorspel de kleur
rond hol driehoek klasse
nee nee nee groen
nee nee ja rood
ja nee nee groen
nee ja ja rood
ja ja nee rood
nee ja nee groen
nee ja nee groen
ja nee nee groen
nee nee ja rood
? ? ?
ronde
driehoek holle
groen rood groen rood
Beslissingsbomen
Essentieel :
•
nauwkeurigheid geleerde boom (schatten a.d.h.v. “test-data” -- hangt ook af van kenmerken)•
criterium selectie kenmerken is essentieel (entropie)•
interpreteerbaarheid geleerde boomHeel wat alternatieve methodes (o.a. probabilistische modellen)
Toepassingen in allerlei domeinen:
•
medisch, financieel, wetenschappelijk, marketing, engineering, controle, ...Verschillende
Domeinen
Wetenschap
•
Robot Scientist Engineering & Control•
Darpa Grand Challenge•
Activiteitsherkenning Sociale NetwerkenWetenschap
In heel wat domeinen :
•
machinaal leren, data mining, essentieel•
bvb. bioinformatics & computerlinguïstiek De toekomst ?De Robot Scientist
Kunstmatige intelligentie toegepast op de wetenschap zelf
•
Kunnen machines wetenschappelijke werk verrichten ?Robot Scientist (2004)
Domein van microbiologie
•
pathway rond gist (Saccharomyces cerevisiae);Experimenten opzetten om hypothesen te testen, te verfijnen, te bevestigen
Werd geautomatiseerd
Discussie
Geen gevaar voor jobverlies in de wetenschap
•
Het gaat om minder creatieve taken•
Wel ? Meer tijd vrij voor creatieve kantwetenschap
Nieuwe vragen en antwoorden voor wetenschapsfilosofie ?
Darpa Grand Challenge
Leren door Imitatie
Voor sommige taken kan men geen controle programma’s schrijven met de hand
De DARPA Grand Challenge
•
sommige controle programma’s geleerd•
o.a. classificatie terrein en snelheid bepalen.Zie YOUTUBE: Sebastian Thrun -- Google Talks -- Grand Challenge
Leren door Imitatie
Slide Sebastian Thrun
Sebastian
Stanley
Leren door Imitatie
Slide Sebastian Thrun
Snelheid Sebastian en Stanley
Bestuur de wagen een tijdje
Registreer waarden sensoren & snelheid
Leren Terrein
Activiteitsherkenning
Electronica sensoren
GPS, GSM, Smart Phone, video, PDA, RFID, ...
bevatten informatie over gebruik en gebruikers
•
Kan die gebruikt worden om de gebruiker te assisteren ?intervention they need in doing so, and the efficiency which they process various kinds of features, especially higher-dimensional ones. In Figure 2, we indicate the variety of selection and inference algorithms by stacks of boxes.
However, this profusion of options has not translated into an activity inferencing system capable of recognizing large numbers of day-to-day activities in natural environments. A key underlying problem is that no existing combination of sensors and feature selector has been shown to detect robustly the features necessary to distinguish between thousands of activities. For instance, objects used during activities have long been thought to be a crucial discriminator. However, existing object recognition and tracking systems [6] tend not to work very well when applied to a large variety of objects in unstructured environments. Activity recognition systems based on tracking objects therefore tend to be customized for particular environments and objects, and restricted in their utility as general purpose day-to-day activity recognizers. Given that producing each customized detector is itself a research task, the goal of general-purpose recognition has not surprisingly remained unattained.
A new class of small, wireless sensors to individual objects seems likely to provide a practical means of detecting objects used in many day-to-day activities [3, 4]. Given this stream of objects, recent work has shown that even simple symbolic inference techniques are sufficient for tracking the progress of these activities.
Detecting Object Use with RFID-Based Sensing
Figure 3 Radio Frequency Identification tags (left). A tagged toothbrush and toothpaste (right).
A passive Radio Frequency Identification (RFID [1]) tag is a postage-stamp-sized wireless, battery free transponder that, when interrogated (via radio) by an ambient reader, returns a unique identifier (see Figure 2). Each tag consists of an antenna, some protocol logic and optional non-volatile memory. Tags use the energy of the interrogating signal to return a 64 to 128-bit identifier unique to each tag, and when applicable, data stored in on-tag memory. Short-range tags, which are inductively coupled, have a 2 to 30 cm range, whereas long-range backscatter based tags have a 1 to 10 m range. Tags are available off the shelf for less than 50 cents a tag. Short range readers are priced in the
1 cm 1 cm 1 cm
Francois Bremond
Mogelijke Toepassingen
Ondersteuning gebruikers
•
Calo Project -- automatische office assistent ?•
Smart phones -- automatisch instellen•
Shopping -- niets vergeten, juiste prijs ?•
Transport -- juiste bus ?•
Intelligent huis -- fornuis uitgezet ?•
Surveillatie allerhande -- assistentie ouderenNetwerken
P1 P2 P3 P4 A1 I1 Internet Sociaal Bibliografisch Wetenschappelijk Communicatie ...Sociale Netwerken
Heel wat informatie over personen en hun relaties beschikbaar
•
informeel:•
kring van kennissen, vrienden, collega’s en familie.•
vandaag de dag:•
websites zoals Facebook, LinkedIn, Netlog, ...•
het grote verschil•
Men beschikt over informatie over IEDEREEN in hetnetwerk
Analyse van Netwerken
Voor bvb. aanbevelingen / marketing
•
Facebook: nieuwe kennissen; LinkedIn: jobs; Commercieel: nieuwe productenInteressante problemen
•
Wie een product eerst aanbevelen? Verspreiding ?•
Koopt iemand het product ? Classificatie.•
Welke relaties bestaan er tussen personen ?Data Mining en Privacy
Analyse activiteiten en sociale netwerken
•
gevaar voor privacy, misbruiken, fouten, ...•
combinatie informatie op verschillende socialenetwerken
Het data mining onderzoekt ook
•
privacy preserving techniekenHet grote probleem is natuurlijk de
Besluit
Machines kunnen leren
en hebben interessante toepassingen; veelbelovend ook in de toekomst
Referenties
Youtube: Winning the Darpa Grand Challenge, Google Talks, Sebastian Thrun
• ook artikels in o.a. Scientific American,
Robot Scientist (Aberystwyth), Ross D. King
• artikels in Wired, Nat. Geographic, etc.
Dammen en andere spelletjes --
• http://www.cs.ualberta.ca/~games/
Activiteitsleren
Basiswerken
Stuart Russel en Peter Norvig. Artificial Intelligence: A Modern Approach, 2de uitgave, Prentice Hall, 2002. Tom Mitchell, Machine Learning, McGraw-Hill, 1997.
Ian Witten en Eibe Frank. Data Mining. Morgan Kaufmann: Practical Machine Learning Algorithms and Tools, 2de uitgave, Morgan Kaufmann, 2005.