DeRaedtPP

(1)

Over Machines

die Leren

Luc De Raedt

(2)

De Kunstmatige

Intelligentie

1956: de eerste meeting rond

kunstmatige intelligentie in Dartmouth

de kernvraag:

•

Kunnen we intelligente machines bouwen?

(3)

Intelligentie

Heeft veel aspecten en facetten

Het onderzoek richt zich meestal op deelproblemen Wij : machinaal leren

•

Kunnen machines leren ?

(4)

Overzicht

A. Wat is machinaal leren ?

B. Waarom is het interessant ? C. Hoe werkt het ?

(5)

A. Wat is Machinaal

Leren ?

(6)

Machinaal Leren

Een machine leert wanneer

•

zijn performantie (zijn prestaties)

•

op een bepaalde taak

(7)

Dammen

http://www.cs.ualberta.ca/~chinook/project/legacy.html

(8)

Dammen

Machine = computerprogramma Taak = dammen

Performantie = percentage gewonnen partijen Ervaring = gespeelde partijen

(9)

(10)

Spam

Machine = e-mail programma, spamfilter Taak = e-mails classificeren

Performantie = nauwkeurigheid van classificaties Ervaring = voorbeelden van spam en niet-spam

(11)

(12)

(13)

Recommender Systeem

Machine = website (en programma)

Taak = boeken aanbevelen

Performantie = behaalde omzet

(14)

Machinaal Leren

Een machine leert wanneer

•

zijn performantie (zijn prestaties)

•

op een bepaalde taak

(15)

B. Waarom Machinaal

Leren ?

(16)

Waarom ?

Kunstmatige intelligentie

Machinaal leren is gewoon erg praktisch

•

sommige programma’s (software) kunnen niet met de hand geprogrammeerd worden

•

analyse van data (data mining)

Inzicht in de aard van het leren en het verwerven van kennis

•

welke wetten gelden voor lerende systemen ?

(17)

Data Mining

Machinaal leren analyseert gegevens/ervaring Nauw verwant met data mining

•

zoekt naar nieuwe nuttige kennis in mogelijk complexe datasets

Data mining is erg populair

•

Het is makkelijk om data te genereren maar moeilijk om ze te interpreteren

(18)

(19)

Principes van Leren

Een functie wordt geleerd

•

Dammen

•

f( ) = 9-13

•

P( ,9-13) = kans dat zet gespeeld wordt

•

Q( ,9-13) = verwachte beloning

•

Spam

•

f(e-mail) = spam of geen spam

•

Recommender systeem

(20)

De Ervaring

Dammen

•

leren uit voorbeelden

•

goede/slechte zetten uit tekstboeken of van damleraar ?

•

leren uit imitatie (Eng. behavioral cloning)

•

imiteer de wereldkampioen

•

leren uit beloningen

•

speel het spel, beloning = gewonnen stukken/partijen

(21)

Drie Leertechnieken

1. Het leren uit beloningen 2. Het leren van associaties

3. Het leren van beslissingsbomen + toepassingen en inzichten

(22)

C. Hoe werkt het ?

(23)

Donald Michie’s

Menace

Donald Michie (2007) Menace (1961)

(24)

X

O

X

O

X

Kies doosje op basis van huidige positie X aan Zet

Kies at random een parel uit het doosje

Voer de zet uit

Slide naar Johannes Fuernkranz

Menace

(25)

Menace

Machine = 287 luciferdoosjes + parels Codeert probabilistische functie

•

P(doosje, kleur) geeft kans weer op zet

Leren van functie

•

bij verlies: bewaar alle gebruikte parels

•

bij winst: stop gebruikt parels terug en voeg extra parel van zelfde kleur toe

Q∗(s, a) = R(s, a) + γ! s! P (s"_{|s, a) max} a! Q ∗_(s"_{, a}"₎ Q∗(s, a) = R(s, a) + γ ! s! P (s"_{|s, a) max} a! Q ∗_(s"_{, a}"₎ Richard Belmann

(26)

Exploratie versus

Exploitatie

Exploratie :

•

de ruimte van mogelijke strategieën voldoende doorzoeken

Exploitatie :

•

de geleerde kennis zoveel mogelijk gebruiken “Two armed-bandit” probleem

(27)

Leren uit Beloningen

(28)

AI en Games

AI is meer dan Spelletjes

Die worden vooral gebruikt omdat ze makkelijk te controleren omgevingen opleveren

Tal van andere toepassingen

•

robotica, controle, internet, ...

(29)

C. Hoe werkt het ?

(30)

(31)

(32)

Associaties

Welke producten worden frequent samen gekocht ?

4/5=80% 4/5=80%

(33)

Associaties

ALS DAN met KANS 4/5=80%

3/5=60%

60%

(34)

Toepassingen

Dit zijn lokale patronen, ze zeggen iets over

sommige gegevens

Marketing, o.a. supermarkt, bank, ...

Data mining in wetenschappelijke domeinen Analyse van (sociale) netwerken

(35)

Structuur-Activiteits-Relaties

Figuur: Siegfried Nijssen

(36)

C. Hoe werkt het ?

(37)

Classificatie en

Regressieproblemen

Classificatie

•

voorspel de klasse

•

bvb. spam of niet spam bij e-mail Regressie

•

voorspel een numerieke waarde

•

bvb. de temperatuur morgen

Belangrijkste probleem in machinaal leren en data mining Tal van technieken; wij: beslissingbomen

(38)

Illustratie

fortis dexia kbc ... Bel20

nee nee nee ... stijgt

nee nee ja ... daalt

ja nee nee ... stijgt

nee ja ja ... daalt

ja ja nee ... daalt

nee ja nee ... stijgt

ja nee nee ... stijgt

nee nee ja ... daalt

Kan ik voorspellen of de BEL 20 morgen stijgt of daalt ?

(39)

Een Beslissingsboom

kbc fortis

nee ja

stijgt daalt stijgt daalt

(40)

Een Illustratie

Voorspel de kleur

rond hol driehoek klasse

nee nee nee groen

nee nee ja rood

ja nee nee groen

nee ja ja rood

ja ja nee rood

nee ja nee groen

ja nee nee groen

nee nee ja rood

(41)

? ? ?

ronde

driehoek holle

groen rood groen rood

(42)

Beslissingsbomen

Essentieel :

•

nauwkeurigheid geleerde boom (schatten a.d.h.v. “test-data” -- hangt ook af van kenmerken)

•

criterium selectie kenmerken is essentieel (entropie)

•

interpreteerbaarheid geleerde boom

Heel wat alternatieve methodes (o.a. probabilistische modellen)

Toepassingen in allerlei domeinen:

•

medisch, financieel, wetenschappelijk, marketing, engineering, controle, ...

(43)

(44)

Verschillende

Domeinen

Wetenschap

•

Robot Scientist Engineering & Control

•

Darpa Grand Challenge

•

Activiteitsherkenning Sociale Netwerken

(45)

Wetenschap

In heel wat domeinen :

•

machinaal leren, data mining, essentieel

•

bvb. bioinformatics & computerlinguïstiek De toekomst ?

(46)

De Robot Scientist

Kunstmatige intelligentie toegepast op de wetenschap zelf

•

Kunnen machines wetenschappelijke werk verrichten ?

(47)

Robot Scientist (2004)

Domein van microbiologie

•

pathway rond gist (Saccharomyces cerevisiae);

Experimenten opzetten om hypothesen te testen, te verfijnen, te bevestigen

Werd geautomatiseerd

(48)

Discussie

Geen gevaar voor jobverlies in de wetenschap

•

Het gaat om minder creatieve taken

•

Wel ? Meer tijd vrij voor creatieve kant

wetenschap

Nieuwe vragen en antwoorden voor wetenschapsfilosofie ?

(49)

Darpa Grand Challenge

(50)

Leren door Imitatie

Voor sommige taken kan men geen controle programma’s schrijven met de hand

De DARPA Grand Challenge

•

sommige controle programma’s geleerd

•

o.a. classificatie terrein en snelheid bepalen.

Zie YOUTUBE: Sebastian Thrun -- Google Talks -- Grand Challenge

(51)

Leren door Imitatie

Slide Sebastian Thrun

(52)

Sebastian

Stanley

Leren door Imitatie

Slide Sebastian Thrun

Snelheid Sebastian en Stanley

Bestuur de wagen een tijdje

Registreer waarden sensoren & snelheid

(53)

Leren Terrein

(54)

Activiteitsherkenning

Electronica sensoren

GPS, GSM, Smart Phone, video, PDA, RFID, ...

bevatten informatie over gebruik en gebruikers

•

Kan die gebruikt worden om de gebruiker te assisteren ?

intervention they need in doing so, and the efficiency which they process various kinds of features, especially higher-dimensional ones. In Figure 2, we indicate the variety of selection and inference algorithms by stacks of boxes.

However, this profusion of options has not translated into an activity inferencing system capable of recognizing large numbers of day-to-day activities in natural environments. A key underlying problem is that no existing combination of sensors and feature selector has been shown to detect robustly the features necessary to distinguish between thousands of activities. For instance, objects used during activities have long been thought to be a crucial discriminator. However, existing object recognition and tracking systems [6] tend not to work very well when applied to a large variety of objects in unstructured environments. Activity recognition systems based on tracking objects therefore tend to be customized for particular environments and objects, and restricted in their utility as general purpose day-to-day activity recognizers. Given that producing each customized detector is itself a research task, the goal of general-purpose recognition has not surprisingly remained unattained.

A new class of small, wireless sensors to individual objects seems likely to provide a practical means of detecting objects used in many day-to-day activities [3, 4]. Given this stream of objects, recent work has shown that even simple symbolic inference techniques are sufficient for tracking the progress of these activities.

Detecting Object Use with RFID-Based Sensing

Figure 3 Radio Frequency Identification tags (left). A tagged toothbrush and toothpaste (right).

A passive Radio Frequency Identification (RFID [1]) tag is a postage-stamp-sized wireless, battery free transponder that, when interrogated (via radio) by an ambient reader, returns a unique identifier (see Figure 2). Each tag consists of an antenna, some protocol logic and optional non-volatile memory. Tags use the energy of the interrogating signal to return a 64 to 128-bit identifier unique to each tag, and when applicable, data stored in on-tag memory. Short-range tags, which are inductively coupled, have a 2 to 30 cm range, whereas long-range backscatter based tags have a 1 to 10 m range. Tags are available off the shelf for less than 50 cents a tag. Short range readers are priced in the

1 cm 1 cm 1 cm

Francois Bremond

(55)

Mogelijke Toepassingen

Ondersteuning gebruikers

•

Calo Project -- automatische office assistent ?

•

Smart phones -- automatisch instellen

•

Shopping -- niets vergeten, juiste prijs ?

•

Transport -- juiste bus ?

•

Intelligent huis -- fornuis uitgezet ?

•

Surveillatie allerhande -- assistentie ouderen

(56)

Netwerken

P1 P2 P3 P4 A1 I1 Internet Sociaal Bibliografisch Wetenschappelijk Communicatie ...

(57)

Sociale Netwerken

Heel wat informatie over personen en hun relaties beschikbaar

•

informeel:

•

kring van kennissen, vrienden, collega’s en familie.

•

vandaag de dag:

•

websites zoals Facebook, LinkedIn, Netlog, ...

•

het grote verschil

•

Men beschikt over informatie over IEDEREEN in het

netwerk

(58)

Analyse van Netwerken

Voor bvb. aanbevelingen / marketing

•

Facebook: nieuwe kennissen; LinkedIn: jobs; Commercieel: nieuwe producten

Interessante problemen

•

Wie een product eerst aanbevelen? Verspreiding ?

•

Koopt iemand het product ? Classificatie.

•

Welke relaties bestaan er tussen personen ?

(59)

Data Mining en Privacy

Analyse activiteiten en sociale netwerken

•

gevaar voor privacy, misbruiken, fouten, ...

•

combinatie informatie op verschillende sociale

netwerken

Het data mining onderzoekt ook

•

privacy preserving technieken

Het grote probleem is natuurlijk de

(60)

Besluit

Machines kunnen leren

en hebben interessante toepassingen; veelbelovend ook in de toekomst

(61)

Referenties

Youtube: Winning the Darpa Grand Challenge, Google Talks, Sebastian Thrun

• ook artikels in o.a. Scientific American,

Robot Scientist (Aberystwyth), Ross D. King

• artikels in Wired, Nat. Geographic, etc.

Dammen en andere spelletjes --

• http://www.cs.ualberta.ca/~games/

Activiteitsleren

(62)

Basiswerken

Stuart Russel en Peter Norvig. Artificial Intelligence: A Modern Approach, 2de uitgave, Prentice Hall, 2002. Tom Mitchell, Machine Learning, McGraw-Hill, 1997.

Ian Witten en Eibe Frank. Data Mining. Morgan Kaufmann: Practical Machine Learning Algorithms and Tools, 2de uitgave, Morgan Kaufmann, 2005.