• No results found

DeRaedtPP

N/A
N/A
Protected

Academic year: 2021

Share "DeRaedtPP"

Copied!
62
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Over Machines

die Leren

Luc De Raedt

(2)

De Kunstmatige

Intelligentie

1956: de eerste meeting rond

kunstmatige intelligentie in Dartmouth

de kernvraag:

Kunnen we intelligente machines bouwen?

(3)

Intelligentie

Heeft veel aspecten en facetten

Het onderzoek richt zich meestal op deelproblemen Wij : machinaal leren

Kunnen machines leren ?

(4)

Overzicht

A. Wat is machinaal leren ?

B. Waarom is het interessant ? C. Hoe werkt het ?

(5)

A. Wat is Machinaal

Leren ?

(6)

Machinaal Leren

Een machine leert wanneer

zijn performantie (zijn prestaties)

op een bepaalde taak

(7)

Dammen

http://www.cs.ualberta.ca/~chinook/project/legacy.html

(8)

Dammen

Machine = computerprogramma Taak = dammen

Performantie = percentage gewonnen partijen Ervaring = gespeelde partijen

(9)
(10)

Spam

Machine = e-mail programma, spamfilter Taak = e-mails classificeren

Performantie = nauwkeurigheid van classificaties Ervaring = voorbeelden van spam en niet-spam

(11)
(12)
(13)

Recommender Systeem

Machine = website (en programma)

Taak = boeken aanbevelen

Performantie = behaalde omzet

(14)

Machinaal Leren

Een machine leert wanneer

zijn performantie (zijn prestaties)

op een bepaalde taak

(15)

B. Waarom Machinaal

Leren ?

(16)

Waarom ?

Kunstmatige intelligentie

Machinaal leren is gewoon erg praktisch

sommige programma’s (software) kunnen niet met de hand geprogrammeerd worden

analyse van data (data mining)

Inzicht in de aard van het leren en het verwerven van kennis

welke wetten gelden voor lerende systemen ?

(17)

Data Mining

Machinaal leren analyseert gegevens/ervaring Nauw verwant met data mining

zoekt naar nieuwe nuttige kennis in mogelijk complexe datasets

Data mining is erg populair

Het is makkelijk om data te genereren maar moeilijk om ze te interpreteren

(18)
(19)

Principes van Leren

Een functie wordt geleerd

Dammen

f( ) = 9-13

P( ,9-13) = kans dat zet gespeeld wordt

Q( ,9-13) = verwachte beloning

Spam

f(e-mail) = spam of geen spam

Recommender systeem

(20)

De Ervaring

Dammen

leren uit voorbeelden

goede/slechte zetten uit tekstboeken of van damleraar ?

leren uit imitatie (Eng. behavioral cloning)

imiteer de wereldkampioen

leren uit beloningen

speel het spel, beloning = gewonnen stukken/partijen

(21)

Drie Leertechnieken

1. Het leren uit beloningen 2. Het leren van associaties

3. Het leren van beslissingsbomen + toepassingen en inzichten

(22)

C. Hoe werkt het ?

(23)

Donald Michie’s

Menace

Donald Michie (2007) Menace (1961)

(24)

X

X

O

O

X

X

O

O

X

Kies doosje op basis van huidige positie X aan Zet

Kies at random een parel uit het doosje

Voer de zet uit

Slide naar Johannes Fuernkranz

Menace

(25)

Menace

Machine = 287 luciferdoosjes + parels Codeert probabilistische functie

P(doosje, kleur) geeft kans weer op zet

Leren van functie

bij verlies: bewaar alle gebruikte parels

bij winst: stop gebruikt parels terug en voeg extra parel van zelfde kleur toe

Q∗(s, a) = R(s, a) + γ! s! P (s"|s, a) max a! Q (s", a") Q∗(s, a) = R(s, a) + γ ! s! P (s"|s, a) max a! Q (s", a") Richard Belmann

(26)

Exploratie versus

Exploitatie

Exploratie :

de ruimte van mogelijke strategieën voldoende doorzoeken

Exploitatie :

de geleerde kennis zoveel mogelijk gebruiken “Two armed-bandit” probleem

(27)

Leren uit Beloningen

(28)

AI en Games

AI is meer dan Spelletjes

Die worden vooral gebruikt omdat ze makkelijk te controleren omgevingen opleveren

Tal van andere toepassingen

robotica, controle, internet, ...

(29)

C. Hoe werkt het ?

(30)
(31)
(32)

Associaties

Welke producten worden frequent samen gekocht ?

4/5=80% 4/5=80%

(33)

Associaties

ALS DAN met KANS 4/5=80%

3/5=60%

60%

(34)

Toepassingen

Dit zijn lokale patronen, ze zeggen iets over

sommige gegevens

Marketing, o.a. supermarkt, bank, ...

Data mining in wetenschappelijke domeinen Analyse van (sociale) netwerken

(35)

Structuur-Activiteits-Relaties

Figuur: Siegfried Nijssen

(36)

C. Hoe werkt het ?

(37)

Classificatie en

Regressieproblemen

Classificatie

voorspel de klasse

bvb. spam of niet spam bij e-mail Regressie

voorspel een numerieke waarde

bvb. de temperatuur morgen

Belangrijkste probleem in machinaal leren en data mining Tal van technieken; wij: beslissingbomen

(38)

Illustratie

fortis dexia kbc ... Bel20

nee nee nee ... stijgt

nee nee ja ... daalt

ja nee nee ... stijgt

nee ja ja ... daalt

ja ja nee ... daalt

nee ja nee ... stijgt

nee ja nee ... stijgt

ja nee nee ... stijgt

nee nee ja ... daalt

Kan ik voorspellen of de BEL 20 morgen stijgt of daalt ?

(39)

Een Beslissingsboom

kbc fortis

nee ja

stijgt daalt stijgt daalt

(40)

Een Illustratie

Voorspel de kleur

rond hol driehoek klasse

nee nee nee groen

nee nee ja rood

ja nee nee groen

nee ja ja rood

ja ja nee rood

nee ja nee groen

nee ja nee groen

ja nee nee groen

nee nee ja rood

(41)

? ? ?

ronde

driehoek holle

groen rood groen rood

(42)

Beslissingsbomen

Essentieel :

nauwkeurigheid geleerde boom (schatten a.d.h.v. “test-data” -- hangt ook af van kenmerken)

criterium selectie kenmerken is essentieel (entropie)

interpreteerbaarheid geleerde boom

Heel wat alternatieve methodes (o.a. probabilistische modellen)

Toepassingen in allerlei domeinen:

medisch, financieel, wetenschappelijk, marketing, engineering, controle, ...

(43)
(44)

Verschillende

Domeinen

Wetenschap

Robot Scientist Engineering & Control

Darpa Grand Challenge

Activiteitsherkenning Sociale Netwerken

(45)

Wetenschap

In heel wat domeinen :

machinaal leren, data mining, essentieel

bvb. bioinformatics & computerlinguïstiek De toekomst ?

(46)

De Robot Scientist

Kunstmatige intelligentie toegepast op de wetenschap zelf

Kunnen machines wetenschappelijke werk verrichten ?

(47)

Robot Scientist (2004)

Domein van microbiologie

pathway rond gist (Saccharomyces cerevisiae);

Experimenten opzetten om hypothesen te testen, te verfijnen, te bevestigen

Werd geautomatiseerd

(48)

Discussie

Geen gevaar voor jobverlies in de wetenschap

Het gaat om minder creatieve taken

Wel ? Meer tijd vrij voor creatieve kant

wetenschap

Nieuwe vragen en antwoorden voor wetenschapsfilosofie ?

(49)

Darpa Grand Challenge

(50)

Leren door Imitatie

Voor sommige taken kan men geen controle programma’s schrijven met de hand

De DARPA Grand Challenge

sommige controle programma’s geleerd

o.a. classificatie terrein en snelheid bepalen.

Zie YOUTUBE: Sebastian Thrun -- Google Talks -- Grand Challenge

(51)

Leren door Imitatie

Slide Sebastian Thrun

(52)

Sebastian

Stanley

Leren door Imitatie

Slide Sebastian Thrun

Snelheid Sebastian en Stanley

Bestuur de wagen een tijdje

Registreer waarden sensoren & snelheid

(53)

Leren Terrein

(54)

Activiteitsherkenning

Electronica sensoren

GPS, GSM, Smart Phone, video, PDA, RFID, ...

bevatten informatie over gebruik en gebruikers

Kan die gebruikt worden om de gebruiker te assisteren ?

intervention they need in doing so, and the efficiency which they process various kinds of features, especially higher-dimensional ones. In Figure 2, we indicate the variety of selection and inference algorithms by stacks of boxes.

However, this profusion of options has not translated into an activity inferencing system capable of recognizing large numbers of day-to-day activities in natural environments. A key underlying problem is that no existing combination of sensors and feature selector has been shown to detect robustly the features necessary to distinguish between thousands of activities. For instance, objects used during activities have long been thought to be a crucial discriminator. However, existing object recognition and tracking systems [6] tend not to work very well when applied to a large variety of objects in unstructured environments. Activity recognition systems based on tracking objects therefore tend to be customized for particular environments and objects, and restricted in their utility as general purpose day-to-day activity recognizers. Given that producing each customized detector is itself a research task, the goal of general-purpose recognition has not surprisingly remained unattained.

A new class of small, wireless sensors to individual objects seems likely to provide a practical means of detecting objects used in many day-to-day activities [3, 4]. Given this stream of objects, recent work has shown that even simple symbolic inference techniques are sufficient for tracking the progress of these activities.

Detecting Object Use with RFID-Based Sensing

Figure 3 Radio Frequency Identification tags (left). A tagged toothbrush and toothpaste (right).

A passive Radio Frequency Identification (RFID [1]) tag is a postage-stamp-sized wireless, battery free transponder that, when interrogated (via radio) by an ambient reader, returns a unique identifier (see Figure 2). Each tag consists of an antenna, some protocol logic and optional non-volatile memory. Tags use the energy of the interrogating signal to return a 64 to 128-bit identifier unique to each tag, and when applicable, data stored in on-tag memory. Short-range tags, which are inductively coupled, have a 2 to 30 cm range, whereas long-range backscatter based tags have a 1 to 10 m range. Tags are available off the shelf for less than 50 cents a tag. Short range readers are priced in the

1 cm 1 cm 1 cm

Francois Bremond

(55)

Mogelijke Toepassingen

Ondersteuning gebruikers

Calo Project -- automatische office assistent ?

Smart phones -- automatisch instellen

Shopping -- niets vergeten, juiste prijs ?

Transport -- juiste bus ?

Intelligent huis -- fornuis uitgezet ?

Surveillatie allerhande -- assistentie ouderen

(56)

Netwerken

P1 P2 P3 P4 A1 I1 Internet Sociaal Bibliografisch Wetenschappelijk Communicatie ...

(57)

Sociale Netwerken

Heel wat informatie over personen en hun relaties beschikbaar

informeel:

kring van kennissen, vrienden, collega’s en familie.

vandaag de dag:

websites zoals Facebook, LinkedIn, Netlog, ...

het grote verschil

Men beschikt over informatie over IEDEREEN in het

netwerk

(58)

Analyse van Netwerken

Voor bvb. aanbevelingen / marketing

Facebook: nieuwe kennissen; LinkedIn: jobs; Commercieel: nieuwe producten

Interessante problemen

Wie een product eerst aanbevelen? Verspreiding ?

Koopt iemand het product ? Classificatie.

Welke relaties bestaan er tussen personen ?

(59)

Data Mining en Privacy

Analyse activiteiten en sociale netwerken

gevaar voor privacy, misbruiken, fouten, ...

combinatie informatie op verschillende sociale

netwerken

Het data mining onderzoekt ook

privacy preserving technieken

Het grote probleem is natuurlijk de

(60)

Besluit

Machines kunnen leren

en hebben interessante toepassingen; veelbelovend ook in de toekomst

(61)

Referenties

Youtube: Winning the Darpa Grand Challenge, Google Talks, Sebastian Thrun

• ook artikels in o.a. Scientific American,

Robot Scientist (Aberystwyth), Ross D. King

• artikels in Wired, Nat. Geographic, etc.

Dammen en andere spelletjes --

http://www.cs.ualberta.ca/~games/

Activiteitsleren

(62)

Basiswerken

Stuart Russel en Peter Norvig. Artificial Intelligence: A Modern Approach, 2de uitgave, Prentice Hall, 2002. Tom Mitchell, Machine Learning, McGraw-Hill, 1997.

Ian Witten en Eibe Frank. Data Mining. Morgan Kaufmann: Practical Machine Learning Algorithms and Tools, 2de uitgave, Morgan Kaufmann, 2005.

Afbeelding

Figure 3 Radio Frequency Identification tags (left). A tagged toothbrush and toothpaste (right)

Referenties

GERELATEERDE DOCUMENTEN

To that extent, the case study firstly analyses how the PI might impact the operations of customs authorities, after which potential mitigations to these impacts

Given a single image, we want to estimate the face shape and the illumination conditions, using both the Lambertian Reflectance model (Equation 9.2) and the PCA models of surface

Toseland en Rivas (2005:15) meld dat lede binne taak georiënteerde groepe spesifieke rolle vertolk deur die proses van interaksie, maar ontwikkel rolle ook as

Tydens die na-toets het die meeste van die respondente aangedui dat hul steeds hoop daar word ‘n kuur vir MIV en VIGS gevind, en dat hul graag ’n verskil in mense se

Ten spyte van die algemeenaa.nvaarde oortuiging dat skoolonderwys en die politiek in 'n verhouding tot mekaar staan en mekaar noodwendig onderling beinvloed

Een belangrijk doel van dit onderzoek is om de bedrijfseconomische consequenties te kwantificeren van de maatregelen die vanwege het nieuwe Milieubeleid (Mestbeleid en dergelijke)

Verder bleek de grond in het zuidelijke deel van het tracé zeer nat, waardoor enkele delen moesten worden overgeslagen, proefsleuven verlegd moesten worden, de profielputten

As already indicated before we also believe a distinction should be made between a core service and an additional service as a core service is the main reason for a company being on