Vertrouwen en verbinden
R Huizinga en J Ciocoiu
Data: driver voor digitale transformatie
Digitaliseringaanjager van data management. Data management is aanjager van digitalisering.
Van data silo’s naar eensingle source of truth
80% van relevante business informatie is ongestructureerde data.
< 1% daarvan wordt geanalyseerd
Kennis is macht. Data de bron. (data driven: +6 % en +9%
resultaatverbetering)
Snelheid is de nieuwe differentiator: Informatie=relevantie/
consumptietijd
Factor vertrouwenspeelt grote rol in datamanagement
Denk platformen i.p.v. applicaties
Connected
assets Data lake
(RTDP) Enterprise
External
Data sources
Descriptive
Analytics
Customer / Consumer
Partner
Business
Impact
Diagnostic
Predictive
Prescriptive
CONTROL AND OPTIMIZATION
BASIC INSIGHTS
Application Silo’s Historic Dark data
Location Condition
Use
Supplier data Traffic
Social
Ingest Store Compute
Identify measures to improve
outcomes Capture condition
Report results
Examine causes of performance, faults
and problems
Detect patterns that signal impending events
Can X help me sell more?
Better service for my clients
Faster service.
Better service Happier customers
Lower cost Happier employees
More innovation
Prorail: IoT, DataLake en analytics
Periodiek worden geldautomaten onderhouden, waarbij de onderhoudscyclus nu nog voor alle automaten gelijk is.
Dit kan efficiënter omdat de automaten niet allemaal even frequent worden gebruikt en onder
verschillende omstandigheden opereren.
KPN consulting maakt een systeem voor efficiënter onderhoud op basis van de historische
gebruiksgegevens, recente storingen en gegevens over het apparaat.
Geldservice NL: Datalake, IOT en analytics
Achtergrond: Ymere en onderhoud
Woningcorporatie Ymere beheert in Nederland ca. 1430 wooncomplexen met in totaal meer dan5600 daken
Deze daken kennen ca. 7000 lekkages per jaar
Het voorkomen van lekkages kan o.a. door:
o Planmatig en preventief onderhoud
o Maatregelen op basis van historische analyse o Predictive modeling(machine learning)
o Plaatsen van sensoren
Lekkages worden opgelost door het dakteam Klomp, Patina enConsolidated (mede-opdrachtgever)
Aanpak: machine learning
Idee: eerste concept/voorproef van de mogelijkheden van predictive modeling
Doel:
o Niet: op dinsdag 12 januari om 21:50 ontstaat een lekkage op dak X
o Maar: in januari is het zeer waarschijnlijk dat op dak X, Y, Z een lekkage ontstaat
Gebruikte techniek:
o Machine learning classificatie logistische regressie RandomForest o Implementatie m.b.v. Python en Spark
Data:
o Daken, complexen en activiteiten uit Dakota (Consolidated) o Bouwjaar en locatie uit BAG
o Temperatuur, neerslag en luchtvochtigheid uit KNMI
Predictive modeling
Features
Maand Daktype Dakpartner Gebouwsoort Garantie Conditie Bladval
Valbeveiliging Afschot Vandalisme Oppervlakte Bouwjaar Lengte goot Levensduur
Aantal lekkages cum.
Dakota
BAG
KNMI
Model Training dataset
Features Labels
Validatie datasetPredictions
Validatie
2015 Q1 2016
(On)mogelijkheden
Mogelijkheden
Achterhalen van andere features
Meer data:
o meerdere Jaren
o maar ook van daken die nietop gebouwen van Ymere zitten
Externe databronnen
Obstakels
Privacy van personen, ook externe data
Onvolledige data
Resultaten
Overall accuracy model: 93%
Logistische
regressie kent een trade-off tussen True Positive en False Positive voorspellingen
random voorspelling model
theoretisch optimum
Bijv: 40% van de
Vragen?
Redmer Huizinga (redmer.huizinga@kpn.com)