• No results found

S Nou, een van mijn dossiers is ook BI Voorheen was dat met name gericht op verantwoordingsrapportages: met het stempeltje “accountable”, met name voor

richting de gemeente Amsterdam. We hebben bepaalde bronsystemen gekoppeld aan aan datawarehouse dat we hebben ontwikkeld.

We zijn vorig jaar ook gestart met een proof-of-concept van datalake, data science, data analytics, hoe je het ook wilt noemen, maar dus meer een speelomgeving: gooi die data in een bak, zet er slimme mensen op, en laat ze maar zoeken, ontdekken. Het heeft allebei met data analyse te maken, maar de een is meer gericht op feiten, terwijl de ander veel zoekwerk inhoudt. Iedereen ziet ook hetzelfde bij de feitenbestudering. Je zult daar ook vast wel iets van gezien hebben.

BI mijn verantwoordelijk

Proof-of-concept datalake, alle data daarin

95

Er kwamen toch wel wat andere resultaten uit dat proof-of-concept dan we verwacht hadden. We hadden bijvoorbeeld verwacht dat het weer meer invloed zou hebben. De lijnen die de trams rijden, de combino’s, bleken een bepaalde voorspellende waarde te bevatten. Als jij vaker op lijn 3 rijdt, dan gaan jouw veren eerder kapot dan op lijn 12 of 51, dus ergens in die lijnen zit er iets in het spoor wat veroorzaakt dat er eerder veerstoringen opdienen. Die constatering is gedaan, maar binnen de tijd die we hadden, konden we dat niet nog meer gericht gaan onderzoeken. We hadden er verder geen tijd meer voor, maar we willen dan eigenlijk nog verder gaan zoeken op welk traject dat speelt, tussen welke haltes, en dan een match maken met railservices, die het beheer van de infra doet met zo van “ja jongens, dat stuk spoor is versleten, hoek is te haaks, bramen aan de rails, etc.”. Dan kun je storingen voor zijn. Als zo’n tram namelijk stil komt te staan, dan moet hij weggesleept worden, kunnen de voertuigen daarachter niet doorrijden, krijg je geirriteerde passagiers, krijg je boetes van. Van alle kanten krijg je dan een negatief imago en het is slecht voor onze financiën. Dit is dan een voorbeeld van railmaterieel, maar je kunt ook voor HR, weetje, waarom verkoopt de ene bestuurder meer kaartjes dan de ander? Waarom zijn de mensen bij bus minder ziek dan de mensen bij tram? Of waarom bij tramlijn zoveel en zoveel? Dat soort analyses, het zoeken naar verbanden, dat zit meer in die speelomgeving. Daar zijn we nu mee bezig, maar staan we nog wel aan de vooravond van, OV-chipkaart, voor reisinformatie, maar het is wel ook open voor andere organisaties. Men is dan huiverig omdat men niet weet wat je ermee verdient, maar ja, dat weet je ook niet. Misschien verdien je er veel mee, misschien niets. Dat is een beetje onduidelijkheid. Ik ben dan vanuit mijn functie bezig om te kijken hoe we die organisatie daaromheen vorm kunnen geven. Om een club van mensen te hebben die dat al voor kunnen bewerken. Ik vind daarentegen dat we zelf meer moeten kunnen, dat die afhankelijkheid niet zo groot moet zijn. Dat je gewoon al een club mensen hebt die het leuk vinden om met die data bezig te zijn. Nou ja, er hebben zich hier al verschillende mensen aangeboden om dat te gaan doen. Dat moet eerst langs de OR. Elke organisatie is ook een bureaucratie, dus je kunt niet zomaar een afdeling erbij plaatsen. Ik ben er echter wel van overtuigd dat wanneer je dat neer kunt zetten, dat je daar een hoop meerwaarde uit kunt gaan halen. Die mensen gaan ook 1+1=3, die gaan ook data met elkaar combineren. Nou ja, als je dan causale verbanden kunt vinden, dan kun je dat gaan doorgeven aan het businessonderdeel. Je daarvoor wel de juiste mensen en de juiste tools aantrekken. Daar moet je ook weer geld voor krijgen, waarmee je een soort van kip en ei verhaal krijgt. Dat is dan wel een uitdaging.

We hadden het net even over SAP, waar we veel mee doen. De afdelingen railservices en railmaterieel werken daar veel mee. Onze HR zit erin, personeel zit erin, contracten staan erin. We hebben behoorlijk wat modules in SAP. Alleen is SAP een behoorlijk gesloten database. Is ook een technische database. In database weet je bij het woord “calendar” wat er komen gaat, maar bij SAP heet het dan “0001”. Ga je die data op een hoger niveau eruit proberen te halen? Dan is hij al voor een deel geinterpreteerd? Wil je dat? Wil je dat niet? Ik heb in mijn informatieplan gezet dat data een strategische asset is. Mensen zien het vaak nog niet, maar data is dat zeker.

Verder zie je steeds meer interesse voor data uit de spullenboel vanuit de leverancier. Vroeger was die interesse er helemaal niet. Maar ja, het is in feite ook een dienst of product. Leveranciers vinden dat die data van hen is, terwijl wij vinden dat het met de aankoop van het product naar ons toekomt. Ik zou bijvoorbeeld graag data over de rijstijlen willen hebben. Niet op individueel niveau, dat heeft ook met privacy te maken, maar je wilt wel grip houden op van “kunnen we onze rijstijl verbeteren voor het comfort van de passagiers of besparen van brandstof?”. De bus heeft bijvoorbeeld echt een black box, daar kom je echt niet in. Nou ja, je kunt er dan allemaal wel sniffertjes opzetten, maar als er dan iets kapotgaat… Het is niet legaal. Het is echt een aparte dienst, een apart product wat bedrijven tegenwoordig leveren.

Andere resultaten: meer weersinvloeden verwacht Storingen spoor of voertuig? Constatering gedaan Tevredenheid van passagiers leidraad HR: verkoop kaartjes bestuurders wisselend, blijkt uit data: waarom?

Huiverig wegens verdienmodel, vooravond Onafhankelijk worden als GVB 1+1=3 met data

koppelen van afdelingen

SAP: HR, personeel en contracten. Flink wat modules

Gesloten database:

technische data

Interesse data van

voertuigen vanuit

leverancier

Ik heb interesse in data

van rijstijlen:

brandstof/comfort passagiers

96 N.S. Nee, wij hebben een BI-omgeving die afkomstig is van Microsoft, een Microsoft

stack, het MSIS platform, sequel (SQL) based. Dus de EPO gebruiken we daarvan. Staging wordt gebruikt en de data warehousing. We ontsluiten vervolgens met Qlikview, op dit moment. Die omgeving wordt ook wel een beetje misbruikt met analyse, vandaar dat ik nu ook wel een beetje druk uitoefen om die analyseomgeving in te gaan richten. Wat je toen zag gebeuren, was dat de dashboardomgevingen van de verantwoordingszijde steeds meer begonnen uit te dijen. Niet vanuit de behoefte vanwege verantwoordingsrapportages, maar meer om analysewerk te gaan doen. Die omgeving is vrij zware omgeving vanwege de interpretaties. Nou, als je daar dan vrij zware queries op gaat draaien, dan is dat voor de overige gebruikers geen feestje. Daar hebben we dus een Microsoftomgeving voor. SAP ontsluiten is een uitdaging. SAP biedt daar wel tooling voor, plug en play zeggen zij, maar voor ons valt dat tegen. Daar moeten we nog goed onderzoek doen. Voor de rest gebruiken we een HADOOP omgeving, daar wordt met Pickle, Hive, Cassandra, en Python. Eigenlijk ook bedoelt om de ontwikkelingen in de markt te testen. Op dit moment zit daar nog een leverancier op, maar in de toekomst wil ik dat alle partijen daarop kunnen werken. Van daaruit kan het dan met Qlikview ontsloten worden, of met Qliksense, of met R, noem het maar op. Die wil wat vrijer hebben. Dat je een set aan tooling hebt om dat te testen. De brondata is echter zo divers, dat gaat van exceldata tot SAP databases, SQL, Oracle, eigenlijk alles wat je maar kunt verzinnen, en dat landt dan op dat SQL platform. Sommige tooling wordt misschien ook wel uitgefaseerd, dus sommige dingen worden dan ook bewust niet aangekocht. Het groeit, het groeit.

Die analyseomgeving staat nu nog on premise. Er zitten namelijk ook OV- Chipkaartgegevens in. Nouja, die zijn gestoeld op privacy, dus daar moet je eerst over nadenken. Verder zijn we bezig met de cloudontwikkeling: gegevens wel of niet in de cloud. Daar heb je je optimale schaalbaarheid. Ik weet nog niet zeker of dat een positieve business case op gaat leveren, omdat de teller pas gaat lopen op het moment dat je er data uithaalt. Het opslaan van data in de cloud is voordeliger, maar het gebruiken ervan, dan wil de teller nog weleens oplopen. Die afweging gaan we dit jaar maken.

De ontwikkeling gaat achter elkaar door. Er worden nieuwe systemen aangekocht, systemen verandert. Je moet dan het oude systeem loskoppelen, maar met behoud van data, want dat mag je natuurlijk niet zomaar weggooien, want dan kun je geen rapportages meer draaien, maar je moet er wel voor zorgen dat het nieuwe systeem de data op eenzelfde manier aan je rapportagesysteem aandraagt, om continuïteit van je rapportages te waarborgen. It’s a never ending story.

Microsoft stack Ontsluiten in Qlikview Misbruik met analyse van Qlikview Zware omgeving interpretaties Vervelend overige gebruikers Hadoop omgeving GVB Nu een leverancier, in toekomst verschillende partijen

Brondata divers: SAP, SQL, Oracle, op SQL platform Analyseomgeving op premise Wel/niet in cloud? Optimale schaalbaarheid Opslaan cloud voordeliger, maar gebruik duurder. Afweging Nieuwe systemen ontwikkeling, conversie

Ralph Ja precies, precies. En over dat GIVA, wat heb je daar verder mee gedaan hier? Hoe

gaat de ontwikkeling daarvan? GIVA?

N.S. GIVA zit niet in mijn dossier, maar daar is een hele analyse van gedaan van hoe we