Big Data Vraagt Om Big Sharing

We produceren en publiceren met elkaar immense hoeveelheden data. Dagelijks worden er meer minuten video geüpload naar YouTube dan een normaal mens in zijn leven kan bekijken. Dagelijks worden er via Twitter ruim 500 miljoen Tweets verzonden. Op Facebook en Instagram worden miljoenen levens bijna van minuut tot minuut verslagen, vaak ook nog met behulp van hoog-resolutie beeldmateriaal. Onze auto’s zijn voor een belangrijk deel computer gestuurd en alle rit- en verbruiksinformatie wordt netjes opgeslagen. Pakketjes die verstuurd worden zijn voorzien van chips en kunnen in elke fase van het bezorgtraject gevolgd worden. Al deze gegevens, die vanwege hun hoeveelheid en verscheidenheid ook wel wordt aangeduid met de term BIG DATA bevat schatten aan informatie, die – mits goed geïnterpreteerd – een serieuze bijdrage kan leveren aan het optimaliseren van processen, het tijdig onderkennen van risico’s en misschien zelfs ook wel in het doen van adequate voorspellingen.

Google heeft een aantal jaren geleden reeds bewezen beter in staat te zijn om de verspreiding van een griepepidemie te voorspellen dan de World Health Organization. Google combineerde hiervoor onder meer de topografische herkomst van mensen die op woorden als ‘keelpijn’ en ‘koorts’ zochten met verkoopcijfers van citrusvruchten in diezelfde regio. En recent heeft Microsoft de knock-out ronde van het wereldkampioenschap voetbal foutloos (!) weten te voorspellen, door historische wedstrijduitslagen van de diverse teams te combineren met gegevens uit weersvoorspellingen, de aard en de kwaliteit van de grasmat in het stadion waar de wedstrijd gespeeld zou worden, de afstand van de thuisstad van de teams tot Brazil, de hoeveelheid meereizende fans, etc.
Bovenstaande voorbeelden geven de relevantie van het uitvoeren van Big Data analyses aan. De voorspellingen die op basis van dergelijke analyses gedaan worden kunnen – zeker wanneer er zelflerende algoritmes bij gebruikt worden – zelfs zo goed kloppen, dat het heel reëel is om e overwegen veel processen en beslissingen aan te laten sturen door Big Data analyse uitkomsten, in real time. We spreken dan over Data Driven Decision Making. De verkeersregeling in veel grote steden, het aansturen van hartbewakingsmachines in ziekenhuizen, het uitvoeren van risico-analyses bij financiële transacties: het zijn allemaal gebieden waar Big Data analyses nu al dagelijks in de praktijk voor worden ingezet.

De techniek om deze analyses op gigantische hoeveelheden gegevens, die veelal niet in een gestructureerd formaat opgeslagen zijn, uit te voeren is reeds vergevorderd. Er zijn mogelijkheden om de data in grote clusters ‘in de cloud’ op te slaan, en de benodigde rekencapaciteit hoeft niet meer per se van supercomputers met mega-processoren te komen, maar kan ook door slimme aaneenschakeling van vele lichtere computers in peer-to-peer netwerken worden geregeld.
En nu de techniek beschikbaar is (en alleen nog maar tot meer in staat zal blijken in de komende jaren) is het voor organisaties vooral van belang erover na te denken hoe zij al deze mogelijkheden willen toepassen. Een eerste belangrijke stap daarbij is het kijken naar wat andere, vergelijkbare organisaties al met Big Data Analyse doen. Wat hebben zij geanalyseerd, welke algoritmes gebruikten zij daarbij en welke databronnen? Alleen dan wanneer bedrijven en instellingen bereid zijn deze kennis met elkaar te delen kunnen de mogelijkheden die Big Data Analyse biedt optimaal benut worden. De benodigde data is bedrijfs-of instelling-overschrijdend; laat de kennis omtrent de toepassingen dat dan ook zijn.

Advertentie

CRM en Big Data

Wanneer ik mensen vertel dat CRM Resultants zich vooral richt op de implementatie van Microsoft Dynamics CRM in het onderwijs en bij banken en verzekeraars, dan is de eerste reactie vaak: “Wat een verschillende branches”. Daarop leg ik dan uit dat er sprake is van meer overeenkomsten dan verschillen tussen deze segmenten, en dat het bij het implementeren van CRM tegenwoordig vooral gaat om het mogelijk maken van een goede match. Een match op de vraag van de klant en het aanbod van de leverancier. In het geval van het onderwijs gaat het dan bijvoorbeeld op het geven van studieadvies, waarbij de ambities en competenties van een student gematcht worden op het studieaanbod, of om het matchen van een student op een stageplek. Bij banken en verzekeraars is het maken van een dergelijke match ook steeds belangrijker, omdat consumenten bijvoorbeeld willen kunnen meebepalen of hun centjes al dan niet in groene fondsen belegd worden en omdat de financiële producten die aangeboden worden steeds complexer worden.

In de tegenwoordige ‘buyers market’ is het vervolgens belangrijk om het product- en dienstenaanbod flexibel af te kunnen stemmen op de wens van de klant. CRM systemen worden daarbij vooral ingezet om profielinformatie van de klant op te slaan en de dialoog met de klant (waarin de profielinformatie ook grotendeels vergaard wordt) op een effectieve manier te ondersteunen.

Moderne datamanagement technieken maken het echter ook in toenemende mate mogelijk om profielinformatie te verrijken met gegevens die verkregen zijn uit zogenaamd BIG DATA management. Onder BIG DATA wordt de veelheid van beschikbare gegevens uit interne en externe bronnen bedoeld. Bijvoorbeeld de gegevens die mensen over zichzelf op social media plaatsen, de bij het ministerie van onderwijs beschikbare vooropleidingsgegevens van een student of de historische schademeldingen van een verzekerde. Door de veelheid van data die beschikbaar is op een slimme manier te combineren en analyseren, en door klanten en prospects in te delen in bepaalde ‘archetypes’, kan BIG DATA uitstekend gebruikt worden om gedrag van deze klanten te voorspellen en/of het juiste match-advies uit te brengen.

Een andere overeenkomst tussen onderwijsinstellingen en financiële dienstverleners is dat beide type instellingen beschikken over een enorme hoeveelheid historische gegevens van hun klanten. De BIG DATA leeft dus reeds grotendeels in huis, en het gaat vooral om het slim analyseren en ontdekken van trends en patronen in deze data.

Het voorbeeld van Albert Heijn met de luiers en het bier is bij velen reeds bekend, maar te mooi om hier niet nog even te herhalen. Toen AH in het begin van de jaren negentig de bonuskaart invoerde kreeg de winkelketen namelijk voor het eerst goed inzicht in wat er bij de mensen in het boodschappenmandje lag. Velen vreesden destijds dat ze vervolgens door AH persoonlijk benaderd zouden worden met allerlei aanbiedingen, maar daar ging het AH helemaal niet om. AH wendde namelijk datamining technieken aan om te achterhalen welke combinaties van producten er in de mandjes lagen. En zo kwam men erachter dat veel jonge vaders die er door hun vrouw of vriendin op uitgestuurd werden om nog even een pak luiers te kopen, ook maar meteen wat bier meenamen. Door deze trend te herkennen kon AH het bier vervolgens fysiek in het schap naast de luiers plaatsen, waarna de omzet uit de verkoop van bier verdrievoudigde.

Bij BIG DATA analyse gaat het ook om het herkennen van dergelijke patronen. Vanuit de ICT hoek is men nu vooral nog bezig met het faciliteren van de dataopslag voor BIG DATA, waarbij per source initiatieven als Hadoop belangrijk zijn. Maar nog veel belangrijker zal uiteindelijk het ontdekken van trends en patronen in complexe en enorme hoeveelheden data zijn. Het gaat er daarbij om de data naar de bevraging te brengen, en niet de bevraging van de data, zoals we dat tot nog toe met het opstellen van rapportages vooral gewend zijn. Om dit goed te kunnen doen en om de aldus herkende trends vervolgens te matchen op (de archetypes van) klanten en prospects is zowel branche- als CRM kennis nodig. Ik zie hierin in de nabije toekomst een belangrijke rol voor CRM implementatie partijen weggelegd.