Geef je organisatie, processen en mensen een boost met Data Science
Data Science is het geautomatiseerde proces van data analyse met machine learning met als doel het verkrijgen van nieuwe inzichten uit (big) data en het nemen van datagedreven beslissingen. Het is toepasbaar op vrijwel alle processen in elke organisatie. Of het nu gaat om het beoordelen van een nieuwe hypotheekaanvraag, het voorspellen van de churn rate of het optimaliseren van routes, Data Science geeft je organisatie, processen en mensen een flinke boost. Je processen draaien effectiever en efficiënter waardoor het werkgeluk toeneemt en resultaten verbeteren. In dit artikel leer je hoe je Data Science succesvol kunt implementeren in jouw organisatie en wat daarbij komt kijken. En welke tools, technieken en type algoritmes het beste bij jouw probleem passen. Maar eerst geven we data science betekenis door een duidelijke definitie en we benoemen de 25 voordelen. We sluiten af met zeven tips en een handige checklist.
Wat is Data Science?
Wat is Data Science? Dit vakgebied houdt zich bezig met het geautomatiseerd verwerken en analyseren van allerlei data. Het doel is om breed in de organisatie de processen en beslissingen verregaand te optimaliseren. Data Science richt zich vooral op het analyseren van big data en het ontwikkelen en toepassen van machine learning modellen, maar is daartoe niet beperkt. De modellen leggen patronen en causale relaties in data bloot die voor de doorsnee mens vrijwel onvindbaar zijn.
Data Science definitie
Data Science betekent letterlijk Datawetenschappen maar die vertaling is nog steeds erg abstract en nietszeggend. We geven hier een data science definitie die iedereen kan begrijpen:
Data Science is het proces waarbij je alle relevante data selecteert, filtert, opschoont, combineert, grondig analyseert, mooi visualiseert en er businesswaarde uithaalt.
Dit proces wordt goed weergegeven door de volgende figuur waarbij je (big) data gaat vertalen naar waardevolle informatie, inzichten en nieuwe kennis. Dit doe je al dan niet met behulp van statistiek en algoritmes. Die kennis vertaal je vervolgens naar de beste acties (voor dat moment) en procesverbeteringen.
Tegenwoordig staat Data Science synoniem voor Artificial Intelligence maar dat is niet helemaal terecht. Data Science staat voor Datawetenschappen en is een veel groter vakgebied dat ook KPI dashboards, rapporten en normale data-analyse bestrijkt. Data Science is daarom goed vergelijkbaar met het vakgebied Business Intelligence. Daarom benadrukken we in dit artikel vooral de algoritmische kant.
Figuur 1: Het doel van Data Science weerspiegelt in de piramide: van ruwe data naar de beste acties en procesverbetering.
Data Science ga je doelbewust inzetten in jouw organisatie om concrete vraagstukken en problemen op te lossen. Het is geen speeltje van de data scientist maar een praktische wetenschap die je gaat helpen om dagelijks betere beslissingen te nemen en procesverbeteringen door te voeren. Het maakt vooral grote impact op de operationele beslissingen waar beoordelingsprocessen een grote rol spelen, waarvan er dagelijks vele worden genomen.
Data Science voorbeelden
Data Science krijgt al waarde door voor jezelf na te gaan welke vraagstukken en beslissingen in jouw organisatie geautomatiseerd kunnen worden. Zo maak je het concreet. We geven hier een aantal aansprekende voorbeelden:
- Wat is de toekomstige vraag naar bepaalde producten en hoe kun je die beter voorspellen? Zie ook forecasting.
- Hoe ga je machine learning inzetten om je voorraadposities en kapitaalbeslag te optimaliseren?
- Hoe kun je het werving- en selectieproces verbeteren zodat je de beste mensen kunt selecteren?
- Wat is de beste prijs die je kunt vragen voor een specifieke hotelkamer gegeven de belangstelling?
- Wat is de kans dat een machine of een apparaat de komende dagen of weken in storing gaat?
- Valt de situatie op camerabeelden van een uitgaansgebied te kenschetsen als potentieel gewelddadig?
- Staan er objecten of subjecten op een foto en hoe identificeer je die met naam en toenaam?
Elke organisatie beoordeelt zaken op dagelijkse basis, soms wel veel vaker. Als expert zet je dan je beste beentje voor en gaat er eens goed voor zitten. Je analyseert alle informatie en komt uiteindelijk tot een conclusie.
Data Science automatiseert niet alleen het menselijke beoordelingsproces, maar het kan ook veel meer variabelen mee laten wegen. Zo kom je tot een veel verfijnder oordeel en besluit. Omdat je automatiseert, verdwijnt ook de willekeur uit je beoordelingsproces. Neem vrijblijvend contact met ons op voor gericht Data Science advies.
Ken de Data Science betekenis
Je gaat de werkelijke betekenis van Data Science beter kennen en echt begrijpen als je nagaat waar in jouw organisatie allemaal beslissingen en beoordelingsprocessen plaatsvinden. Deze processen beoordelen bijvoorbeeld hoeveel een object waard is, of het verantwoord is om iemand een lening te verstrekken en wat de kans op fraude is bij een aanvraag of schadeclaim. Ook berekenen ze bijvoorbeeld wat de snelste route is voor een bezorger die 100 pakketjes op een dag moet afleveren of een verkoper die een reeks klanten wil gaan bezoeken.
De lijst met voordelen van Data Science is lang. De kunst is om in jouw organisatie gezamenlijk die toepassingen te ontdekken. Data Science wordt volgens Hal Varian, een gerespecteerd econoom bij Google en emeritus professor aan Berkeley, de komende decennia een ontzettend belangrijke, cruciale competentie voor organisaties. Om hier maar gelijk op door te pakken, wijzen we je meteen op onze opleiding Data Science.
De 25 voordelen van Data Science
We weten door onze jarenlange ervaring met Data Science, AI en machine learning als geen ander waar en hoe je de vruchten kunt plukken. Je gaat niet alleen op zoek naar quick wins – een standalone toepassing ontwikkelen – maar ook zoek je naar de langetermijnvoordelen wanneer je Data Science structureel en organisatiebreed gaat inzetten. We zetten hier alle 25 voordelen van het toepassen van Data Science technieken op een rij. In onderstaande figuur worden ze samengevat tot een top tien.
Figuur 2: De top 10 voordelen van data science zijn op een meer zichtbare manier samengevat.
- Je voorkomt een wirwar aan vaak ingewikkelde spreadsheets
- Je gaat meer verkopen en een betere margestructuur realiseren
- Je versnelt beoordelingsprocessen in je organisatie op radicale wijze
- Je kunt veel efficiënter personaliseren en differentiëren
- Data Science laat je eenvoudig allerlei (big) data combineren en analyseren
- Het ontlast niet alleen de IT-afdeling maar ook de operationele systemen
- Je ontwikkelt één versie van de waarheid, hoewel die niet in beton is gegoten
- Medewerkers, teams en managers laten veel betere prestaties zien
- Je voorkomt informatieoverbelasting en kunt datagedreven beslissen
- Het werkt als aanjager voor het creëren en managen van nieuwe kennis
- Het laat leidinggevenden meer visiegericht en coachend werken
- Je verbetert de delicate balans tussen brein en intuïtie
- Je stimuleert creatief zoekgedrag dat nieuwe deuren opent
- Door continue blootstelling aan betrouwbare data ken je je business model beter
- Je creëert meer betrokkenheid en loyaliteit bij je medewerkers
- Je realiseert met de tooling meer transparantie en voorkomt ook fraude
- Het helpt je bij de verbeterslag in het managen van bedrijfsrisico’s
- Je bedrijf wordt flexibeler: zie het boek ‘De wendbare organisatie’
- Het stimuleert innovatie door inzichten die aangeven dat je strategie is uitgewerkt
- Je krijgt meer grip op dynamiek, marktwerking en turbulentie
- Je kunt met AI modellen nauwkeuriger anticiperen en voorspellen
- Je kunt je datakwaliteit gaan verbeteren dankzij datawetenschappen
- Het werkgeluk kan toenemen door overzichtelijke en soepele processen
- Het kan zorgen voor een duurzamere wereld doordat er minder verspilling plaatsvindt
- De mens kan zich beter ontplooien in een gestroomlijnde, gezonde organisatie
Met bovengenoemde voordelen bij de hand kun je nu de businesscase voor Data Science gaan maken en die gaan uitwerken. Wil je ondersteuning bij het opzetten of verder professionaliseren van je processen en beslissingen? Neem dan meteen contact op met één van onze data science consultants.
Data Science management
Om Data Science goed te managen heb je allereerst een frisse blik nodig op het vakgebied. En vooral een niet te enge blik. Zo ontwikkel je een duurzame en gedragen visie, zodat iedereen in jouw organisatie zich bewust is wat de rol en toegevoegde waarde van data is. Data Science management richt zich vooral op het pakken van regie en het managen van het proces. Een paar zaken zijn daarbij van cruciaal belang en randvoorwaardelijk voor succes.
Figuur 3: Het proces laat zien wat de stappen zijn om Data Science management in jouw bedrijf te implementeren.
- Business Data Science: de business en de besluitvorming zijn leidend voor het ontwikkelen van data science toepassingen. Zie ook de eerdergenoemde opmerkingen over beoordelingsprocessen. Het moet geen IT data science ofwel een IT feestje worden. De business staat dus aan het roer, IT ondersteunt.
- Data Science manager: deze manager coördineert alle strategische en operationele Data Science processen binnen de organisatie. Hij of zij rapporteert aan de directie of een directielid. Deze ervaren leidinggevende is een bruggenbouwer, kent de organisatie en haar processen van haver tot gort en maakt de vertaalslag naar IT. Zie ook de BI manager.
- Data Science roadmap: business en IT maken onder bezielende leiding van de Data Science manager een roadmap. Die bevat een aantal vaste elementen: de strategische speerpunten van de organisatie en hoe Data Science daaraan bij gaat dragen, de producten en diensten die je met Data Science gaat leveren, het team met de verschillende rollen, de benodigde data-infrastructuur zoals een datawarehouse en een data lake, en tot slot de hard- en software.
- De impact op de mens: een vaak onderbelicht aspect van Data Science management is de mens. Een te technocratische benadering van het vakgebied laat de mens ondersneeuwen terwijl mensenmanagement en verandermanagement juist cruciaal zijn voor het succes. Wanneer beslissingen straks automatisch worden genomen door algoritmes mag je weerstand verwachten van beslissers die zich misschien buitenspel voelen gezet. Denk dus goed na hoe je daar in jouw organisatie mee om wilt gaan.
Data Science management neemt dus de business en de beslissingen als vertrekpunt, stelt een bruggenbouwer als manager aan, ontwikkelt een gezamenlijke roadmap en heeft oog voor de impact op de mens.
Een wereldwijd datageneratie-proces
Of het nu gaat om aankopen of sensordata, zoekopdrachten, slimme meters of geluidsopnames van telefoongesprekken. Mensen en machines worden een steeds belangrijker onderdeel van een wereldwijd datageneratie-proces. We kunnen de omvang en impact ervan nog nauwelijks bevatten. Maar door het mixen van die verschillende interne en externe databronnen kan je uiteindelijk komen tot compleet nieuwe en onverwachte inzichten. Daarmee kun je dan nieuwe, waardevolle dataproducten of datadienstverlening creëren. Dit is in een notendop de grootste uitdaging waar je met Data Science management voor staat: data omzetten tot waardevolle producten.
Welke Data Science technieken zijn er?
Met Data Science ga je proberen te voorspellen wat er in de toekomst zou kunnen gaan gebeuren. Je gaat op zoek naar patronen in data die een voorspellende waarde hebben. Maar daartoe is het niet beperkt. Je kunt niet alleen voorspellen maar ook classificeren en datapunten gaan clusteren. Voor dit alles gebruik je een scala aan Data Science technieken.
Sla de complexiteit van data science techniek plat
Het bovenstaande klinkt allemaal ingewikkeld maar feitelijk komt het er bij al deze technieken op neer dat je brute rekenkracht gaat inzetten om snel patronen te vinden in je data en daar een bruikbaar AI model van maakt. Voor de ene situatie gebruik je een methode die gestoeld is op beslisbomen, in een andere situatie zet je in op lineaire regressie of genetische algoritmes. Je helpt met behulp van deze technieken de computer met leren, zonder dat je die expliciet moet programmeren. Neurale netwerken bijvoorbeeld, proberen de hersenen van een mens na te bootsen. Ook die zijn zeer afhankelijk van de rekenkracht van grote of heel veel computers. Daarnaast bestaan er kant-en-klare bibliotheken met een groot scala aan technieken die je direct kunt inzetten. Je hoeft het wiel dus niet zelf elke keer uit te vinden. Laat je dus niet afschrikken door de schijnbare magie van Data Science technieken. Maar wanneer alle zintuigen van een mens (horen, zien, ruiken, enzovoorts) beter kunnen worden afgedaan door Data Science, wordt het tijd om aandacht te besteden aan de ethiek.
Voorspel onderhoud met Predictive Maintenance
Een van de meest besproken toepassingen is voorspellend onderhoud plegen met data science ofwel Predictive Maintenance. Ook hier speelt een beslissing weer een belangrijke rol: wat is het beste moment om preventief onderhoud uit te voeren? Waar traditionele organisaties volgens een starre planning om de zoveel maanden of jaar standaard op elke machine of elk machineonderdeel preventief onderhoud uitvoeren, beoogt voorspellend onderhoud het juist op die momenten te doen wanneer de kans op een machinestoring of uitval (een KPI-voorbeeld) het grootst is.
Differentiëren met Data Science: beweeg je van dat schot hagel naar een precisiebombardement
Met foto’s en sensoren kun je een datastroom op gang brengen die je met Data Science automatisch analyseert. Concreet laat je de patronen opsporen die een indicatie geven dat een onderdeel kapot dreigt te gaan. Door alleen onderhoud te plegen wanneer het echt nodig is, bespaar je niet alleen veel geld, ook je productiecapaciteit neemt toe en je gooit geen dingen weg die nog prima functioneren. Data Science reikt je dus de tools aan om tot in detail te gaan differentiëren, en dat vaak volledig geautomatiseerd. Zo ga je van dat schot hagel voor een hele stad naar een precisiebombardement van specifieke gebouwen.
Datagedreven beslissen met Data Science
In nog een behoorlijk aantal organisaties zie je dat veelbelovende Data Science toepassingen meestal weer snel van het toneel verdwijnen, de zogenoemde eendagsvliegen. Er wordt druk geëxperimenteerd, iedereen is enthousiast, maar de regie ontbreekt en zelfs een glimp van een visie op de rol van Data Science is vaak ver te zoeken. De oplossing hiervoor is om eerst met elkaar een goed beeld te krijgen van de beslissingen die in jouw organisatie worden genomen of zouden genomen moeten worden. Door die in kaart te brengen kan je Data Science koppelen aan concrete beslissingen en daarmee krijg je direct de use cases inzichtelijk. Onderstaand schema kan je daarbij helpen.
Figuur 4: net als bij BI & Analytics koppel je Data Science doelbewust aan de beslissingen in je organisatie.
Start eerst met de operationele beslissingen die dagelijks, wekelijks of maandelijks worden genomen. Bijvoorbeeld de beslissing om een startup een lening te verstrekken. Of de beslissing om de voorraad van een artikel al dan niet aan te vullen. Doorloop dan alle stappen in het schema: redeneer eerst terug naar de benodigde kennis, informatie en data waarmee je je beslissing veel meer datagedreven kan maken. Pak daarna door op de acties die volgen op de beslissing, de performance, de reflectie en ervaring.
De impact stijgt exponentieel naarmate je meer processen door Data Science algoritmes laat controleren of besturen.
Denk vervolgens na hoe je alle stappen met Data Science zou kunnen automatiseren. Zo kunnen alle betrokkenen zich veel meer bewust worden van de toegevoegde waarde en kan de regie beter worden ingericht. Je verlaat daarmee de experimentele fase en gaat Data Science structureel inbedden in je processen. De impact stijgt exponentieel naarmate je meer processen door Data Science algoritmes laat controleren of besturen.
7 tips voor een bliksemstart met Data Science
Snel en effectief met Data Science aan de slag? De volgende tips helpen je organisatie te accelereren en meteen de vruchten te plukken van Data Science.
- Wat is je overkoepelende plan, wat zijn de doelen in je organisatie en hoe kun je met Data Science daarop direct aanhaken? Veel bedrijven en managers leven in de waan van de dag en hebben de neiging om overal op te reageren zonder overkoepelend plan of strategie. Datagedreven beslissen met Data Science staat altijd in het teken van de operationele, tactische en strategische doelen van de organisatie. Richt je dus in eerste instantie op de Key Performance Indicators (KPI’s) inclusief bijbehorende normen en targets.
- Hoe ziet jouw Data Science roadmap eruit? In organisaties opereren Data Scientists nog veelal als lonely wolfs. Die organisaties zijn nog vaak traditioneel ingericht of kennen managers die vaak nog eendimensionaal denken. We zien in de praktijk dan ook een groot gat tussen de wereld van Data Science en de bedrijfskunde. Daardoor blijken goedbedoelde initiatieven uiteindelijk niet succesvol te zijn. Een goede BI-roadmap en samenwerking in een multidisciplinair team kunnen helpen om deze werelden bij elkaar te brengen.
- Focus op de benodigde kennis en vaardigheden van het team in plaats van al je geld te zetten op dure en onbereikbare supermannen of -vrouwen. Bedenk dat als dergelijke duurbetaalde functionarissen plotseling overstappen naar de concurrent in hun jacht naar een (nog) hoger loon en betere arbeidsvoorwaarden, jouw organisatie het nakijken heeft. Het risico dat cruciale net ingezette processen bij het vertrek van deze sleutelfunctionaris direct stagneren, is levensgroot aanwezig. Data Science vergt een inspanning van het complete team. Heb je een team met de juiste vaardigheden aan boord? Koester dat team en optimaliseer de aanwezige talenten en balanceer de overlappende competenties.
- Besteed je aandacht aan samenwerking en investeer in de dialoog. Teams waarin er voldoende veiligheid is om een goede dialoog te voeren over verschillende meningen leveren de beste verbeterideeën en innovaties op.
- Investeer in de kerncompetenties die horen bij experimenteren en innoveren. Kennis van team- en innovatieprocessen is net zo belangrijk als inhoudelijke kennis. Deze bevorderen de motivatie en productiviteit van de individuele teamleden en het team. Ga na wat het kennisniveau is van team- en innovatieprocessen.
- Reflecteer continu op het proces, de onderlinge samenwerking en de individuele bijdragen aan het team. Dit stimuleert persoonlijke groei en versnelt de leercurves. Dit is een extra voordeel ten opzichte van een Data Science superspecialist. De feedback in het team maakt kortcyclisch, iteratief leren pas echt mogelijk. Dit reflecteren kan je vaak goed ondersteunen met behulp van competenties en klassieke verbetermethoden zoals de PDCA-verbetercirkels. Hoe wordt in jouw organisatie reflectie en samenwerking mogelijk gemaakt en ondersteund?
- Stel persoonlijke groei centraal in je organisatie, investeer in competentiegroei, groei van het team en stel de organisatiedoelen altijd centraal. Hoe kom ik, het team en de organisatie nu verder? En wie en wat is hiervoor nodig?
Data Science tools
De markt voor Data Science tooling groeit en verandert bijna elke dag en die monitoren we continu met de BI & Analytics Guide 2025. Uit deze studie blijkt dat, naast de bekende, grotere spelers zoals Microsoft (met Power BI), SAS (met Visual Analytics), IBM (met Watson Analytics), SAP en Tibco, open source een hoge vlucht heeft genomen. Er vinden op dit gebied veel interessante ontwikkelingen plaats. Er wordt veel tijd gestoken in de verdere ontwikkeling van programmeertalen als R, Python en Data Science tools en platforms als Hadoop, Dataiku en RapidMiner.
- R biedt vele verschillende statistische en grafische technieken, zoals lineaire regressie en niet-lineaire modellen, klassieke statistische tests, tijdreeksanalyse, classificatie, clustering, et cetera. Het is redelijk eenvoudig uitbreidbaar ook door de objectgeoriënteerde opzet van R.
- Python is een objectgeoriënteerde, uitbreidbare programmeertaal met krachtige bibliotheken voor datamanipulatie en analyse. Bij uitstek geschikt voor het scrapen van websites.
- Zowel R als Python kun je inzetten in combinatie met Hadoop en haar MapReduce routines.
- RapidMiner is een platform waarvan slechts de kern open source is. Het biedt een geïntegreerde omgeving voor machine learning, text mining, data mining en advanced analytics.
Tools voor Data Science (BI) zijn er dus in overvloed, maar hoe zorg je nu dat je ook succesvol kan worden? Immers, van de tien data science projecten haalt slechts één project uiteindelijk de eindstreep, zo blijkt uit tal van internationale data science studies. Het is onze missie en passie om een belangrijke bijdrage te leveren aan het verbeteren van die succesratio. Vergeet niet: de crux zit hem in de beoordelingsprocessen.
De opleiding Data Science Deze 10-daagse topopleiding is bedoeld voor iedereen die vanuit een zakelijk perspectief succesvol wil zijn met data science en daarnaast een boost wil geven aan zijn of haar carrière. Met veel aandacht voor alle toepassingsmogelijkheden die algoritmes en machine learning bieden, de tools zoals Python, R & BI tools. Uiteraard krijgen privacy, ethiek en wetgeving ook de nodige aandacht. De nadruk van deze training ligt vooral op de business-kant van Data Science.
Data Science checklist
Tot slot nog een handige checklist en 5 aandachtspunten om de kans op succes met Data Science in jouw organisatie te vergroten.
- Ontwikkel eerst een gezamenlijke, organisatiebrede visie op het vakgebied, blijf in eerste instantie weg van de techniek, maar experimenteer er wel mee.
- Inventariseer eerst de operationele beoordelingsprocessen in jouw organisatie. Daar liggen de potentiële kanshebbers voor succesvolle data science toepassingen.
- Wees je ervan bewust dat bij data science je datakwaliteit van hoog niveau moet zijn, anders loop je grote risico’s. Foutieve data in een rapport merk je relatief snel op, bij een algoritme dat onder de motorkap draait niet.
- Stel een evenwichtig data science team samen dat niet alleen maar bestaat uit techneuten. Maak ook ruimte voor business consultants, data analytics translators en business analisten.
- Wees je zeer bewust dat data science, AI, machine learning (en natuurlijk ook robots) grote impact kunnen hebben op het huidige en toekomstige werk van mensen in jouw organisatie. Je kunt altijd weerstand verwachten.
Wil je nog meer data science tips lezen? Verdiep je hieronder dan verder in het vakgebied.
Wil je Data Science nog beter doorgronden? Hieronder vind je een overzicht van artikelen waarmee je jouw kennis naar een nog hoger niveau kunt brengen.
Wanneer je Data Science niet goed (genoeg) begrijpt dan bestaat er een behoorlijke kans dat het geen succes gaat worden. Zie ook onze 7 tips voor succes.
Meteen met Data Science aan de slag?
Wil je je laten inspireren of ben je op zoek naar meer informatie? Neem dan meteen contact op met ons ervaren Data Science team. We helpen je graag en stap verder.
Over Passionned Group
Passionned Group is dé specialist in Data Science vraagstukken en oplossingen. Onze doorgewinterde consultants helpen grotere en kleinere organisaties bij de kanteling naar een intelligente, datagedreven organisatie. Om het jaar organiseren wij de Dutch BI & Data Science Award™.
Veelgestelde vragen
Wanneer is Data Science ontstaan?
In de jaren zestig begonnen statistici en wiskundigen algoritmes te ontwikkelen voor gegevensanalyse en statistische modellering. Pas na 2015 duikt de term Data Science steeds vaker op dankzij big data, geavanceerde algoritmes en de toegenomen rekenkracht van computers. Een recente publicatie is het Engelstalige boek ‘Data Science voor Beslissers en & Data Professionals’.
Uit welke onderdelen bestaat Data Science?
Data Science is een multidisciplinaire wetenschap waarbinnen verschillende vakgebieden samenkomen, zoals onder andere wiskunde, statistiek, programmeren, machine learning, data analyse, dashboarding, tekst mining, data engineering en datavisualisatie.
Wat doet een Data Scientist?
Een data scientist focust zich voornamelijk op het ontwikkelen en toepassen van machine learning modellen.
Kun je enkele concrete toepassingen van Data Science geven?
Met behulp van Data Science technieken kun je de vraag naar bepaalde producten en diensten beter voorspellen en je voorraadposities optimaliseren. Daarnaast kunt je het preventief onderhoud aan machines voorspellen en het werving- en selectieproces van personeel verbeteren. Ook kun je de verwachte drukte bij festivals en andere evenementen voorspellen.
Wat is het verschil tussen Data Science en Business Intelligence?
Een Business Intelligence consultant analyseert voornamelijk gestructureerde data. Een data scientist analyseert gestructureerde én ongestructureerde data. Terwijl een BI manager vooral datawarehouses bouwt, richt een data scientist zich op de ontwikkeling van machine learning modellen met algoritmes. Toch zijn Data Science en Business Intelligence volgens onze definities aan elkaar gelijk.
Hoe ziet het Data Science proces eruit?
Het proces bestaat globaal uit zes stappen: probleemstelling, gegevensverzameling, data-exploratie, data engineering, machine learning modellering en datavisualisatie.
Welke programmeertalen en tools zijn beschikbaar?
Data scientists maken, afhankelijk van de specifieke opdracht en persoonlijke voorkeuren, gebruik van verschillende programmeertalen. Populair zijn Python, R en Julia. Ook worden in bepaalde situaties Scala, MATLAB en SAS gebruikt. Hadoop, Dataiku en RapidMiner zijn enkele populaire datascienceplatforms.