Databronnen en datagerelateerde vragen evolueren continu. Een goede data-oplossing of -architectuur groeit dan ook mee met uw organisatie en voortschrijdende inzichten. Maar welke oplossingen bestaan er precies? En welke is het meest geschikt voor uw uitdagingen van vandaag én die van morgen? Verken hieronder de meest courante oplossingen en belangrijkste principes.
Data-driven beslissingen beginnen vaak met een aantal eenvoudige rapporten. Tools zoals Microsoft Power BI connecteren daarvoor rechtstreeks met backendsystemen. Naarmate er meer vragen komen en er dus meer informatie nodig is, zijn er alsmaar meer systemen (ERP, CRM, Finance, …) betrokken. Klantengegevens kunnen bijvoorbeeld in meerdere tools zitten, vaak met eigen coderingen, eigenschappen, …
De informatie kan bovendien complementair of net overlappend zijn. In het laatste geval is het niet altijd duidelijk welke versie het meest accuraat is.
Met Power BI kunt u informatie transformen en mergen. Volstaat dat? Is dit in ieder rapport consistent toegepast? Wat als de regels wijzigen en transformaties gefragmenteerd zitten over meerdere rapporten of systemen? Een gecentraliseerde aanpak kan op termijn heel wat voordelen opleveren.
Naast een gefragmenteerde datacollectie en -transformatie komen incorrecte, incomplete of dubbele gegevens vaak voor. Door menselijke fouten, historische fouten of meer structurerele oorzaken. Het gevolg? Slechte beslissingen, geërgerde klanten, een gehavende reputatie of zelfs verminderde omzet.
Daarom is het datakwaliteit zo cruciaal bij het bepalen van een datastrategie op lange termijn en het kiezen van de juiste data-oplossing.
Dankzij cloudtechnologie (waaronder Microsoft Azure) is het mogelijk om data intelligence-oplossingen en uw datastrategie gradueel uit te bouwen. In de cloud kunt u immers stap voor stap schakelen, zonder grote investeringen. Wanneer u merkt dat de limieten van uw huidige rapportering bereikt zijn, stapt u gewoon over naar een structurele oplossing. Heel ‘agile’. Zo boekt u snel resultaat zonder het grotere plaatje uit het oog te verliezen. Bovendien bespaart het u heel wat extra werk nadien.
Data warehouses spelen al geruime tijd een belangrijke rol bij het ondersteunen van businessprocessen en rapportering. Een datawarehouse helpt om getransformeerde, gefilterde en gestructureerde data – vaak transactionele data – te bewaren in een vaste, relationele datastructuur. Aan de hand van tools zoals Microsoft Power BI data zet u die data om in in visueel aantrekkelijke dashboards.
Een datawarehouse bestaat uit een set van technologieën, van ETL-componenten – zoals Azure Data Factory – tot databases – zoals Azure SQL.
Een datawarehouse zorgt ervoor dat data uit verschillende systemen klaargestoomd worden voor de business. Er zijn echter ook een aantal beperkingen:
Om bovengenoemde beperkingen te omzeilen, maken heel wat organisaties gebruik van een data lake. In tegenstelling tot een data warehouse is een data lake namelijk niet onderhevig aan vaste structuren, en dus flexibeler en makkelijker uit te breiden. Een data lake laat toe om vrijwel alle ongestructureerde data weg te schrijven en uit te lezen wanneer nodig. Dat maakt deze oplossing een stuk toekomstgerichter, en de droom van elke data scientist.
Toch is een data lake niet in alle omstandigheden de ultieme oplossing. Zo zijn ook hier een aantal beperkingen:
Gelukkig bestaat er sinds kort ook zoiets als een data lakehouse. Deze oplossing combineert de voordelen van een data lake en warehouse in één architectuur of oplossing. Zo biedt een lakehouse zowel de flexibiliteit en diversiteit van een data lake als de consistentie en kwaliteit van een data warehouse. Kwaliteitsmonitoring zorgt er bovendien voor dat data steeds compleet en correct is.
In een data lakehouse zijn opslag en rekenkracht losgekoppeld van elkaar. Dat maakt deze oplossing zeer schaalbaar en kostenefficiënt, ook bij grote hoeveelheden data. Rekenkracht kan op die manier immers ingezet worden wanneer dat nodig is. Kortom, met een data lakehouse kunnen zowel data scientists als businessanalisten en users optimaal gebruik maken van data.
Elke situatie is uniek, maar deze criteria helpen u alvast bij uw keuze:
OQuila maakt gebruik van 100% Azure-componenten (PaaS en SaaS). We combineren de voordelen van een data warehouse en data lake door middel van Azure Synapse en standaard OQuila-configuraties. Via standaardconnectoren kan brondata uit nagenoeg elk systeem worden gehaald, en dat zowel on-premise als in de cloud. Zo kunnen zowel data scientists, ervaren businessanalisten als self-service BI-gebruikers ten volle de kracht van data benutten.