Terug naar Insights
Data Management

Microsoft Fabric: Het Geïntegreerde Data Platform voor Analytics en AI

8 min leestijd
Microsoft Fabric: Het Geïntegreerde Data Platform voor Analytics en AI

Microsoft Fabric is een alles-in-één analytics platform dat data engineering, data science, real-time analytics, data warehousing en business intelligence combineert in één geïntegreerde omgeving. Fabric vertegenwoordigt Microsofts visie op de toekomst van het dataplatform: een unified platform dat de complexiteit van losse tools elimineert.

In dit artikel verkennen we de zeven workloads van Microsoft Fabric, leggen we de medallion-architectuur uit, duiken we in het kostenmodel, vergelijken we Fabric met Databricks en bespreken we migratiesscenario's.

De Zeven Workloads van Microsoft Fabric

Microsoft Fabric bundelt zeven gespecialiseerde workloads onder één dak. Elke workload adresseert een specifiek aspect van het data- en analyticslandschap.

1. Data Engineering

De Data Engineering workload biedt een Spark-gebaseerde omgeving voor het bouwen van datapijplijnen en transformaties. Hier vindt de zware dataverwerking plaats: het extraheren, transformeren en laden van data naar het lakehouse.

Kernfunctionaliteiten:

  • Apache Spark notebooks in Python, Scala en SQL
  • Lakehouse architectuur met Delta Lake-tabellen
  • Dataflow Gen2 voor low-code datatransformaties
  • Pipeline-orchestratie vergelijkbaar met Azure Data Factory

2. Data Factory

Data Factory in Fabric is de data-integratie engine. Het biedt connectors naar honderden databronnen en maakt het mogelijk om data te verplaatsen van bron naar lakehouse of warehouse.

Kernfunctionaliteiten:

  • 150+ connectors naar cloud- en on-premise bronnen
  • Copy jobs voor bulk data movement
  • Dataflows voor visuele transformaties
  • Scheduling en monitoring van pijplijnen

3. Data Science

De Data Science workload biedt een volledige machine learning omgeving, inclusief experiment tracking, model training en deployment.

Kernfunctionaliteiten:

  • MLflow-integratie voor experiment tracking
  • AutoML voor geautomatiseerde modeltraining
  • Model registry voor versiebeheer
  • Integratie met Azure OpenAI voor generatieve AI

4. Data Warehouse

Het Data Warehouse in Fabric is een volledig beheerde SQL-gebaseerde data warehouse oplossing. Het combineert de vertrouwde SQL-ervaring met de schaalbaarheid van het cloudplatform.

Kernfunctionaliteiten:

  • T-SQL-compatibiliteit voor bestaande query's
  • Cross-database queries over warehouses en lakehouses
  • Automatische statistieken en queryoptimalisatie
  • Row-level en column-level security

5. Real-Time Intelligence

Real-Time Intelligence (voorheen Real-Time Analytics) is ontworpen voor het analyseren van streaming data. Het is gebaseerd op Azure Data Explorer technologie.

Kernfunctionaliteiten:

  • KQL (Kusto Query Language) voor snelle querys op streamingdata
  • Eventstreams voor het vastleggen van real-time events
  • Real-time dashboards
  • Integratie met IoT- en telemetriedata

6. Power BI

Power BI is de Business Intelligence workload van Fabric. Het biedt rapportage, dashboarding en self-service analytics mogelijkheden.

Kernfunctionaliteiten:

  • Interactieve rapporten en dashboards
  • Direct Lake modus voor snelle queries op lakehouse data
  • Paginated reports voor operationele rapportages
  • Metrics en scorecards voor KPI-monitoring

7. Data Activator

Data Activator is de nieuwste workload die automatisch acties triggert wanneer datapatronen worden gedetecteerd. Denk aan alerts, notificaties en geautomatiseerde workflows.

Kernfunctionaliteiten:

  • Reflex: definieer triggers op basis van datapatronen
  • Automatische notificaties via Teams, e-mail of Power Automate
  • No-code triggerdefiniëring
  • Integratie met alle andere Fabric workloads

Medallion Architectuur in Fabric

De medallion-architectuur is het aanbevolen datamodel binnen Microsoft Fabric. Het organiseert data in drie lagen die elk een specifiek doel dienen.

Bronze Laag (Ruwe Data)

De bronze laag bevat ruwe, ongetransformeerde data direct uit de bron. Hier wordt niets gewijzigd; de data wordt een-op-een gekopieerd.

  • Doel: Volledige bron-trouw, audittrail, herverwerking mogelijk
  • Formaat: Delta Lake tabellen, vaak in originele structuur
  • Retentie: Langdurig bewaard als historische referentie

Silver Laag (Gecleande Data)

In de silver laag wordt data gecleand, gevalideerd en gestandaardiseerd. Duplicaten worden verwijderd, datatypes gecorrigeerd en datakwaliteitsregels toegepast.

  • Doel: Betrouwbare, consistente data klaar voor analyse
  • Transformaties: Deduplicatie, type-casting, join met referentiedata
  • Kwaliteitscontroles: Geautomatiseerde controles op volledigheid en juistheid

Gold Laag (Business-Ready Data)

De gold laag bevat geaggregeerde, business-ready datasets geoptimaliseerd voor rapportage en analytics.

  • Doel: Directe consumptie door dashboards, rapporten en AI-modellen
  • Structuur: Star schema's met feiten- en dimensietabellen
  • Gebruikers: Business analisten, management, Power BI-rapporten

Key takeaway: De medallion-architectuur zorgt voor een heldere scheiding van verantwoordelijkheden. Elke laag heeft een eigen doel, eigen kwaliteitsstandaarden en eigen gebruikers. Dit maakt uw dataplatform schaalbaar, onderhoudbaar en auditeerbaar.

Kostenmodel: Capacity Units (CU's)

Microsoft Fabric werkt met een capacity-based kostenmodel, gebaseerd op Capacity Units (CU's). Dit wijkt af van het traditionele per-gebruiker of per-query prijsmodel.

Hoe CU's Werken

AspectBeschrijving
Wat is een CU?Een eenheid van rekenkracht die over alle workloads wordt gedeeld
FactureringMaandelijks per capacity-tier (F2, F4, F8, F16, F32, F64, etc.)
DelenAlle workloads (Spark, SQL, Power BI) delen dezelfde capacity
SchalenCapacity kan op- en afgeschaald worden naar behoefte
PauzerenCapacity kan gepauzeerd worden om kosten te besparen

Kostenoptimalisatie Tips

  1. Start klein: Begin met een F4 of F8 capacity en schaal op wanneer nodig
  2. Pauzeer buiten kantooruren: Als uw werkbelasting alleen overdag draait, pauzeer de capacity 's nachts en in het weekend
  3. Monitor CU-gebruik: Gebruik de Fabric Capacity Metrics App om te zien welke workloads de meeste capaciteit verbruiken
  4. Optimaliseer queries: Inefficiënte Spark jobs of SQL queries verbranden onnodig CU's
  5. Reserveer vooraf: Azure-reserveringen bieden tot 40% korting bij een commitment van een of drie jaar

Wanneer Fabric Kiezen (en Wanneer Niet)

Microsoft Fabric is krachtig, maar niet voor elke organisatie de juiste keuze. Hieronder een helder overzicht.

Fabric Kiezen Wanneer

  • U al investeert in het Microsoft-ecosysteem (Azure, Microsoft 365, Power BI)
  • U een all-in-one platform zoekt dat data engineering, BI en data science combineert
  • U een lakehouse-architectuur wilt bouwen
  • U self-service analytics wilt faciliteren voor business gebruikers
  • U het beheer van meerdere losse tools wilt vereenvoudigen

Fabric Vermijden Wanneer

  • U een multi-cloud strategie hebt en vendor lock-in wilt vermijden
  • U zeer geavanceerde ML-workloads hebt die maximale controle over de Spark-omgeving vereisen
  • U al een volwassen dataplatform hebt op een ander ecosysteem
  • Uw budget beperkt is en u al over losse tools beschikt die goed functioneren

Fabric versus Databricks

Een veelgestelde vraag is hoe Microsoft Fabric zich verhoudt tot Databricks. Beide platformen bieden krachtige data- en analytics-capaciteiten, maar met verschillende filosofieën.

CriteriumMicrosoft FabricDatabricks
FilosofieUnified Microsoft platformOpen, multi-cloud data intelligence
Cloud supportAlleen AzureAzure, AWS, GCP
Data EngineeringSpark (beheerd)Spark (geoptimaliseerd, Delta Lake native)
SQL AnalyticsData Warehouse workloadDatabricks SQL
BIPower BI (native geïntegreerd)Via externe BI-tools
ML/AIBasis MLflow + Azure OpenAIGeavanceerde ML + MLflow + Foundation Models
GovernanceMicrosoft Purview integratieUnity Catalog
KostenmodelCapacity UnitsDBU's (per workload)
Beste voorMicrosoft-georiënteerde organisatiesMulti-cloud, geavanceerde data engineering/ML

Combinatie is Mogelijk

Fabric en Databricks sluiten elkaar niet uit. Veel organisaties kiezen voor Databricks als data engineering en ML platform, en Fabric/Power BI als BI-laag. De integratie tussen beide platformen is steeds beter geworden.

Migratiescenario's

Van Power BI Premium naar Fabric

Organisaties met bestaande Power BI Premium capaciteiten kunnen migreren naar Fabric capacity. Bestaande rapporten en datasets blijven functioneren. U krijgt er de overige Fabric workloads bij.

Van Azure Synapse naar Fabric

Azure Synapse wordt geleidelijk geïntegreerd in Fabric. Bestaande Synapse workspaces kunnen naast Fabric draaien. Microsoft biedt migratietools voor Synapse pipelines en SQL pools.

Van On-Premise naar Fabric

Organisaties die van on-premise SQL Server of SSIS migreren, kunnen Fabric gebruiken als cloud-bestemming. De Data Factory workload biedt connectors naar on-premise bronnen via een data gateway.

Meer over data-architectuurkeuzes leest u op onze pagina over data warehousing. Voor een breder perspectief op datamanagement raadpleeg het DAMA DMBOK framework.

De Rol van Governance in Fabric

Een Fabric-implementatie zonder data governance leidt snel tot wildgroei. Richt uw governance in via:

  • Werkruimte-beleid: Wie mag workspaces aanmaken en beheren?
  • Datadomeinen: Organiseer content langs bedrijfsdomeinen
  • Endorsement: Certificeer betrouwbare datasets en rapporten
  • Monitoring: Gebruik de admin portal voor usage monitoring en compliance
  • Metadata management: Documenteer datasets en transformaties in een data catalogus

Conclusie

Microsoft Fabric is een ambitieus platform dat de potentie heeft om het datalandschap van organisaties fundamenteel te vereenvoudigen. Door zeven workloads te integreren in één platform, elimineert Fabric de complexiteit van losse tools en biedt het een pad van ruwe data tot AI-inzichten.

De sleutel tot succes is een doordachte implementatie met aandacht voor architectuur, governance en kosten. Begin klein, bewijs waarde en schaal op.

Wilt u verkennen of Microsoft Fabric past bij uw organisatie? Wij helpen u met een assessment en implementatieplan op maat.

Plan een vrijblijvend gesprek en ontdek de mogelijkheden van Microsoft Fabric.

Data Dock — Data op orde. AI aan boord.

Veelgestelde vragen

Wilt u meer weten over data management?