Microsoft Fabric: Het Geïntegreerde Data Platform voor Analytics en AI

Microsoft Fabric is een alles-in-één analytics platform dat data engineering, data science, real-time analytics, data warehousing en business intelligence combineert in één geïntegreerde omgeving. Fabric vertegenwoordigt Microsofts visie op de toekomst van het dataplatform: een unified platform dat de complexiteit van losse tools elimineert.
In dit artikel verkennen we de zeven workloads van Microsoft Fabric, leggen we de medallion-architectuur uit, duiken we in het kostenmodel, vergelijken we Fabric met Databricks en bespreken we migratiesscenario's.
De Zeven Workloads van Microsoft Fabric
Microsoft Fabric bundelt zeven gespecialiseerde workloads onder één dak. Elke workload adresseert een specifiek aspect van het data- en analyticslandschap.
1. Data Engineering
De Data Engineering workload biedt een Spark-gebaseerde omgeving voor het bouwen van datapijplijnen en transformaties. Hier vindt de zware dataverwerking plaats: het extraheren, transformeren en laden van data naar het lakehouse.
Kernfunctionaliteiten:
- Apache Spark notebooks in Python, Scala en SQL
- Lakehouse architectuur met Delta Lake-tabellen
- Dataflow Gen2 voor low-code datatransformaties
- Pipeline-orchestratie vergelijkbaar met Azure Data Factory
2. Data Factory
Data Factory in Fabric is de data-integratie engine. Het biedt connectors naar honderden databronnen en maakt het mogelijk om data te verplaatsen van bron naar lakehouse of warehouse.
Kernfunctionaliteiten:
- 150+ connectors naar cloud- en on-premise bronnen
- Copy jobs voor bulk data movement
- Dataflows voor visuele transformaties
- Scheduling en monitoring van pijplijnen
3. Data Science
De Data Science workload biedt een volledige machine learning omgeving, inclusief experiment tracking, model training en deployment.
Kernfunctionaliteiten:
- MLflow-integratie voor experiment tracking
- AutoML voor geautomatiseerde modeltraining
- Model registry voor versiebeheer
- Integratie met Azure OpenAI voor generatieve AI
4. Data Warehouse
Het Data Warehouse in Fabric is een volledig beheerde SQL-gebaseerde data warehouse oplossing. Het combineert de vertrouwde SQL-ervaring met de schaalbaarheid van het cloudplatform.
Kernfunctionaliteiten:
- T-SQL-compatibiliteit voor bestaande query's
- Cross-database queries over warehouses en lakehouses
- Automatische statistieken en queryoptimalisatie
- Row-level en column-level security
5. Real-Time Intelligence
Real-Time Intelligence (voorheen Real-Time Analytics) is ontworpen voor het analyseren van streaming data. Het is gebaseerd op Azure Data Explorer technologie.
Kernfunctionaliteiten:
- KQL (Kusto Query Language) voor snelle querys op streamingdata
- Eventstreams voor het vastleggen van real-time events
- Real-time dashboards
- Integratie met IoT- en telemetriedata
6. Power BI
Power BI is de Business Intelligence workload van Fabric. Het biedt rapportage, dashboarding en self-service analytics mogelijkheden.
Kernfunctionaliteiten:
- Interactieve rapporten en dashboards
- Direct Lake modus voor snelle queries op lakehouse data
- Paginated reports voor operationele rapportages
- Metrics en scorecards voor KPI-monitoring
7. Data Activator
Data Activator is de nieuwste workload die automatisch acties triggert wanneer datapatronen worden gedetecteerd. Denk aan alerts, notificaties en geautomatiseerde workflows.
Kernfunctionaliteiten:
- Reflex: definieer triggers op basis van datapatronen
- Automatische notificaties via Teams, e-mail of Power Automate
- No-code triggerdefiniëring
- Integratie met alle andere Fabric workloads
Medallion Architectuur in Fabric
De medallion-architectuur is het aanbevolen datamodel binnen Microsoft Fabric. Het organiseert data in drie lagen die elk een specifiek doel dienen.
Bronze Laag (Ruwe Data)
De bronze laag bevat ruwe, ongetransformeerde data direct uit de bron. Hier wordt niets gewijzigd; de data wordt een-op-een gekopieerd.
- Doel: Volledige bron-trouw, audittrail, herverwerking mogelijk
- Formaat: Delta Lake tabellen, vaak in originele structuur
- Retentie: Langdurig bewaard als historische referentie
Silver Laag (Gecleande Data)
In de silver laag wordt data gecleand, gevalideerd en gestandaardiseerd. Duplicaten worden verwijderd, datatypes gecorrigeerd en datakwaliteitsregels toegepast.
- Doel: Betrouwbare, consistente data klaar voor analyse
- Transformaties: Deduplicatie, type-casting, join met referentiedata
- Kwaliteitscontroles: Geautomatiseerde controles op volledigheid en juistheid
Gold Laag (Business-Ready Data)
De gold laag bevat geaggregeerde, business-ready datasets geoptimaliseerd voor rapportage en analytics.
- Doel: Directe consumptie door dashboards, rapporten en AI-modellen
- Structuur: Star schema's met feiten- en dimensietabellen
- Gebruikers: Business analisten, management, Power BI-rapporten
Key takeaway: De medallion-architectuur zorgt voor een heldere scheiding van verantwoordelijkheden. Elke laag heeft een eigen doel, eigen kwaliteitsstandaarden en eigen gebruikers. Dit maakt uw dataplatform schaalbaar, onderhoudbaar en auditeerbaar.
Kostenmodel: Capacity Units (CU's)
Microsoft Fabric werkt met een capacity-based kostenmodel, gebaseerd op Capacity Units (CU's). Dit wijkt af van het traditionele per-gebruiker of per-query prijsmodel.
Hoe CU's Werken
| Aspect | Beschrijving |
|---|---|
| Wat is een CU? | Een eenheid van rekenkracht die over alle workloads wordt gedeeld |
| Facturering | Maandelijks per capacity-tier (F2, F4, F8, F16, F32, F64, etc.) |
| Delen | Alle workloads (Spark, SQL, Power BI) delen dezelfde capacity |
| Schalen | Capacity kan op- en afgeschaald worden naar behoefte |
| Pauzeren | Capacity kan gepauzeerd worden om kosten te besparen |
Kostenoptimalisatie Tips
- Start klein: Begin met een F4 of F8 capacity en schaal op wanneer nodig
- Pauzeer buiten kantooruren: Als uw werkbelasting alleen overdag draait, pauzeer de capacity 's nachts en in het weekend
- Monitor CU-gebruik: Gebruik de Fabric Capacity Metrics App om te zien welke workloads de meeste capaciteit verbruiken
- Optimaliseer queries: Inefficiënte Spark jobs of SQL queries verbranden onnodig CU's
- Reserveer vooraf: Azure-reserveringen bieden tot 40% korting bij een commitment van een of drie jaar
Wanneer Fabric Kiezen (en Wanneer Niet)
Microsoft Fabric is krachtig, maar niet voor elke organisatie de juiste keuze. Hieronder een helder overzicht.
Fabric Kiezen Wanneer
- U al investeert in het Microsoft-ecosysteem (Azure, Microsoft 365, Power BI)
- U een all-in-one platform zoekt dat data engineering, BI en data science combineert
- U een lakehouse-architectuur wilt bouwen
- U self-service analytics wilt faciliteren voor business gebruikers
- U het beheer van meerdere losse tools wilt vereenvoudigen
Fabric Vermijden Wanneer
- U een multi-cloud strategie hebt en vendor lock-in wilt vermijden
- U zeer geavanceerde ML-workloads hebt die maximale controle over de Spark-omgeving vereisen
- U al een volwassen dataplatform hebt op een ander ecosysteem
- Uw budget beperkt is en u al over losse tools beschikt die goed functioneren
Fabric versus Databricks
Een veelgestelde vraag is hoe Microsoft Fabric zich verhoudt tot Databricks. Beide platformen bieden krachtige data- en analytics-capaciteiten, maar met verschillende filosofieën.
| Criterium | Microsoft Fabric | Databricks |
|---|---|---|
| Filosofie | Unified Microsoft platform | Open, multi-cloud data intelligence |
| Cloud support | Alleen Azure | Azure, AWS, GCP |
| Data Engineering | Spark (beheerd) | Spark (geoptimaliseerd, Delta Lake native) |
| SQL Analytics | Data Warehouse workload | Databricks SQL |
| BI | Power BI (native geïntegreerd) | Via externe BI-tools |
| ML/AI | Basis MLflow + Azure OpenAI | Geavanceerde ML + MLflow + Foundation Models |
| Governance | Microsoft Purview integratie | Unity Catalog |
| Kostenmodel | Capacity Units | DBU's (per workload) |
| Beste voor | Microsoft-georiënteerde organisaties | Multi-cloud, geavanceerde data engineering/ML |
Combinatie is Mogelijk
Fabric en Databricks sluiten elkaar niet uit. Veel organisaties kiezen voor Databricks als data engineering en ML platform, en Fabric/Power BI als BI-laag. De integratie tussen beide platformen is steeds beter geworden.
Migratiescenario's
Van Power BI Premium naar Fabric
Organisaties met bestaande Power BI Premium capaciteiten kunnen migreren naar Fabric capacity. Bestaande rapporten en datasets blijven functioneren. U krijgt er de overige Fabric workloads bij.
Van Azure Synapse naar Fabric
Azure Synapse wordt geleidelijk geïntegreerd in Fabric. Bestaande Synapse workspaces kunnen naast Fabric draaien. Microsoft biedt migratietools voor Synapse pipelines en SQL pools.
Van On-Premise naar Fabric
Organisaties die van on-premise SQL Server of SSIS migreren, kunnen Fabric gebruiken als cloud-bestemming. De Data Factory workload biedt connectors naar on-premise bronnen via een data gateway.
Meer over data-architectuurkeuzes leest u op onze pagina over data warehousing. Voor een breder perspectief op datamanagement raadpleeg het DAMA DMBOK framework.
De Rol van Governance in Fabric
Een Fabric-implementatie zonder data governance leidt snel tot wildgroei. Richt uw governance in via:
- Werkruimte-beleid: Wie mag workspaces aanmaken en beheren?
- Datadomeinen: Organiseer content langs bedrijfsdomeinen
- Endorsement: Certificeer betrouwbare datasets en rapporten
- Monitoring: Gebruik de admin portal voor usage monitoring en compliance
- Metadata management: Documenteer datasets en transformaties in een data catalogus
Conclusie
Microsoft Fabric is een ambitieus platform dat de potentie heeft om het datalandschap van organisaties fundamenteel te vereenvoudigen. Door zeven workloads te integreren in één platform, elimineert Fabric de complexiteit van losse tools en biedt het een pad van ruwe data tot AI-inzichten.
De sleutel tot succes is een doordachte implementatie met aandacht voor architectuur, governance en kosten. Begin klein, bewijs waarde en schaal op.
Wilt u verkennen of Microsoft Fabric past bij uw organisatie? Wij helpen u met een assessment en implementatieplan op maat.
Plan een vrijblijvend gesprek en ontdek de mogelijkheden van Microsoft Fabric.
Data Dock — Data op orde. AI aan boord.
Veelgestelde vragen
Gerelateerde diensten
Ontdek hoe Data Dock uw organisatie concreet kan helpen.
Data Governance
Data Governance vormt het hart van professioneel datamanagement. Wij helpen organisaties bij het opzetten van een robuust governance-raamwerk met duidelijke rollen, verantwoordelijkheden en beleidsregels. Zo creëert u de randvoorwaarden voor betrouwbare, compliant en waardevolle data.
Lees meerData Architectuur
Een solide data-architectuur is de blauwdruk voor uw gehele datalandschap. Wij ontwerpen schaalbare, toekomstbestendige architecturen die de brug slaan tussen bedrijfsstrategie en technische implementatie. Van conceptueel model tot technische specificatie.
Lees meerWilt u meer weten over data management?