In deze serie van blogposts bekijken we hoe we op een aantal eenvoudige manieren de grootte van een model kunnen beperken.
De vorige blogposts
De impact van een kolom
Power BI is niet zomaar een database. Gegevens worden er anders opgeslagen dan in een ‘gewone’ database als SQL of Access. In Power BI worden gegevens in kolommen opgeslagen en geanalyseerd. Dus hoe meer kolommen je hebt, hoe meer er geanalyseerd moet worden. En hoe meer unieke waarden in een kolom, hoe langer de analyse van een kolom duurt.
Vandaar dat je best enkel de kolommen die je echt nodig hebt in een model laadt. Op die manier zal het model niet alleen kleiner worden; het vernieuwen van de gegevens zal ook sneller gebeuren.
In mijn model ga ik de volgende kolommen verwijderen omdat ik er niet op wil rapporteren:
- InvoiceDate, ShippingDate (in Sales)
- Week or Weekend, Semester (in Dates)
Als we de gegevens in Excel vernieuwen dan zien we dat het model van 18MB naar 16,8 MB daalt.
Dat lijkt misschien geen groot verschil, maar in dit voorbeeldje bevat de grootste tabel slechts 260.000 records.
Er is nog 1 extra veld dat eigenlijk ook zou moeten verwijderd worden, maar dat wordt uitgelegd in de volgende blogpost; omdat je dan ook beter zal begrijpen waarom het verwijderen van kolommen een impact heeft op de duur van een refresh.