Dans cette série de posts, nous allons examiner comment il est possible de limiter la taille d’un modèle en quelques actions simples.
Les posts précédents
L’impact d’une colonne
Power BI n’est pas juste une base de données. Les données dans Power BI sont sauvegardées différemment que dans une base de données « classique » telle que SQL ou Access. Dans Power BI, les données sont sauvegardées et analysées sous la forme de colonnes. Dès lors, plus vous avez de colonnes, plus il y a d’analyses. Et plus il y a de valeurs uniques dans une colonne, plus l’analyse d’une colonne prend du temps.
Il vaut donc mieux dans un modèle uniquement charger les colonnes dont vous avez vraiment besoin. Dan cette manière le modèle reste rapide et moins dur.
Dans mon modèle, je vais supprimer les colonnes suivantes parce que je ne veux pas y lier de rapports :
- InvoiceDate, ShippingDate (dans Sales)
- Week or Weekend, Semester (dans Dates)
Si nous actualisons les données dans Excel, nous constatons que le modèle est passé de 18MB à 16,8 MB.
Dat lijkt misschien geen groot verschil, maar in dit voorbeeldje bevat de grootste tabel slechts 260.000 records.
Er is nog 1 extra veld dat eigenlijk ook zou moeten verwijderd worden, maar dat wordt uitgelegd in de volgende blogpost; omdat je dan ook beter zal begrijpen waarom het verwijderen van kolommen een impact heeft op de duur van een refresh.