Záverečným projektom v rámci predmetu bola výroba reportu v Power BI.
V analýze som pracovala s datasetom o kolekcii múzea moderného umenia v New Yorku. Moja hlavná otázka bola, čo za diela sa v múzeu podľa získaných dát nachádzajú, konkrétne som sa pýtala na tieto oblasti:
Ktorý autor má v kolekcii najviac diel?
Aký je pomer medzi počtom diel od žien a od mužov?
Do ktorej z daných klasifikácií spadá najviac diel?
V ktorom roku bolo získaných najviac diel?
Ktorá národnosť prevláda medzi autormi?
Čistenie dát:

Medzi veci, ktoré som pri čistení dát riešila, patrí to, že som sa chýbajúce údaje, ako napríklad meno alebo pohlavie autora, snažila jednotne pomenovať unknown.
Pri zmene dátového typu údajov a výške a šírke na číslo som musela zmeniť . na ,
Odstránila som všetky diela, ktoré nemali uvedený názov (2 %).
Stĺpec Constituent ID som nastavila na typ číslo a potom som odstránila chyby, tiež som sa zbavila všetkých riadkov, ktoré nemali žiadne Object ID, pretože nemali vyplnené ani iné údaje o sebe.
Odstránila som tiež stĺpce, ktoré neboli takmer u žiadneho alebo dokonca u žiadneho diela vyplnené: Circumference, Depth, Diameter, Length, Weight, Seat Height, Duration.
Odpovede na otázky:
Najviac diel v kolekcii má autor E. McKnight Kauffer (167). Pri veľa dielach tiež nie je autor vôbec známy alebo uvedený.
Viac autorov je mužského pohlavia (5649), veľa diel tiež nemá pohlavie autora uvedené (1176).
Najviac diel spadá medzi dizajn (5929).
Najviac diel bolo získaných v roku 1999 (696).
Najviac autorov je z Ameriky (2512), potom nasleduje Nemecko (677) a Veľká Británia (489).Počtom je však na druhom mieste najviac diel od autorov s neuvedenou národnosťou (725).
Zaujímavosti:
Z diel získaných v roku 1999 bolo až 106 z Česka. Najviac ich vtedy bolo z Nemecka (243).

Od žien bolo najviac diel získaných v roku 1970 (82).
Čo sa národnosti a žien týka, po Američankách sú na druhom mieste tituly od žien zo Švajčiarska (59).

Článok nájdete pubikovaný aj na mojom profile na Medium.
Výsledná vizualizácia:
