Adatbányászat Blog

Az Adatbányász Blogon a dmlab szakértőinek írásait olvashatod a big data és data science területéről.

dmlab.hu - Big data és data science tanácsadás
"Ha örülsz, hogy fejedre nőttek az adatok."

Keress minket bátran:
- Nagy-Rácz István +36704595669
- Gáspár Csaba +36208234154
- info@dmlab.hu

2013.11.05. 19:37 István NagyRácz

Adatvizualizációs próbálkozások

Címkék: konferencia vizualizáció tableau

Régóta fenn volt a todo-im között egy bejegyzés, hogy "Kompetencia - Tableau Public", vagyis, hogy ismerkedjem meg a Tableau adatvizualizációs eszközzel, nézzem meg mire képes a public verzió, mit is takar a Tableau szerint az adatelemzés vizuális formája. 

Remek apropót adott ehhez a héten megrendezésre kerülő Budapest BI Fórum dashboard pályázata, ahol a cél az volt, hogy a pályázók készítsenek egy dashboardot egy választott eszközben a KSH által szolgáltatott adatokon, amelyek a hazai személygépjármű állomány statisztikáit tartalmazzák idősorosan, földrajzi és műszaki dimenziók szerinti bontásban. Az adathalmazban megadott mutatók az állomány méretét és összesített korát tartalmazzák.

Az első próbálkozások után két olyan tanulsága volt a próbálkozásnak, amit hasznosnak tartottam amellett, hogy egy új eszközt ismertem meg:

  1. Egyszerűség. Az első próbálkozásaim alkalmával összeszedtem minden olyan gondolatot, ami arra kérdésre adott választ, hogy mit is tudnék kezdeni ezzel az adathalmazzal? Milyen összefüggéseket tudok megmutatni? Milyen érdekességeket lehet ábrázolni az adatokkal? Ez a gondolkodásmód az elemzői múltamból adódik, ahol egy adatbányászati probléma megoldása során ezeket a kérdéseket kell megválaszolni és az ezekre adott válaszok alapján lehet elindulni az adatelőkészítési szakaszban. Ez a megközelítésmód nem áll messze a vizuális adatelemzéstől, hiszen ott pontosan ilyen kérdéseket lehet megválaszolni jól eltalált vizualizációkkal. Egy dashboard kapcsán azonban a cél egy - akár összetett - vizualizáció elkészítése, aminél a legfőbb cél, hogy a fogyasztása egyszerű legyen: jól és gyorsan értelmezhető ábrákat kell csinálni, amelyek nem terhelik túl a fogyasztó befogadóképességét. Ez el is vezetett a második tanulsághoz:
  2. Legyen egy sztorid. Egy dashboardon nem lehet cél, hogy az adathalmazban lévő minden összefüggést megjelenítsünk, a cél az, hogy az adatok alapján legyen egy történetünk, amit a vizualizációkkal mesélünk el. A megjelenítés célja, hogy ezen a sztorin végigvezesse annak fogyasztóját: tegye fel a kérdést, majd különböző részletezettséggel válaszolja azt meg.

Nekem ezen a ponton eszembe jutott Körmendi Gyuri autóvásárlásos története, és így jutottam el a konkrét feladat kapcsán, hogy megnézzem azt, hogy hogyan változott Magyarországon az egyes autómárkák elterjedtsége. Nem csupán arra voltam kíváncsi, hogy ez időben hogyan alakult, hanem arra is, hogy ez miként tér el a már meglévő állomány és az új autó vásárlások között. 

Budapest_BI_Fórum.png

A képre kattintva megtekinthető az általam készített interaktív vizualizáció is.

Szólj hozzá!

A bejegyzés trackback címe:

https://adatbanyaszat.blog.hu/api/trackback/id/tr955616578

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.