Adatbányászat Blog

Az Adatbányász Blogon a dmlab szakértőinek írásait olvashatod a big data és data science területéről.

dmlab.hu - Big data és data science tanácsadás
"Ha örülsz, hogy fejedre nőttek az adatok."

Keress minket bátran:
- Nagy-Rácz István +36704595669
- Gáspár Csaba +36208234154
- info@dmlab.hu

2010.04.20. 10:34 Prekopcsák Zoltán

RapidMiner 5.0 - Felhasználói felület

Címkék: felület rapidminer

A korábbi bejegyzésekben bemutattam az új verzió újdonságait, valamint az újszerű metaadat-kezeléssel járó előnyöket, most pedig a felhasználói felületről ejtenék néhány szót.

A korábbi verziókkal szemben gyakori és jogos kritika volt, hogy nehezen tanulható, nagyon sok energiát kell beletenni, mire az ember az első értelmes elemzését létre tudja hozni. A fejlesztők is belátták ezt, és az 5.0 kiadás "adatbányászat a tömegeknek" szlogenje is azt jelezte, hogy igyekeznek minél egyszerűbbé tenni a szoftver elsajátítását.

Ennek egyik legfontosabb jele az új flow layout, ami a többi szoftver esetén már ismerős lehet: az egyes operátorokat kis ikonok jelképezik, és azokat összekötve definiálhatjuk az adatok áramlását. Itt egy bonyolultabb, több elágazással is terhelt példa látható:

Ez a megoldás nagyon hasonlít például az IBM SPSS Modeler (régi nevén Clementine) interfészéhez, de egy fontos különbség, hogy az egyes operátorokat jelképező ikonokon kis félkör alakú "konnektorok" jelentek meg, ezáltal egy operátornak többféle ki- és bemenete is lehet. Ez az adatelemzési filozófia viszonylag gyorsan elsajátítható, de néha bosszantó dolgokkal találkozunk. Két konnektor összekötésére természetes megoldásnak tűnik, hogy az egérgombot lenyomva tartva húzunk egyenest közéjük, azonban a RapidMiner ezt nem fogadja el, hanem a két konnektoron külön-külön kell kattintanunk, hogy a kapcsolatot létrehozzuk. Persze mondhatjuk, hogy ez megszokás kérdése, de az elején mindenképp bosszantó.

A metaadat-kezeléssel járó újabb előny, hogy új operátorok hozzáadása esetén a keretrendszer megpróbálja automatikusan létrehozni a kapcsolatokat. Bár ez kiválóan hangzik, sajnos nagyon ritkán sikerül megtalálnia a megfelelő megoldást, így érdemben nem csökkenti az elemzési időt.

Komoly nehézséget okoz azonban a flow layout felületen, ha metaoperátorokat akarunk használni. A RapidMiner egyik fő előnye a többi szoftverrel szemben, hogy beépített operátorokkal nagyon rugalmasan lehet validációt, optimalizálást, vagy akár szavazó eljárásokat létrehozni, amit a többi szoftverben általában csak szkripteléssel (vagy úgy sem) lehet megoldani. A metaoperátorok ugyanolyan ikonokként jelennek meg a felületen, mint a többi egyszerű operátor, azonban duplán belekattintva annak belsejébe kerülünk, és a belső elemzést szerkeszthetjük. Így azonban nem látjuk át egyszerre az elemzést, ezért ilyenkor talán érdemes visszaváltani a klasszikus operátorfa nézetre, ahol a teljes elemzés áttekinthető.

Összességében a szoftver felhasználói felületéről elmondható, hogy jobban sikerült, mint a korábbi verziók esetén, azonban messziről ordít róla, hogy programozók és adatbányászok tervezték, mert néha a legalapvetőbb felülettervezési elveket sem tartották be. Azt hiszem a RapidMiner sokkal nagyobb lépést tudna a tenni a "tömegek" felé, ha a jövőben a felülettervezést olyan emberre bíznák, akinek valóban ez a szakterülete.

Szólj hozzá!

A bejegyzés trackback címe:

https://adatbanyaszat.blog.hu/api/trackback/id/tr21936582

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.