Adatbányászat Blog

Az Adatbányász Blogon a dmlab szakértőinek írásait olvashatod a big data és data science területéről.

dmlab.hu - Big data és data science tanácsadás
"Ha örülsz, hogy fejedre nőttek az adatok."

Keress minket bátran:
- Nagy-Rácz István +36704595669
- Gáspár Csaba +36208234154
- info@dmlab.hu

2010.05.10. 11:28 Prekopcsák Zoltán

RapidMiner 5.0 - kiterjesztések

Címkék: közösség web rapidminer pmml

Az eddigi cikkekben áttekintettem a RapidMiner 5.0 újdonságait, metaadat kezelését és felhasználói felületét, ezúttal pedig az alapszoftverhez ingyenesen letölthető kiegészítéseket veszem szemügyre.

Az új verzióhoz a megjelenés után 3 hónappal már összesen nyolc kiegészítés áll rendelkezésre. Ezek közül néhánnyal már a korábbi verziókban is találkozhattunk, így a Weka operátorainak jelenléte, valamint a szövegbányászati és idősoros operátorok nem okoznak nagy meglepetést. Meglepő fordulat viszont, hogy az eddig csak a fizetős verzióban kínált riporting modul ingyenessé vált, amivel a szoftver megjelenített ábráit és eredményeit szervezhetjük riportokba és menthetjük változatos formátumokba. Szintén ingyenessé vált egy párhuzamosító kiegészítés, amely néhány operátor többmagú futását teszi lehetővé. Ezt tipikusan az optimalizáló és egyéb vezérlési szerkezeteket megvalósító operátorok tudják kihasználni. A két kiterjesztés megnyitásával a RapidMiner fizetős és ingyenes verziója funkciókészletben egyenértékűvé vált, ami az üzleti modell eltolódását is jelzi.

Az egyik teljesen új kiterjesztés webes adatok elemzését segíti. A szoftver képessé válik nyers web-logok, HTML fájlok, RSS források beolvasására és azokat a RapidMiner által kezelhető táblás adatszerkezetekre konvertálja, ami után már használhatóak a megszokott előfeldolgozó és modellező eljárások. Ez nagyban segítheti olyan feladatok megoldását, amihez mi az eddigiekben főleg parancssoros eszközöket (pl. awk) használtunk a beolvasás előtt.

Ugyancsak nagy előrelépést jelent a PMML modul, amellyel szabványos formátumba lehet kimenteni, illetve beolvasni adatbányászati modelleket, így elméletileg megvalósulhat a szoftverfüggetlen modellezés. Egy másik trendre tapintottak rá a fejlesztők a MyExperiment integrálásával. Ezen a weboldalon keresztül megoszthatunk elemzéseket, valamint megvitathatjuk azokat a többi felhasználóval.

Az új modulok közül a webes kiegészítés inkább egy régi hiányosság megvalósítása, míg a PMML és a MyExperiment új stratégiai iránynak tűnik, ezért ezekről még a későbbiekben is ejtünk pár szót ezen a blogon.

Szólj hozzá!

A bejegyzés trackback címe:

https://adatbanyaszat.blog.hu/api/trackback/id/tr81987964

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.