Adatbányászat Blog

Az Adatbányász Blogon a dmlab szakértőinek írásait olvashatod a big data és data science területéről.

dmlab.hu - Big data és data science tanácsadás
"Ha örülsz, hogy fejedre nőttek az adatok."

Keress minket bátran:
- Nagy-Rácz István +36704595669
- Gáspár Csaba +36208234154
- info@dmlab.hu

2010.03.30. 22:37 Gáspár Csaba

Elégedettségfelmérés adatbányászati szoftverekkel kapcsolatban

Címkék: survey összehasonlítás rapidminer spss modeler spss clementine adatbányászati technológiák sas entprise miner SAS

Mivel igen nagyra értékelem az érdekes és izgalmas adatokat, nem utasítom általában vissza, ha nekem kell szolgáltatni ilyeneket. A legtöbbször szoktak is adni ezért cserébe valamit. Így jutottam hozzá a 3rd Annual Data Mining Survey részletes elemzéséhez is (a felmérést a RexerAnalytics készítette, rövid összefoglaló itt, a 48 oldalas elemzést ingyen az alábbi címen lehet igényelni: DataMinerSurvey@RexerAnalytics.com. Ha valaki nagyon türelmetlen, az írhat nekem is (gaspar@tmit.bme.hu), majd versenyzünk, melyikünk küldi gyorsabban az anyagot).

A felmérés sok izgalmas rész mellett arra is választ kért a kitöltőktől, hogy melyik adatbányászati eszközöket használják, azok közül melyekkel dolgoznak elsődlegesen. Ez utóbbi szoftvercsomaggal kapcsolatban rákérdeztek, mennyire vannak megelégedve az eszközzel, hányan szándékozzák továbbra is ezt az eszközt használni.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Az ábrák magukért beszélnek, mindenki vonja le maga a messzemenő következtetéseit. Az elsőn (itt fent) azt láthatjuk, hogy melyik eszközt hányan használják az akadémia és hányan az üzleti szférában (sötétebb sáv jelöli, hogy hányan használják az eszközt elsődleges eszközként). A következő ábrák pedig az elégedettségről, illetve arról árulkodnak, hogy hányan nem kívánnak eszközt váltani.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Az ábrákat figyelve az jutott eszembe, hogy mennyire ritkán fordulhat elő, hogy egy közösség egyszerre több eszközt is használjon a vezető gyártók csomagjai közül. Mi az akadémiai hátterünkkel megtehetjük (megtehettük), hogy a legtöbbet kipróbálhassuk, néhányban mélyebben elmerüljünk.

Nálunk házon belül az IBM SPSS Modeler, a SAS Enterprise Miner és a RapidMiner szoftverekkel halmozódott fel komolyabb tapasztalat (erre épül például az "Adatbányászati technológiák" című tárgyunk). A fenti survey eredményeiről beszélgetve, az az ötletünk támadt, hogy mondjuk el véleményünket a három szoftverről. Mindhárommal kapcsolatban 10-10 olyan pontot gyűjtöttünk össze, ami miatt szeretjük illetve nem szeretjük az adott szoftvert. Programcsomagonként egy-egy postot szánunk a témának, szóval ez a bejegyzés a blogunk első tematikus postsorozata beharangozójának tekinthető.

2 komment

A bejegyzés trackback címe:

https://adatbanyaszat.blog.hu/api/trackback/id/tr521882641

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Zibriczky Dávid 2010.03.31. 10:59:01

Engem meglepett, hogy a saját kódot az iparban gyakorlatilag nem használják elsődleges eszközként.

Mi lehet ennek az oka?
1) Erőforrásigényes új projekthez új kódot írni?
2) Nincsenek az algoritmusok általánosan lekódolva, csak kísérletezésre használják őket?
3) Senki nem bízik a saját kódjában?

Gáspár Csaba 2010.03.31. 12:37:02

Szerintem a saját kód használatának másodlagossága az iparban nem annyira meglepő. Általában olyan feladatok megoldása is feladat egy ipari cégnél, ami jól bejáratott, jól támogatott eljárásokra, eszközökre épít.

Engem pont a másik irányban lepett meg a dolog, hogy milyen sokan használnak saját kódot. Szerintem fejleszteni ilyet akkor kell, ha valami speciális, újszerű kihívás áll elő, valami, amire nincsen "gyári" megoldás. Jó látni, hogy a válaszolók jelentős száma mer saját kódot használni (megjegyzem a válaszolók 51% az USA-ból való, erősen a tengerentúli cégkultúrát látjuk itt)