Adatbányászat Blog

Az Adatbányász Blogon a dmlab szakértőinek írásait olvashatod a big data és data science területéről.

dmlab.hu - Big data és data science tanácsadás
"Ha örülsz, hogy fejedre nőttek az adatok."

Keress minket bátran:
- Nagy-Rácz István +36704595669
- Gáspár Csaba +36208234154
- info@dmlab.hu

2011.04.06. 15:15 Gáspár Csaba

Adatbányászati versenyek üzleti modellje kapcsán - Lehetséges lépések

Címkék: előadás verseny ötletek iqsymposium

Ezekben a percekben fejeztem be az előadásomat az IQSymposiumon. Ott azt ígértem meg a közönségnek, hogy azon túl, hogy az előadás tartalmilag látható lesz a blogunkon, meg fognak jelenni azok a gondolatok is, melyek mentén a vázolt üzleti modellben rejlő lehetőségeket ki lehet aknázni.

Az adatbányászati versenyekkel kapcsolatosan az alábbi fő továbblépési lehetőségeket javasoljuk figyelmetekbe:

Adatbányászati versenyen való részvétel

Megfelelő versenyt találni két oldalon érdemes: sok kisebb verseny látható a kaggle.com weboldalán, míg a nagyobbakról a kdnuggets.com oldalon érdemes tájékozódni.

  • Kompetencia növelése: Elsőre talán furcsa lesz hallani, de leginkább a nem algoritmikus kompetenciát lehet itt jól megszerezni, hanem a hatékony és pontos elemzői munkához, a felhasznált adatbányászati szoftverek korlátainak megismeréséhez lehet hozzájutni. Új eljárások megismerésére is mód adódik, de ha valaki igazán tanulni akar ezen a téren, akkor a korábbi évek győztes csapatainak tapasztalatait olvasgassa (tipikusan egy-egy konferencián külön workshopot indítanak versenyeknek, például az előadásban is szereplő Orange adatokon dolgozó KDD Cup 2009 verseny ide vágó cikkeit itt lehet megtalálni).
  • Csapatépítés: Tapasztalatom szerint intenzív és közösségkovácsoló eseményekké szokta kinőni magát az utolsó napok közös, végső hajrája. Emellett a versenyek kapcsán nagyon könnyen lehet új és hasznos elemzési konvenciókat kitalálni és bevezetni.
  • Jó referencia: Meglepő tapasztalataim vannak ezzel kapcsolatban. Egy nemzetközi versenyen elért akár sokadik hely is komoly referenciának számít, hiszen a csapat nemzetközi mezőnyben, jól lemérhető módon teljesített. Ez főleg azoknál lehet érdekes, akik új szereplőként jelennek meg, vagy nemzetközi vizekre kívánnak kilépni. Ezen eredmények nemcsak céges hanem személyes referenciaként is jelentős erővel bírnak egy-egy önéletrajzban.

Versenyt kiírni

Kétségkívül több előkészítést igénylő feladat ez, a legtöbbször érdemes ebben olyan szakember tanácsát kikérni, akinek a versenyekkel kapcsolatban vannak már tapasztalatai. Még rangos versenyeken is el-el követnek olyan hibákat, melyek után a verseny lényegében értelmét veszti (pl. az entitások azonosítója hordoz értékes információt, rosszul mintavételezik vagy rendezik a halmazt, ami alapján a feladat vagy triviálissá vagy megoldhatatlanná válik).

  • Saját adatokkal verseny indítása: Kétségkívül a legkomolyabb feladat, a kaggle.com oldalt javasoljuk a célra.
  • Hazai, hallgatóknak szóló verseny kiírása: Régóta törjük a fejünket ezen, éppen megfelelő üzleti partnert keresünk hozzá. Több nemzetközi, hallgatóknak szóló verseny is van, azaz nemzetközi példák már vannak. A hallgatók szakmai irányultságát jelentősen tudja befolyásolni egy-egy ilyen versenyélmény, és a friss diplomások, gyakornokok elérésére is megfelelő mód lehet ez a megoldás.
  • Mini pályázat: Akár már néhány 10ezer forinttal indítani lehet olyan mini pályázatot, ahol egy előre megadott technológiai feladatra keres a cég jó algoritmikai megoldást. Itt nem kész kódra kell gondolni, hanem egy-egy algoritmus ismertetésére. Gyakran vannak olyan kutatók, hallgatók, PhD hallgatók, akik szakterületükről kifolyólag ismerik az adott probléma megoldását. Ilyen pályázatok útján hatékonyan el lehet érni ezeket az információkat. A blogunk szívesen segít a célcsoport elérésében, a kiírás közzétételében is.

Versenyek figyelése

A korábban említett két oldalt tudjuk e célból továbbra is ajánlani, annyi kiegészítéssel, hogy mi magunk folyamatosan figyeljük ezeket a versenyeket. Egy részüket dokumentáljuk, az adathalmazokat lementjük. Ha valamilyen speciális érdeklődési köröd van, írd meg nekünk, és ha tudunk kapcsolódó versenyt, vagy felbukkan egy témába vágó, szívesen értesítünk.

Kooperációs lehetőségek

Többször merült már fel, hogy egy-egy külső kolléga, hallgató szeretett volna velünk együtt versenyezni. Általában ezt úgy oldottuk meg, hogy közös konvenciót dolgoztunk ki a megoldások összekapcsolhatóságára, és olyan megállapodásokat kötöttünk, hogy ha a külső csapat és a mi csapatunk eredményének kombinációja mindkettőnk megoldásán segít, szívesen egyesítjük erőinket. Volt már eset, hogy ezzel a megoldással jelentősen előrébb tudtunk lépni a leaderboardon.

Gondolkodjunk együtt

Biztosan vannak olyan gondolatok, ötletek, együttműködési lehetőségek, melyeket nem tudtunk itt számba venni. A fent leírtakból talán kitűnik, hogy a mi csapatunk különösen motivált az ilyenfajta ügyekben. Ha a témába vágó gondolat, ötlet fogalmazódik meg benned, bátran keress meg minket (gaspar@tmit.bme.hu vagy akár itt kommentben), szívesen leülünk beszélgetni az ügyről.

Szólj hozzá!

A bejegyzés trackback címe:

https://adatbanyaszat.blog.hu/api/trackback/id/tr152803614

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása