Adatbányászat Blog

Az Adatbányász Blogon a dmlab szakértőinek írásait olvashatod a big data és data science területéről.

dmlab.hu - Big data és data science tanácsadás
"Ha örülsz, hogy fejedre nőttek az adatok."

Keress minket bátran:
- Nagy-Rácz István +36704595669
- Gáspár Csaba +36208234154
- info@dmlab.hu

Hírlevél

Iratkozz fel hírlevelünkre, hogy mindig naprakészen tudjunk tájékoztatni.
Feliratkozás
Leiratkozás

Címkék

10éves (1) 2007 (1) 2010 (23) 2011 (27) 2012 (13) 2013 (23) 2014 (5) 2015 (6) 2016 (10) 2017 (4) 2018 (4) adaptív (1) adat- és médiainformatika (1) adatárusítás (1) adatbányászat (10) adatbányászati algoritmusok (1) adatbányászati alkalmazások (2) adatbányászati meetup (1) adatbányászati oktatás (1) adatbányászati technológiák (4) adatelemzés (1) adatelemzési platformok (1) adattárház (5) adattárház fórum (6) adattárolás (1) adattisztítás (1) adatvédelem (2) advise (2) aegon (1) aglitás (1) agy (2) ajánló (11) ajánlórendszerek (1) aktivitás felismerés (1) algoritmus (1) alkalmazás (3) állásajánlat (1) amazon ec2 (1) ambiens (1) ami (1) amuse (1) analitika (1) analytics (1) andego (3) apache (1) api (2) Arató Bence (3) artificial intelligence (1) bank (1) Barabási (2) barabási (2) beharangazó (1) beharangozó (18) bejelentés (2) belami (1) best practice (9) beszámoló (15) BI (3) bi (13) Bi (1) bi-trek (1) biconsulting (7) bigdata (25) Big Data (3) big data (7) biopen (1) biztosító (1) BI Akadémia (1) bi consulting (1) bi start (1) blog (6) BME (14) bme (2) bootcamp (1) brainstorming (1) bsp (1) budapest (1) business analytics (1) business analytics szakirány (1) churn (2) ci (1) címkefelhő (2) CIO (1) clementine (1) Clementine Consulting (1) cloud computing (2) cognos (1) credit scoring (1) crisp-dm (1) crm (2) Cruncconf (1) crunch (2) csalásdetektálás (1) DataExpert (1) dataexplorer (1) datapest (1) datascience (2) datasource (1) data engineering (1) data mining (1) data science (7) diplomamunka (1) dmla1o (1) dmlab (12) döntési fák (1) drill (1) e-commerce (1) előadás (22) előrejelzés (1) élő közvetítés (1) Enbrite.ly (1) energetika (1) esemény (2) esettanulmány (3) ethics (1) etikus (1) etl (2) évforduló (3) fejlesztés (2) felmérés (5) felsőoktatás (1) felület (1) felvásárlás (3) film (1) fizetés (1) forecasting (1) forgalomelőrejelzés (2) foursquare (1) fraud detection (1) freebase (1) gartner (2) gazdasagi informatikus (2) gépi tanulás (4) gépi tanuló algoritmus (1) google (8) google analytics (1) graphlab (1) gravity (3) greenplum (1) gyakorlat (1) hadoop (10) hallgatók (2) hálózatelemzés (3) hálózatkutatás (2) hálózatok (3) hazai (2) hiba (4) hírlevél (2) hive (1) honlap (1) HR (1) HVG (1) i5 (1) ibm (6) ibm modeler (1) ibm spss (3) icdm (1) idc (2) idősor (1) idősorok (1) ieee (1) iir (1) impact (1) infobright (1) információbróker (1) innováció (5) innovatívBI (1) innovativ bi (4) inspiráció (1) intelligencia (2) Internet Hungary (1) iqsymposium (19) iqsys (16) iroda (4) jelentkezés (2) jmp (2) job (1) kaggle (2) kampánymenedzsment (1) kapcsolati hálók (1) karrier (1) kdd (3) kdnuggets (2) képzés (4) kérdés (2) kérdőív (1) kerekasztal (1) keresés (1) kereső (1) keresztvalidáció (4) klaszterezés (2) knime (1) kockázati tőke (1) kollaboratív munka (1) kompetencia (1) konferencia (72) könyv (6) környezet (1) közlekedés (1) közösség (2) közösségi hálózatok (4) közvetítés (6) kritika (1) küldetés (1) kürt akadémia (1) kutatás (2) lemorzsolódás (1) licensz (1) live (1) logisztika (1) machine learning (1) magyar telekom (2) mahout (1) mapreduce (1) marketplace (1) média (2) meetup (11) mellékspecializáció (1) mém (3) memóriacentrikus (1) menedzsment (3) metaadat (1) metodika (2) microsoft (1) mobil (5) mobil bi (4) modeler (2) modell (3) morgan stanley (1) motion chart (1) munkaerő (2) mysql (1) mytraffic (4) nemzetközi (5) nemzetközi összehasonlítás (1) netflix prize (1) networking (1) next big thing (1) nips (1) nosql (1) nyílt forráskód (4) nyomkövetés (1) offline áruházak (1) okostelefon (1) oktatás (23) olvasók (1) online áruházak (1) online kutatás (1) open source (19) open source bi (3) operatorfa (1) osbi (12) összehasonlítás (1) ötletek (2) pandas (2) paradoxon (1) pascal (1) pentaho (1) personal data mining (1) phd (2) philips (1) piac (3) pikk (1) pilot (1) PISA-felmérés (1) pmml (1) politika (2) powerpivot (1) prága (1) praktiker (1) prediktív analitika (2) prediktív analitka (1) prediktiv modellezés (5) prediktív modellezés (1) prezi (15) privacy (1) privacy preserving data mining (1) product management (1) projekt (1) projektmenedzsment (6) publikáció (1) python (9) radoop (12) random forest (1) rapid-i (2) rapidanalytics (7) rapidminer (40) RapidMiner (2) rcomm (7) refine (1) Rexer Analytics (1) rsctc (1) R nyelv (7) saas (1) sap (1) SAS (20) sas enterprise miner (2) sas enterpris guide (1) sas entprise miner (1) sas fórum (1) sas forum (3) siker (3) simptech (1) sixtep (2) smarthabits (1) spike sorting (1) sportanalitika (1) spss (13) SPSS (3) spss clementine (3) spss hungary (5) spss modeler (6) ssd (1) starschema (2) startup (9) statisztika (1) survey (1) svm (1) szabad szoftver (1) szakmai (1) szavazó eljárások (2) szélenergia (1) szélerőmű (1) szervezetfejlesztés (2) szociális hálók (1) szoftver (5) szöveg (1) szövegbányászat (2) sztaki (2) tableau (1) talend (2) támogatás (1) tanulmány (1) tanulság (1) távolság (1) technológia (1) tedx (1) telekommunikáció (2) teradata (2) teszt (1) text mining (1) tmit (6) toborzás (1) tőzsdei előrejelzés (1) tracking (1) trendek (9) tudományos (1) tunedit (1) twitter (17) ügyfél (1) üzleti intelligencia (3) üzleti modell (3) üzleti reggeli (3) választható tárgy (1) validáció (4) válogatás (1) válság (1) változás (1) vélemény (1) véleméy (1) verseny (20) vezetői képzés (1) videó (3) vizualizáció (5) web (4) web2 (2) webanalitika (3) webshop (1) weka (2) wikipedia (2) workshop (1) yahoo (2) Címkefelhő

TWitter a csapat tagjaitól

2011.04.06. 15:15 Gáspár Csaba

Adatbányászati versenyek üzleti modellje kapcsán - Lehetséges lépések

Címkék: előadás verseny ötletek iqsymposium

Ezekben a percekben fejeztem be az előadásomat az IQSymposiumon. Ott azt ígértem meg a közönségnek, hogy azon túl, hogy az előadás tartalmilag látható lesz a blogunkon, meg fognak jelenni azok a gondolatok is, melyek mentén a vázolt üzleti modellben rejlő lehetőségeket ki lehet aknázni.

Az adatbányászati versenyekkel kapcsolatosan az alábbi fő továbblépési lehetőségeket javasoljuk figyelmetekbe:

Adatbányászati versenyen való részvétel

Megfelelő versenyt találni két oldalon érdemes: sok kisebb verseny látható a kaggle.com weboldalán, míg a nagyobbakról a kdnuggets.com oldalon érdemes tájékozódni.

  • Kompetencia növelése: Elsőre talán furcsa lesz hallani, de leginkább a nem algoritmikus kompetenciát lehet itt jól megszerezni, hanem a hatékony és pontos elemzői munkához, a felhasznált adatbányászati szoftverek korlátainak megismeréséhez lehet hozzájutni. Új eljárások megismerésére is mód adódik, de ha valaki igazán tanulni akar ezen a téren, akkor a korábbi évek győztes csapatainak tapasztalatait olvasgassa (tipikusan egy-egy konferencián külön workshopot indítanak versenyeknek, például az előadásban is szereplő Orange adatokon dolgozó KDD Cup 2009 verseny ide vágó cikkeit itt lehet megtalálni).
  • Csapatépítés: Tapasztalatom szerint intenzív és közösségkovácsoló eseményekké szokta kinőni magát az utolsó napok közös, végső hajrája. Emellett a versenyek kapcsán nagyon könnyen lehet új és hasznos elemzési konvenciókat kitalálni és bevezetni.
  • Jó referencia: Meglepő tapasztalataim vannak ezzel kapcsolatban. Egy nemzetközi versenyen elért akár sokadik hely is komoly referenciának számít, hiszen a csapat nemzetközi mezőnyben, jól lemérhető módon teljesített. Ez főleg azoknál lehet érdekes, akik új szereplőként jelennek meg, vagy nemzetközi vizekre kívánnak kilépni. Ezen eredmények nemcsak céges hanem személyes referenciaként is jelentős erővel bírnak egy-egy önéletrajzban.

Versenyt kiírni

Kétségkívül több előkészítést igénylő feladat ez, a legtöbbször érdemes ebben olyan szakember tanácsát kikérni, akinek a versenyekkel kapcsolatban vannak már tapasztalatai. Még rangos versenyeken is el-el követnek olyan hibákat, melyek után a verseny lényegében értelmét veszti (pl. az entitások azonosítója hordoz értékes információt, rosszul mintavételezik vagy rendezik a halmazt, ami alapján a feladat vagy triviálissá vagy megoldhatatlanná válik).

  • Saját adatokkal verseny indítása: Kétségkívül a legkomolyabb feladat, a kaggle.com oldalt javasoljuk a célra.
  • Hazai, hallgatóknak szóló verseny kiírása: Régóta törjük a fejünket ezen, éppen megfelelő üzleti partnert keresünk hozzá. Több nemzetközi, hallgatóknak szóló verseny is van, azaz nemzetközi példák már vannak. A hallgatók szakmai irányultságát jelentősen tudja befolyásolni egy-egy ilyen versenyélmény, és a friss diplomások, gyakornokok elérésére is megfelelő mód lehet ez a megoldás.
  • Mini pályázat: Akár már néhány 10ezer forinttal indítani lehet olyan mini pályázatot, ahol egy előre megadott technológiai feladatra keres a cég jó algoritmikai megoldást. Itt nem kész kódra kell gondolni, hanem egy-egy algoritmus ismertetésére. Gyakran vannak olyan kutatók, hallgatók, PhD hallgatók, akik szakterületükről kifolyólag ismerik az adott probléma megoldását. Ilyen pályázatok útján hatékonyan el lehet érni ezeket az információkat. A blogunk szívesen segít a célcsoport elérésében, a kiírás közzétételében is.

Versenyek figyelése

A korábban említett két oldalt tudjuk e célból továbbra is ajánlani, annyi kiegészítéssel, hogy mi magunk folyamatosan figyeljük ezeket a versenyeket. Egy részüket dokumentáljuk, az adathalmazokat lementjük. Ha valamilyen speciális érdeklődési köröd van, írd meg nekünk, és ha tudunk kapcsolódó versenyt, vagy felbukkan egy témába vágó, szívesen értesítünk.

Kooperációs lehetőségek

Többször merült már fel, hogy egy-egy külső kolléga, hallgató szeretett volna velünk együtt versenyezni. Általában ezt úgy oldottuk meg, hogy közös konvenciót dolgoztunk ki a megoldások összekapcsolhatóságára, és olyan megállapodásokat kötöttünk, hogy ha a külső csapat és a mi csapatunk eredményének kombinációja mindkettőnk megoldásán segít, szívesen egyesítjük erőinket. Volt már eset, hogy ezzel a megoldással jelentősen előrébb tudtunk lépni a leaderboardon.

Gondolkodjunk együtt

Biztosan vannak olyan gondolatok, ötletek, együttműködési lehetőségek, melyeket nem tudtunk itt számba venni. A fent leírtakból talán kitűnik, hogy a mi csapatunk különösen motivált az ilyenfajta ügyekben. Ha a témába vágó gondolat, ötlet fogalmazódik meg benned, bátran keress meg minket (gaspar@tmit.bme.hu vagy akár itt kommentben), szívesen leülünk beszélgetni az ügyről.

Szólj hozzá!

A bejegyzés trackback címe:

https://adatbanyaszat.blog.hu/api/trackback/id/tr472803614

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.