Adatbányászat Blog

Az Adatbányász Blogon a dmlab szakértőinek írásait olvashatod a big data és data science területéről.

dmlab.hu - Big data és data science tanácsadás
"Ha örülsz, hogy fejedre nőttek az adatok."

Keress minket bátran:
- Nagy-Rácz István +36704595669
- Gáspár Csaba +36208234154
- info@dmlab.hu

2007.11.12. 00:59 Gáspár Csaba

Új siker - I. hely az NiSIS Competition 2007 adatbányászati versenyen

A nyári SIGKDD 2007 "Workshop and Challenge on Time Series Classification" versenyen elért harmadik helyünk után egy újabb nemzetközi eredményről számolhatunk be. Mi adtuk be a legjobb megoldást a NiSIS Competition 2007 versenyre.

A verseny során egy osztályozási feladatot kellett megoldanunk, ahol azt kellett eldönteni, hogy autóból készített, alacsony felbontású, fekete-fehér képeken gyalogos látható-e vagy sem. Véleményünk szerint a feladat azzal vált képfelismerési/képfeldolgozási feladatból adatbányászati problémává, hogy a képek rendkívül kicsik (36x18 képpont). Ezt a véleményünket mi sem bizonyítja jobban, mint az, hogy legjobbnak bizonyult megoldásunk az adatbányászati technikáknak köszönheti sikerét. A verseny validációs halmazán 95.97%-os pontossággal tudtuk megmondani, hogy az adott képen gyalogos látható-e vagy sem. Ez annak az ismeretében még szembetűnőbb, hogy számtalan kép csupán töredékkép volt, azaz az eredeti 36x18 pixel csak egy része állt rendelkezésünkre.

A versenyen induló "i-mine" nevű csapatunk két tanszéki kutatóból (Kardkovács T. Zsoltból és belőlem, Gáspár-Papanek Csabából) illetve négy, az adatbányászattal most szeptembertől ismerkedő hallgatóból állt.

A versenyhez kapcsolódó elemzésnek illetve az elért eredménynek két fő tanulsága van. Az egyik, hogy a CRISP-DM metodika pontos követése kifizetődő, még akkor is, ha a folyamat elején az előre még nem látható. Ezt az adott eset szinte regénybeillő módon bizonyította.

A másik tanulság, hogy adatbányászati illetve mérnöki affinitással akkor is jó eredményeket lehet elérni, ha a feladat eredetileg nem adatbányászati jellegűnek tűnik. Érdekes volt látni, hogyan kerekednek felül saját eljárásaink az képfeldolgozás irodalmában sokat dícsért módszereken.

Újra igazolást nyert a gondolat, hogy mielőtt nekiesel egy valós problémának, ne az eddig publikált megoldások felkutatásával kezdd a munkád, hanem ülj le, és gondold végig, Te hogyan oldanád meg a feladatot. Csak ezt követően nézd meg, mások mit értek el a területen. Ezáltal saját kreatívitásodat nem határolják be mások ötletei, és láthatóvá válik, hogy az így talált szabad ötlet gyakorta hatékonyabb, mint az évtizedek óta elfogadott eljárás.

Szólj hozzá!

A bejegyzés trackback címe:

https://adatbanyaszat.blog.hu/api/trackback/id/tr491383650

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.