Adatbányászat Blog

Az Adatbányász Blogon a dmlab szakértőinek írásait olvashatod a big data és data science területéről.

dmlab.hu - Big data és data science tanácsadás
"Ha örülsz, hogy fejedre nőttek az adatok."

Keress minket bátran:
- Nagy-Rácz István +36704595669
- Gáspár Csaba +36208234154
- info@dmlab.hu

2010.01.29. 17:39 Gáspár Csaba

Adatbányászkodás a Google keresési adataiban

Címkék: google oktatás rapidminer spss modeler spss clementine ibm spss adatbányászati oktatás sas enterprise miner adatbányászati alkalmazások adatbányászati technológiák adatbányászati algoritmusok sas enterpris guide SAS

Aki adatelemzéssel foglalkozik, mindig felkapja a fejét, ha valami új és izgalmas adatforráshoz jut. Különösen akkor, ha pont a világ egyik legnagyobb adatvagyonát, a google tudását csapolhatja meg.

A bejegyzés ötletét adó cikk arról szól, hogy ha a magyar google.hu oldalon használjuk az automatikus keresőszó-kiegészítést, akkor furcsa dolgokra lehet találni: például ha beütjük a "hogyan" szót, akkor felajánlja azokat a "hogyan" szóval kezdődő gyakori keresési kifejezéseket, melyeket a legtöbben ütöttek be a keresőbe. Például a már említett "hogyan" szóra az első két javaslat a következő: "hogyan kell csókolózni" és "hogyan lopjunk áramot".

A fenti módszer alkalmas arra is, hogy kicsit utánanézzünk annak, hogy hazánk fiai hogyan használják a google-t, ha adatbányászat ügyében keresnek valamit. Kicsit játszottam a szolgáltatással, összeszedtem néhány izgalmas eredményt.

Kezdjük nevünkhöz híven először az adatbányászathoz kapcsolódó kulcsszavakkal. Ha annyit ütök be, hogy "adatbányász", az alábbi találatok jönnek be a böngészőmben:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Izgalmas például látni, hogy hazánkban  az emberek egyrészt állások után keresnek ("állás", "elemző"), könyvek után kutakodnak (könyvcímként ismert az "adatbányászat a hatékonyság eszköze", illetve a "könyv" szó is előkerül). A többi sor is érdekes, például "Adatbányászati alkalmazások" és "Adatbányászati algoritmusok" néven is fut egy-egy tárgy a BME-n (az elsőt mi tartjuk, a másik Bodon Feri nevével van fémjelezve). Persze nem tudhatjuk, hogy itt a kereső honfitársunk mire gondolt, de azért érdekes, hogy sokan a "bme"-t is az adatbányászat szó mögé teszik. Sőt, ha a keresőkifejezést tovább bővítjük "adatbányászat" kulcsszóig, akkor a fenti listából kieső néhány sor helyére a másik témába vágó tárgyunk neve jelenik meg: "Adatbányászati technológiák". A könyvek sora is bővül, megjelenik az "adatbányászat koncepciók és technikák" kifejezés.

Hasonlóan érdekes eredmények jönnek ki, ha adatbányászati eszközök nevét adjuk be a keresőnek, jó példa erre az "spss clementine" (a szolgáltatás még nehezen tanulja az új trendeket, az "spss modeler" és "ibm spss" kifejezésekre csak egy-egy javaslat érkezik még):

 

 

 

 

 

 

 

 

Látható, hogy a hazai oldalon az igazi kérdés, hogyan lehet hozzájutni az eszközhöz, és ha lehet, hogyan lehet ezt megtenni ingyen. Hasonló szavakat látunk akkor is, ha például "SAS Enterprise Miner" vagy "SAS Enterprise Guide" kulcsszavakkal próbálkozunk (ugye magyar nyelvterületen csupán a "SAS" szóra semmi BI-hoz köthető folytatás nem jelenik meg). Ezzel ellentétben ha ingyenes eszköz után keresgélünk a google.hu oldalon, akkor több szakmai kérdés is körvonalazódik a gyakori kérdések között, például a RapidMiner esetén a memóriahasználat kérdései voltak népszerűek.

A játékot lehet folytatni, például jópofa dolgokat lehet találni magyar pártok rövidítéseihez kapcsolódóan, de ezt az olvasókra bízzuk. 

Szólj hozzá!

A bejegyzés trackback címe:

https://adatbanyaszat.blog.hu/api/trackback/id/tr441713055

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása