Adatbányászat Blog

Az Adatbányász Blogon a dmlab szakértőinek írásait olvashatod a big data és data science területéről.

dmlab.hu - Big data és data science tanácsadás
"Ha örülsz, hogy fejedre nőttek az adatok."

Keress minket bátran:
- Nagy-Rácz István +36704595669
- Gáspár Csaba +36208234154
- info@dmlab.hu

Hírlevél

Iratkozz fel hírlevelünkre, hogy mindig naprakészen tudjunk tájékoztatni.
Feliratkozás
Leiratkozás

Címkék

2007 (1) 2010 (23) 2011 (27) 2012 (13) 2013 (23) 2014 (5) 2015 (6) 2016 (8) 2017 (1) adaptív (1) adat- és médiainformatika (1) adatárusítás (1) adatbányászat (10) adatbányászati algoritmusok (1) adatbányászati alkalmazások (2) adatbányászati meetup (1) adatbányászati oktatás (1) adatbányászati technológiák (4) adatelemzési platformok (1) adattárház (5) adattárház fórum (6) adattárolás (1) adattisztítás (1) adatvédelem (2) advise (2) aegon (1) aglitás (1) agy (2) ajánló (11) ajánlórendszerek (1) aktivitás felismerés (1) algoritmus (1) alkalmazás (3) állásajánlat (1) amazon ec2 (1) ambiens (1) ami (1) analitika (1) analytics (1) andego (3) apache (1) api (2) Arató Bence (3) bank (1) Barabási (2) barabási (2) beharangazó (1) beharangozó (18) bejelentés (2) belami (1) best practice (9) beszámoló (14) Bi (1) bi (13) BI (3) bi-trek (1) biconsulting (7) bigdata (20) Big Data (2) big data (4) biopen (1) biztosító (1) BI Akadémia (1) bi consulting (1) bi start (1) blog (5) BME (14) bootcamp (1) brainstorming (1) bsp (1) budapest (1) business analytics (1) business analytics szakirány (1) churn (2) ci (1) címkefelhő (2) CIO (1) clementine (1) Clementine Consulting (1) cloud computing (2) cognos (1) credit scoring (1) crisp-dm (1) crm (2) csalásdetektálás (1) DataExpert (1) dataexplorer (1) datapest (1) data mining (1) data science (5) diplomamunka (1) dmlab (11) döntési fák (1) drill (1) e-commerce (1) előadás (21) élő közvetítés (1) Enbrite.ly (1) energetika (1) esemény (2) esettanulmány (3) etikus (1) etl (2) évforduló (2) fejlesztés (2) felmérés (5) felsőoktatás (1) felület (1) felvásárlás (2) film (1) fizetés (1) forecasting (1) forgalomelőrejelzés (2) foursquare (1) fraud detection (1) freebase (1) gartner (2) gazdasagi informatikus (2) gépi tanulás (4) google (7) google analytics (1) graphlab (1) gravity (3) greenplum (1) gyakorlat (1) hadoop (10) hallgatók (2) hálózatelemzés (3) hálózatkutatás (2) hálózatok (3) hazai (2) hiba (3) hírlevél (2) hive (1) honlap (1) HR (1) HVG (1) i5 (1) ibm (6) ibm modeler (1) ibm spss (3) icdm (1) idc (2) idősor (1) idősorok (1) ieee (1) iir (1) infobright (1) információbróker (1) innováció (5) innovatívBI (1) innovativ bi (4) inspiráció (1) intelligencia (2) Internet Hungary (1) iqsymposium (19) iqsys (16) iroda (4) jelentkezés (1) jmp (2) kaggle (1) kampánymenedzsment (1) kapcsolati hálók (1) karrier (1) kdd (3) kdnuggets (2) képzés (4) kérdés (1) kérdőív (1) kerekasztal (1) keresés (1) kereső (1) keresztvalidáció (4) klaszterezés (2) knime (1) kockázati tőke (1) kollaboratív munka (1) kompetencia (1) konferencia (70) könyv (6) környezet (1) közlekedés (1) közösség (2) közösségi hálózatok (4) közvetítés (6) kritika (1) küldetés (1) kürt akadémia (1) kutatás (2) lemorzsolódás (1) licensz (1) live (1) magyar telekom (2) mahout (1) mapreduce (1) marketplace (1) média (2) meetup (11) mellékspecializáció (1) mém (2) memóriacentrikus (1) menedzsment (3) metaadat (1) metodika (1) microsoft (1) mobil (5) mobil bi (4) modeler (2) modell (3) morgan stanley (1) motion chart (1) munkaerő (1) mysql (1) mytraffic (4) nemzetközi (5) nemzetközi összehasonlítás (1) netflix prize (1) networking (1) next big thing (1) nips (1) nosql (1) nyílt forráskód (4) nyomkövetés (1) offline áruházak (1) okostelefon (1) oktatás (21) olvasók (1) online áruházak (1) online kutatás (1) open source (19) open source bi (3) operatorfa (1) osbi (12) összehasonlítás (1) ötletek (2) pandas (2) paradoxon (1) pascal (1) pentaho (1) personal data mining (1) phd (2) philips (1) piac (3) pikk (1) pilot (1) pmml (1) politika (2) powerpivot (1) prága (1) praktiker (1) prediktív analitika (2) prediktív analitka (1) prediktiv modellezés (5) prediktív modellezés (1) prezi (15) privacy (1) privacy preserving data mining (1) projekt (1) projektmenedzsment (4) publikáció (1) python (8) radoop (12) random forest (1) rapid-i (2) rapidanalytics (7) RapidMiner (2) rapidminer (39) rcomm (7) refine (1) Rexer Analytics (1) rsctc (1) R nyelv (7) saas (1) sap (1) SAS (20) sas enterprise miner (2) sas enterpris guide (1) sas entprise miner (1) sas forum (3) sas fórum (1) siker (3) simptech (1) sixtep (2) smarthabits (1) spike sorting (1) sportanalitika (1) spss (13) SPSS (3) spss clementine (3) spss hungary (5) spss modeler (6) ssd (1) starschema (2) startup (8) statisztika (1) survey (1) svm (1) szabad szoftver (1) szakmai (1) szavazó eljárások (2) szélenergia (1) szélerőmű (1) szervezetfejlesztés (1) szociális hálók (1) szoftver (5) szöveg (1) szövegbányászat (2) sztaki (2) tableau (1) talend (2) támogatás (1) tanulmány (1) tanulság (1) távolság (1) technológia (1) tedx (1) telekommunikáció (2) teradata (2) teszt (1) text mining (1) tmit (5) toborzás (1) tőzsdei előrejelzés (1) tracking (1) trendek (8) tudományos (1) tunedit (1) twitter (17) ügyfél (1) üzleti intelligencia (3) üzleti modell (3) üzleti reggeli (3) validáció (4) válogatás (1) válság (1) változás (1) vélemény (1) véleméy (1) verseny (19) vezetői képzés (1) videó (3) vizualizáció (5) web (4) web2 (2) webanalitika (3) webshop (1) weka (2) wikipedia (2) workshop (1) yahoo (2) Címkefelhő

TWitter a csapat tagjaitól

2016.11.08. 17:30 Gáspár Csaba

Data science és big data képzések - Érdeklődők gyűjtése

Címkék: oktatás hírlevél jelentkezés 2017 2016

A napokban sokan megkerestek milyen oktatásokat tartunk a közeljövőben, milyen BME-s előadásokat fogunk megnyitni a külsősök előtt, milyen cégre szabott oktatásokat lehet kérni tőlünk. Hogy ne csak azt mondhassuk, hogy a kövessétek a blogot, arra gondoltam jó ötlet gyűjteni az érdeklődők elérhetőségeti:

Ha szeretnél értesítést kapni előzetesen azokról a data science és big data oktatásokról, melyekben részt veszünk, regisztráld magadat az alábbi oldalon:

Érdeklődőként való regisztráció

proactive.pngA blogon továbbra is jelezni fogjuk az aktuális lehetőségeket, a blog hírlevelét (jelentkezés itt) most újítottuk meg, ott is megírjuk az információkat, ez a lista azonban nem hírlevél. Ha bejelölöd milyen típusú dolgok érdekelnek, és éppen indítunk valami ide vágó oktatást, akkor a regisztráltaknak proaktívan kiküldjük a rájuk vonatkozó információkat. 

Reméljük ez is segít majd azoknak, akik már most tervezik a jövő évi oktatási keretüket is. 

 

ideaw.gifHa nem tudtok várni arra, hogy megjelenjenek a meghirdetett oktatások, vagy egyedi igényetek van, keressetek meg bátran, a legtöbb oktatásunk cégre / személyre szabottan fut, keress meg minket, szívesen javaslunk tematikát és adunk ajánlatot.

Gáspár Csaba: gaspar.csaba@dmlab.hu  +36208234154

Szólj hozzá!

2016.11.03. 21:37 Gáspár Csaba

Csavarjunk egyet az innovatív adatelemzési irányok keresésén

Címkék: menedzsment projektmenedzsment metodika crisp-dm aglitás

crisp_dm.pngA Nagy Könyvben az áll, hogy egy valamirevaló adatbányászati / adatelemzési projektet a CRISP-DM (Cross Industry Standard Process for Data Mining) metodika szerint érdemes menedzselni. Eszerint egy projektnek hat fő fázisa van, (1) első lépésben megértjük az üzleti problémát, majd (2) a hozzá kapcsolódó adatokat, (3) adatátalakításokat végzünk, (4) gépi tanulási vagy statisztikai modelleket futtatunk, (5) kiértékeljük a kapott eredményeket üzleti szempontból, és persze ha minden klappol, akkor (6) hadrendbe állítjuk a megoldást. Nyilván ennél bonyolultabb a helyzet (a részletes leírást a metodikáról itt olvashatunk), szinte mindig van szükség iterációkra, mikor egy vagy több fázist is vissza kell ugranunk az aktuális lépés során tapasztaltak miatt. Érdekes látni, hogy ez iteratív fejlesztés mennyire jól illeszthető a ma egyre jobban terjedő agilis szemlélethez. 

De nem is a CRISP-DM metodikát akarom most kivesézni, felülbírálni - minden hibája ellenére igazán szeretem, gyakran mentett meg minket kényes helyzetekben. Inkább egy újfajta jelenségre szeretném felhívni a figyelmet: egyre többször van lehetőségünk olyan módon elkezdeni egy-egy projektet, hogy nem a legelső fázisnál, az üzleti feladat megértésénél indulunk - hanem a másodiknál, az adatok megismerésénél.

Arról van szó, hogy vannak vállalatok, akik nagyon vágynak arra, hogy valami igazán izgalmas, jelentős üzleti hatást felmutatni képes adatos projektet indítsanak, és a lehetséges partnereket állandóan szondázzák, mondjanak valami igazán ütős use-case-t. Gyakran egy-egy jó pozícióban levő tanácsadó cég is megkeres hasonló feladattal: "bent ülök az X cég big data board-jában, most dolgozzuk ki a stratégiát, ha van valami remek alkalmazási ötletetek, mondjátok el, ha elég jó, lehetne belőle jó üzletet csinálni". 

Nagyon nehéz ilyenkor valami jó javaslattal előállni, faramuci helyzet, hogy nem a megrendelő hozza az üzleti problémát, hanem mi. Ezért ezekben a helyzetekben gyakran azt javasoljuk, forduljunk az adatokhoz: néhány ilyen megkeresést át tudtunk alakítani egy adatvezéreltebb gondolkodás mentén működő projekté:

  • Elsőként hozzáférést kaptunk az adatok egy részhez, és egyszerűen megértettük milyen típusú, mennyiségű és minőségű adattal élnek együtt ezek a cégek. Tipikusan néhány érdekes adatkört adtak oda, ami szerintük is tartogat meglepetéseket.
  • Ezt követően egyfajta data discovery fázisban kicsit megpiszkáltuk az adatokat, mit is rejtenek. Ezek az elemzések egyfajta ad-hoc riportoknak foghatók fel, segítenek abban, hogy ötleteket tudjunk adni arról, mire is használhatók ezek az adatok. Lényeg, hogy itt az adatok is súgnak nekünk.
  • Az adatok ismeretében készítettünk jó sok javaslatot, hogyan lehetne üzletileg kiaknázni az adatokat. Itt a friss, más nézőpontból érkező szemünk adata lehetőségek (és korlátok) mentén leírtunk 10-20 use-case-t, esetenként néhány slide-nyi anyagot szedtünk össze. Egy-egy ilyen javaslatot gyakran néhány, a cégre vonatkozó adattal is megtámogatunk.
  • Ezeket vizsgálta meg a megrendelő üzleti csapata, a use-case-ek jelentős része nem érte el az ingerküszöbüket, de mindig akadt egy-kettő, ami érdekelte őket. Mivel láttak hozzá néhány releváns adatot, gyakran könnyebben meggyőzhetőek ilyenkor, mintha külsősként azt mondom, ez biztos megoldás után kiáltó gond nálatok.
  • Ezt követően általában egy proof-of-concept fázis jön, mikor az adott use-case-re kidolgozzuk az elemzést a múltbeli adatokon, itt bizonyítjuk be, hogy érdemes ez az elemzést, adatbányászati modellezést folytatni.
  • Végül, ha ez utóbbi lépésben is meggyőzők voltunk, akkor foglalkozunk a megoldás integrációjával, ekkor kerülnek fel az eredményeink a dashboard-okra, beépítjük a kalkulációkat a rendszerekbe, és itt dolgozzuk ki hosszú távon hogyan érdemes frissíteni az eredményeket.

gut.jpgLátható, hogy az iteratív, egyre komplexebb megoldásokat kihozó szemlélet itt is megmaradt, de az első pont az adatokról szól, és nem az üzletről. A döntések meghozatalánál persze az is sokat nyomott a latba, hogy így a költségek is fokozatosan jelennek meg. Az adatfeltárás + use-case készítés jóval kisebb feladat (8-21 nap), mint mondjuk a historikus adatokon már futó poof-of-concept megoldás kialakítása, de az igazán komoly befektetést igénylő integráció előtt van egy érvényes döntési pont, ahol múltbeli adatokra támaszkodva jól meg lehet becsülni az üzletre gyakorolt hatását az adott megoldásnak.

Én igazán szeretek így dolgozni, nagyon kreatív és sokkal üzletszagúbb megoldások tudnak így létrejönni. És attól a pillanattól fogva, hogy a partner saját adatain futó elemzésekkel támasztjuk alá a mondandónkat, sokkal érdekesebbek lesznek az elsőre akár túl egyszerű vagy sci-fi jellegű ötletek is.

ideaw.gifÉrdekes számodra ez a megközelítés, mert a Te cégednél is van egy állandó ötletvadászat az innovatív irányokat illetően, de valahogy mindig az az érzésed, hogy a bejövő ötletek valahogy nem hitelesek. Írj nekünk, és mi szívesen segítünk a fenti metodika szerint megtalálni azt, ami nálatok valóban érdemes bevezetni.

Gáspár Csaba: gaspar.csaba@dmlab.hu

Szólj hozzá!

2016.10.08. 15:45 Gáspár Csaba

Adat-alapú vezetés meetup kedden

Címkék: meetup 2016 vezetői képzés

Az big data megoldásokban rejlő lehetőségek kihasználása nem tekinthető pusztán IT feladatnak. Erre a területre is igaz, hogy akkor tudják hatékonyabbá tenni egy-egy vállalat működését, ha az adatvezérelt gondolkodás vezetői szinten is gyökeret ver. A technológiai oldalról számtalan lehetőség van arra, hogy egy a data science vagy big data téma iránt érdeklődő szakember belekóstoljon ezekbe a témákba, csak gondoljunk arra a rengeteg technológiai meetupra, ami ma Budapesten elérhető a nagyközönség számára.

a_6.jpgA vezetői réteg lehetősége sokkal korlátozottabb, ezért is nagy öröm számomra, hogy következő kedden, 2016. október 11.-én tartja a Spark Institute az Adat-alapú vezetés című meetupját. A Spark Institute képzéseivel a vezetői réteget célozzák meg, a változó technológiai környezethez való alkalmazkodásra illetve a felforgató technológiák felhasználására kívánja felkészíteni a résztvevőket.

Ezen a vonalon kerül képbe az adatvezérelt gondolkodás, a big data világának üzleti vonatkozásai. A keddi meetup-on én tartom a felvezető előadást a big data technológiai és üzleti aspektusairól, majd Szukács István (StreamBright Data) fog beszélni az ajánlórendszerekben rejlő lehetőségekről, majd Vértes Balázs (Enbrite.ly) az online hirdetések minőségbiztosításáról.

2016. október 11. 19.00

Adat-alapú vezetés meetup - Spark Institute

Helyszín: LogMeIn - 1061 Budapest, Paulay Ede u 12.

Figyelem, a rendezvényt nem a meetup.com-on szervezik, a részvétel regisztrációhoz kötött,
a rendezvény holnapján erre van lehetőséged

Szólj hozzá!

2016.09.30. 21:00 Gáspár Csaba

Tároljuk-e le ezt az adatot?

Címkék: google adattárolás data science

Egy data scientist a címben szereplő kérdésre egy automatikus igennel szokott válaszolni - ha van valami adatunk, tároljuk le, mi ezen a kérdés. És valóban, mi akadályoz meg minket ebben? Ha belegondolunk, mennyire olcsó ma már az adattárolás, a kérdés felmerülése elsőre furcsán is hathat. Többek előadásában láttam már visszaköszönni a mellékelt ábrát, és én is gyakran használom - azt mutatja meg, hogy az elmúlt 35 évben hogyan zuhant le egyetlen GB adattárolás éves költsége. A születésem környékén több mint egy millió dollárba került volna azt eltárolni, ami ma egy promóciós ajándéknak utánam dobott 8GB-os pendrive-on elfér. Bár sokat keresgéltem, de nem láttam 2015/2016-os adatokat, de az ábrán így is látszik, hogy az elmúlt években már bőven beestünk a 10 dollárcent alatti értékekhez, ennyibe kerül 1GB háttértár kapacitás manapság.

cost-per-gigabyte-large.pngMit is jelent ez? Azt, hogy ha az adatmennyiség nem extrém nagy, akkor egy átlagos nagyvállalatnál az adatok tárolásáról szóló meetinget résztvevő kollégák órabére valószínűleg jelentősen meghaladja a teljes tárolás költségét. 

Mégis meg kell védenem azokat a szervezeteket, ahol nem minden adatot tárolnak, amire valaha rátaláltak vagy valaha birtokoltak. Mert csak egy szempont az, hogy egy ilyen adatot el kell tárolni, de van itt néhány más szempont is:

  • Ha eltároltuk, akkor kinek lesz jogosultsága ezeket az adatokat olvasni? Egy nagyvállalati környezetben ennek eldöntése már nem annyira triviális, mint lementeni azt.
  • Felmerül a kérdés, hogy ha tároljuk az adatot, akkor azt mennyire biztonságosan kell tenni. Nincs-e benne valami olyan érzékeny adat, aminek védelme extra költséget igényel. 
  • Sokszor olyan ügyféladat is lehet az adathalmaz mélyén, amire törlési kényszer van törvényi kötelezettségek miatt. Így a felelőtlenül törölt adatok a végén akár több fejfájást is okozhatnak, mint eredetileg gondoltuk.

Jól látható tehát, hogy a "mindent tároljunk" szabály inkább kihívásokat hoz egy hagyományos óriáscég számára. Az elv bevezetését én csak olyan helyen láttam, ahol (1) az ügyfelekhez köthető személyes adatok kezelése egyszerűsítve volt, (2) ahol minden alkalmazott bátran hozzáférhet (pénzügyi adatok kivételével) minden adathoz, azaz nagyon egyszerű jogosultsági szabályok voltak adathozzáférés szempontjából, (3) és ahol tipikusan rugalmasan bővíthető adattárolási infrastruktúra (pl. AWS) állt rendelkezésre. Ha ezt a három szempontot összeadjuk, könnyű kitalálni, hogy az innovatív, startup világ felöl közelítő techcégek eshetnek bele csak ebbe a körbe.

Pedig valójában minden cégnél van létjogosultsága a "tároljunk mindent" elv feltételeit megteremteni. Ma egyre több iparágban az adatokban rejlő lehetőségek jelentik az egyik legfontosabb feltételét annak, hogy hosszú távon versenyképesek legyenek. Az adatok kiaknázásához pedig - nem meglepő módon - már eltárolt adatok is szükségesek szoktak lenni.

Adalék az árakhoz: Ha megnyitom a Google Drive fiókomat, akkor ott egyetlen gomb megnyomásával az elérhető tárkapacitásomat felnyomhatom 10TB (10*1000GB) területre. Ezért cserébe elég biztonságos hozzáférést, adatvesztés nélküli tárolást kapok úgy, hogy egyszerre 3 példányban tárolják az adataimat olyan adatközpontokban, amik legalább 300km távolságban vannak egymástól - így egy kisbolygó szerencsétlen érkezése sem nagyon veszélyeztetik a családi fotókat. Ezért összesen havi 100$ kérnének most tőlem.

Azaz évente 1GB tárolása 0,012$-ba (alig 35Ft-ba) kerülne.

aaa.jpgSok adat van nálatok is, már foglalkoztok a kiaknázásával, de jó lenne ha valaki friss szemmel is rá tudna nézni, elbeszélgetnél arról milyen módon lehetne még felhasználni azt? Írj bátran nekünk, szívesen gondolkodunk együtt olyanokkal, akiket érdekelnek az innovatív big data és data science megoldások. Cím: gaspar.csaba@dmlab.hu

Szólj hozzá!

2016.09.15. 12:51 Gáspár Csaba

Mi maradt le a bevásárlólistáról? - Ma új hazai adatbányászati verseny indul

Címkék: verseny hazai 2016

A data scientistté válás útjának egyik fontos állomása az adatbányászati versenyeken való indulás. A gépi tanulási eljárásokkal kapcsolatos tudásod, a helyes tesztelési és tanítási rendszer kialakításának a képessége, a jó visszamérési stratégiád ellenőrzésére nagyon alkalmas egy jó versenyen való részvétel. Ezért is népszerű a kaggle.com adatbányászati versenyeket szervező oldal, érdemes követni rajta az eseményeket akkor is, ha nincs időd bekapcsolódni a megmérettetésekbe.

a_5.jpgKülön örülök, ha hazai versenyek indulnak, hiszen ezen események egyfajta indikátorai annak, hogy a hazai adatos közösség hol is tart valójában. Ezért is szeretém külön felhívni a figyelmet a ma induló Cetli  ("Shopping List") Competition versenyre: a Nextent jóvoltából és az ő támogatásukkal induló megmérettetésen a Cetli nevű applikáció adatai felett dolgozhatunk. A versenyt a datapallet.io hosztolja. A verseny során az anonimizált felhasználók bevásárlólistáit láthatjuk, amik júliusi-augusztusi példányaiból találomra eltávolítottak egy-egy elemet. A versenyen résztvevőinek ezeket az eltávolított termékeket kell megbecsülni. 

Ha érdekel, nézz körül a verseny oldalán, majd regisztrálj versenyzőnek. 

Verseny hivatalos oldala 

A verseny indulásáról a ma esti Budapest.py Meetupon fognak bővebben beszélni a verseny szervezői. 

Ha úgy érzed, hogy neked is van olyan adathalmazod, ami kapcsán érdekes lehetne kiírni egy adatbányászati versenyt? Érdekelne, mi lenne az elérhető közel legjobb megoldás, vagy kíváncsi vagy rá, kik értenek igazán az adott fajta feladat megoldásához? Egyszerűen a beszállítóidat szeretnéd megversenyeztetni? Keress meg minket, és mi szívesen segítünk a verseny megfogalmazásában, kiírásában, akár a lebonyolításában.  - Gáspár Csaba gaspar.csaba@dmlab.hu

Szólj hozzá!

2016.08.09. 16:44 István Nagy

Őszi kurzusaink a BME-n

Címkék: oktatás tmit gépi tanulás bigdata BME

Még sokan a szabadságukat töltik, vagy élvezik a nyarat, de a csapatunk elkezdett dolgozni az öszi BME-s kurzusok aktualizálásán. Ennek már hagyományos része, hogy a külsős hallgatók között is megnyitjuk a kurzusainkat. Az előző félévek tapasztalatai alapján minden kurzus esetén legalább annyi külsős hallgató érkezett, mint amennyi diák felvette azt "hivatalos" keretek között. Úgy gondoljuk, hogy mindenki számára előnyös ez az ajánlat: a külsősök tanulhatnak valami újat, a hallgatóknak a kérdések és visszajelzések alapján valódi képük lesz a tanultak felhasználhatóságáról, az oktatóknak pedig mindig izgalmas az interaktív órák tartása.

Jöjjön hát az étlap, miből lehet jelenleg válogatni.

Ha az adatelemzéssel kapcsolatos programnyelvekhez szeretnél érteni

Tárgy neve: Alkalmazott adatelemzés (Applied Data Analytics, azaz ADA)
Kedd és csütörtök 12-14h
Terem: később dől el pontosan, de biztosan a Lágymányosi kampusz, Magyar tudósok körútja 2.
Tárgy hivatalos tematikája

Az iteratív módon fejlesztett adatfeldolgozó eljárások vannak a középpontban, az adatelemzés programozási nyelveit tanítjuk nektek. A témát a reguláris kifejezésekkel, illetve az awk szövegfeldolgozóval kezdjük, majd SAS programozási nyelvet, Python és R programozást tanítunk úgy, hogy közben a legfontosabb gépi tanulási feladatokat is röviden áttekintjük. A félév során három kisházit adunk a hallgatóknak, majd vizsgával zárul a tárgy. Ezek ugye nem kötelezők a külsős hallgatóknak, de ha valaki meg szeretné méretni magát, annak adunk lehetőséget. Azonban mind a tematika, mind a követelmények átalakítás alatt, szóval itt még lehetnek meglepetések :)

Ha a big data technológiák dzsungelében szeretnél tájékozódni

Tárgy neve: 'Big Data' elemzési eszközök nyílt forráskódú platformokon
Kedd 12-14h
Terem: később
Tárgy hivatalos tematikája

Itt a Dmlab big data szakemberei adnak betekintést a területen kialakult technológiai stack felépítésébe. A MapReduce, Hadoop alapoktól indulunk, és a legújabb technológiákig jutunk el. Nyilván mindben teljesen nem fogunk tudni elmélyedni, de aki ezt a kurzust végighallgatja, az könnyen el fog tájékozódni a big data technológiák között. A félév végén egy ZH és egy házifeladat alapján kapnak jegyet a hallgatók, külön kérésre a külsős kollégák is megmérettethetik magukat ezeken a számonkéréseken.

 

 Jelentkezés

Mivel mindegyik tárgyon szeretnénk egészséges arányt tartani a belsős és külsős hallgatók között, ezért kérjük, hogy az alábbi form segítségével jelentkezz a tárgyak egyikére. Néhány napon belül visszajelzünk a jelentkezésedről.

Jelentkezési form

(UPDATE: A hallgatói jelentkezések lezárása után, szeptember 5.-vel kezdődő héten jelzünk vissza, hogy ki fért be a meghírdetett külsős keretbe).

Egyedi tematikájú képzések
Felhívjuk a figyelmet arra, hogy szívesen dolgozunk ki személyre vagy cégre szabott tematikát is, ha gyorsabb haladásra és hatékonyabb tanulásra van szükség. Itt sokkal jobban tudunk igazodni a már meglévő kompetenciátokhoz, a képzés gyakorlatai során akár a saját adataitokon végezzük az elemzést. Ezúton más technológiákat is szívesen tanítunk, Python, R, RapidMiner, IBM SPSS Modeler, SAS, Oracle, KNime környezetben is szívesen oktatunk, de big data technológiákhoz is vannak jó képzési javaslataink. Az elmúlt évben több mint tíz ilyen képzést tartottunk, keressetek meg bátran, ha ilyen kérés merül fel bennetek, a tematika rögzítése után gyorsan tudunk árajánlatot adni, a speciális igényeitekhez igazodni.

Ha érdekel, írj néhány sort: Nagy-Rácz István - nagy.istvan@dmlab.hu

A kép forrása

Szólj hozzá!

2016.08.04. 12:19 István Nagy

Idén is CRUNCH konferencia

https-_2f_2fcdn_evbuc_com_2fimages_2f13190254_2f5608145127_2f1_2foriginal.pngTavaly arról írtunk, hogy hazánk big data szempontból is nagykorúvá vált azzal, hogy a Prezi, a UStream és a RapidMiner csapata Budapesten szervezett egy mind előadóiban, mind szervezésében világszínvonalú adatos konferenciát. Idén is megrendezésre kerül a Crunch konferencia. A workshopok listáját böngészve idén is érdemes lesz résztvenni a konferencián, de a hazánkba látogató szakmabeli előadók és hallgatóság a networkingre is viszonylag ritka lehetőséget ad.

A szervezők jóvoltából a blog olvasói az alábbi linken kedvezményesen vehetnek részt a konferencián. Használjátok ki a lehetőséget és találkozzunk a Millenárison idén ősszel is.

Szólj hozzá!

2016.07.28. 23:31 Gáspár Csaba

Lakótársat keresünk - Inspiráló belvárosi iroda

Címkék: iroda 2016 dmlab RapidMiner Enbrite.ly

Mindig meglep, mennyire sokat számít milyen környezetben dolgozik egy csapat. Először ezt akkor éreztem meg, mikor a Radoop és a Dmlab közösen bérelt irodát az Ipar utcában, mikor a szürke egyetemi közegből kiszabadultunk. A jó környezet egyszerűen húz előre, repülsz, nagyobb tempóra tudsz kapcsolni. Sokan félreértik ezt az állításomat, és azt gondolják hogy a design bútor, vicces grafikák és babzsákok háromszögébe kell zárni a kollégákat. De a környezet tágabb értelemben értelmezendő: sokat számít, hogy milyen emberek között ülsz, milyen más cégek azok akik körülötted vannak, kikkel találkozol a konyhában, ha kávézol, és milyen környezetben vagy, ha kilépsz az utcára, vagy ha elmész ebédelni.

moving.jpgEzért szeretem a mi irodánkat, a RED-et, amiben most üresedés van, és ahova új lakótársakat keresünk. Eddig a RapidMiner, az Enbrite.ly és a Dmlab uralta ezt a Madách térnél lévő 400 négyzetméteres teret. Lényegében a régi Kirowsky, majd régi Prezi.com iroda első emeleti szintjéről van szó a Károly körút 9. alatt. Biztos sokatok járt már itt korábban akár egy meetup kapcsán. Most az Enbrite.ly költözik tovább tőlünk a Mosaikba, az iroda közel harmada kiadó.

Ha érdekes lehet nektek, vagy ismersz valakit, akinek megmozgathatja a fantáziáját a dolog, akkor álljon itt néhány infó az irodáról (nyilván a teljesség igénye nélkül):

  • A belvárosban, a Deák tér tőszomszédságában, a Károly körút 9-ben vagyunk, ha valaha dolgoztál ennyire a város közepén, tudod miről beszélek.
  • Egy nagy közös térben van 10-14 szabad asztalunk, ami mellé jár két nagyobb tárgyaló használata, és egy hatalmas közös konyha. Ezen túlmenően van két apróbb telefonálószoba, ahol egy-két fős hívásokat lehet elintézni.
  • Magunk menedzseljük az irodát, a költségeken osztozunk, de a takarítást külső cég végzi.
  • A kényelmünket szolgáló dolgok: Illy kapszulás kávé, ballonos viz, hetente többször gyümölcs. 
  • A közeg főleg adatos világban dolgozó, nyitott emberekből áll.
  • Négyzetméterárak szempontjából kedvező megállapodásunk van a tulajdonossal, a költségeket a csapatok lényegében szétdobják egymás között. Mivel közvetlenül velünk kell szerződnöd, így itt nem gond magában, ha nem tudsz több éves szerződéseket aláírni.

Ha érdekes lehet neked vagy egy ismerősödnek a téma, írj nekünk egy emailt. Nagy-Rácz István: (nagyracz.istvan@dmlab.hu) vagy Gáspár Csaba (gaspar.csaba@dmlab.hu). 

Szólj hozzá!

2016.06.21. 22:35 Gáspár Csaba

Barabási új könyve - Leesett az állam

Címkék: oktatás ajánló könyv hálózatok hálózatkutatás 2016 hálózatelemzés Barabási

Eddig is tudtuk, hogy Barabási Albert-László azon ritka kutatók egyike, akik a szélesebb közönség számára is élvezhető módon tudnak kommunikálni. A korábbi könyveit ismerők (Behálózva, Villanások) már bizonyára felkapták a fejüket az új könyv megjelenésének hírére. Ők biztosan csalódottak lesznek, ha kezükbe veszik a "A hálózatok tudománya" című kiadványt, ugyanis ez nem ismeretterjesztő céllal, hanem mint egyetemi tankönyv jelent meg. A rengeteg képleten, levezetésen bizonyára csak nagyon kevesen fogják magukat végigrágni, főleg azok, akik kreditpontokat kapnak azért, ha levizsgáznak az adott anyagból.

a_halozatok_tudomanya_barabasi.JPGMindezek ellenére szenzációsnak tartom a könyv megjelenését, elég ehhez egy kicsit más szemmel lapozgatni az oldalakat. Ha egyetemi oktatóként nézek erre a kiadványra, hirtelen minden idegszálam felvillanyozódik, le vagyok nyűgözve - mint mikor az első valóban okostelefont tartottam a kezemben: sosem gondoltam, hogy szükség van ilyenre a világnak, de mikor megtapasztalom annak erejét, minden más mobiltelefon elveszti értelmét és szürke semmiséggé válik.

Ugyanez az érzés fogott el Barabási új könyve kapcsán is, azt hiszem ez az első igazi magyar nyelvű egyetemi tankönyv, amit a kezemben tartottam valaha. Nem egyszerűen szép és szemléletes, hanem magával ragadó ábrák, remek illusztrációk, színes érdekességek, háttérinformációk teszik kiemelkedővé a könyvet. Jól felépített fejezetek, a komolyabb levezetések külön kiszerkesztve, hogy olyan szakokon is lehessen belőle tanítani, ahol nincs meg minden tétel bizonyításához a megfelelő matematikai háttér. Gyakorlófeladatok, házifeladatok, ellenőrző kérdések. Mindezt keménykötéses, nagyméretű alakban, majdnem 500 oldalon keresztül élvezhetjük a legfinomabb papírra nyomtatva.

Mindenkinek javaslom, hogy ha könyvesboltban jár, keressen meg egy példányt, és csak játsszon el a gondolattal, hogy mi lett volna ha ilyen jellegű könyvekből kellett volna felkészülnie egyetemi évei alatt egy-egy tárgyból. Egy ilyen könyvet kézben tartva az kevésbé tűnik valószínűleg, hogy a közeljövőben az egyetemek helyett a fiatalok a Coursera kurzusaira járnak majd, hogy mindent a Youtube-on látható karizmatikus előadóktól érdemes csak tanulni.

Érdeklődő hallgatóknak

Biztos vagyok benne, hogy már szeptembertől lesznek olyan kurzusok a hazai felsőoktatásban, aminek alapját a könyvben leírtak adják. Ha hallgatóként mégis úgy érzed, hogy nem lesz elérhető számodra ilyen óra, szívesen megtanulnád ami a könyvben van, de félsz, hogy csak úgy önszorgalomból nem leszel elég kitartó, úgy van egy formabontó ajánlatunk:

  • Adunk neked ajándékba egy példányt a könyvből
  • Gyere el vizsgázni hozzánk a könyv anyagából 2016. október 1-ig, szívesen levizsgáztatunk belőle.
  • Ha nem sikerülne a vizsgád, vagy végül nem tudtál eljönni, akkor visszakérjük tőled a könyvet.

A részleteket úgyis megbeszéljük majd, a lényeg, hogy segítünk abban, hogy rávedd magad arra, hogy a könyvben foglaltakat megtanuld. A lehetőséget első körben a 3 leggyorsabban jelentkező hallgatónak adjuk meg. Jelentkezni: gaspar@tmit.bme.hu címen tudtok.

UPDATE: A blogposztunkra a könyvet kiadó Libri is reagált: támogatásként felajánlottak három példányt a könyvből. Hálás köszönet érte.

Szólj hozzá!

2016.06.07. 11:45 Ragány Csaba

KDnuggets 2016 szoftver poll eredményei Google motion chart-ban

Címkék: kdnuggets motion chart

Kikerültek a végleges eredmények a KDnuggets 2016-os (17.) data science szoftverhasználati felméréséről. A hivatalos oldalon böngészhetünk az adatok között és elolvashatjuk az igen részletes elemzést (idén már két oldalas), amit itt a blogon egy Google motion chart-tal egészítettünk ki. Ezen a mozgó diagramon a teljes időintervallumon, vagyis 2001 és 2016 között követhetjük nyomon azt, hogy évről-évre hogyan változott az előző évhez képest a “top 50” eszköz népszerűsége a szavazók körében. Akiket érdekelnek az eredmények, azt hiszem jó párszor végig fogják nézni a chart-ot...

Szólj hozzá!

2016.03.24. 18:10 Gáspár Csaba

Etika a big data világában

Néhány hete egy Python kurzus végén beszélgettem egy lelkes kollégával, akinek lelkesen újságoltam milyen izgalmas adatelemzési projektet indítottunk egy új partnernél. A partner neve hallatán ő egyáltalán nem lett lelkes - sőt kijelentette, hogy ennek társaságnak ő sosem dolgozna. Régi gondolatokat ébresztett fel bennem ez a történet.

Korábban nem volt annyira érdekes a civil szférában, hogy egy adatelemző adta eredmény mennyire szól bele az egyén életébe. Egyszerűen nem voltak a legyűjtött adatok olyan részletesek, hogy olyan erős modellt tudjunk építeni, ami alapján valakinek az életébe túlzottan beleszóljunk. 

a_4.jpgAztán szép lassan egyre mélyebbre ásott a szakma, mígnem szinte előjel nélkül eljött a data science etika fekete napja, ami egyértelműen a Target.com körül kitört botrány: az árurendelési és böngészési szokásokból nagy pontossággal tudták kimutatni, hogy mikor esett teherbe egy ügyfelük. Ennek birtokában célzottan keresték meg prospektusokkal a kismamákat, akik gyakran még a hírt nem is közölték környezetükkel. Sőt, később kiderült, hogy bizonyos esetekben a Target.com magánál az ügyfélnél is hamarabb tudta meg az új fejleményt, a hatalmas adatmennyiségből olyan termékeket tudtak azonosítani, amik az első trimeszterben levő kismamák figyelmét önkéntelenül felkeltik.

Az eset hirtelen rávilágított azokra a kérdésekre, meddig felelős egy elemző az általa végzett elemzésért, mettől felelős az elemzési eredményekre támaszkodó üzleti oldal, mennyiben kell odafigyelni az elemzésünk lelkiismereti vonatkozásaira?

Napjainkban még csak a dilemmát látjuk, nem annyira a megoldást. Jogos igényünk, hogy legyenek világos szabályok, amik alapján mindig meg lehet mondani, hogy amit teszünk, az etikus (függetlenül attól, hogy a jog mit mond a dologról). Személyes véleményem szerint nem alkotható meg a jó szabályrendszer, minduntalan fogunk pro és kontra ellenpéldákat találni. Ez azonban nem azt jelenti, hogy nem kell próbálkozni a kérdés tisztázásával.

Az én felelősségem abból a szempontból is nagyobb, mert mind a Műegyetemen, mind a cégeknél folyó on-site képzések kapcsán sok ember tőlem hall először erről a dilemmáról, az etikai aggályokról. Egyenlőre nem tudok többet tenni, mint néhány konkrét esetet felvázolva elgondolkodtatom őket arról, hogy ők hogyan döntenének hasonló esetekben, elmondom az én személyes állásfoglalásomat - de nem gondolom, hogy ezt kellene mindenkinek követnie. Ezekkel a sztorikkal szembesítem őket:

  • Régi amerikai hitelbírálati esetek, mikor a hitelfelvevő bőrszínét, majd ennek tiltása után a szomszédban lakók bőrszínét kérdezték meg a jelentkezőtől
  • Megkérdezem, mi a véleményük a keresés tényétől változó repülőjegyárak mechanizmusáról
  • Felvázolom nekik a már említett Target.com történetet az elemző és a marketinges aspektusából
  • Végigbeszélünk egy egészségügyi adatelemzős esetet, mikor műtéti kockázatok számításáról és felhasználásáról gondolkodunk
  • A társkereső oldalakba épített adatelemzési algoritmusok sajátosságai kapcsán feszegetjük a kérdést, hogy ezen oldalak célja a hosszú előfizetési időszak elérése, ami egy idő után már ellentétes lehet azzal, hogy hamar megtalálja a hozzá passzoló lehetséges partnereket.

Tudtok olyan sztorikat még, ami ezen a területen érdekes lehet? 

 

Szólj hozzá!

2016.01.31. 10:08 Gáspár Csaba

Féléves nyitott data science kurzus a BME-n

Címkék: oktatás tmit 2016 BME adatelemzési platformok

UPDATE: Az idei félévre lezártuk a jelentkezést. Köszönjük a rekordszámú érdeklődést. Ha valakinek kérdése van hozzánk, akkor a komment szekcióban bátran keressetek minket.

Az előző félév ismételten bizonyította, hogy nagyon népszerűek a BME-n futó, külsősök számára is megnyitott data science és big data képzéseink. Előző félévben közel 50 külsős szakember jelentkezett be a tárgyainkra, az Ericssonnal kötött megállapodás kapcsán például az onnan érkező kollégák közül 27-en a zárthelyit is megírták.

a.jpgFolytatjuk a hagyományt, ebben a félévben a data science világába bevezető tárgyunkat nyitjuk meg. Hetente szerdánként 10h15-től és minden második csütörtökön 8h15-től lesznek ezek az órák megtartva. Az első alkalom február 17-én, szerdán, 10h15-kor kezdődik.

Téma szempontjából az adatelemzés alapjait vesszük át: adatmodell, CRISP-DM, felügyelt és nem felügyelt tanulási eljárások, adatbányászati modellezés, és sok alkalmazási példa: elvándorlás-előrejelzés, kockázatbecslés, szegmentáció, idősorok előrejelzése. Az első hetekben RapidMiner 6-tal dolgozunk, majd a python adatelemzős alapjait sajátítjuk el gyakorlati alkalmak keretében. Mindenkitől azt kérjük, hogy a gyakorlati órákra majd hozzon saját számítógépet, amire a megfelelő programcsomagokat telepítette (az ingyenes verziókkal dolgozunk).

A tárgyhoz házifeladat is tartozik, ami egy felügyelt tanulási feladat lesz valós adathalmazon - sőt a kaggle.com rendszerén keresztül egy zárt adatbányászati versenyen is megversenyeztetjük majd a házifeladatra adott megoldásokat. A helyszínről és a pontos beosztásról a jelentkezés után, annak elfogadása esetén tájékoztatunk. 

Már most látszik, hogy elég sok külsős hallgató jelentkezése várható, ezért némi korlátozással is élnünk kell majd. Egyrészt a szokásosnál nagyobb kooperációt kérünk majd tőletek, hogy továbbra is az egyetemi hallgatók körül foroghasson ez a tárgy, ténylegesen rájuk tudjunk koncentrálni a munka során - a külsős hallgatók az ő vendégeik, tartsuk ezt tiszteletben. A külsős hallgatók létszámát korlátozzuk, illetve ugyanazon cégtől csak kivételes esetben fogunk nagy számú jelentkezést befogadni. 

Várunk benneteket!

Jelentkezés az "Adatelemzési platformok" című tárgyra - LEZÁRVA az jelenlegi félévre.

Egyedi tematikájú képzések

a_3.jpgFelhívjuk a figyelmet arra, hogy szívesen dolgozunk ki személyre vagy cégre szabott tematikát is, ha gyorsabb haladásra és hatékonyabb tanulásra van szükség. Itt sokkal jobban tudunk igazodni a már meglévő kompetenciátokhoz, a képzést gyakorlatai során akár a saját adataitokon végezzük az elemzést. Ezúton más technológiákat is szívesen tanítunk, Python, R, RapidMiner, SPSS Modeler, SAS, Oracle, KNime környezetben is szívesen oktatunk, de big data technológiákhoz is vannak jó képzési javaslataink. Az elmúlt évben több mint tíz ilyen képzést tartottunk, keressetek meg bátran, ha ilyen kérdés merül fel benneteket, a tematika rögzítése után gyorsan tudunk árajánlatot adni, a speciális igényeitekhez igazodni.

Ha érdekes, írj néhány sort: Gáspár Csaba - gaspar.csaba@dmlab.hu

Szólj hozzá!

2016.01.29. 18:46 Gáspár Csaba

Az első hazai sportanalitikai konferencia

Címkék: ajánló konferencia 2016 sportanalitika

a_1.jpgTanszékünk volt kollégái által gründolt U1 Research csapata a sportanalitika területén tart konferenciát 2016 február 25.-én. Ismereteim szerinte ez az első hazai ilyen típusú kezdeményezés, érdemes rá odafigyelni, a belépő ára is igen kedvező. 

Kedvcsinálónak idemásolom a konferencia felvezetőben megfogalmazott kérdéseket - azt hiszem ez nemcsak az adatelemzők, hanem a sport után érdeklődők szívét is megdobogtatja majd:

  • Mennyiben járult hozzá az adatelemzés a foci Eb-re való kijutáshoz?
  • Vajon segített volna több sportolót az olimpiára való kijutásban az adatelemzés?
  • Hogyan lehet a rendelkezésre álló adatokat a sport szolgálatába állítani?
  • Hogyan lehet maximalizálni a teljesítményt?
  • Hogyan lehet minimalizálni a sportsérüléseket?
  • Hogyan lehet növelni a bevételeket?

U1 Sport Data Analytics Summit - 2016

2016 február 25. - Boscolo Hotel, Budapest

Csak remélni tudjuk, hogy a hazai sport is nyitni fog az analitika iránt, és a hazai szakmai közegnek is jut ebből feladat. Az első fecskék már megjelentek, de én még sok élő példát nem ismerek. A BME-n levő tanszékünkön squash ütőkbe rejtett szenzorok elemzésébe folyik, külföldön élő hallgatóm a munkahelyén folyó munka kapcsán kanadai hoki csapatok mozgását elemezte, és nemrég találkoztunk egy nagy tanácsadó céggel, aki itthonról szolgáltat sportanalitikát európai futballcsapatoknak. Ha tudtok más hazai sportanalitikai projektről, bátran osszátok meg velünk kommentben.

(Kép forrása)

Szólj hozzá!

2016.01.28. 09:18 István Nagy

Versenyek kora

Címkék: verseny magyar telekom telekommunikáció bigdata

Talán nem kell bemutatnuk a csapatot abból a szempontból, hogy mindig is elég sok időt szántunk arra, hogy a különböző adatbányászati versenyeken elinduljunk és azokon minél jobb helyezéseket érjünk el. Nagyon hasznosnak tartjuk ezeket a versenyeket és a csapatunkban is elég nagy motiváló erővel bír az, hogy ilyen versenyeken elindulni nem csak megtűrt, hanem egyenesen támogatott dolog.

Emiatt nagy öröm számunkra, hogy itthon is egyre több verseny indul el, ahol nem csak a szervezők magyarok, de maga a probléma is (és így az adat is) hazai cégektől származik. Jó példa volt erre a BKK és SZTAKI által közösen kiírt Mol Bubi Challenge, vagy a Magyar Telekom és a Kitchen Budapest által életre hívott Big data contest. Ez utóbbi verseny egy ötletpályázat volt, amire konkrét, megvalósítható koncepciókat, prototípusokat vagy már működő megoldásokat vártak a kiírók, melyek telekommunikációs adatok Big Data módszerekkel történő kreatív felhasználásán alapulnak.

Csapatunk három ötletet is nevezett a versenyre, amiből kettő bejutott a tegnap délután tartott döntőbe is, ahol a Telekom héttagú zsűrije előtt kellett felvázolni az ötleteket egy pitchverseny keretein belül. Az első ötletünk a lemorzsolódás előrejelzésének megújítása volt. Az alapötletet az a gondolat adta, hogy lehet hogy egy pre-paid ügyfél számot cserél, de barátokat nem, ezért a hívásgráfok elemzésével azonosíthatóak azok az ügyfelek, akik igazából nem hagyták ott a cégünket, hanem csak új entitásként tértek vissza. 

A másik ötletünk az volt, hogy tegyük személyre szabottá azt, hogyan kommunikálunk az ügyfelekkel, akik valamilyen oknál fogva nem fizették be a szolgáltatásokért járó díjat. A projekt tapasztalatainkból jól látszik, hogy azzal, hogy az ügyfeleket a megfelelő csatornán, a megfelelő üzenettel, valamint a megfelelő kontextusban (tér és időbeli egyaránt) célozzuk meg, növelhető az akció (ez esetben a befizetési pontosság) hatékonysága. Ez utóbbi ötletet választotta a zsűri a legjobbnak, ezzel sikerült elhoznunk a verseny egymillió forintos fődíját.

Szólj hozzá!

2016.01.24. 11:35 Gáspár Csaba

Év eleji újratervezés

Címkék: évforduló menedzsment 2016

A világ állandóan változik, és Darwin óta tudjuk, hogy nem a legokosabb, nem a legerősebb, 
de nem is a legügyesebb lesz az, aki ezekből a változásokból a legjobban jön ki. 
Hanem az, aki legjobban 
alkalmazkodik a változáshoz.

Az évzáró megbeszélésünk elején közösen összegyűjtöttük, hogy melyik hónapban mi történt velünk az elmúlt évben. Ezt a táblázatot nézegettem a napokban, és azon morfondíroztam, hogy mennyivel léptünk előrébb egy év alatt, mi az amivel többet állíthatunk magunkról 2015 januárjához képest. A legkiemelkedőbb pontként a gyors tanulási görbe és az adaptációs képesség jelent meg idén.

comp_norb.pngAzért is érdekes ez, mert míg minden csapattagunktól ezt a tulajdonságot  magától érthető módon elvárjuk, addig egy cégtől általában azt követeljük meg, hogy egy-egy témához felkészülés nélkül értsen. Egyszerűen sután hangzik, ha azt mondom egy bemutatkozó találkozón magunkról, hogy gyorsan meg tudunk tanulni egy-egy új területet: ugyanis nehéz megkülönböztetni magunkat a mindent bevállaló fiatal lelkes srácoktól, miközben a gyors tanulás tulajdonsága mégiscsak az egyik legerősebb dolog ebben a gyorsan változó, napról-napra új technológiákat hozó data science világban. 

Természetesen személyesen önmagunkra lebontva is érdemes rácsodálkozni, miben jutottunk előre egy év alatt. Tapasztalataim szerint ezen az úton a legmesszebbre az Éviránytű mozgalom remek kis füzetével lehet  eljutni, javaslom ezt mindenkinek függetlenül attól, milyen területen tevékenykedik. Ez egy ingyenesen letölthető, kb. húsz oldalas munkafüzet jópofa feladatokkal az előző és a következő évre vonatkozóan. A korábbi évek tapasztalatai alapján mindenki le volt nyűgözve, aki belefektetett ebbe a belső munkába, és rászánt két óra nyugodt időt a kitöltésére. Az igazi kísérletezőknek pedig javaslom, csinálják meg a kérdőívet a saját cégükre is vonatkoztatva.

Változásokban gazdag Új Évet mindenkinek!

Éviránytű - www.yearcompass.com

"Zárd le 2015-öt. Tervezd meg 2016-ot."

Szólj hozzá!