Adatbányászat Blog

Az Adatbányász Blogon a dmlab szakértőinek írásait olvashatod a big data és data science területéről.

dmlab.hu - Big data és data science tanácsadás
"Ha örülsz, hogy fejedre nőttek az adatok."

Keress minket bátran:
- Nagy-Rácz István +36704595669
- Gáspár Csaba +36208234154
- info@dmlab.hu

2015.08.30. 12:32 Gáspár Csaba

BME Választható tárgyak a big data világából

a.jpgEz a kedvcsináló direktben a Műegyetem hallgatóinak szól, szeptember első hetében nekik kell ugyanis döntenie arról, milyen tárgyakat hallgatnak az adott félévben. Most ősszel két olyan választható tárgyunk indul, amit bátran ajánlok mindenkinek, akit a data science világa, vagy a big data területe érdekel.

Ha az adatelemzéssel kapcsolatos programnyelvekhez szeretnél érteni

Tárgy neve: Alkalmazott adatelemzés (Applied Data Analytics, azaz ADA)
Kedd és csütörtök 12-14h
Tárgy hivatalos tematikája


Az elmúlt évek technológiai trendjei kapcsán egyre nagyobb az igény az olyan adatelemzésben járatos szakemberek után, akik nemcsak értik és használják a különböző adatbányászati eljárásokat, hanem komplex adatfeldolgozó megoldások implementálásával is megbízhatók. Egyre nagyobb szerepet kapnak ma a különböző adatelemzésre szakosodott programozási nyelvek, ezekre koncentrál a választható tárgyunk is. Foglalkozunk az alapszintű adatfeldolgozó megoldásokkal, a SAS programozási nyelvel, majd az R illetve a python nyelv adatfeldolgozásra specializált részeit ismertetjük meg. Sok gyakorlati példa, valós adathalmazok, veterán adatelemző kollégák, értelmes házifeladat és követelmények. Ezt az új tárgyat most másodszorra hírdetjük meg, nagyon szeretnénk, hogy idén is összejöjjön az indulásához szükséges létszám.

Ha a big data technológiák dzsungelében szeretnél tájékozódni

Tárgy neve: 'Big Data' elemzési eszközök nyílt forráskódú platformokon
Kedd 12-14h
Tárgy hivatalos tematikája

Azt hiszem a big data jelenséget senkinek sem kell bemutatnunk, átszövi a teljes IT világát. De milyen technológiák azok, amelyek tényleg nagy adatmennyiségeket képesek megmozgatni, amik sokgépes klaszterekek között osztják el a számításokat, amikre rábízhatjuk nagy adattömegeket. A tárgy fókuszában a Hadoop és a köré évről-évre egyre nagyobbra duzzadó big data technológiai stack áll. A hazai big data szakma legjobbjai tartják az órákat, a követelményekben szerepel egy kisebb Hadoop alapú rendszer felépítése, mint házifeladat - egy fiatal mérnökkel kevés jobb dolog tud történni, mint ennek vagy a fenti tárgynak az elvégzése.

(Kép forrása)

Külsős hallgatók fogadása


A hagyományoknak megfelelően a fenti két tárgy a külsős kollégák előtt is nyitva lesznek de az ő jelentkezésüket a csak egy héttel később, a hallgatók után várjuk. Mivel a választható tárgyakon túl más előadást is tartunk, így számukra egy kicsit szélesebb körből tudunk ajánlani órát - ami azért is fontos, mert a választható tárgyak kötelezően délben kezdődnek, így munkahely mellett azokat nehezebb végezni.

A részletekkel hamarosan jelentkezünk itt a blogon.

5 komment

A bejegyzés trackback címe:

https://adatbanyaszat.blog.hu/api/trackback/id/tr227745394

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

tnsnames.ora 2015.09.06. 12:01:13

Egy rövidebb vitatkozós posztot írtam a témában:
liftinstinct.blogspot.hu/2015/09/sas.html

Prekopcsák Zoltán · http://prekopcsak.hu 2015.10.05. 00:42:26

Miklós,

Mielőtt egy ilyen vita-blogposztot írsz, legközelebb szerintem olvasd el rendesen a bejegyzést. A kritizált tárgy a SAS programozási nyelvet tanítja, szó sincs visual flow tanításáról, arra külön tárgy van a BME-n. Ennek a tárgynak az a célja, hogy a leggyakrabban használt adatelemezési _programnyelveket_ megtanítsa a hallgatóknak. Ajánlom figyelmedbe a különböző toplistákat, a SAS nyelv ugyanis alig van lemaradva az R mögött, például itt: www.tiobe.com/index.php/content/paperinfo/tpci/index.html

Kevés ember van az országban, aki nálam érdekeltebb lenne a SAS bukásában, de teljesen indokoltnak tartom, hogy ennek a tematikának a részét képezi a SAS nyelv.

Ezen túl sikerült fanyar célzásokat tenni a Big Data tárgyra is. Ennek többek között én dolgoztam ki az eredeti tematikáját 2012-ben, ezt láthatod a honlapon. A BME tematika rendszere sajnos nem képes kezelni a gyorsan változó tematikákat, de elárulom, hogy azóta évente legalább 30%-ban megújítjuk, a két éve még sehol nem lévő Spark már kb 20%-át adja az anyagnak.

Továbbá nem mulasztottál el beszólni a RapidMinernek sem - elsőre gondoltam megkérdezem mi a bajod a hivatkozott cikkel, de a további ámokfutásodat látva erre már nem vagyok kíváncsi.

Nyugodt ember vagyok, nem szoktam kikelni magamból, de mélységesen felháborít, hogy mások sok éves, minden összevetésben magas színvonalú, gyakorlatilag non-profit munkáján élcelődsz, ráadásul az írásod téves alapokon nyugszik és mindenféle konstruktív szemléletet nélkülöz. Nem hiszem, hogy ez előrébb viszi a világot...

tnsnames.ora 2015.10.05. 10:12:17

@Prekopcsák Zoltán:

Akkor a konstruktivitás szellemében, nagyon röviden.

>>>>
A kritizált tárgy a SAS programozási nyelvet tanítja, szó sincs visual flow tanításáról
>>>>
Ezt írtam: „...tematika szövege mondjuk nem említi explicit, de nem tudom elképzelni az elkerülését”.
Ennél többet nem akarok mondani idevágóan.

>>>>
Ajánlom figyelmedbe a különböző toplistákat, a SAS nyelv ugyanis alig van lemaradva az R mögött, például itt:
>>>>
Ha a visual flow-t en bloc nem vesszük, akkor is volt két másik ellenérvem a SAS ilyetén oktatása ellen.
Te felhoztál egy harmadik pozitív érvet, amiről én is tudtam, viszont „ortogonális”-nak gondolom az én érveimre.
Egy jobb hangulatú beszélgetésben biztos meg lehetne vitatni a szembeállítását és súlyozását az érveknek.

>>>>
Kevés ember van az országban, aki nálam érdekeltebb lenne a SAS bukásában, de teljesen indokoltnak tartom, hogy ennek a tematikának a részét képezi a SAS nyelv.
>>>>
Tegyük tisztába én írásaimban mindig konkrét dolgokat (SAS, RapidMiner) szólok be, sosem bántok (közvetlenül) embert.
Te viszont ilyeneket írtál nekem:
„szerintem olvasd el rendesen a bejegyzést.”
„de a további ámokfutásodat látva erre már nem vagyok kíváncsi.”
„írásod ... mindenféle konstruktív szemléletet nélkülöz”
Azt hittem ennél jobb és egymás tiszteletét megadó kapcsolatban voltunk, vagyunk.

Viszont, ha beszólsz személyemnek, akkor ennél picivel több indoklás nem ártana a konkrétumok szintjén, a kijelentésen felül.
Így csak tudomásul tudom venni, hogy „teljesen indokoltnak tartod”.

>>>>
Ezen túl sikerült fanyar célzásokat tenni a Big Data tárgyra is.
>>>>
Nem hiszek abban, hogy létezik tökéletes tanterv, mivel kőkemény kompromisszumokat kell kötni, azt gondolom.
Ha valaki úgy lelkendezik, hogy egy tanterv „perfekt”, az bennem biztos gyanut ébresztene.
A Big Data tematikát éppenhogy dícsértem, ami kérdéseim vannak (remélem nem baj) azok csak ízesítési léptékűek és elhanyagolhatóak (ezért nem feszegettem mélyebben).
A másik tematikával sincs gondom a SAS tematika és a SAS komplementer-tematika is önmagában nagyon jó.
Én két dolgot vitattam csak a blogposztomban.
- A két tematika egy félévben mennyire fér el egymás mellett.
- Mennyire örömteli a SAS itthoni ilyen fókuszú tanítása

>>>>
...a két éve még sehol nem lévő Spark már kb 20%-át adja az anyagnak.
>>>>
Éljen! A Spark nálunk is kezd egyre nagyobb fókuszban lenni.

>>>>
Továbbá nem mulasztottál el beszólni a RapidMinernek sem - elsőre gondoltam megkérdezem mi a bajod a hivatkozott cikkel, de a további ámokfutásodat látva erre már nem vagyok kíváncsi.
>>>>
Akkor ezt hagyjuk is! ;)

>>>>
Nyugodt ember vagyok, nem szoktam kikelni magamból, de mélységesen felháborít, hogy mások sok éves, minden összevetésben magas színvonalú, gyakorlatilag non-profit munkáján élcelődsz, ráadásul az írásod téves alapokon nyugszik és mindenféle konstruktív szemléletet nélkülöz. Nem hiszem, hogy ez előrébb viszi a világot...
>>>>
Sajnálom, hogy ezt szűrted le posztomból és így ebben a formában: és ezt a szomorúságomat nem kívánom jobban kifejteni.

Gáspár Csaba 2015.10.05. 13:10:36

@tnsnames.ora:

A kritikákat érték oldalát szeretem általában hosszabb távon magammal vinni, mégis első lépésben a negatív élre válaszolnék én is. Kezdeném a védekezést azzal, mennyire korszerű egy ilyen tárgy. Tőlem eléggé ellenséges lépés lenne, ha listáznám a hazai felsőoktatásban, vagy akár csak a Műegyetemen a kapcsolódó témákban futó tárgyak listáját, és tematikáját. Ebben az összehasonlítsban szerintem mindkét tárgy a maga kategóriájában rendkívül modern és előremutató. Még akkor is, ha az általad átnézett tematika néhány évvel ezelőtt született, amikor még nagyon máshogy nézett ki a szakmai világunk.

A SAS nyelv oktatása szerintem is kikívánkozna a tananyagból - de ezt nem lehet csak úgy megtenni, egy ilyen átalakítást a rendszer csak komoly nehézségek árán támogat. Így aztán az évek során a SAS nyelv tárgyon belüli szerepét nagyon lecsökkentettük.

De a pohár teli részére koncentrálva, nekem a legfontosabb visszajelzés a következő :mind a big data tárgyunkra, mind a adatelemzés programozási vonalát képviselő tárgyunkra hatalmas az igény az üzleti oldalról is. Mindkét tárgyra igaz, hogy több a blogunkon meghirdetett felhívásra jelentkező külsős látogató, mint a hivatalos egyetemi hallgató. Ez azt jelenti, hogy több mint ötven ember jár be hozzánk az előadásokra, sokan még zh-ni is fognak. Két nagy cég is munkaidőben, szervezetten hoz komplett team-eket az órákra, mert látják, hogy érték az amit ott kapnak.

Szóval azt hiszem, jó amit csinálunk. Akinek meg ennél pontosabb, személyre szabottabb tematikára van szüksége, azoknak bátran ajánljuk a céges oktatási csomagjainkat. Talán meg is érne ez a téma egy külön blogbejegyzést.

tnsnames.ora 2015.10.06. 12:16:44

@Gáspár Csaba:
Abszolút korrekt, és mint ilyen tiéd volt az egyetlen a köreitekből (értelmezésemben). Engem érdekelne a téma szívesen beszélgetnék róla, de ilyen vita-megágyazás után lemondanék róla inkább. Ahogy a tervezett második menetes blogposztomról is. Ennyit nem ér az egész, ennél már Fifázni is jobb. :DDDDD