Adatbányászat Blog

Az Adatbányász Blogon a dmlab szakértőinek írásait olvashatod a big data és data science területéről.

dmlab.hu - Big data és data science tanácsadás
"Ha örülsz, hogy fejedre nőttek az adatok."

Keress minket bátran:
- Nagy-Rácz István +36704595669
- Gáspár Csaba +36208234154
- info@dmlab.hu

Hírlevél

Iratkozz fel hírlevelünkre, hogy mindig naprakészen tudjunk tájékoztatni.
Feliratkozás
Leiratkozás

Címkék

10éves (1) 2007 (1) 2010 (23) 2011 (27) 2012 (13) 2013 (23) 2014 (5) 2015 (6) 2016 (10) 2017 (4) 2018 (4) adaptív (1) adat- és médiainformatika (1) adatárusítás (1) adatbányászat (10) adatbányászati algoritmusok (1) adatbányászati alkalmazások (2) adatbányászati meetup (1) adatbányászati oktatás (1) adatbányászati technológiák (4) adatelemzés (1) adatelemzési platformok (1) adattárház (5) adattárház fórum (6) adattárolás (1) adattisztítás (1) adatvédelem (2) advise (2) aegon (1) aglitás (1) agy (2) ai (1) ajánló (11) ajánlórendszerek (1) aktivitás felismerés (1) algoritmus (1) alkalmazás (3) állásajánlat (1) amazon ec2 (1) ambiens (1) ami (1) amuse (1) analitika (1) analytics (1) andego (3) apache (1) api (2) Arató Bence (3) artificial intelligence (1) bank (1) Barabási (2) barabási (2) beharangazó (1) beharangozó (18) bejelentés (2) belami (1) best practice (9) beszámoló (15) bi (13) BI (3) Bi (1) bi-trek (1) biconsulting (7) bigdata (25) Big Data (3) big data (8) biopen (1) biztosító (1) BI Akadémia (1) bi consulting (1) bi start (1) blog (6) BME (14) bme (2) bootcamp (1) brainstorming (1) bsp (1) budapest (1) business analytics (1) business analytics szakirány (1) cancer detection (1) churn (2) ci (1) címkefelhő (2) CIO (1) clementine (1) Clementine Consulting (1) cloud computing (2) cognos (1) credit scoring (1) crisp-dm (1) crm (2) Cruncconf (1) crunch (2) csalásdetektálás (1) DataExpert (1) dataexplorer (1) datapest (1) datascience (2) datasource (1) data engineering (1) data mining (1) data science (7) diplomamunka (1) dmla1o (1) dmlab (12) döntési fák (1) drill (1) e-commerce (1) egészségügy (1) előadás (22) előrejelzés (1) élő közvetítés (1) Enbrite.ly (1) energetika (1) esemény (2) esettanulmány (3) ethics (1) etikus (1) etl (2) eu (1) évforduló (3) fejlesztés (2) felmérés (5) felsőoktatás (1) felület (1) felvásárlás (3) film (1) fizetés (1) forecasting (1) forgalomelőrejelzés (2) foursquare (1) fraud detection (1) freebase (1) gartner (2) gazdasagi informatikus (2) gdpr (1) gépi tanulás (4) gépi tanuló algoritmus (1) google (8) google analytics (1) graphlab (1) gravity (3) greenplum (1) gyakorlat (1) hackhaton (1) hadoop (10) hallgatók (2) hálózatelemzés (3) hálózatkutatás (2) hálózatok (3) hazai (2) hiba (4) hírlevél (2) hive (1) honlap (1) HR (1) HVG (1) i5 (1) ibm (6) ibm modeler (1) ibm spss (3) icdm (1) idc (2) idősor (1) idősorok (1) ieee (1) iir (1) image processing (1) impact (1) infobright (1) információbróker (1) innováció (5) innovatívBI (1) innovativ bi (4) inspiráció (1) intelligencia (2) Internet Hungary (1) iqsymposium (19) iqsys (16) iroda (4) jelentkezés (2) jmp (2) job (1) kaggle (2) kampánymenedzsment (1) kapcsolati hálók (1) karrier (1) kdd (3) kdnuggets (2) képfeldolgozás (1) képzés (4) kérdés (2) kérdőív (1) kerekasztal (1) keresés (1) kereső (1) keresztvalidáció (4) kína (1) klaszterezés (2) knime (1) kockázati tőke (1) kollaboratív munka (1) kompetencia (1) konferencia (72) könyv (6) környezet (1) közlekedés (1) közösség (2) közösségi hálózatok (4) közvetítés (6) kritika (1) küldetés (1) kürt akadémia (1) kutatás (2) lemorzsolódás (1) licensz (1) live (1) logisztika (1) machine learning (1) magyar telekom (2) mahout (1) mapreduce (1) marketplace (1) média (2) meetup (11) mellékspecializáció (1) mém (3) memóriacentrikus (1) menedzsment (3) metaadat (1) metodika (2) microsoft (1) mobil (5) mobil bi (4) modeler (2) modell (3) morgan stanley (1) motion chart (1) munkaerő (2) mysql (1) mytraffic (4) nemzetközi (5) nemzetközi összehasonlítás (1) netflix prize (1) networking (1) next big thing (1) nips (1) nosql (1) nyílt forráskód (4) nyomkövetés (1) offline áruházak (1) okostelefon (1) oktatás (23) olvasók (1) online áruházak (1) online kutatás (1) open source (19) open source bi (3) operatorfa (1) osbi (12) összehasonlítás (1) ötletek (2) pandas (2) paradoxon (1) pascal (1) pentaho (1) personal data mining (1) phd (2) philips (1) piac (3) pikk (1) pilot (1) PISA-felmérés (1) pmml (1) politika (2) powerpivot (1) prága (1) praktiker (1) prediktív analitika (2) prediktív analitka (1) prediktiv modellezés (5) prediktív modellezés (1) prezi (15) privacy (1) privacy preserving data mining (1) product management (1) projekt (1) projektmenedzsment (6) publikáció (1) python (9) radoop (12) random forest (1) rapid-i (2) rapidanalytics (7) rapidminer (40) RapidMiner (2) rcomm (7) refine (1) Rexer Analytics (1) rsctc (1) R nyelv (7) saas (1) sap (1) SAS (20) sas enterprise miner (2) sas enterpris guide (1) sas entprise miner (1) sas fórum (1) sas forum (3) siker (3) simptech (1) sixtep (2) smarthabits (1) spike sorting (1) sportanalitika (1) spss (13) SPSS (3) spss clementine (3) spss hungary (5) spss modeler (6) ssd (1) starschema (2) startup (9) statisztika (1) survey (1) svm (1) szabad szoftver (1) szakmai (1) szavazó eljárások (2) szélenergia (1) szélerőmű (1) szervezetfejlesztés (2) szociális hálók (1) szoftver (5) szöveg (1) szövegbányászat (2) sztaki (2) tableau (1) talend (2) támogatás (1) tanulmány (1) tanulság (1) távolság (1) technológia (1) tedx (1) telekommunikáció (2) teradata (2) teszt (1) text mining (1) tmit (6) toborzás (1) tőzsdei előrejelzés (1) tracking (1) trendek (9) tudományos (1) tunedit (1) twitter (17) ügyfél (1) usa (1) üzleti intelligencia (3) üzleti modell (3) üzleti reggeli (3) választható tárgy (1) validáció (4) válogatás (1) válság (1) változás (1) vélemény (1) véleméy (1) verseny (20) vezetői képzés (1) videó (3) vizualizáció (5) web (4) web2 (2) webanalitika (3) webshop (1) weka (2) wikipedia (2) workshop (1) yahoo (2) Címkefelhő

TWitter a csapat tagjaitól

2010.10.27. 15:03 Prekopcsák Zoltán

Mi zajlik az agyban? - egy érdekes adatbányászati részfeladat

Címkék: prága agy távolság nips spike sorting klaszterezés

Talán az a leghálásabb az adatbányászati munkában, hogy rengeteg területre nyerhetünk bepillantást és olyan problémákon dolgozhatunk, amelyek óriási hatással lehetnek az élet különböző területein. A kereskedelem, a telekommunikáció és a pénzügyi világ már klasszikus terepnek számít, de az elmúlt évtized rengeteg új iparágban tette lehetővé nagy mennyiségű adatok gyűjtését és azok elemzését. Az oktatás, a közlekedés, a mezőgazdaság, és sok más terület mellett az utóbbi évtized adatbányászati sikerágazata a genetika, a gyógyszerkutatás és úgy általában az orvosi alkalmazások.

Személyes érintettségem kapcsán egy orvosi világból jövő izgalmas adatbányászati feladatot szeretnék bemutatni. Október eleje óta a prágai műszaki egyetemen dolgozom egy 5 hónapos ösztöndíj keretében, ahol a rendelkezésünkre álló adathalmaz egy cseh orvos, Robert Jech műtéteiből származik. Bizonyos agyi eredetű betegségek (pl. Parkinson-kór) kezelésére a kockázatos gyógyszerek helyett egyre inkább elfogadott módszer lett az utóbbi években a mély agyi stimuláció (Deep Brain Stimulation - DBS). A módszer lényege, hogy a hibásan működő agyi területre apró elektródát ültetnek be, ami időszakos kisülésekkel inspirálja a neuronokat, így egyetlen műtéttel akár évekre visszaszorítva a tüneteket. A műtét során az orvos apró érzékelőkkel méri az agyi aktivitást, hogy megtalálja a kezelendő területet, és ezeket a méréseket szerencsére el is tárolják. A csupán több milliméteres felbontású globális pásztázó módszerekkel (pl. fMRI, MEG) ellentétben ezekből az adatokból lokális, mikrométeres felbontású információkat kaphatunk az agy működéséről.

Az érzékelő kis mérete miatt megvizsgálhatjuk az agy nagyon apró környezetét, és akár egyedi neuronok működését is figyelemmel kísérhetjük. Bizonyos esetekben akár több száz ilyen érzékelőt is mozgatnak az agyban, amivel már akár több ezer neuron működése figyelhető. Természetesen ez még mindig elenyésző az emberi agyban levő 100 milliárd neuronhoz képest, de már így is nagyban segítheti az agyi folyamatok megértését és az egyes területek szerepének megismerését. Az agy működése egyébként sem a neuronok számán, hanem azok kapcsolatain alapul, és ezt globális pásztázó módszerekkel sokkal nehezebb megfigyelni.



A fenti kép jobb felső sarkában látható egy rövid felvétel, amin a nagy alapzaj mellett néha nagyobb kilövések jelennek meg, amik egy-egy neuron aktivitásának felelnek meg. Az ilyen aktivitás-görbéket a szakirodalomban tüskének (spike) nevezik.

A tüskék érzékelése (spike detection) a nagy zaj miatt már önmagában is egy kihívásokkal teli feladat, de ha ezt sikerül megoldani, akkor felmerül a kérdés, hogy hány különböző neuron tüskéit láthatjuk. A tüskék formája nagyban függ a neuron alakjától, valamint az érzékelőtől való távolságától, így minden neuron valamelyest egyedi tüskéket produkál. A neurontevékenységek elkülönítéséhez tehát egy klaszterezési feladatot kell megoldanunk (spike sorting), amelyben mind a klaszterek száma, mind azok viszonya ismeretlen. A 80-as években emberi munkát, a 90-es évek végétől egyszerű klaszterezési módszereket használtak, az utóbbi néhány évben pedig már egyre kifinomultabb módszerekkel oldják meg a problémát.

A klaszterezési feladatot némileg árnyalja, hogy a biológia némi háttérismeretet is biztosít számunkra. Egy neuron feltöltődési ideje (refractory period) 2-3ms, azaz egy tüske után ennyi ideig nem képes újabb aktivitásra. Tehát ha az adatsorban két tüskét is találunk a feltöltődési időn belül, akkor biztosak lehetünk benne, hogy ez a két tüske két különböző neuronhoz, vagyis két külön klaszterbe tartozik. A klaszterezési feladatot így némi felügyelt információval tudjuk támogatni, és ez segítheti a klaszterszám meghatározását is.

Egy lehetséges megoldás a klaszterezéshez használt távolság tanulása, amelyben ilyen háttérismereteket is használni tudunk. Az egyik első ilyen cikk a NIPS 2002 konferencián jelent meg és azóta is sokan foglalkoznak távolság-tanulási (distance metric learning) problémákkal.

Természetesen a tüskék klaszterezése (spike sorting) csak egy apró részfeladat az agy működésének megértésében, de mindenképp hasznos részeredményeket ad, mérnöki szemmel nézve pedig egy szép adatbányászati kihívást jelent.

Szólj hozzá!

A bejegyzés trackback címe:

https://adatbanyaszat.blog.hu/api/trackback/id/tr202397534

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.