Adatbányászat Blog

Az Adatbányász Blogon a dmlab szakértőinek írásait olvashatod a big data és data science területéről.

dmlab.hu - Big data és data science tanácsadás
"Ha örülsz, hogy fejedre nőttek az adatok."

Keress minket bátran:
- Nagy-Rácz István +36704595669
- Gáspár Csaba +36208234154
- info@dmlab.hu

Hírlevél

Iratkozz fel hírlevelünkre, hogy mindig naprakészen tudjunk tájékoztatni.
Feliratkozás
Leiratkozás

Címkék

10éves (1) 2007 (1) 2010 (23) 2011 (27) 2012 (13) 2013 (23) 2014 (5) 2015 (6) 2016 (10) 2017 (4) 2018 (4) adaptív (1) adat- és médiainformatika (1) adatárusítás (1) adatbányászat (10) adatbányászati algoritmusok (1) adatbányászati alkalmazások (2) adatbányászati meetup (1) adatbányászati oktatás (1) adatbányászati technológiák (4) adatelemzés (1) adatelemzési platformok (1) adattárház (5) adattárház fórum (6) adattárolás (1) adattisztítás (1) adatvédelem (2) advise (2) aegon (1) aglitás (1) agy (2) ai (1) ajánló (11) ajánlórendszerek (1) aktivitás felismerés (1) algoritmus (1) alkalmazás (3) állásajánlat (1) amazon ec2 (1) ambiens (1) ami (1) amuse (1) analitika (1) analytics (1) andego (3) apache (1) api (2) Arató Bence (3) artificial intelligence (1) bank (1) Barabási (2) barabási (2) beharangazó (1) beharangozó (18) bejelentés (2) belami (1) best practice (9) beszámoló (15) bi (13) BI (3) Bi (1) bi-trek (1) biconsulting (7) bigdata (25) Big Data (3) big data (8) biopen (1) biztosító (1) BI Akadémia (1) bi consulting (1) bi start (1) blog (6) BME (14) bme (2) bootcamp (1) brainstorming (1) bsp (1) budapest (1) business analytics (1) business analytics szakirány (1) cancer detection (1) churn (2) ci (1) címkefelhő (2) CIO (1) clementine (1) Clementine Consulting (1) cloud computing (2) cognos (1) credit scoring (1) crisp-dm (1) crm (2) Cruncconf (1) crunch (2) csalásdetektálás (1) DataExpert (1) dataexplorer (1) datapest (1) datascience (2) datasource (1) data engineering (1) data mining (1) data science (7) diplomamunka (1) dmla1o (1) dmlab (12) döntési fák (1) drill (1) e-commerce (1) egészségügy (1) előadás (22) előrejelzés (1) élő közvetítés (1) Enbrite.ly (1) energetika (1) esemény (2) esettanulmány (3) ethics (1) etikus (1) etl (2) eu (1) évforduló (3) fejlesztés (2) felmérés (5) felsőoktatás (1) felület (1) felvásárlás (3) film (1) fizetés (1) forecasting (1) forgalomelőrejelzés (2) foursquare (1) fraud detection (1) freebase (1) gartner (2) gazdasagi informatikus (2) gdpr (1) gépi tanulás (4) gépi tanuló algoritmus (1) google (8) google analytics (1) graphlab (1) gravity (3) greenplum (1) gyakorlat (1) hackhaton (1) hadoop (10) hallgatók (2) hálózatelemzés (3) hálózatkutatás (2) hálózatok (3) hazai (2) hiba (4) hírlevél (2) hive (1) honlap (1) HR (1) HVG (1) i5 (1) ibm (6) ibm modeler (1) ibm spss (3) icdm (1) idc (2) idősor (1) idősorok (1) ieee (1) iir (1) image processing (1) impact (1) infobright (1) információbróker (1) innováció (5) innovatívBI (1) innovativ bi (4) inspiráció (1) intelligencia (2) Internet Hungary (1) iqsymposium (19) iqsys (16) iroda (4) jelentkezés (2) jmp (2) job (1) kaggle (2) kampánymenedzsment (1) kapcsolati hálók (1) karrier (1) kdd (3) kdnuggets (2) képfeldolgozás (1) képzés (4) kérdés (2) kérdőív (1) kerekasztal (1) keresés (1) kereső (1) keresztvalidáció (4) kína (1) klaszterezés (2) knime (1) kockázati tőke (1) kollaboratív munka (1) kompetencia (1) konferencia (72) könyv (6) környezet (1) közlekedés (1) közösség (2) közösségi hálózatok (4) közvetítés (6) kritika (1) küldetés (1) kürt akadémia (1) kutatás (2) lemorzsolódás (1) licensz (1) live (1) logisztika (1) machine learning (1) magyar telekom (2) mahout (1) mapreduce (1) marketplace (1) média (2) meetup (11) mellékspecializáció (1) mém (3) memóriacentrikus (1) menedzsment (3) metaadat (1) metodika (2) microsoft (1) mobil (5) mobil bi (4) modeler (2) modell (3) morgan stanley (1) motion chart (1) munkaerő (2) mysql (1) mytraffic (4) nemzetközi (5) nemzetközi összehasonlítás (1) netflix prize (1) networking (1) next big thing (1) nips (1) nosql (1) nyílt forráskód (4) nyomkövetés (1) offline áruházak (1) okostelefon (1) oktatás (23) olvasók (1) online áruházak (1) online kutatás (1) open source (19) open source bi (3) operatorfa (1) osbi (12) összehasonlítás (1) ötletek (2) pandas (2) paradoxon (1) pascal (1) pentaho (1) personal data mining (1) phd (2) philips (1) piac (3) pikk (1) pilot (1) PISA-felmérés (1) pmml (1) politika (2) powerpivot (1) prága (1) praktiker (1) prediktív analitika (2) prediktív analitka (1) prediktiv modellezés (5) prediktív modellezés (1) prezi (15) privacy (1) privacy preserving data mining (1) product management (1) projekt (1) projektmenedzsment (6) publikáció (1) python (9) radoop (12) random forest (1) rapid-i (2) rapidanalytics (7) rapidminer (40) RapidMiner (2) rcomm (7) refine (1) Rexer Analytics (1) rsctc (1) R nyelv (7) saas (1) sap (1) SAS (20) sas enterprise miner (2) sas enterpris guide (1) sas entprise miner (1) sas fórum (1) sas forum (3) siker (3) simptech (1) sixtep (2) smarthabits (1) spike sorting (1) sportanalitika (1) spss (13) SPSS (3) spss clementine (3) spss hungary (5) spss modeler (6) ssd (1) starschema (2) startup (9) statisztika (1) survey (1) svm (1) szabad szoftver (1) szakmai (1) szavazó eljárások (2) szélenergia (1) szélerőmű (1) szervezetfejlesztés (2) szociális hálók (1) szoftver (5) szöveg (1) szövegbányászat (2) sztaki (2) tableau (1) talend (2) támogatás (1) tanulmány (1) tanulság (1) távolság (1) technológia (1) tedx (1) telekommunikáció (2) teradata (2) teszt (1) text mining (1) tmit (6) toborzás (1) tőzsdei előrejelzés (1) tracking (1) trendek (9) tudományos (1) tunedit (1) twitter (17) ügyfél (1) usa (1) üzleti intelligencia (3) üzleti modell (3) üzleti reggeli (3) választható tárgy (1) validáció (4) válogatás (1) válság (1) változás (1) vélemény (1) véleméy (1) verseny (20) vezetői képzés (1) videó (3) vizualizáció (5) web (4) web2 (2) webanalitika (3) webshop (1) weka (2) wikipedia (2) workshop (1) yahoo (2) Címkefelhő

TWitter a csapat tagjaitól

2018.11.26. 09:50 Gáspár Csaba

Adatkezelési kultúrák

Címkék: kína usa eu ai big data gdpr

Big data forradalom: adatkezelési erőviszonyok a „cég-állam-egyén szentháromságában”

 Komoly felelősség és páratlan üzleti potenciál. Valahogy így lehetne leírni azt a lehetőséget, amellyel a (személyes) adatok kezelése, birtoklása és az adatelemzés kecsegtet.

Big data forgatókönyvek

Az elmúlt hónapokban éjjel-nappal a GDPR-ról, a téma fontosságáról és az ezzel együtt járó kötelezettségekről lehetetett hallani. Ám valóban „csak” arról van itt szó, hogy illetéktelenek kezébe kerülhetnek érzékeny adatok? Az adatgyűjtés és az adatfelhasználás lehetőségei valójában ennél sokkal színesebbek, és sokszor a leírt rémhíreknél barátságosabbak is lehetnek. Mi több, ha kicsit jobban elmélyedünk a témában, meglehet, hogy saját folyamataink hatékonyságán is dobhatunk egyet. Utánajártunk néhány érdekességnek és a világ ma fellelhető adatkezelési forgatókönyveinek.

 Egy 2007-es európai uniós nyilvános tanulmányban[1] számoltak be arról, hogy az IT, a telekommunikáció, a média és a szórakoztatóipar összefonódása és az üzleti intelligencia fejlődése miatt körülbelül 2015-re különleges jelentőséggel bírnak majd a személyes adatok, melyek birtokosa monopolhelyzetbe kerülhet. A szerzők háromféle adatkezelési forgatókönyvet vázoltak fel. Meglepően jól prognosztizáltak: ezek az adatelemzési, adattárolási gyakorlatok, vagy legalábbis ehhez nagyon hasonlók megjelennek a világ jelentős gazdasági övezeteiben:

  1. Cégközpontú szkenárió
  2. Államközpontú szkenárió
  3. Egyénközpontú szkenárió

 A három nézőpont különböző aspektusokat és lehetőségeket kínál arra, amiért és ahogyan érdemes az adatokkal foglalkoznunk.

Cégközpontú big data forgatókönyv – Az egyesült kapitalista adatliberalizmus

A legjelentősebb adatbányászati nagyhatalmak hazája az Egyesült Államok. Az IT-szektorban vezető helyen szerepel, vállalatai szárnyalnak, így nem meglepő, ha az adatok amerikai cégközpontú megközelítése sokakat csábít, mindenki erre a vonatra próbál felkapaszkodni.

A világ adatvagyonának legnagyobb birtokosait (például: a Google, a Facebook, az Apple, az Amazon, az eBay vagy a Twitter) az amerikai törvények sokszor előnyben részesítik: némi hozzájárulás után szinte szabaddá válik az adatfeldolgozás, sőt, Donald Trump egyik első hivatali intézkedésével engedélyezte az amerikai internetszolgáltatóknak a rajtuk átfolyó ügyféladatok értékesítését. Hazai hasonlattal élve ez olyan lenne, mintha nálunk a Telekom eladásra kínálná számunkra a szomszédunk netforgalmát (kicsit abszurd, nem?). Néha Amerikában is kirobban egy-egy „adatbotrány”, ám ezek száma és jelentősége a birtokolt információhoz képest elenyésző. A netes óriáscégek a megszerzett, megvásárolt adatokra támaszkodva őrületes hatékonyságról tanúskodnak, ami sokakat félelemmel tölt el, míg másokat csábít és kapzsivá tesz ez a döntéstámogató rendszer. Ezt a létező szisztémát leginkább csak belülről lehetne megbolygatni, például trösztellenes törvényekkel. Sokszor felmerült már a Google, a Facebook vagy az Amazon feldarabolásának igénye, mint ahogyan az korábban az AT&T egyeduralkodó amerikai távközlési vállalattal is megtörtént.

Profitorientált vállalati döntéstámogató rendszerek

A módszer keltette érzések és személyes gondolatok lecsupaszítása után elmélyedhetünk a szkenárió lényegi megközelítésében is. Az elv az elérhető legnagyobb hatékonyság-növekedésen alapszik: központjában a folyamatok optimalizálása, az alsóbb döntéshozási pontok támogatása áll, az adatokra pedig a személyes vonal redukálása mellett objektív pénzteremtő erőként tekint. Ez az adatgyűjtési módszer költséget takarít meg és bevételt növel. A Dmlabnál számos referenciánk kapcsolódik ehhez az adatfeldolgozáshoz: részt vettünk már meghibásodások előrejelzésének kidolgozásában, üzemanyagfogyasztás optimalizálásában vagy például az ügyfeleknek kedvezőbb, ugyanakkor a vállalat számára is megfelelő ajánlatadási eljárás megtalálásában.

Államközpontú big data diktatúra – A kínai falanszter informatikai alapjai

A jó öreg Kínát hozhatjuk fel itt legjobb példaként. A világ legősibb folyamatos civilizációja kiválóan kiaknázta az adatbányászat nyújtotta előnyöket is. Itt nem feltétlenül a titkosszolgálati és hírszerzési vonalra gondoltunk (szemben az amerikai NSA-botrányokkal), hanem sokkal inkább hétköznapokhoz köthető információk hasznosítására. Kínában jelenleg működik egy pontrendszer, amely az állampolgárokat minősíti az adatokra lefordítható aktivitása (például iskolázottság, munkahely, pénzügyi mozgás vagy társas kapcsolatok) alapján. Mindezt megspékelve egy hatalmas kiterjedésű állami internetes cenzúrával, amelyen közel kétmillió ember dolgozik. Félelmetes, ám hatékony és hatásos megvalósulása az adatok birtoklásának, amelyet másnéven bizánci információkezelési rendszernek is neveznek.

Csak egy példa a sok közül: Kínában rohamtempóban építik a köztéri kamerarendszert, kísérleti jelleggel már számos közintézményt és iskolát bekameráztak. Utóbbiban figyelemmel kísérik a diákok képességeit, tanulási szokásait és a fegyelmezettséget. Az így nyert adatok feltételezhetően bekerülnek majd az állami döntéstámogató pontrendszer indikátorai közé, és talán a közeljövőben ezen múlik majd, hogy egy állampolgár elegendő pontot „gyűjtött-e” a hitelképességhez, az útlevéligényléshez vagy akár egy közigazgatás álláshely sikeres megpályázásához.

Központosított adatbázis kezelés

Ellenőrzés és kontroll. Ez a két, időnként félelmetesnek ható kulcsszó ebben az államközpontú megközelítésben. Máshol a világon nem tapasztalható ez a merev és szigorú adatkezelési forgatókönyv, ám néhány vállalatnál fellelhető egy-két aspektus. Ezek főként olyan cégek, ahol az adatok szerepe kevésbé a hatékonyságnövelés, sokkal inkább a munkavállalók és a folyamatok kézbentartása, ellenőrzése. A szemlélet elterjedésének erős lökést adtak a különböző videó, képi vagy hanganyagok feldolgozására készített deep learning megoldások.

 A Dmlabnál is találkoztunk már olyan projekttel, amikor e forgatókönyv elveihez folyamodtunk: a Nemzeti Adó- és Vámhivatallal (NAV) közösen dolgoztunk egy hatékonyabb ÁFA-csalás elleni módszer megalkotásán, de említhetjük bármilyen fraud (csalás) ellen szóló megoldási javaslatunkat is.

Egyénközpontú big data – Megkérdőjelezhető európai bizalom és nagymértékű individualizmus az adatkezelésben

Nincs olyan állam (ma még), amelyre egyértelműen rá lehetne húzni ezt a forgatókönyvet, ám az új európai adatkezelési szabályok (GDPR) életbe lépésével kétségtelenül Európa lett a központja ennek a szemléletnek, azaz a személyes adatokkal történő önrendelkezés jogának. A kontinentális (elsősorban svéd) gyakorlatba beleillik a „privacy” védelmének a joga. Jó példa lehet erre a Linux operációs rendszer szellemisége, a PirateBay mögötti ideológia, vagy a hamarosan érvénybe lévő irányelv, miszerint a bankoknak az ügyfél kérésére ki kell adniuk a harmadik fél részére a pénzügyi adatokat. Azért tegyük hozzá, hogy a monopolhelyzetű adatokból élő cégek nem a kontinensről származnak, így egy európai vállalat laza tollvonással válhat az adatokkal kapcsolatos önrendelkezés harcosává.

A magánélet üzleti intelligencia megoldásai

Az európai gondolkodásban fontos szerep jut a magánélet és a különböző szabadságjogok védelmének, a szigorú adatvédelmi szabályoknak. E szerint a világkép szerint a privacy-nak, azaz a magánéletnek, az információnak, mint magántulajdonnak kellene a legnagyobb hangsúlyt kapnia a haszon és az ellenőrzés helyett. Az Európai Unió az egyik leglelkesebb képviselője ennek a felfogásnak, ám a kontinentális földrész jóval kisebb erőt tudhat magáénak, mint amekkora lendülettel az USA vagy Kína vetette bele magát a téma kiaknázásába. A helyzethátrány oka leginkább az, hogy az elképzelések motorja inkább az EU intézményrendszere, amelyhez (egyelőre) még nem párosul felhajtóerőként a felhasználók tudatossága. Írásunk mellé ajánlunk még egy (szerintünk jó) cikket az európai adatvédelemmel kapcsolatos dilemmákról.

 Szétnézve az üzleti folyamataink között ez a módszer egy kicsit kakukktojásnak tűnhet, de bármily meglepő, az adatokat a haszonszerzése igénye nélkül egyszerűen „wellbeing-re” is lehet használni, ha mondjuk arra törekszünk, hogy az ügyfeleinknek vagy a munkatársainknak jobb legyen. Ilyen lehet a working log rendszer alapján egy egyénre szabott szabadságajánló vezetői információs rendszer, valamilyen belső HR-analitikai megoldás vagy például a felhasználói adatok visszaszolgáltatása az ügyfelek számára.

Semmi sem fekete vagy fehér, és olykor a szürkét is nehéz meglátni

A világ társadalmai nem kategorizálhatók egyértelműen e három forgatókönyv mentén: általában e három big data forgatókönyv egyvelegével találkozhatunk egy-egy országban, ami a technológiai trendek fejlődésével gyorsan változik, egyre változatosabbak az adatfelhasználási lehetőségek, így érdemes figyelemmel kísérni a trendeket.

 A személyes és üzleti adatok védelme, ugyanakkor az információszabadság kettősége egy olyan erő, amellyel sokan (vissza)élnek. Az óvatosságon túllépve a lehetőséget kell meglátni ebben a száguldó vonatban, és lehetőleg minél előbb felülni rá.

 

[1] WORLD ECONOMIC FORUM (2007): Digital Ecosystem - Convergence between IT, Telecoms, Media and Entertainment: Scenarios to 2015. World Scenario Series, 2007

 

Szólj hozzá!

A bejegyzés trackback címe:

https://adatbanyaszat.blog.hu/api/trackback/id/tr9914385228

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.