A cloud computing témájában folytatott beszélgetések során gyakran elhangzott, hogy addig örüljünk, míg a Google ki nem hozza az adatbányász szoftverét. A napokban bejelentett Google Prediction API nem egy adatbányászati szoftver, csak egy interfész, amin keresztül osztályozási és regressziós feladatokat oldhatunk meg, modelleket építhetünk és alkalmazhatunk webes alkalmazásunkból úgy, hogy a modell építése és tárolása a Google felhőjére van bízva. Állítólag ajánlórendszerek kialakítására is alkalmas lesz a technológia. Részletekkel még nem tudok szolgálni, csak most iratkoztam fel az API várólistájára, de aki nagyon kiváncsi, az itt nézelődjön első körben.
Mindenesetre elmondhatjuk, hogy a Google a BI ezen területére is betette a lábát. Elutasíthatjuk jelenleg a cloud computing megoldásokat, de előbb utóbb meg kell velük barátkoznunk. Lesznek felhő alapú megoldások, melyek a modelljeink építésében, alkalmazásában, hatékonyságának figyelésében és újratanításában fognak szolgáltatásokat nyújtani, és nem ritkán használni is fogjuk azokat. A helyzet korántsem olyan fenyegető, mint Hannibál volt Róma számára, de több mint említésre méltó.
Végül az irigységemnek adok hangot. Azzal, hogy a Google lehetővé teszi, hogy használjuk a predikciós algoritmusait (nem szól a leírás arról, hogy milyen algoritmusok futnak a háttérben), valójában a világ legnagyobb méretű adathalmaz repositoryját tudja létrehozni: a modell tanításához meg kell osztanunk az adathalmazunkat a Goolge API-jával. Egy így kialakuló hatalmas adathalmaztár jobb, pontosabb eljárások kidolgozásához nagy segítséget nyújt. Nem hiszem, hogy a Google-nak eredetileg ez az "ördögi" szándéka lett volna, de szerintem ezen adathalmaz birtoklása adatbányászati értelemben hatalmas előnyt jelent majd számára. Hogy egy kedvelt mondást idézzek (
forrás):