|
|
1. sor: |
1. sor: |
− | '''Angol megnevezés:''' Data Mining | + | '''Angol megnevezés:''' ... |
| __TOC__ | | __TOC__ |
| == Történeti modul == | | == Történeti modul == |
− | *Adatokat bányásztak az adószedők már az ókorban. A csillagokat figyelő tudósok és horoszkóphívők meg horoszkóp-szélhámosok több évezrede. Adatokat bányásztak a történészek. Azután jöttek a statisztikusok és kiterjesztették ezt az ősi tevékenységet mindenre, ami valamilyen módon adatszerűen kezelhető. Mi akkor új az egészben: kettős. Az első azoknak az egyre nagyobb teljesítőképességű számítógépeknek a használata, amelyek adatok milliárdjait tudják ésszerű időben és költséggel kezelni. A másik azoknak a matematikai-logikai módszereknek a fejlődése, amelyek az adatbányászat céljait szolgálják. Az első ilyen módszerek a statisztikusok kezében születtek és a statisztikusok számára készültek, elsősorban a sokváltozós analízis módszerei, egybeesések, visszatérések, egyidejű és időben eltolt kölcsönhatások szűrése, a hasonló tartalmú adatok csoportosításának és csoportjai felismerésének módszerei. Ezek a szűrő, hasonlóságokat kiemelő eljárások részben már a 100-200 évvel ezelőtti matematikában is ismeretesek voltak, de a számítástechnika tette lehetővé, hogy valódi adattömegeken megbízható módon, jól becsülhető pontossággal lehessen ezeket a műveleteket elvégezni. Lényegében véve arról van szó, hogy feltételezett struktúrákat vizsgálnak az adatokon, azaz keresik az adatok logikai összefüggéseit. Ebben is óriási a haladás, feltételezés-családok vizsgálatában, bizonytalanságok figyelembevételével. Mindez kiegészül olyan tanuló módszerekkel, ember-gép kapcsolatokat segítő eljárásokkal, amelyek e hatalmas esemény- és összefüggés-kutató fegyvertárat kapcsolják. Itt lép be az emberi tudás újra, a módszerek matematikai és számítástechnikai kidolgozása után következik az a különös tapasztalat és szakértelem, ami az adott feladatcsoporthoz tartozó módszereket ki tudja válogatni, és megbízható döntés-előkészítést tud szolgáltatni | + | * ... |
− | | + | == Ontológiai modul == |
− | *A 90-es években a tárolókapacitások méretének igen erőteljes növekedése, valamint az árak nagymértékű csökkenése miatt az elektronikus eszközök és adatbázisok a hétköznapi életben is mind inkább elterjedtek. Az egyszerű és olcsó tárolási lehetőségek a nyers, feldolgozatlan adatok tömeges méretű felhalmozását eredményezték, ezek azonban közvetlen visszakeresésen és ellenőrzésen kívül egyéb haszonnal nem jártak. Sok helyen a ritkán látogatott adatokból adat temetők (data tombs) alakultak ki, amelyek tárolása költséget jelentett, de hasznot nem hozott. | + | * ... |
− | | + | == Ellentmondások és vitatott kijelentések modulja == |
− | *Egyre több területen merült fel az igény, hogy az adathalmazokból a hagyományosnál árnyaltabb szerkezetű információt nyerjenek ki. A hagyományos adatbázis-kezelő rendszerek komplexebb feladatokat egyátalán nem tudnak megoldani, vagy az eredmény kiszámítása elfogadhatatlanul hosszú időbe telt. A szükség egy új tudományterületet keltett életre, az adatbányászatot, amelynek célja "hasznos, látens információ kinyerése adatbázisokból". | + | * ... |
| + | == Definíciós modul == |
| + | * ... |
| + | == Tesztkérdések modul == |
| + | * ... |
| + | == Ajánlott irodalmak modulja == |
| + | * ... |