„Adatbányászat” változatai közötti eltérés

A Miau Wiki wikiből
(Definíciós modul)
13. sor: 13. sor:
 
* ...
 
* ...
 
== Definíciós modul ==
 
== Definíciós modul ==
* ...
+
 
 +
*Az adatbányászat nagy mennyiségű adat leválogatásának, feltárásának és modellezésének folyamata.  
 +
 
 +
*Az adatbányászat eszköz, amely az adatokat versenyelőnnyé változtatja.
 +
*Az adatbányászat olyan, korábban nem ismert összefüggések és információk kinyerése, amelyet később fel lehet használni fontos üzleti döntések meghozatalánál. 
 +
 
 +
*Olyan eljárások és módszerek összessége, melyek segítségével feltárhatók a vállalatoknál felhalmozódott adatok közt rejlő, korábban ismeretlen összefüggések, rejtett trendek, szabályszerűségek. Célja, hogy az így nyert információt üzleti előnyök, sikerek megalapozására, a döntéshozatal támogatására fordíthassák. 
 +
 
 +
*Az adatbányászat segítségével rejtett összefüggéseket fedezhetünk fel nagy mennyiségű adathalmazban. Az adatbányászat azt a nyilvánvaló ellentmondást oldja fel, hogy minél több adattal rendelkezünk, annál bonyolultabb és időigényesebb ezt hatékonyan elemezni és értékes következtetéseket levonni belőlük.
 +
 +
*Ember számára emészthető, hasznos információk, rejtett összefüggések kinyerése nagy adathalmazokból.
 +
 
 +
*Az adatbányászat a nagy adatbázisokban rejlő rejtett, és kevésbé rejtett információk felismerése és kinyerése. Az adatbányászat tehát egyfajta adatelemzés, melynek más eljárásokhoz hasonlóan van módszertana, és vannak eszközök, melyek hozzá köthetőek.
 +
 
 
== Tesztkérdések modul ==
 
== Tesztkérdések modul ==
 
* ...
 
* ...
 
== Ajánlott irodalmak modulja ==
 
== Ajánlott irodalmak modulja ==
 
* ...
 
* ...

A lap 2005. november 17., 14:07-kori változata

Angol megnevezés: ...

Történeti modul

  • Adatokat bányásztak az adószedők már az ókorban. A csillagokat figyelő tudósok és horoszkóphívők meg horoszkóp-szélhámosok több évezrede. Adatokat bányásztak a történészek. Azután jöttek a statisztikusok és kiterjesztették ezt az ősi tevékenységet mindenre, ami valamilyen módon adatszerűen kezelhető. Mi akkor új az egészben: kettős. Az első azoknak az egyre nagyobb teljesítőképességű számítógépeknek a használata, amelyek adatok milliárdjait tudják ésszerű időben és költséggel kezelni. A másik azoknak a matematikai-logikai módszereknek a fejlődése, amelyek az adatbányászat céljait szolgálják. Az első ilyen módszerek a statisztikusok kezében születtek és a statisztikusok számára készültek, elsősorban a sokváltozós analízis módszerei, egybeesések, visszatérések, egyidejű és időben eltolt kölcsönhatások szűrése, a hasonló tartalmú adatok csoportosításának és csoportjai felismerésének módszerei. Ezek a szűrő, hasonlóságokat kiemelő eljárások részben már a 100-200 évvel ezelőtti matematikában is ismeretesek voltak, de a számítástechnika tette lehetővé, hogy valódi adattömegeken megbízható módon, jól becsülhető pontossággal lehessen ezeket a műveleteket elvégezni. Lényegében véve arról van szó, hogy feltételezett struktúrákat vizsgálnak az adatokon, azaz keresik az adatok logikai összefüggéseit. Ebben is óriási a haladás, feltételezés-családok vizsgálatában, bizonytalanságok figyelembevételével. Mindez kiegészül olyan tanuló módszerekkel, ember-gép kapcsolatokat segítő eljárásokkal, amelyek e hatalmas esemény- és összefüggés-kutató fegyvertárat kapcsolják. Itt lép be az emberi tudás újra, a módszerek matematikai és számítástechnikai kidolgozása után következik az a különös tapasztalat és szakértelem, ami az adott feladatcsoporthoz tartozó módszereket ki tudja válogatni, és megbízható döntés-előkészítést tud szolgáltatni
  • A 90-es években a tárolókapacitások méretének igen erőteljes növekedése, valamint az árak nagymértékű csökkenése miatt az elektronikus eszközök és adatbázisok a hétköznapi életben is mind inkább elterjedtek. Az egyszerű és olcsó tárolási lehetőségek a nyers, feldolgozatlan adatok tömeges méretű felhalmozását eredményezték, ezek azonban közvetlen visszakeresésen és ellenőrzésen kívül egyéb haszonnal nem jártak. Sok helyen a ritkán látogatott adatokból adat temetők (data tombs) alakultak ki, amelyek tárolása költséget jelentett, de hasznot nem hozott.

Adatokat bányásztak az adószedők már az ókorban. A csillagokat figyelő tudósok és horoszkóphívők meg horoszkóp-szélhámosok több évezrede. Adatokat bányásztak a történészek. Azután jöttek a statisztikusok és kiterjesztették ezt az ősi tevékenységet mindenre, ami valamilyen módon adatszerűen kezelhető. Mi akkor új az egészben: kettős. Az első azoknak az egyre nagyobb teljesítőképességű számítógépeknek a használata, amelyek adatok milliárdjait tudják ésszerű időben és költséggel kezelni. A másik azoknak a matematikai-logikai módszereknek a fejlődése, amelyek az adatbányászat céljait szolgálják. Az első ilyen módszerek a statisztikusok kezében születtek és a statisztikusok számára készültek, elsősorban a sokváltozós analízis módszerei, egybeesések, visszatérések, egyidejű és időben eltolt kölcsönhatások szűrése, a hasonló tartalmú adatok csoportosításának és csoportjai felismerésének módszerei. Ezek a szűrő, hasonlóságokat kiemelő eljárások részben már a 100-200 évvel ezelőtti matematikában is ismeretesek voltak, de a számítástechnika tette lehetővé, hogy valódi adattömegeken megbízható módon, jól becsülhető pontossággal lehessen ezeket a műveleteket elvégezni. Lényegében véve arról van szó, hogy feltételezett struktúrákat vizsgálnak az adatokon, azaz keresik az adatok logikai összefüggéseit. Ebben is óriási a haladás, feltételezés-családok vizsgálatában, bizonytalanságok figyelembevételével. Mindez kiegészül olyan tanuló módszerekkel, ember-gép kapcsolatokat segítő eljárásokkal, amelyek e hatalmas esemény- és összefüggés-kutató fegyvertárat kapcsolják. Itt lép be az emberi tudás újra, a módszerek matematikai és számítástechnikai kidolgozása után következik az a különös tapasztalat és szakértelem, ami az adott feladatcsoporthoz tartozó módszereket ki tudja válogatni, és megbízható döntés-előkészítést tud szolgáltatni

Ontológiai modul

  • ...

Ellentmondások és vitatott kijelentések modulja

  • ...

Definíciós modul

  • Az adatbányászat nagy mennyiségű adat leválogatásának, feltárásának és modellezésének folyamata.
  • Az adatbányászat eszköz, amely az adatokat versenyelőnnyé változtatja.
*Az adatbányászat olyan, korábban nem ismert összefüggések és információk kinyerése, amelyet később fel lehet használni fontos üzleti döntések meghozatalánál.  
*Olyan eljárások és módszerek összessége, melyek segítségével feltárhatók a vállalatoknál felhalmozódott adatok közt rejlő, korábban ismeretlen összefüggések, rejtett trendek, szabályszerűségek. Célja, hogy az így nyert információt üzleti előnyök, sikerek megalapozására, a döntéshozatal támogatására fordíthassák.   
  • Az adatbányászat segítségével rejtett összefüggéseket fedezhetünk fel nagy mennyiségű adathalmazban. Az adatbányászat azt a nyilvánvaló ellentmondást oldja fel, hogy minél több adattal rendelkezünk, annál bonyolultabb és időigényesebb ezt hatékonyan elemezni és értékes következtetéseket levonni belőlük.
*Ember számára emészthető, hasznos információk, rejtett összefüggések kinyerése nagy adathalmazokból. 
*Az adatbányászat a nagy adatbázisokban rejlő rejtett, és kevésbé rejtett információk felismerése és kinyerése. Az adatbányászat tehát egyfajta adatelemzés, melynek más eljárásokhoz hasonlóan van módszertana, és vannak eszközök, melyek hozzá köthetőek.

Tesztkérdések modul

  • ...

Ajánlott irodalmak modulja

  • ...