Adatbányászat

A Miau Wiki wikiből
A lap korábbi változatát látod, amilyen Igaz István (vitalap | szerkesztései) 2005. november 18., 11:23-kor történt szerkesztése után volt. (Történeti modul)

Angol megnevezés: Data Mining

Történeti modul

2000: "Üzleti döntéstámogatási módszer, amely segít megtalálni és kiaknázni új üzleti lehetőségeket a nagytömegű adathalmazokban rejlő, nem ismert összefüggések feltárásával."

"Egyesíti az adatbázis-kezelés, a statisztika és a mesterséges intelligencia kutatások eredményeit. Új távlatokat nyit meg ott, ahol a hagyományos módszerek nem elég jók, vagy nem elég gyorsak az igazán hatékony adatelemzéshez. Valós múltbeli összefüggésekre alapozva segít a jövő döntéseinek megalapozásában. Általános módszer, amely minden üzleti területen hatékonyan alkalmazható. Az adatbányászati algoritmusok meglévő alkalmazásokba való beépítésével (pl. ügyfélszolgálat) intelligens alkalmazások hozhatóak létre. Olyan komplex összefüggések feltárását biztosítja, amelyek nem nyerhetők ki egyszerű, vagy multidimenzionális lekérdezésekkel. Hatékony eszköze az elektronikus kereskedelem bevezetésének és fejlesztésének. Az üzleti döntéstámogatás eszköztárának egyedi, mással nem pótolható része." [1]

2002: "Nagy mennyiségű adat átválogatása, vizsgálata és modellezése annak érdekében, hogy az üzletben vagy kutatásban korábban kiaknázatlan előnyökre tegyünk szert." [2]

2005: "Ma a vállalatok léte múlhat az információk gyors és pontos begy˝ujtésén, elemzésén, a rugalmas fejl˝odésen, valamint az innováción. Egyre több fels ˝o vezet˝o ismeri fel, hogy az Internet, az adatok elektronikus tárolása a vállalat szolgálatába állítható. Az adatok azonban önmagukban nem hasznosak, hanem a bel˝olük kinyerhet˝o, a vállalat igényeihez igazodó, azt kielégít ˝o információkra lenne szükség. Ez egy újabb szükségletet teremt: egy olyan eszköz iránti igényt, ami képes arra, hogy információszerzés céljából elemezze a nyers adatokat. Ez az új eszköz az adatbányászat."

Ontológiai modul

"Ez egy" kapcsolattípus: információ

"Van neki, része a szócikknek" kapcsolattípus:

"A szócikk része valaminek (a szócikkel egyenrangú fogalmak)" kapcsolattípus:

Ellentmondások és vitatott kijelentések modulja

  • ...

Definíciós modul

  • Nagy mennyiségű adat átválogatása, vizsgálata és modellezése annak érdekében, hogy az üzletben vagy kutatásban korábban kiaknázatlan előnyökre tegyünk szert.
  • Üzleti döntéstámogatási módszer, amely segít megtalálni és kiaknázni új üzleti lehetőségeket a nagytömegű adathalmazokban rejlő, nem ismert összefüggések feltárásával.
  • Az adatbányászat nagy mennyiségű adat leválogatásának, feltárásának és modellezésének folyamata.
  • Az adatbányászat eszköz, amely az adatokat versenyelőnnyé változtatja.
  • Az adatbányászat olyan, korábban nem ismert összefüggések és információk kinyerése, amelyet később fel lehet használni fontos üzleti döntések meghozatalánál.
  • Olyan eljárások és módszerek összessége, melyek segítségével feltárhatók a vállalatoknál felhalmozódott adatok közt rejlő, korábban ismeretlen összefüggések, rejtett trendek, szabályszerűségek. Célja, hogy az így nyert információt üzleti előnyök, sikerek megalapozására, a döntéshozatal támogatására fordíthassák.
  • Az adatbányászat segítségével rejtett összefüggéseket fedezhetünk fel nagy mennyiségű adathalmazban. Az adatbányászat azt a nyilvánvaló ellentmondást oldja fel, hogy minél több adattal rendelkezünk, annál bonyolultabb és időigényesebb ezt hatékonyan elemezni és értékes következtetéseket levonni belőlük.
  • Ember számára emészthető, hasznos információk, rejtett összefüggések kinyerése nagy adathalmazokból.
  • Az adatbányászat a nagy adatbázisokban rejlő rejtett, és kevésbé rejtett információk felismerése és kinyerése. Az adatbányászat tehát egyfajta adatelemzés, melynek más eljárásokhoz hasonlóan van módszertana, és vannak eszközök, melyek hozzá köthetőek.
  • A vállalkozások egyre több és több adatot rögzítenek és tárolnak, de ezek többségét a napi munkán kívül szinte semmire sem használják. Ez a hatalmas adatmennyiség egy olyan vagyon, melyben hasznosítható összefüggések, tendenciák rejlenek. Ezeknek az összefüggéseknek a feltárására alkalmas az adatbányászat.

Tesztkérdések modul

  • Hol jelennek meg először az adatbányászati eszközök?

Az adatbányászati eszközök először a piaci szegmensekben jelennek meg.


  • Mi az adatbányászat célja?

Az adatbányászat célja: előre nem látható összefüggések, törvényszerűségek felfedezése üzleti előny megszerzése éredekében.


  • Az adatbányászat kész megoldás-e egy-egy problémára?

Nem, az adatbányászat egy technológia és nem egy kész megoldás egy-egy problémára, emiatt az információ szolgáltató architektúrába kell beilleszteni.


  • Az adatbányászat mekkora adatmennyiséggel birkózik meg?

Az adatbányászati megoldások bármekkora adatmennyiséggel megbirkóznak,gazdaságosan felhasználva a rendelkezésre álló hardver forrásokat.


  • Miben nyújtanak segítséget a feldolgozott adathalmazok és a megfelelő adatbányászati módszerekkel elemzett adatok?

Más konkrét sratégiai és egyedi üzleti döntések előkészítésében nyújtanak segítséget.


  • Mekkora üzleti hasznot hoznak az adatbányászati modellek által adott becslések a cégnek?

Az adatbányászat valódi értéke nem abban rejlik, hogy 100 százalékosan megbízható eredményt produkál, hanem sokkal inkább abban, hogy segítségével mekkora többletnyereséget vagy költség csökkenést érhetünk el. Például egy direkt marketing levél kiküldésénél lehet, hogy a modell segítségével kijelölt ügyfélszegmensnek csak 5%-a fog válaszolni, de ez nagyon nagy szám, ha a modell alkalmazása nélkül előálló 2.5 %-os válaszadási arányhoz viszonyítjuk.

Ajánlott irodalmak modulja

  • J. Han, M. Kamber: Adatbányászat, PANEM, Budapest, 2004.

[3]

  • Bodon Ferenc, Lukács András: Adatbányászat, Informatikai algoritmusok. 2. kötet, 33. fejezet, ELTE Eötvös Kiadó, Budapest, 2005.
  • Bodon Ferenc: Adatbányászati algoritmusok, (tanulmány), Budapest, 2004. [4]
  • J.D.Ullman: Datamining, CS345 Lecture Notes, Stanford University, USA, 2000.

[(http://www-db.stanford.edu/~ullman/mining/allnotes.pdf )]

  • G. Chang, M.J.Healey, J.A.M. McHugh, J.T.L. Wang: Mining the World Wide Web, Kluwer Academic Publisher, 2001.
  • Usama M. Fayyadm G.P.Shapiro, P. Smyth, R. Uthurusamy: Advances in Knowledge Discovery and Data Mining, AAAI Press/ The MIT Press, 1996.
  • P. Adriaans, D. Zantinge: Adatbányászat, PANEM, Budapest, 2002.