DM-blokk
Tartalomjegyzék
2007.10.26. - Adatbányászati blokk
Brechler Zsolt
Döntési fákkal fogunk foglalkozni. Weka tudományos szempontból érdekes,többet tud mint egy SPSS.
- Adatbányászat/tudáskinyerés: implicit módon tudnak előállni.
ADöntési fákkal fogunk foglalkozni.
- tranzakciós adatbázisrendszer,vezetői információs rendszer,adattárház,adatpiac
Tuzes Gyorgy
adatbanyaszati modelleket leginkabb banki kornyezetekbe hasznaljak
fobb hasznalati teruletek
-lemorzsolodas vizsgalat -ugyfelszegmentacio -kockazatelemzes
Alkalmazza a mesterseges intellignciat.
Kurucz Eszter
Adatbányászat feladata:
- Leíró adatbányászat:egy adathalmaz tulajdonságainak tömör feltárása.
- prediktív adatbányászat:Jövőben viselkedés előrejelzése.
A prediktív adatbányászathoz tartozik az osztályozás, melynek módszerei közé tartozik :
- Döntési fák
- Logisztikus regresszió
- Mesterséges neurális hálózatok
Döntési fák:
- Egyszerű,könnyen értelmezhető módon ábrázolják azt a szabályrendszert, mellyel az objektumokat rendezzük.
- Ha..,akkor... típusú szabályokkal is megfogalmazhatjuk.
- A fa építésnél meg kell határozni, hogy melyik résznél történjen a vágás.
Entropia:alkalmas a rendezettség mérésére.
Mesterséges neurális hálózatok:
- kategóri és folytonos függő változót is képesek kezelni
- felépítése:
- Bemeneti réteg
- Rejtett réteg
- Kimeneti réteg
Bicók Csongor
Horváth Henrietta
Gáncs Júlia
Bogyay Gábor
Vékony Viola
Adatbányászat feladata:
- Leíró adatbányászat
- prediktív adatbányászat
ID3 adott célattribútum-érték páros (kiszámolja az entropiát=rendezettlenség) Entrópiai minimalizálás - minél kisebb a véletlenszerűsége a csoportosításában
neurális hálozatok felépítése: Bemeneti réteg (Független változó) Rejtett réteg Kimeneti réteg (függő változó)
Pauleczki Mihály
Sápi András
Döntéshozó,weka,spss.Az adatbányászat tudáskinyerés.Forrás rendszerek v. tranzakciós rendszrek.Adattárház:elemzői szempontból releváns adatokat tartalmaz,innen nyerjük ki a rengeteg adatból ami majd kell az adatpiacnak.
Putnoki Gyula
Palatinus Miklós
Döntési fa weka-val, vagy spss-el. adatbányászat: nagy adathalmazból információt nyerjünk ki. adattárház: elemzői szempontból releváns adatokat tartalmaz.(döntéstámogató) adatpiac: egy-egy csoportnak releváns adatokat jelenít meg.(ebből dolgozik)
- általános jellemzői: Egy adott üzleti terület vagy üzleti megoldás adatkörét tartlamazzák, gyors adatelérést biztosítanak.
Adatpiac használatai:
- CRM (ügyfélkapcsolatok): Kampánymenedzsment, ügyfélszegmentáció, válaszadási modellek, ügyfélérték
- Kockázatelemzés: csalásfelderítés, behajtás, hitelpontozó kártyák, Basel II modell
Adatbányászat által használt területek: statisztika, mesterséges intelligencia, adatbányászat lépései:
- adattisztítás (inkonzisztens adatok eltávolítása)
- hiányzó értékek problémályának megoldása
- adatkiválasztás (mely adatok relevánsak az adott, modellezendő probéma tekintetében)
- adattranszformáció (modellezéshez szükséges formátumú, aggregáltságú adatkör kialakítása
- adatbányászat
- kiértékelés (a valóban értékes információk kiválasztása
- tudásmegjelenítés
leíró adatbányászat: tulajdonságainak tömör, összefoglaló jellegű feltárása.
- adatok megjelenítése, összesítések
prediktív adatbányászat (osztályozó eljárás) módszerek:
- döntési fák
- logisztikus regresszió
- mesterséges neurális hálózatok
Döntési fák:
egyszerű, könnyen értelmezhető. Ha.., akkor.. típusú szabályokkal megfogalmazható ID3 algoritmus: attribútum-érték párosra kiszámolja az entrópiát(rendezettség mérésére).
Neurális hálózatok
- kategória és folytonos függő változót is képesek kezelni
- akár több száz, egymással is összefüggő megyarázó változót tud hatékonyan használni
- felépítése:
- bemeneti réteg(független változók)
- rejtett réteg
- kimeneti réteg(függő változók)