„DM-blokk” változatai közötti eltérés
(→Bogyay Gábor) |
|||
(Egy közbenső módosítás ugyanattól a szerkesztőtől nincs mutatva) | |||
171. sor: | 171. sor: | ||
==xy== | ==xy== | ||
==zq== | ==zq== | ||
+ | [[Kategória:Egyéb_feladatok]] |
A lap jelenlegi, 2008. január 30., 12:44-kori változata
Tartalomjegyzék
2007.10.26. - Adatbányászati blokk
Brechler Zsolt
Döntési fákkal fogunk foglalkozni. Weka tudományos szempontból érdekes,többet tud mint egy SPSS.
- Adatbányászat/tudáskinyerés: implicit módon tudnak előállni.
ADöntési fákkal fogunk foglalkozni.
- tranzakciós adatbázisrendszer,vezetői információs rendszer,adattárház,adatpiac
Tuzes Gyorgy
adatbanyaszati modelleket leginkabb banki kornyezetekbe hasznaljak
fobb hasznalati teruletek
-lemorzsolodas vizsgalat -ugyfelszegmentacio -kockazatelemzes
Alkalmazza a mesterseges intellignciat.
Kurucz Eszter
Adatbányászat feladata:
- Leíró adatbányászat:egy adathalmaz tulajdonságainak tömör feltárása.
- prediktív adatbányászat:Jövőben viselkedés előrejelzése.
A prediktív adatbányászathoz tartozik az osztályozás, melynek módszerei közé tartozik :
- Döntési fák
- Logisztikus regresszió
- Mesterséges neurális hálózatok
Döntési fák:
- Egyszerű,könnyen értelmezhető módon ábrázolják azt a szabályrendszert, mellyel az objektumokat rendezzük.
- Ha..,akkor... típusú szabályokkal is megfogalmazhatjuk.
- A fa építésnél meg kell határozni, hogy melyik résznél történjen a vágás.
Entropia:alkalmas a rendezettség mérésére.
Mesterséges neurális hálózatok:
- kategóri és folytonos függő változót is képesek kezelni
- felépítése:
- Bemeneti réteg
- Rejtett réteg
- Kimeneti réteg
Bicók Csongor
Horváth Henrietta
Gáncs Júlia
Bogyay Gábor
Döntési fákkal fogunk foglalkozni. WEKA tudományos szempontból érdekes,többet tud mint egy SPSS.
- Adatbányászat/tudáskinyerés: implicit módon tudnak előállni.
Adatok:
- tranzakciós adatbázisrendszer,vezetői információs rendszer,adattárház,adatpiac
Adatpiacok:
- egy adott üzleti terület vagy üzleti megoldás adatkörét tartalmazzák.Egyszerűsítik az adateltérést alkalmazásokon keresztül.Gyors adatelérést bíztosítanak.
- banki környezetben: CRM (kampánymenedzsment,ügyfélszegmentáció,válaszadási modellek,lemorzsolódás vizsgálat,ügyfél jövedelmezőség,ügyfélérték) és kockázatelemzés (hitelpontozó kártyák,csalásferdítés,behajtás,basel II).
Adatbányászat által használt területek: Nagyon sokat használ. Leginkább statisztikát.
Adatbányászat lépései:
- 1.adattisztítás: zajok és ikon zisztens adatok eltávolítása
- 2.adatintegráció: különböző forrásrendszerek adatainak egyesítése
- 3.adatkiválasztás. mely adatok relevánsak az adott, modellezendő probléma tekintetében
- 4.adattranszformáció: modellezéshez szükséges formátumú, aggregáltságú afatkör kialakítása
- 5.adatbányászat: adatbányászati technikák alkalmazása a tudás kinyerése érdekében
- 6.kiértékelés: a valóban értékes információk kiválasztása, értékelése
- 7.tudás megjelenítés: a kinyert információk ábrázolása a végfelhasználók, döntéshozók számára feldolgozható formában,az eredmények áramoltatása a szervezet folyamataiban.
Adatbányászat feladata:
* Leíró adatbányászat:egy adathalmaz tulajdonságainak tömör feltárása. * Prediktív adatbányászat:Jövőben viselkedés előrejelzése.
A prediktív adatbányászathoz tartozik az osztályozás, melynek módszerei közé tartozik :
* Döntési fák * Logisztikus regresszió * Mesterséges neurális hálózatok
Predíktiv adatbányászat-Osztályozás:
- Döntési fák:Egyszerű és könnyen értelmezhető módon ábrázoljűk azt a szabályrendszert ábrázolják mellyel az objektumokat osztályokba rendezzük.
Azt kell tudni megválaszolni,melyik attributúm, és annak mely értékeinél történjen a vágás.
- ID3:
-adott cél attributum érték párosa, -entrópia minimalizálása. minnél kisebb a véletlenszerűség a csoportosításban
- CART( Classification and Regression Trees )
- CHAID( Chi-squared Automatic Interaction Delecation)
Entrópia egyenlet: minusz szummapi -t szorzom logpivel
- Mesterséges neurális hálózatok:
- kategória és folytonos függő változót is képesek kezelni
- akár több száz, egymással is összefüggő magyarázó változót tud hatékonyan használni
- Felépítése:
- bemeneti réteg - rejtett réteg - kimeneti réteg
Túltanulás elkerülésére két részre osztjuk: 1. tanuló 2. teszt adatbázis K-szomszédsági eljárások: az egyedeket a független változók terében helyezzük el. Hátrány:jelentős futásidő Regressziós eljárás: Lineáris, és logisztikus regresszió ( ez a leggyakoribb)
Vékony Viola
Adatbányászat feladata:
- Leíró adatbányászat
- prediktív adatbányászat
ID3 adott célattribútum-érték páros (kiszámolja az entropiát=rendezettlenség) Entrópiai minimalizálás - minél kisebb a véletlenszerűsége a csoportosításában
neurális hálozatok felépítése: Bemeneti réteg (Független változó) Rejtett réteg Kimeneti réteg (függő változó)
Pauleczki Mihály
Sápi András
Döntéshozó,weka,spss.Az adatbányászat tudáskinyerés.Forrás rendszerek v. tranzakciós rendszrek.Adattárház:elemzői szempontból releváns adatokat tartalmaz,innen nyerjük ki a rengeteg adatból ami majd kell az adatpiacnak.Adatbányászat által használt területek: statisztika, mesterséges intelligencia. Adatbányászat lépései: adattisztítás,adatkiválasztás,adattranszformáció,adatbányászat,kiértékelés.Leíró adatbányászat: tulajdonságainak tömör, összefoglaló jellegű feltárása.Adatok megjelenítése, összesítések prediktív adatbányászat (osztályozó eljárás) módszerek: döntési fák,logisztikus regressziómmesterséges neurális hálózatok Döntési fák:egyszerű, könnyen értelmezhető. Ha.., akkor.. típusú szabályokkal megfogalmazható ID3 algoritmus: attribútum-érték párosra kiszámolja az entrópiát(rendezettség mérésére).
Putnoki Gyula
Palatinus Miklós
Döntési fa weka-val, vagy spss-el. adatbányászat: nagy adathalmazból információt nyerjünk ki. adattárház: elemzői szempontból releváns adatokat tartalmaz.(döntéstámogató) adatpiac: egy-egy csoportnak releváns adatokat jelenít meg.(ebből dolgozik)
- általános jellemzői: Egy adott üzleti terület vagy üzleti megoldás adatkörét tartlamazzák, gyors adatelérést biztosítanak.
Adatpiac használatai:
- CRM (ügyfélkapcsolatok): Kampánymenedzsment, ügyfélszegmentáció, válaszadási modellek, ügyfélérték
- Kockázatelemzés: csalásfelderítés, behajtás, hitelpontozó kártyák, Basel II modell
Adatbányászat által használt területek: statisztika, mesterséges intelligencia, adatbányászat lépései:
- adattisztítás (inkonzisztens adatok eltávolítása)
- hiányzó értékek problémályának megoldása
- adatkiválasztás (mely adatok relevánsak az adott, modellezendő probéma tekintetében)
- adattranszformáció (modellezéshez szükséges formátumú, aggregáltságú adatkör kialakítása
- adatbányászat
- kiértékelés (a valóban értékes információk kiválasztása
- tudásmegjelenítés
leíró adatbányászat: tulajdonságainak tömör, összefoglaló jellegű feltárása.
- adatok megjelenítése, összesítések
prediktív adatbányászat (osztályozó eljárás) módszerek:
- döntési fák
- logisztikus regresszió
- mesterséges neurális hálózatok
Döntési fák:
egyszerű, könnyen értelmezhető. Ha.., akkor.. típusú szabályokkal megfogalmazható ID3 algoritmus: attribútum-érték párosra kiszámolja az entrópiát(rendezettség mérésére).
Neurális hálózatok
- kategória és folytonos függő változót is képesek kezelni
- akár több száz, egymással is összefüggő megyarázó változót tud hatékonyan használni
- felépítése:
- bemeneti réteg(független változók)
- rejtett réteg
- kimeneti réteg(függő változók)