„DM-blokk” változatai közötti eltérés
(→Bogyay Gábor) |
|||
45. sor: | 45. sor: | ||
==Gáncs Júlia== | ==Gáncs Júlia== | ||
==Bogyay Gábor== | ==Bogyay Gábor== | ||
+ | |||
+ | Döntési fákkal fogunk foglalkozni. | ||
+ | WEKA tudományos szempontból érdekes,többet tud mint egy SPSS. | ||
+ | *Adatbányászat/tudáskinyerés: implicit módon tudnak előállni. | ||
+ | '''Adatok:''' | ||
+ | *tranzakciós adatbázisrendszer,vezetői információs rendszer,adattárház,adatpiac | ||
+ | '''Adatpiacok''': | ||
+ | *egy adott üzleti terület vagy üzleti megoldás adatkörét tartalmazzák.Egyszerűsítik az adateltérést alkalmazásokon keresztül.Gyors adatelérést bíztosítanak. | ||
+ | *banki környezetben: CRM (kampánymenedzsment,ügyfélszegmentáció,válaszadási modellek,lemorzsolódás vizsgálat,ügyfél jövedelmezőség,ügyfélérték) és kockázatelemzés (hitelpontozó kártyák,csalásferdítés,behajtás,basel II). | ||
+ | '''Adatbányászat által használt területek''': Nagyon sokat használ. Leginkább statisztikát. | ||
+ | |||
+ | '''Adatbányászat lépései:''' | ||
+ | *1.adattisztítás: zajok és ikon zisztens adatok eltávolítása | ||
+ | *2.adatintegráció: különböző forrásrendszerek adatainak egyesítése | ||
+ | *3.adatkiválasztás. mely adatok relevánsak az adott, modellezendő probléma tekintetében | ||
+ | *4.adattranszformáció: modellezéshez szükséges formátumú, aggregáltságú afatkör kialakítása | ||
+ | *5.adatbányászat: adatbányászati technikák alkalmazása a tudás kinyerése érdekében | ||
+ | *6.kiértékelés: a valóban értékes információk kiválasztása, értékelése | ||
+ | *7.tudás megjelenítés: a kinyert információk ábrázolása a végfelhasználók, döntéshozók számára feldolgozható formában,az eredmények áramoltatása a szervezet folyamataiban. | ||
+ | '''Adatbányászat feladata''': | ||
+ | |||
+ | * Leíró adatbányászat:egy adathalmaz tulajdonságainak tömör feltárása. | ||
+ | * Prediktív adatbányászat:Jövőben viselkedés előrejelzése. | ||
+ | |||
+ | A prediktív adatbányászathoz tartozik az osztályozás, melynek módszerei közé tartozik : | ||
+ | |||
+ | * Döntési fák | ||
+ | * Logisztikus regresszió | ||
+ | * Mesterséges neurális hálózatok | ||
+ | |||
+ | '''Predíktiv adatbányászat-Osztályozás:''' | ||
+ | *''Döntési fák'':Egyszerű és könnyen értelmezhető módon ábrázoljűk azt a szabályrendszert ábrázolják mellyel az objektumokat osztályokba rendezzük. | ||
+ | Azt kell tudni megválaszolni,melyik attributúm, és annak mely értékeinél történjen a vágás. | ||
+ | *ID3: | ||
+ | -adott cél attributum érték párosa, | ||
+ | -entrópia minimalizálása. minnél kisebb a véletlenszerűség a csoportosításban | ||
+ | *CART( Classification and Regression Trees ) | ||
+ | *CHAID( Chi-squared Automatic Interaction Delecation) | ||
+ | ''' ''Entrópia egyenlet: minusz szummapi -t szorzom logpivel''''' | ||
+ | |||
+ | *'''Mesterséges neurális hálózatok:''' | ||
+ | **kategória és folytonos függő változót is képesek kezelni | ||
+ | **akár több száz, egymással is összefüggő magyarázó változót tud hatékonyan használni | ||
+ | ** ''Felépítése'': | ||
+ | - bemeneti réteg | ||
+ | - rejtett réteg | ||
+ | - kimeneti réteg | ||
+ | Túltanulás elkerülésére két részre osztjuk: 1. tanuló 2. teszt adatbázis | ||
+ | ''K-szomszédsági eljárások'': az egyedeket a független változók terében helyezzük el. Hátrány:jelentős futásidő | ||
+ | ''Regressziós eljárás'': | ||
+ | Lineáris, és logisztikus regresszió ( ez a leggyakoribb) | ||
+ | |||
==Vékony Viola== | ==Vékony Viola== | ||
A lap 2007. október 26., 13:17-kori változata
Tartalomjegyzék
2007.10.26. - Adatbányászati blokk
Brechler Zsolt
Döntési fákkal fogunk foglalkozni. Weka tudományos szempontból érdekes,többet tud mint egy SPSS.
- Adatbányászat/tudáskinyerés: implicit módon tudnak előállni.
ADöntési fákkal fogunk foglalkozni.
- tranzakciós adatbázisrendszer,vezetői információs rendszer,adattárház,adatpiac
Tuzes Gyorgy
adatbanyaszati modelleket leginkabb banki kornyezetekbe hasznaljak
fobb hasznalati teruletek
-lemorzsolodas vizsgalat -ugyfelszegmentacio -kockazatelemzes
Alkalmazza a mesterseges intellignciat.
Kurucz Eszter
Adatbányászat feladata:
- Leíró adatbányászat:egy adathalmaz tulajdonságainak tömör feltárása.
- prediktív adatbányászat:Jövőben viselkedés előrejelzése.
A prediktív adatbányászathoz tartozik az osztályozás, melynek módszerei közé tartozik :
- Döntési fák
- Logisztikus regresszió
- Mesterséges neurális hálózatok
Döntési fák:
- Egyszerű,könnyen értelmezhető módon ábrázolják azt a szabályrendszert, mellyel az objektumokat rendezzük.
- Ha..,akkor... típusú szabályokkal is megfogalmazhatjuk.
- A fa építésnél meg kell határozni, hogy melyik résznél történjen a vágás.
Entropia:alkalmas a rendezettség mérésére.
Mesterséges neurális hálózatok:
- kategóri és folytonos függő változót is képesek kezelni
- felépítése:
- Bemeneti réteg
- Rejtett réteg
- Kimeneti réteg
Bicók Csongor
Horváth Henrietta
Gáncs Júlia
Bogyay Gábor
Döntési fákkal fogunk foglalkozni. WEKA tudományos szempontból érdekes,többet tud mint egy SPSS.
- Adatbányászat/tudáskinyerés: implicit módon tudnak előállni.
Adatok:
- tranzakciós adatbázisrendszer,vezetői információs rendszer,adattárház,adatpiac
Adatpiacok:
- egy adott üzleti terület vagy üzleti megoldás adatkörét tartalmazzák.Egyszerűsítik az adateltérést alkalmazásokon keresztül.Gyors adatelérést bíztosítanak.
- banki környezetben: CRM (kampánymenedzsment,ügyfélszegmentáció,válaszadási modellek,lemorzsolódás vizsgálat,ügyfél jövedelmezőség,ügyfélérték) és kockázatelemzés (hitelpontozó kártyák,csalásferdítés,behajtás,basel II).
Adatbányászat által használt területek: Nagyon sokat használ. Leginkább statisztikát.
Adatbányászat lépései:
- 1.adattisztítás: zajok és ikon zisztens adatok eltávolítása
- 2.adatintegráció: különböző forrásrendszerek adatainak egyesítése
- 3.adatkiválasztás. mely adatok relevánsak az adott, modellezendő probléma tekintetében
- 4.adattranszformáció: modellezéshez szükséges formátumú, aggregáltságú afatkör kialakítása
- 5.adatbányászat: adatbányászati technikák alkalmazása a tudás kinyerése érdekében
- 6.kiértékelés: a valóban értékes információk kiválasztása, értékelése
- 7.tudás megjelenítés: a kinyert információk ábrázolása a végfelhasználók, döntéshozók számára feldolgozható formában,az eredmények áramoltatása a szervezet folyamataiban.
Adatbányászat feladata:
* Leíró adatbányászat:egy adathalmaz tulajdonságainak tömör feltárása. * Prediktív adatbányászat:Jövőben viselkedés előrejelzése.
A prediktív adatbányászathoz tartozik az osztályozás, melynek módszerei közé tartozik :
* Döntési fák * Logisztikus regresszió * Mesterséges neurális hálózatok
Predíktiv adatbányászat-Osztályozás:
- Döntési fák:Egyszerű és könnyen értelmezhető módon ábrázoljűk azt a szabályrendszert ábrázolják mellyel az objektumokat osztályokba rendezzük.
Azt kell tudni megválaszolni,melyik attributúm, és annak mely értékeinél történjen a vágás.
- ID3:
-adott cél attributum érték párosa, -entrópia minimalizálása. minnél kisebb a véletlenszerűség a csoportosításban
- CART( Classification and Regression Trees )
- CHAID( Chi-squared Automatic Interaction Delecation)
Entrópia egyenlet: minusz szummapi -t szorzom logpivel
- Mesterséges neurális hálózatok:
- kategória és folytonos függő változót is képesek kezelni
- akár több száz, egymással is összefüggő magyarázó változót tud hatékonyan használni
- Felépítése:
- bemeneti réteg - rejtett réteg - kimeneti réteg
Túltanulás elkerülésére két részre osztjuk: 1. tanuló 2. teszt adatbázis K-szomszédsági eljárások: az egyedeket a független változók terében helyezzük el. Hátrány:jelentős futásidő Regressziós eljárás: Lineáris, és logisztikus regresszió ( ez a leggyakoribb)
Vékony Viola
Adatbányászat feladata:
- Leíró adatbányászat
- prediktív adatbányászat
ID3 adott célattribútum-érték páros (kiszámolja az entropiát=rendezettlenség) Entrópiai minimalizálás - minél kisebb a véletlenszerűsége a csoportosításában
neurális hálozatok felépítése: Bemeneti réteg (Független változó) Rejtett réteg Kimeneti réteg (függő változó)
Pauleczki Mihály
Sápi András
Döntéshozó,weka,spss.Az adatbányászat tudáskinyerés.Forrás rendszerek v. tranzakciós rendszrek.Adattárház:elemzői szempontból releváns adatokat tartalmaz,innen nyerjük ki a rengeteg adatból ami majd kell az adatpiacnak.Adatbányászat által használt területek: statisztika, mesterséges intelligencia. Adatbányászat lépései: adattisztítás,adatkiválasztás,adattranszformáció,adatbányászat,kiértékelés.Leíró adatbányászat: tulajdonságainak tömör, összefoglaló jellegű feltárása.Adatok megjelenítése, összesítések prediktív adatbányászat (osztályozó eljárás) módszerek: döntési fák,logisztikus regressziómmesterséges neurális hálózatok Döntési fák:egyszerű, könnyen értelmezhető. Ha.., akkor.. típusú szabályokkal megfogalmazható ID3 algoritmus: attribútum-érték párosra kiszámolja az entrópiát(rendezettség mérésére).
Putnoki Gyula
Palatinus Miklós
Döntési fa weka-val, vagy spss-el. adatbányászat: nagy adathalmazból információt nyerjünk ki. adattárház: elemzői szempontból releváns adatokat tartalmaz.(döntéstámogató) adatpiac: egy-egy csoportnak releváns adatokat jelenít meg.(ebből dolgozik)
- általános jellemzői: Egy adott üzleti terület vagy üzleti megoldás adatkörét tartlamazzák, gyors adatelérést biztosítanak.
Adatpiac használatai:
- CRM (ügyfélkapcsolatok): Kampánymenedzsment, ügyfélszegmentáció, válaszadási modellek, ügyfélérték
- Kockázatelemzés: csalásfelderítés, behajtás, hitelpontozó kártyák, Basel II modell
Adatbányászat által használt területek: statisztika, mesterséges intelligencia, adatbányászat lépései:
- adattisztítás (inkonzisztens adatok eltávolítása)
- hiányzó értékek problémályának megoldása
- adatkiválasztás (mely adatok relevánsak az adott, modellezendő probéma tekintetében)
- adattranszformáció (modellezéshez szükséges formátumú, aggregáltságú adatkör kialakítása
- adatbányászat
- kiértékelés (a valóban értékes információk kiválasztása
- tudásmegjelenítés
leíró adatbányászat: tulajdonságainak tömör, összefoglaló jellegű feltárása.
- adatok megjelenítése, összesítések
prediktív adatbányászat (osztályozó eljárás) módszerek:
- döntési fák
- logisztikus regresszió
- mesterséges neurális hálózatok
Döntési fák:
egyszerű, könnyen értelmezhető. Ha.., akkor.. típusú szabályokkal megfogalmazható ID3 algoritmus: attribútum-érték párosra kiszámolja az entrópiát(rendezettség mérésére).
Neurális hálózatok
- kategória és folytonos függő változót is képesek kezelni
- akár több száz, egymással is összefüggő megyarázó változót tud hatékonyan használni
- felépítése:
- bemeneti réteg(független változók)
- rejtett réteg
- kimeneti réteg(függő változók)