„DM-blokk” változatai közötti eltérés
(16 közbenső módosítás, amit 9 másik szerkesztő végzett, nincs mutatva) | |||
1. sor: | 1. sor: | ||
=2007.10.26. - Adatbányászati blokk= | =2007.10.26. - Adatbányászati blokk= | ||
==Brechler Zsolt== | ==Brechler Zsolt== | ||
+ | Döntési fákkal fogunk foglalkozni. | ||
+ | Weka tudományos szempontból érdekes,többet tud mint egy SPSS. | ||
+ | *Adatbányászat/tudáskinyerés: implicit módon tudnak előállni. | ||
+ | ADöntési fákkal fogunk foglalkozni. | ||
+ | *tranzakciós adatbázisrendszer,vezetői információs rendszer,adattárház,adatpiac | ||
+ | |||
+ | ==Tuzes Gyorgy== | ||
+ | |||
+ | adatbanyaszati modelleket leginkabb banki kornyezetekbe hasznaljak | ||
+ | |||
+ | fobb hasznalati teruletek | ||
+ | |||
+ | -lemorzsolodas vizsgalat | ||
+ | -ugyfelszegmentacio | ||
+ | -kockazatelemzes | ||
+ | |||
+ | Alkalmazza a mesterseges intellignciat. | ||
+ | |||
==Kurucz Eszter== | ==Kurucz Eszter== | ||
+ | '''Adatbányászat feladata:''' | ||
+ | *Leíró adatbányászat:egy adathalmaz tulajdonságainak tömör feltárása. | ||
+ | *prediktív adatbányászat:Jövőben viselkedés előrejelzése. | ||
+ | A prediktív adatbányászathoz tartozik az osztályozás, melynek módszerei közé tartozik : | ||
+ | *Döntési fák | ||
+ | *Logisztikus regresszió | ||
+ | *Mesterséges neurális hálózatok | ||
+ | |||
+ | '''Döntési fák:''' | ||
+ | *Egyszerű,könnyen értelmezhető módon ábrázolják azt a szabályrendszert, mellyel az objektumokat rendezzük. | ||
+ | *Ha..,akkor... típusú szabályokkal is megfogalmazhatjuk. | ||
+ | *A fa építésnél meg kell határozni, hogy melyik résznél történjen a vágás. | ||
+ | Entropia:alkalmas a rendezettség mérésére. | ||
+ | |||
+ | '''Mesterséges neurális hálózatok:''' | ||
+ | *kategóri és folytonos függő változót is képesek kezelni | ||
+ | *felépítése: | ||
+ | **Bemeneti réteg | ||
+ | **Rejtett réteg | ||
+ | **Kimeneti réteg | ||
+ | |||
==Bicók Csongor== | ==Bicók Csongor== | ||
==Horváth Henrietta== | ==Horváth Henrietta== | ||
+ | ==Gáncs Júlia== | ||
==Bogyay Gábor== | ==Bogyay Gábor== | ||
+ | |||
+ | Döntési fákkal fogunk foglalkozni. | ||
+ | WEKA tudományos szempontból érdekes,többet tud mint egy SPSS. | ||
+ | *Adatbányászat/tudáskinyerés: implicit módon tudnak előállni. | ||
+ | '''Adatok:''' | ||
+ | *tranzakciós adatbázisrendszer,vezetői információs rendszer,adattárház,adatpiac | ||
+ | '''Adatpiacok''': | ||
+ | *egy adott üzleti terület vagy üzleti megoldás adatkörét tartalmazzák.Egyszerűsítik az adateltérést alkalmazásokon keresztül.Gyors adatelérést bíztosítanak. | ||
+ | *banki környezetben: CRM (kampánymenedzsment,ügyfélszegmentáció,válaszadási modellek,lemorzsolódás vizsgálat,ügyfél jövedelmezőség,ügyfélérték) és kockázatelemzés (hitelpontozó kártyák,csalásferdítés,behajtás,basel II). | ||
+ | '''Adatbányászat által használt területek''': Nagyon sokat használ. Leginkább statisztikát. | ||
+ | |||
+ | '''Adatbányászat lépései:''' | ||
+ | *1.adattisztítás: zajok és ikon zisztens adatok eltávolítása | ||
+ | *2.adatintegráció: különböző forrásrendszerek adatainak egyesítése | ||
+ | *3.adatkiválasztás. mely adatok relevánsak az adott, modellezendő probléma tekintetében | ||
+ | *4.adattranszformáció: modellezéshez szükséges formátumú, aggregáltságú afatkör kialakítása | ||
+ | *5.adatbányászat: adatbányászati technikák alkalmazása a tudás kinyerése érdekében | ||
+ | *6.kiértékelés: a valóban értékes információk kiválasztása, értékelése | ||
+ | *7.tudás megjelenítés: a kinyert információk ábrázolása a végfelhasználók, döntéshozók számára feldolgozható formában,az eredmények áramoltatása a szervezet folyamataiban. | ||
+ | '''Adatbányászat feladata''': | ||
+ | |||
+ | * Leíró adatbányászat:egy adathalmaz tulajdonságainak tömör feltárása. | ||
+ | * Prediktív adatbányászat:Jövőben viselkedés előrejelzése. | ||
+ | |||
+ | A prediktív adatbányászathoz tartozik az osztályozás, melynek módszerei közé tartozik : | ||
+ | |||
+ | * Döntési fák | ||
+ | * Logisztikus regresszió | ||
+ | * Mesterséges neurális hálózatok | ||
+ | |||
+ | '''Predíktiv adatbányászat-Osztályozás:''' | ||
+ | *''Döntési fák'':Egyszerű és könnyen értelmezhető módon ábrázoljűk azt a szabályrendszert ábrázolják mellyel az objektumokat osztályokba rendezzük. | ||
+ | Azt kell tudni megválaszolni,melyik attributúm, és annak mely értékeinél történjen a vágás. | ||
+ | *ID3: | ||
+ | -adott cél attributum érték párosa, | ||
+ | -entrópia minimalizálása. minnél kisebb a véletlenszerűség a csoportosításban | ||
+ | *CART( Classification and Regression Trees ) | ||
+ | *CHAID( Chi-squared Automatic Interaction Delecation) | ||
+ | ''' ''Entrópia egyenlet: minusz szummapi -t szorzom logpivel''''' | ||
+ | |||
+ | *'''Mesterséges neurális hálózatok:''' | ||
+ | **kategória és folytonos függő változót is képesek kezelni | ||
+ | **akár több száz, egymással is összefüggő magyarázó változót tud hatékonyan használni | ||
+ | ** ''Felépítése'': | ||
+ | - bemeneti réteg | ||
+ | - rejtett réteg | ||
+ | - kimeneti réteg | ||
+ | Túltanulás elkerülésére két részre osztjuk: 1. tanuló 2. teszt adatbázis | ||
+ | ''K-szomszédsági eljárások'': az egyedeket a független változók terében helyezzük el. Hátrány:jelentős futásidő | ||
+ | ''Regressziós eljárás'': | ||
+ | Lineáris, és logisztikus regresszió ( ez a leggyakoribb) | ||
+ | |||
==Vékony Viola== | ==Vékony Viola== | ||
+ | |||
+ | Adatbányászat feladata: | ||
+ | *Leíró adatbányászat | ||
+ | *prediktív adatbányászat | ||
+ | |||
+ | ID3 | ||
+ | adott célattribútum-érték páros (kiszámolja az entropiát=rendezettlenség) | ||
+ | Entrópiai minimalizálás - minél kisebb a véletlenszerűsége a csoportosításában | ||
+ | |||
+ | neurális hálozatok felépítése: | ||
+ | Bemeneti réteg (Független változó) | ||
+ | Rejtett réteg | ||
+ | Kimeneti réteg (függő változó) | ||
+ | |||
==Pauleczki Mihály== | ==Pauleczki Mihály== | ||
==Sápi András== | ==Sápi András== | ||
+ | Döntéshozó,weka,spss.Az adatbányászat tudáskinyerés.Forrás rendszerek v. tranzakciós rendszrek.Adattárház:elemzői szempontból releváns adatokat tartalmaz,innen nyerjük ki a rengeteg adatból ami majd kell az adatpiacnak.Adatbányászat által használt területek: statisztika, mesterséges intelligencia. Adatbányászat lépései: adattisztítás,adatkiválasztás,adattranszformáció,adatbányászat,kiértékelés.Leíró adatbányászat: tulajdonságainak tömör, összefoglaló jellegű feltárása.Adatok megjelenítése, összesítések | ||
+ | prediktív adatbányászat (osztályozó eljárás) módszerek: döntési fák,logisztikus regressziómmesterséges neurális hálózatok | ||
+ | Döntési fák:egyszerű, könnyen értelmezhető. Ha.., akkor.. típusú szabályokkal megfogalmazható ID3 algoritmus: attribútum-érték párosra kiszámolja az entrópiát(rendezettség mérésére). | ||
==Putnoki Gyula== | ==Putnoki Gyula== | ||
+ | |||
+ | ==Palatinus Miklós== | ||
+ | |||
+ | Döntési fa weka-val, vagy spss-el. | ||
+ | adatbányászat: nagy adathalmazból információt nyerjünk ki. | ||
+ | adattárház: elemzői szempontból releváns adatokat tartalmaz.(döntéstámogató) | ||
+ | adatpiac: egy-egy csoportnak releváns adatokat jelenít meg.(ebből dolgozik) | ||
+ | *általános jellemzői: Egy adott üzleti terület vagy üzleti megoldás adatkörét tartlamazzák, gyors adatelérést biztosítanak. | ||
+ | '''Adatpiac használatai:''' | ||
+ | *CRM (ügyfélkapcsolatok): Kampánymenedzsment, ügyfélszegmentáció, válaszadási modellek, ügyfélérték | ||
+ | *Kockázatelemzés: csalásfelderítés, behajtás, hitelpontozó kártyák, Basel II modell | ||
+ | Adatbányászat által használt területek: statisztika, mesterséges intelligencia, | ||
+ | '''adatbányászat lépései:''' | ||
+ | *adattisztítás (inkonzisztens adatok eltávolítása) | ||
+ | *hiányzó értékek problémályának megoldása | ||
+ | *adatkiválasztás (mely adatok relevánsak az adott, modellezendő probéma tekintetében) | ||
+ | *adattranszformáció (modellezéshez szükséges formátumú, aggregáltságú adatkör kialakítása | ||
+ | *adatbányászat | ||
+ | *kiértékelés (a valóban értékes információk kiválasztása | ||
+ | *tudásmegjelenítés | ||
+ | |||
+ | leíró adatbányászat: | ||
+ | tulajdonságainak tömör, összefoglaló jellegű feltárása. | ||
+ | *adatok megjelenítése, összesítések | ||
+ | |||
+ | prediktív adatbányászat (osztályozó eljárás) | ||
+ | módszerek: | ||
+ | *döntési fák | ||
+ | *logisztikus regresszió | ||
+ | *mesterséges neurális hálózatok | ||
+ | |||
+ | '''Döntési fák:''' | ||
+ | |||
+ | egyszerű, könnyen értelmezhető. Ha.., akkor.. típusú szabályokkal megfogalmazható | ||
+ | ID3 algoritmus: attribútum-érték párosra kiszámolja az entrópiát(rendezettség mérésére). | ||
+ | |||
+ | '''Neurális hálózatok''' | ||
+ | |||
+ | *kategória és folytonos függő változót is képesek kezelni | ||
+ | *akár több száz, egymással is összefüggő megyarázó változót tud hatékonyan használni | ||
+ | *felépítése: | ||
+ | **bemeneti réteg(független változók) | ||
+ | **rejtett réteg | ||
+ | **kimeneti réteg(függő változók) | ||
+ | |||
=2007.11.09. - Adatbányászati blokk= | =2007.11.09. - Adatbányászati blokk= | ||
==xy== | ==xy== | ||
17. sor: | 171. sor: | ||
==xy== | ==xy== | ||
==zq== | ==zq== | ||
+ | [[Kategória:Egyéb_feladatok]] |
A lap jelenlegi, 2008. január 30., 12:44-kori változata
Tartalomjegyzék
2007.10.26. - Adatbányászati blokk
Brechler Zsolt
Döntési fákkal fogunk foglalkozni. Weka tudományos szempontból érdekes,többet tud mint egy SPSS.
- Adatbányászat/tudáskinyerés: implicit módon tudnak előállni.
ADöntési fákkal fogunk foglalkozni.
- tranzakciós adatbázisrendszer,vezetői információs rendszer,adattárház,adatpiac
Tuzes Gyorgy
adatbanyaszati modelleket leginkabb banki kornyezetekbe hasznaljak
fobb hasznalati teruletek
-lemorzsolodas vizsgalat -ugyfelszegmentacio -kockazatelemzes
Alkalmazza a mesterseges intellignciat.
Kurucz Eszter
Adatbányászat feladata:
- Leíró adatbányászat:egy adathalmaz tulajdonságainak tömör feltárása.
- prediktív adatbányászat:Jövőben viselkedés előrejelzése.
A prediktív adatbányászathoz tartozik az osztályozás, melynek módszerei közé tartozik :
- Döntési fák
- Logisztikus regresszió
- Mesterséges neurális hálózatok
Döntési fák:
- Egyszerű,könnyen értelmezhető módon ábrázolják azt a szabályrendszert, mellyel az objektumokat rendezzük.
- Ha..,akkor... típusú szabályokkal is megfogalmazhatjuk.
- A fa építésnél meg kell határozni, hogy melyik résznél történjen a vágás.
Entropia:alkalmas a rendezettség mérésére.
Mesterséges neurális hálózatok:
- kategóri és folytonos függő változót is képesek kezelni
- felépítése:
- Bemeneti réteg
- Rejtett réteg
- Kimeneti réteg
Bicók Csongor
Horváth Henrietta
Gáncs Júlia
Bogyay Gábor
Döntési fákkal fogunk foglalkozni. WEKA tudományos szempontból érdekes,többet tud mint egy SPSS.
- Adatbányászat/tudáskinyerés: implicit módon tudnak előállni.
Adatok:
- tranzakciós adatbázisrendszer,vezetői információs rendszer,adattárház,adatpiac
Adatpiacok:
- egy adott üzleti terület vagy üzleti megoldás adatkörét tartalmazzák.Egyszerűsítik az adateltérést alkalmazásokon keresztül.Gyors adatelérést bíztosítanak.
- banki környezetben: CRM (kampánymenedzsment,ügyfélszegmentáció,válaszadási modellek,lemorzsolódás vizsgálat,ügyfél jövedelmezőség,ügyfélérték) és kockázatelemzés (hitelpontozó kártyák,csalásferdítés,behajtás,basel II).
Adatbányászat által használt területek: Nagyon sokat használ. Leginkább statisztikát.
Adatbányászat lépései:
- 1.adattisztítás: zajok és ikon zisztens adatok eltávolítása
- 2.adatintegráció: különböző forrásrendszerek adatainak egyesítése
- 3.adatkiválasztás. mely adatok relevánsak az adott, modellezendő probléma tekintetében
- 4.adattranszformáció: modellezéshez szükséges formátumú, aggregáltságú afatkör kialakítása
- 5.adatbányászat: adatbányászati technikák alkalmazása a tudás kinyerése érdekében
- 6.kiértékelés: a valóban értékes információk kiválasztása, értékelése
- 7.tudás megjelenítés: a kinyert információk ábrázolása a végfelhasználók, döntéshozók számára feldolgozható formában,az eredmények áramoltatása a szervezet folyamataiban.
Adatbányászat feladata:
* Leíró adatbányászat:egy adathalmaz tulajdonságainak tömör feltárása. * Prediktív adatbányászat:Jövőben viselkedés előrejelzése.
A prediktív adatbányászathoz tartozik az osztályozás, melynek módszerei közé tartozik :
* Döntési fák * Logisztikus regresszió * Mesterséges neurális hálózatok
Predíktiv adatbányászat-Osztályozás:
- Döntési fák:Egyszerű és könnyen értelmezhető módon ábrázoljűk azt a szabályrendszert ábrázolják mellyel az objektumokat osztályokba rendezzük.
Azt kell tudni megválaszolni,melyik attributúm, és annak mely értékeinél történjen a vágás.
- ID3:
-adott cél attributum érték párosa, -entrópia minimalizálása. minnél kisebb a véletlenszerűség a csoportosításban
- CART( Classification and Regression Trees )
- CHAID( Chi-squared Automatic Interaction Delecation)
Entrópia egyenlet: minusz szummapi -t szorzom logpivel
- Mesterséges neurális hálózatok:
- kategória és folytonos függő változót is képesek kezelni
- akár több száz, egymással is összefüggő magyarázó változót tud hatékonyan használni
- Felépítése:
- bemeneti réteg - rejtett réteg - kimeneti réteg
Túltanulás elkerülésére két részre osztjuk: 1. tanuló 2. teszt adatbázis K-szomszédsági eljárások: az egyedeket a független változók terében helyezzük el. Hátrány:jelentős futásidő Regressziós eljárás: Lineáris, és logisztikus regresszió ( ez a leggyakoribb)
Vékony Viola
Adatbányászat feladata:
- Leíró adatbányászat
- prediktív adatbányászat
ID3 adott célattribútum-érték páros (kiszámolja az entropiát=rendezettlenség) Entrópiai minimalizálás - minél kisebb a véletlenszerűsége a csoportosításában
neurális hálozatok felépítése: Bemeneti réteg (Független változó) Rejtett réteg Kimeneti réteg (függő változó)
Pauleczki Mihály
Sápi András
Döntéshozó,weka,spss.Az adatbányászat tudáskinyerés.Forrás rendszerek v. tranzakciós rendszrek.Adattárház:elemzői szempontból releváns adatokat tartalmaz,innen nyerjük ki a rengeteg adatból ami majd kell az adatpiacnak.Adatbányászat által használt területek: statisztika, mesterséges intelligencia. Adatbányászat lépései: adattisztítás,adatkiválasztás,adattranszformáció,adatbányászat,kiértékelés.Leíró adatbányászat: tulajdonságainak tömör, összefoglaló jellegű feltárása.Adatok megjelenítése, összesítések prediktív adatbányászat (osztályozó eljárás) módszerek: döntési fák,logisztikus regressziómmesterséges neurális hálózatok Döntési fák:egyszerű, könnyen értelmezhető. Ha.., akkor.. típusú szabályokkal megfogalmazható ID3 algoritmus: attribútum-érték párosra kiszámolja az entrópiát(rendezettség mérésére).
Putnoki Gyula
Palatinus Miklós
Döntési fa weka-val, vagy spss-el. adatbányászat: nagy adathalmazból információt nyerjünk ki. adattárház: elemzői szempontból releváns adatokat tartalmaz.(döntéstámogató) adatpiac: egy-egy csoportnak releváns adatokat jelenít meg.(ebből dolgozik)
- általános jellemzői: Egy adott üzleti terület vagy üzleti megoldás adatkörét tartlamazzák, gyors adatelérést biztosítanak.
Adatpiac használatai:
- CRM (ügyfélkapcsolatok): Kampánymenedzsment, ügyfélszegmentáció, válaszadási modellek, ügyfélérték
- Kockázatelemzés: csalásfelderítés, behajtás, hitelpontozó kártyák, Basel II modell
Adatbányászat által használt területek: statisztika, mesterséges intelligencia, adatbányászat lépései:
- adattisztítás (inkonzisztens adatok eltávolítása)
- hiányzó értékek problémályának megoldása
- adatkiválasztás (mely adatok relevánsak az adott, modellezendő probéma tekintetében)
- adattranszformáció (modellezéshez szükséges formátumú, aggregáltságú adatkör kialakítása
- adatbányászat
- kiértékelés (a valóban értékes információk kiválasztása
- tudásmegjelenítés
leíró adatbányászat: tulajdonságainak tömör, összefoglaló jellegű feltárása.
- adatok megjelenítése, összesítések
prediktív adatbányászat (osztályozó eljárás) módszerek:
- döntési fák
- logisztikus regresszió
- mesterséges neurális hálózatok
Döntési fák:
egyszerű, könnyen értelmezhető. Ha.., akkor.. típusú szabályokkal megfogalmazható ID3 algoritmus: attribútum-érték párosra kiszámolja az entrópiát(rendezettség mérésére).
Neurális hálózatok
- kategória és folytonos függő változót is képesek kezelni
- akár több száz, egymással is összefüggő megyarázó változót tud hatékonyan használni
- felépítése:
- bemeneti réteg(független változók)
- rejtett réteg
- kimeneti réteg(függő változók)