„DM-blokk” változatai közötti eltérés

A Miau Wiki wikiből
(Bogyay Gábor)
 
(Egy közbenső módosítás ugyanattól a szerkesztőtől nincs mutatva)
171. sor: 171. sor:
 
==xy==
 
==xy==
 
==zq==
 
==zq==
 +
[[Kategória:Egyéb_feladatok]]

A lap jelenlegi, 2008. január 30., 12:44-kori változata

2007.10.26. - Adatbányászati blokk

Brechler Zsolt

Döntési fákkal fogunk foglalkozni. Weka tudományos szempontból érdekes,többet tud mint egy SPSS.

  • Adatbányászat/tudáskinyerés: implicit módon tudnak előállni.

ADöntési fákkal fogunk foglalkozni.

  • tranzakciós adatbázisrendszer,vezetői információs rendszer,adattárház,adatpiac

Tuzes Gyorgy

adatbanyaszati modelleket leginkabb banki kornyezetekbe hasznaljak

fobb hasznalati teruletek

-lemorzsolodas vizsgalat -ugyfelszegmentacio -kockazatelemzes

Alkalmazza a mesterseges intellignciat.

Kurucz Eszter

Adatbányászat feladata:

  • Leíró adatbányászat:egy adathalmaz tulajdonságainak tömör feltárása.
  • prediktív adatbányászat:Jövőben viselkedés előrejelzése.

A prediktív adatbányászathoz tartozik az osztályozás, melynek módszerei közé tartozik :

  • Döntési fák
  • Logisztikus regresszió
  • Mesterséges neurális hálózatok

Döntési fák:

  • Egyszerű,könnyen értelmezhető módon ábrázolják azt a szabályrendszert, mellyel az objektumokat rendezzük.
  • Ha..,akkor... típusú szabályokkal is megfogalmazhatjuk.
  • A fa építésnél meg kell határozni, hogy melyik résznél történjen a vágás.

Entropia:alkalmas a rendezettség mérésére.

Mesterséges neurális hálózatok:

  • kategóri és folytonos függő változót is képesek kezelni
  • felépítése:
    • Bemeneti réteg
    • Rejtett réteg
    • Kimeneti réteg

Bicók Csongor

Horváth Henrietta

Gáncs Júlia

Bogyay Gábor

Döntési fákkal fogunk foglalkozni. WEKA tudományos szempontból érdekes,többet tud mint egy SPSS.

  • Adatbányászat/tudáskinyerés: implicit módon tudnak előállni.

Adatok:

  • tranzakciós adatbázisrendszer,vezetői információs rendszer,adattárház,adatpiac

Adatpiacok:

  • egy adott üzleti terület vagy üzleti megoldás adatkörét tartalmazzák.Egyszerűsítik az adateltérést alkalmazásokon keresztül.Gyors adatelérést bíztosítanak.
  • banki környezetben: CRM (kampánymenedzsment,ügyfélszegmentáció,válaszadási modellek,lemorzsolódás vizsgálat,ügyfél jövedelmezőség,ügyfélérték) és kockázatelemzés (hitelpontozó kártyák,csalásferdítés,behajtás,basel II).

Adatbányászat által használt területek: Nagyon sokat használ. Leginkább statisztikát.

Adatbányászat lépései:

  • 1.adattisztítás: zajok és ikon zisztens adatok eltávolítása
  • 2.adatintegráció: különböző forrásrendszerek adatainak egyesítése
  • 3.adatkiválasztás. mely adatok relevánsak az adott, modellezendő probléma tekintetében
  • 4.adattranszformáció: modellezéshez szükséges formátumú, aggregáltságú afatkör kialakítása
  • 5.adatbányászat: adatbányászati technikák alkalmazása a tudás kinyerése érdekében
  • 6.kiértékelés: a valóban értékes információk kiválasztása, értékelése
  • 7.tudás megjelenítés: a kinyert információk ábrázolása a végfelhasználók, döntéshozók számára feldolgozható formában,az eredmények áramoltatása a szervezet folyamataiban.

Adatbányászat feladata:

   * Leíró adatbányászat:egy adathalmaz tulajdonságainak tömör feltárása.
   * Prediktív adatbányászat:Jövőben viselkedés előrejelzése. 

A prediktív adatbányászathoz tartozik az osztályozás, melynek módszerei közé tartozik :

   * Döntési fák
   * Logisztikus regresszió
   * Mesterséges neurális hálózatok 

Predíktiv adatbányászat-Osztályozás:

  • Döntési fák:Egyszerű és könnyen értelmezhető módon ábrázoljűk azt a szabályrendszert ábrázolják mellyel az objektumokat osztályokba rendezzük.

Azt kell tudni megválaszolni,melyik attributúm, és annak mely értékeinél történjen a vágás.

  • ID3:
     -adott cél attributum érték párosa,
     -entrópia minimalizálása. minnél kisebb a véletlenszerűség a csoportosításban
  • CART( Classification and Regression Trees )
  • CHAID( Chi-squared Automatic Interaction Delecation)

Entrópia egyenlet: minusz szummapi -t szorzom logpivel

  • Mesterséges neurális hálózatok:
    • kategória és folytonos függő változót is képesek kezelni
    • akár több száz, egymással is összefüggő magyarázó változót tud hatékonyan használni
    • Felépítése:
    - bemeneti réteg
    - rejtett réteg
    - kimeneti réteg

Túltanulás elkerülésére két részre osztjuk: 1. tanuló 2. teszt adatbázis K-szomszédsági eljárások: az egyedeket a független változók terében helyezzük el. Hátrány:jelentős futásidő Regressziós eljárás: Lineáris, és logisztikus regresszió ( ez a leggyakoribb)

Vékony Viola

Adatbányászat feladata:

  • Leíró adatbányászat
  • prediktív adatbányászat

ID3 adott célattribútum-érték páros (kiszámolja az entropiát=rendezettlenség) Entrópiai minimalizálás - minél kisebb a véletlenszerűsége a csoportosításában

neurális hálozatok felépítése: Bemeneti réteg (Független változó) Rejtett réteg Kimeneti réteg (függő változó)

Pauleczki Mihály

Sápi András

Döntéshozó,weka,spss.Az adatbányászat tudáskinyerés.Forrás rendszerek v. tranzakciós rendszrek.Adattárház:elemzői szempontból releváns adatokat tartalmaz,innen nyerjük ki a rengeteg adatból ami majd kell az adatpiacnak.Adatbányászat által használt területek: statisztika, mesterséges intelligencia. Adatbányászat lépései: adattisztítás,adatkiválasztás,adattranszformáció,adatbányászat,kiértékelés.Leíró adatbányászat: tulajdonságainak tömör, összefoglaló jellegű feltárása.Adatok megjelenítése, összesítések prediktív adatbányászat (osztályozó eljárás) módszerek: döntési fák,logisztikus regressziómmesterséges neurális hálózatok Döntési fák:egyszerű, könnyen értelmezhető. Ha.., akkor.. típusú szabályokkal megfogalmazható ID3 algoritmus: attribútum-érték párosra kiszámolja az entrópiát(rendezettség mérésére).

Putnoki Gyula

Palatinus Miklós

Döntési fa weka-val, vagy spss-el. adatbányászat: nagy adathalmazból információt nyerjünk ki. adattárház: elemzői szempontból releváns adatokat tartalmaz.(döntéstámogató) adatpiac: egy-egy csoportnak releváns adatokat jelenít meg.(ebből dolgozik)

  • általános jellemzői: Egy adott üzleti terület vagy üzleti megoldás adatkörét tartlamazzák, gyors adatelérést biztosítanak.

Adatpiac használatai:

  • CRM (ügyfélkapcsolatok): Kampánymenedzsment, ügyfélszegmentáció, válaszadási modellek, ügyfélérték
  • Kockázatelemzés: csalásfelderítés, behajtás, hitelpontozó kártyák, Basel II modell

Adatbányászat által használt területek: statisztika, mesterséges intelligencia, adatbányászat lépései:

  • adattisztítás (inkonzisztens adatok eltávolítása)
  • hiányzó értékek problémályának megoldása
  • adatkiválasztás (mely adatok relevánsak az adott, modellezendő probéma tekintetében)
  • adattranszformáció (modellezéshez szükséges formátumú, aggregáltságú adatkör kialakítása
  • adatbányászat
  • kiértékelés (a valóban értékes információk kiválasztása
  • tudásmegjelenítés

leíró adatbányászat: tulajdonságainak tömör, összefoglaló jellegű feltárása.

  • adatok megjelenítése, összesítések

prediktív adatbányászat (osztályozó eljárás) módszerek:

  • döntési fák
  • logisztikus regresszió
  • mesterséges neurális hálózatok

Döntési fák:

egyszerű, könnyen értelmezhető. Ha.., akkor.. típusú szabályokkal megfogalmazható ID3 algoritmus: attribútum-érték párosra kiszámolja az entrópiát(rendezettség mérésére).

Neurális hálózatok

  • kategória és folytonos függő változót is képesek kezelni
  • akár több száz, egymással is összefüggő megyarázó változót tud hatékonyan használni
  • felépítése:
    • bemeneti réteg(független változók)
    • rejtett réteg
    • kimeneti réteg(függő változók)

2007.11.09. - Adatbányászati blokk

xy

zq

2007.11.30. - Adatbányászati blokk

xy

zq