„DM-blokk” változatai közötti eltérés

A Miau Wiki wikiből
(2007.10.26. - Adatbányászati blokk)
 
(19 közbenső módosítás, amit 10 másik szerkesztő végzett, nincs mutatva)
1. sor: 1. sor:
 
=2007.10.26. - Adatbányászati blokk=
 
=2007.10.26. - Adatbányászati blokk=
 
==Brechler Zsolt==
 
==Brechler Zsolt==
 +
Döntési fákkal fogunk foglalkozni.
 +
Weka tudományos szempontból érdekes,többet tud mint egy SPSS.
 +
*Adatbányászat/tudáskinyerés: implicit módon tudnak előállni.
 +
ADöntési fákkal fogunk foglalkozni.
 +
*tranzakciós adatbázisrendszer,vezetői információs  rendszer,adattárház,adatpiac
 +
 +
==Tuzes Gyorgy==
 +
 +
adatbanyaszati modelleket leginkabb banki kornyezetekbe hasznaljak
 +
 +
fobb hasznalati teruletek
 +
 +
-lemorzsolodas vizsgalat
 +
-ugyfelszegmentacio
 +
-kockazatelemzes
 +
 +
Alkalmazza a mesterseges intellignciat.
 +
 
==Kurucz Eszter==
 
==Kurucz Eszter==
 +
'''Adatbányászat feladata:'''
 +
*Leíró adatbányászat:egy adathalmaz tulajdonságainak tömör feltárása.
 +
*prediktív adatbányászat:Jövőben viselkedés előrejelzése.
 +
A prediktív adatbányászathoz tartozik az osztályozás, melynek módszerei közé tartozik :
 +
*Döntési fák
 +
*Logisztikus regresszió
 +
*Mesterséges neurális hálózatok
 +
 +
'''Döntési fák:'''
 +
*Egyszerű,könnyen értelmezhető módon ábrázolják azt a szabályrendszert, mellyel az objektumokat rendezzük.
 +
*Ha..,akkor... típusú szabályokkal is megfogalmazhatjuk.
 +
*A fa építésnél meg kell határozni, hogy melyik résznél történjen a vágás.
 +
Entropia:alkalmas a rendezettség mérésére.
 +
 +
'''Mesterséges neurális hálózatok:'''
 +
*kategóri és folytonos függő változót is képesek kezelni
 +
*felépítése:
 +
**Bemeneti réteg
 +
**Rejtett réteg
 +
**Kimeneti réteg
 +
 
==Bicók Csongor==
 
==Bicók Csongor==
 
==Horváth Henrietta==
 
==Horváth Henrietta==
 +
==Gáncs Júlia==
 
==Bogyay Gábor==
 
==Bogyay Gábor==
 +
 +
Döntési fákkal fogunk foglalkozni.
 +
WEKA tudományos szempontból érdekes,többet tud mint egy SPSS.
 +
*Adatbányászat/tudáskinyerés: implicit módon tudnak előállni.
 +
'''Adatok:'''
 +
*tranzakciós adatbázisrendszer,vezetői információs  rendszer,adattárház,adatpiac
 +
'''Adatpiacok''':
 +
*egy adott üzleti terület vagy üzleti megoldás adatkörét tartalmazzák.Egyszerűsítik az adateltérést alkalmazásokon keresztül.Gyors adatelérést bíztosítanak.
 +
*banki környezetben: CRM (kampánymenedzsment,ügyfélszegmentáció,válaszadási modellek,lemorzsolódás vizsgálat,ügyfél jövedelmezőség,ügyfélérték) és kockázatelemzés (hitelpontozó kártyák,csalásferdítés,behajtás,basel II).
 +
'''Adatbányászat által használt területek''': Nagyon sokat használ. Leginkább statisztikát.
 +
 +
'''Adatbányászat lépései:'''
 +
*1.adattisztítás: zajok és ikon zisztens adatok eltávolítása
 +
*2.adatintegráció: különböző forrásrendszerek adatainak egyesítése
 +
*3.adatkiválasztás. mely adatok relevánsak az adott, modellezendő probléma tekintetében
 +
*4.adattranszformáció: modellezéshez szükséges formátumú, aggregáltságú afatkör kialakítása
 +
*5.adatbányászat: adatbányászati technikák alkalmazása a tudás kinyerése érdekében
 +
*6.kiértékelés: a valóban értékes információk kiválasztása, értékelése
 +
*7.tudás megjelenítés: a kinyert információk ábrázolása a végfelhasználók, döntéshozók számára feldolgozható formában,az eredmények áramoltatása a szervezet folyamataiban.
 +
'''Adatbányászat feladata''':
 +
 +
    * Leíró adatbányászat:egy adathalmaz tulajdonságainak tömör feltárása.
 +
    * Prediktív adatbányászat:Jövőben viselkedés előrejelzése.
 +
 +
A prediktív adatbányászathoz tartozik az osztályozás, melynek módszerei közé tartozik :
 +
 +
    * Döntési fák
 +
    * Logisztikus regresszió
 +
    * Mesterséges neurális hálózatok
 +
 +
'''Predíktiv adatbányászat-Osztályozás:'''
 +
*''Döntési fák'':Egyszerű és könnyen értelmezhető módon ábrázoljűk azt a szabályrendszert ábrázolják mellyel az objektumokat osztályokba rendezzük.
 +
Azt kell tudni megválaszolni,melyik attributúm, és annak mely értékeinél történjen a vágás.
 +
*ID3:
 +
      -adott cél attributum érték párosa,
 +
      -entrópia minimalizálása. minnél kisebb a véletlenszerűség a csoportosításban
 +
*CART( Classification and Regression Trees )
 +
*CHAID( Chi-squared Automatic Interaction Delecation)
 +
''' ''Entrópia egyenlet:  minusz szummapi -t szorzom logpivel'''''
 +
 +
*'''Mesterséges neurális hálózatok:'''
 +
**kategória és folytonos függő változót is képesek kezelni
 +
**akár több száz, egymással is összefüggő magyarázó változót tud hatékonyan használni
 +
** ''Felépítése'':
 +
    - bemeneti réteg
 +
    - rejtett réteg
 +
    - kimeneti réteg
 +
Túltanulás elkerülésére két részre osztjuk: 1. tanuló  2. teszt adatbázis
 +
''K-szomszédsági eljárások'': az egyedeket a független változók terében helyezzük el. Hátrány:jelentős futásidő
 +
''Regressziós eljárás'':
 +
Lineáris, és logisztikus regresszió ( ez a leggyakoribb)
 +
 
==Vékony Viola==
 
==Vékony Viola==
 +
 +
Adatbányászat feladata:
 +
*Leíró adatbányászat
 +
*prediktív adatbányászat
 +
 +
ID3
 +
adott célattribútum-érték páros (kiszámolja az entropiát=rendezettlenség)
 +
Entrópiai minimalizálás - minél kisebb a véletlenszerűsége a csoportosításában
 +
 +
neurális hálozatok felépítése:
 +
Bemeneti réteg (Független változó)
 +
Rejtett réteg
 +
Kimeneti réteg (függő változó)
 +
 
==Pauleczki Mihály==
 
==Pauleczki Mihály==
 
==Sápi András==
 
==Sápi András==
 +
Döntéshozó,weka,spss.Az adatbányászat tudáskinyerés.Forrás rendszerek v. tranzakciós rendszrek.Adattárház:elemzői szempontból releváns adatokat tartalmaz,innen nyerjük ki a rengeteg adatból ami majd kell az adatpiacnak.Adatbányászat által használt területek: statisztika, mesterséges intelligencia. Adatbányászat lépései: adattisztítás,adatkiválasztás,adattranszformáció,adatbányászat,kiértékelés.Leíró adatbányászat: tulajdonságainak tömör, összefoglaló jellegű feltárása.Adatok megjelenítése, összesítések
 +
prediktív adatbányászat (osztályozó eljárás) módszerek: döntési fák,logisztikus regressziómmesterséges neurális hálózatok
 +
Döntési fák:egyszerű, könnyen értelmezhető. Ha.., akkor.. típusú szabályokkal megfogalmazható ID3 algoritmus: attribútum-érték párosra kiszámolja az entrópiát(rendezettség mérésére).
 +
==Putnoki Gyula==
 +
 +
==Palatinus Miklós==
 +
 +
Döntési fa weka-val, vagy spss-el.
 +
adatbányászat: nagy adathalmazból információt nyerjünk ki.
 +
adattárház: elemzői szempontból releváns adatokat tartalmaz.(döntéstámogató)
 +
adatpiac: egy-egy csoportnak releváns adatokat jelenít meg.(ebből dolgozik)
 +
*általános jellemzői: Egy adott üzleti terület vagy üzleti megoldás adatkörét tartlamazzák, gyors adatelérést biztosítanak.
 +
'''Adatpiac használatai:'''
 +
*CRM (ügyfélkapcsolatok): Kampánymenedzsment, ügyfélszegmentáció, válaszadási modellek, ügyfélérték
 +
*Kockázatelemzés: csalásfelderítés, behajtás, hitelpontozó kártyák, Basel II modell
 +
Adatbányászat által használt területek: statisztika, mesterséges intelligencia,
 +
'''adatbányászat lépései:'''
 +
*adattisztítás (inkonzisztens adatok eltávolítása)
 +
*hiányzó értékek problémályának megoldása 
 +
*adatkiválasztás (mely adatok relevánsak az adott, modellezendő probéma tekintetében)
 +
*adattranszformáció (modellezéshez szükséges formátumú, aggregáltságú adatkör kialakítása
 +
*adatbányászat
 +
*kiértékelés (a valóban értékes információk kiválasztása
 +
*tudásmegjelenítés
 +
 +
leíró adatbányászat:
 +
tulajdonságainak tömör, összefoglaló jellegű feltárása.
 +
*adatok megjelenítése, összesítések
 +
 +
prediktív adatbányászat (osztályozó eljárás)
 +
módszerek:
 +
*döntési fák
 +
*logisztikus regresszió
 +
*mesterséges neurális hálózatok
 +
 +
'''Döntési fák:'''
 +
 +
egyszerű, könnyen értelmezhető. Ha.., akkor.. típusú szabályokkal megfogalmazható
 +
ID3 algoritmus: attribútum-érték párosra kiszámolja az entrópiát(rendezettség mérésére).
 +
 +
'''Neurális hálózatok'''
 +
 +
*kategória és folytonos függő változót is képesek kezelni
 +
*akár több száz, egymással is összefüggő megyarázó változót tud hatékonyan használni
 +
*felépítése:
 +
**bemeneti réteg(független változók)
 +
**rejtett réteg
 +
**kimeneti réteg(függő változók)
  
 
=2007.11.09. - Adatbányászati blokk=
 
=2007.11.09. - Adatbányászati blokk=
17. sor: 171. sor:
 
==xy==
 
==xy==
 
==zq==
 
==zq==
 +
[[Kategória:Egyéb_feladatok]]

A lap jelenlegi, 2008. január 30., 12:44-kori változata

2007.10.26. - Adatbányászati blokk

Brechler Zsolt

Döntési fákkal fogunk foglalkozni. Weka tudományos szempontból érdekes,többet tud mint egy SPSS.

  • Adatbányászat/tudáskinyerés: implicit módon tudnak előállni.

ADöntési fákkal fogunk foglalkozni.

  • tranzakciós adatbázisrendszer,vezetői információs rendszer,adattárház,adatpiac

Tuzes Gyorgy

adatbanyaszati modelleket leginkabb banki kornyezetekbe hasznaljak

fobb hasznalati teruletek

-lemorzsolodas vizsgalat -ugyfelszegmentacio -kockazatelemzes

Alkalmazza a mesterseges intellignciat.

Kurucz Eszter

Adatbányászat feladata:

  • Leíró adatbányászat:egy adathalmaz tulajdonságainak tömör feltárása.
  • prediktív adatbányászat:Jövőben viselkedés előrejelzése.

A prediktív adatbányászathoz tartozik az osztályozás, melynek módszerei közé tartozik :

  • Döntési fák
  • Logisztikus regresszió
  • Mesterséges neurális hálózatok

Döntési fák:

  • Egyszerű,könnyen értelmezhető módon ábrázolják azt a szabályrendszert, mellyel az objektumokat rendezzük.
  • Ha..,akkor... típusú szabályokkal is megfogalmazhatjuk.
  • A fa építésnél meg kell határozni, hogy melyik résznél történjen a vágás.

Entropia:alkalmas a rendezettség mérésére.

Mesterséges neurális hálózatok:

  • kategóri és folytonos függő változót is képesek kezelni
  • felépítése:
    • Bemeneti réteg
    • Rejtett réteg
    • Kimeneti réteg

Bicók Csongor

Horváth Henrietta

Gáncs Júlia

Bogyay Gábor

Döntési fákkal fogunk foglalkozni. WEKA tudományos szempontból érdekes,többet tud mint egy SPSS.

  • Adatbányászat/tudáskinyerés: implicit módon tudnak előállni.

Adatok:

  • tranzakciós adatbázisrendszer,vezetői információs rendszer,adattárház,adatpiac

Adatpiacok:

  • egy adott üzleti terület vagy üzleti megoldás adatkörét tartalmazzák.Egyszerűsítik az adateltérést alkalmazásokon keresztül.Gyors adatelérést bíztosítanak.
  • banki környezetben: CRM (kampánymenedzsment,ügyfélszegmentáció,válaszadási modellek,lemorzsolódás vizsgálat,ügyfél jövedelmezőség,ügyfélérték) és kockázatelemzés (hitelpontozó kártyák,csalásferdítés,behajtás,basel II).

Adatbányászat által használt területek: Nagyon sokat használ. Leginkább statisztikát.

Adatbányászat lépései:

  • 1.adattisztítás: zajok és ikon zisztens adatok eltávolítása
  • 2.adatintegráció: különböző forrásrendszerek adatainak egyesítése
  • 3.adatkiválasztás. mely adatok relevánsak az adott, modellezendő probléma tekintetében
  • 4.adattranszformáció: modellezéshez szükséges formátumú, aggregáltságú afatkör kialakítása
  • 5.adatbányászat: adatbányászati technikák alkalmazása a tudás kinyerése érdekében
  • 6.kiértékelés: a valóban értékes információk kiválasztása, értékelése
  • 7.tudás megjelenítés: a kinyert információk ábrázolása a végfelhasználók, döntéshozók számára feldolgozható formában,az eredmények áramoltatása a szervezet folyamataiban.

Adatbányászat feladata:

   * Leíró adatbányászat:egy adathalmaz tulajdonságainak tömör feltárása.
   * Prediktív adatbányászat:Jövőben viselkedés előrejelzése. 

A prediktív adatbányászathoz tartozik az osztályozás, melynek módszerei közé tartozik :

   * Döntési fák
   * Logisztikus regresszió
   * Mesterséges neurális hálózatok 

Predíktiv adatbányászat-Osztályozás:

  • Döntési fák:Egyszerű és könnyen értelmezhető módon ábrázoljűk azt a szabályrendszert ábrázolják mellyel az objektumokat osztályokba rendezzük.

Azt kell tudni megválaszolni,melyik attributúm, és annak mely értékeinél történjen a vágás.

  • ID3:
     -adott cél attributum érték párosa,
     -entrópia minimalizálása. minnél kisebb a véletlenszerűség a csoportosításban
  • CART( Classification and Regression Trees )
  • CHAID( Chi-squared Automatic Interaction Delecation)

Entrópia egyenlet: minusz szummapi -t szorzom logpivel

  • Mesterséges neurális hálózatok:
    • kategória és folytonos függő változót is képesek kezelni
    • akár több száz, egymással is összefüggő magyarázó változót tud hatékonyan használni
    • Felépítése:
    - bemeneti réteg
    - rejtett réteg
    - kimeneti réteg

Túltanulás elkerülésére két részre osztjuk: 1. tanuló 2. teszt adatbázis K-szomszédsági eljárások: az egyedeket a független változók terében helyezzük el. Hátrány:jelentős futásidő Regressziós eljárás: Lineáris, és logisztikus regresszió ( ez a leggyakoribb)

Vékony Viola

Adatbányászat feladata:

  • Leíró adatbányászat
  • prediktív adatbányászat

ID3 adott célattribútum-érték páros (kiszámolja az entropiát=rendezettlenség) Entrópiai minimalizálás - minél kisebb a véletlenszerűsége a csoportosításában

neurális hálozatok felépítése: Bemeneti réteg (Független változó) Rejtett réteg Kimeneti réteg (függő változó)

Pauleczki Mihály

Sápi András

Döntéshozó,weka,spss.Az adatbányászat tudáskinyerés.Forrás rendszerek v. tranzakciós rendszrek.Adattárház:elemzői szempontból releváns adatokat tartalmaz,innen nyerjük ki a rengeteg adatból ami majd kell az adatpiacnak.Adatbányászat által használt területek: statisztika, mesterséges intelligencia. Adatbányászat lépései: adattisztítás,adatkiválasztás,adattranszformáció,adatbányászat,kiértékelés.Leíró adatbányászat: tulajdonságainak tömör, összefoglaló jellegű feltárása.Adatok megjelenítése, összesítések prediktív adatbányászat (osztályozó eljárás) módszerek: döntési fák,logisztikus regressziómmesterséges neurális hálózatok Döntési fák:egyszerű, könnyen értelmezhető. Ha.., akkor.. típusú szabályokkal megfogalmazható ID3 algoritmus: attribútum-érték párosra kiszámolja az entrópiát(rendezettség mérésére).

Putnoki Gyula

Palatinus Miklós

Döntési fa weka-val, vagy spss-el. adatbányászat: nagy adathalmazból információt nyerjünk ki. adattárház: elemzői szempontból releváns adatokat tartalmaz.(döntéstámogató) adatpiac: egy-egy csoportnak releváns adatokat jelenít meg.(ebből dolgozik)

  • általános jellemzői: Egy adott üzleti terület vagy üzleti megoldás adatkörét tartlamazzák, gyors adatelérést biztosítanak.

Adatpiac használatai:

  • CRM (ügyfélkapcsolatok): Kampánymenedzsment, ügyfélszegmentáció, válaszadási modellek, ügyfélérték
  • Kockázatelemzés: csalásfelderítés, behajtás, hitelpontozó kártyák, Basel II modell

Adatbányászat által használt területek: statisztika, mesterséges intelligencia, adatbányászat lépései:

  • adattisztítás (inkonzisztens adatok eltávolítása)
  • hiányzó értékek problémályának megoldása
  • adatkiválasztás (mely adatok relevánsak az adott, modellezendő probéma tekintetében)
  • adattranszformáció (modellezéshez szükséges formátumú, aggregáltságú adatkör kialakítása
  • adatbányászat
  • kiértékelés (a valóban értékes információk kiválasztása
  • tudásmegjelenítés

leíró adatbányászat: tulajdonságainak tömör, összefoglaló jellegű feltárása.

  • adatok megjelenítése, összesítések

prediktív adatbányászat (osztályozó eljárás) módszerek:

  • döntési fák
  • logisztikus regresszió
  • mesterséges neurális hálózatok

Döntési fák:

egyszerű, könnyen értelmezhető. Ha.., akkor.. típusú szabályokkal megfogalmazható ID3 algoritmus: attribútum-érték párosra kiszámolja az entrópiát(rendezettség mérésére).

Neurális hálózatok

  • kategória és folytonos függő változót is képesek kezelni
  • akár több száz, egymással is összefüggő megyarázó változót tud hatékonyan használni
  • felépítése:
    • bemeneti réteg(független változók)
    • rejtett réteg
    • kimeneti réteg(függő változók)

2007.11.09. - Adatbányászati blokk

xy

zq

2007.11.30. - Adatbányászati blokk

xy

zq