„Adatvagyon-integráció-konszolidáció” változatai közötti eltérés

A Miau Wiki wikiből
a (Adatbázis-tervezési lépések)
a (Adatbázis-tervezési lépések)
16. sor: 16. sor:
 
*időbeli hierarchiák (pl. év, félév, negyedév, hónap, nap)
 
*időbeli hierarchiák (pl. év, félév, negyedév, hónap, nap)
 
*jelenséghierarchiák (pl. mutatószámok csoportjai)
 
*jelenséghierarchiák (pl. mutatószámok csoportjai)
 +
#A dimenziók/oszlopok meghatározása után illik, de nem mindig lehetséges azonnal megalkotni a kódszótárt, mely tartalmazza, milyen oszlopban milyen értékkészlet fordulhat elő. A kódszótár kialakítása lehet többlépcsős, iteratív, ill. végső soron utólagos folyamat is, bár ez esetben a potenciális revíziók száma irracionálisan nagy is lehet...
 +
==Egy-személyes feladatvégzés==
 +
 +
==Adatállományok integrációja és konszolidációja==
 +
http://miau.gau.hu/temp/apeh/strukturalt_adatok_uj/?C=S;O=D

A lap 2011. január 15., 09:32-kori változata

Adatfragmentumok összevezetése

Az alábbi, (egytáblás) adatvagyon-gazdálkodási szabványokat minden informatikát tanuló Hallgató rutinszerűen kell, hogy értse és használja. Egyetlen szakdolgozatnak sem lenne szabad megszületnie az ott feldolgozott adatok korrekt kezelése nélkül...

Előzmények

  1. Annak érdekében, hogy egy adatbázist létre hozassunk, elsőként meg kell határozni az ebben tárolni kívánt adattartalmakat (vö. APEH-statisztikák).
  2. Az adattartalmak rögzítése után ezek nyers állapotait rendelkezésre kell bocsátani pl.
  • internetes kereséssel (vö. képernyőképek, html-másolatok, fájl-mentések)
  • papír-alapú források esetén beszkennelt (lehetőség szerint karakterfelismeréssel támogatott) állományok (vö. http://miau.gau.hu/temp/apeh)

Adatbázis-tervezési lépések

  1. A nyers adatok vizuális értelmezése és az elemzési célok alapján meg kell határozni milyen dimenziókra (egytáblás alapesetben milyen oszlopokra) van szükség az adatbázisban, azaz milyen meta-adatokkal kívánunk leírni egy-egy megfigyelt, mért értéket.
  2. Alapértelmezés szerint: sorszám, objektum, attribútum, érték, mértékegység, forrás, dátum (rögzítés), rögzítette (monogram)
  3. Amennyiben a nyers tartalmak ennél több struktúrát engednek feltárni, akkor ezek használata kötelező: pl.
  • térbeli hierarchiák (pl. megye, statisztikai régió, ország)
  • időbeli hierarchiák (pl. év, félév, negyedév, hónap, nap)
  • jelenséghierarchiák (pl. mutatószámok csoportjai)
  1. A dimenziók/oszlopok meghatározása után illik, de nem mindig lehetséges azonnal megalkotni a kódszótárt, mely tartalmazza, milyen oszlopban milyen értékkészlet fordulhat elő. A kódszótár kialakítása lehet többlépcsős, iteratív, ill. végső soron utólagos folyamat is, bár ez esetben a potenciális revíziók száma irracionálisan nagy is lehet...

Egy-személyes feladatvégzés

Adatállományok integrációja és konszolidációja

http://miau.gau.hu/temp/apeh/strukturalt_adatok_uj/?C=S;O=D