Adatvagyon-integráció-konszolidáció

A Miau Wiki wikiből
A lap korábbi változatát látod, amilyen Pitlik (vitalap | szerkesztései) 2011. január 15., 09:32-kor történt szerkesztése után volt. (Adatbázis-tervezési lépések)

Adatfragmentumok összevezetése

Az alábbi, (egytáblás) adatvagyon-gazdálkodási szabványokat minden informatikát tanuló Hallgató rutinszerűen kell, hogy értse és használja. Egyetlen szakdolgozatnak sem lenne szabad megszületnie az ott feldolgozott adatok korrekt kezelése nélkül...

Előzmények

  1. Annak érdekében, hogy egy adatbázist létre hozassunk, elsőként meg kell határozni az ebben tárolni kívánt adattartalmakat (vö. APEH-statisztikák).
  2. Az adattartalmak rögzítése után ezek nyers állapotait rendelkezésre kell bocsátani pl.
  • internetes kereséssel (vö. képernyőképek, html-másolatok, fájl-mentések)
  • papír-alapú források esetén beszkennelt (lehetőség szerint karakterfelismeréssel támogatott) állományok (vö. http://miau.gau.hu/temp/apeh)

Adatbázis-tervezési lépések

  1. A nyers adatok vizuális értelmezése és az elemzési célok alapján meg kell határozni milyen dimenziókra (egytáblás alapesetben milyen oszlopokra) van szükség az adatbázisban, azaz milyen meta-adatokkal kívánunk leírni egy-egy megfigyelt, mért értéket.
  2. Alapértelmezés szerint: sorszám, objektum, attribútum, érték, mértékegység, forrás, dátum (rögzítés), rögzítette (monogram)
  3. Amennyiben a nyers tartalmak ennél több struktúrát engednek feltárni, akkor ezek használata kötelező: pl.
  • térbeli hierarchiák (pl. megye, statisztikai régió, ország)
  • időbeli hierarchiák (pl. év, félév, negyedév, hónap, nap)
  • jelenséghierarchiák (pl. mutatószámok csoportjai)
  1. A dimenziók/oszlopok meghatározása után illik, de nem mindig lehetséges azonnal megalkotni a kódszótárt, mely tartalmazza, milyen oszlopban milyen értékkészlet fordulhat elő. A kódszótár kialakítása lehet többlépcsős, iteratív, ill. végső soron utólagos folyamat is, bár ez esetben a potenciális revíziók száma irracionálisan nagy is lehet...

Egy-személyes feladatvégzés

Adatállományok integrációja és konszolidációja

http://miau.gau.hu/temp/apeh/strukturalt_adatok_uj/?C=S;O=D