Adatkezelés

A Miau Wiki wikiből

Adatkezelés

Történeti modul

Az adatbázisok története értelemszerűen az adatmodellek[1] és az adatbázis-kezelő rendszerek történetével szoros összefüggésben áll.

  • 1890-es amerikai népszámlálás során ismerte fel Hermann Hollerith, hogy az adatfeldolgozás és adatkezelés hatékonyabbá tehető elektronikus eszközökkel, de ehhez az adathordozókon tárolt szöveget kódolni kell. A Hollerith által kidolgozott, John Billings ötletén alapuló kódolási rendszer képezi a mai napig is a számítógépes adatbevitel alapját. A kódolás már lehetővé teszi, hogy az így tárolt információ tömegesen feldolgozható legyen.
  • 1900-as évek elején is felmerült az adatok gyors, gépesített, tárolásának és visszakeresésének igénye, amikor az első népességnyilvántartást végző (valójában halálozási statisztikákat készítő) lyukszalagos számítógépek megjelentek. Mindazonáltal a lyukkártyás technológia a jelenlegi rekordokban gondolkodó szemléletben éppúgy jelen van, mint a kezdetek kezdetén.
  • 1960-as évek közepén kezdtek el kialakulni az adatbázisok jelenlegi, korszerű formái csak az , elsősorban intézmény bérszámfejtési, adatsorelemzési problémáinak kezelésére. A rutinszerű feladatokat először egy hálós adatbázis[] segítségével igyekeztek lerövidíteni. E korszak terméke pl. a CODASYL. A hálós szemléleten még nagyon jól érződik a számítógép alacsony szintű programozásának az igénye; azonban látni kell, hogy a tényleges számítógép-felhasználók akkor is, ma is elsősorban nem számítástechnikai szakemberek voltak.
  • 1950-es években, a számítógépek megjelenésével a kis méretű,a napi tevékenységekben használatos adatmennyiséget kezelő rendszerek is kifejlődtek.

A hagyományos adatrögzítés úgynevezett elsődleges adathordozókat kezel. Ezek papíron található adatok például: számlák, szerződések, képek, térképek, okmányok. Újabban már lehetnek hang- és filmfelvételek is. Az elsődleges adathordozók kezelésére a számítógép közvetlenül nem képes. Hollerith ötletét felhasználva ezért ezeket jelekké kódoljuk: a szövegeket, az iratokat begépeljük vagy karakterfelismerővel feldolgozzuk, a képeket, a hangokat digitalizáljuk.

  • A számítógéppel való kommunikációt javítani kellett, azaz szét kellett választani az alacsony szintű programozást a magas szintű logikai szerkezettől. Az első adatmodell, amelyben már élesen szétvált a logikai és a fizikai adatbázis, az a relációs adatmodell volt.
  • 1969-ben Edgar F. Codd, az IBM[2] munkatársaként már kidolgozta a mai napig is a legnépszerűbb adatbázis-fajta logikai modelljét, csak 1970-ben publikálta. Téved azonban az, aki azt hiszi, hogy a relációs adatbázis sikertörténetnek indult. Magával az adatbázis logikai szerkezetével semmi baj nem volt, kísértetiesen hasonlít egy közönséges táblázatkezeléshez, csakhogy a lekérdezéssel gondok adódtak. A lekérdezés nyelve ugyanis halmazelméleti és logikai ismeretek igényelt - ami még a számítógép-programozásnál is mostohább feltételnek tűnt a felhasználók szemében. Maga az IBM[3] sem fűzött hozzá komolyabb reményeket, hat év alatt hozták létre az első modern adatbázis-kezelőt, a System-R (ma DB/2) kódnevű szoftvert. Nem úgy a CIA[4], aki többek között Larry Ellison és Bob Miner segédletével egy gradiózus projektbe fogott bele, amelynek célja egy olyan adattár létrehozása volt, amely a CIA minden felmerülő kérdését gyorsan, hatékonyan, és aránylag olcsón megválaszolja. A projekt éppen az orákulum nevet kapta, angolul: Oracle.
  • 1976-ban maga a projekt pénz hiányában nem folytatódott, de Ellison és Miner tovább dolgozott a munkán az általuk 1977-ben alapított Relational Software Inc. (RSI, 1982-től Oracle Corp.) keretein belül.
  • 1977-ben pedig létrejött az első Oracle.A jó időben, a számítástechnikai boom idején végrehajtott korai piacszerzés ellehetetlenítette a többi lehetséges adatmodell virágzását. Hiába jelent meg 1977-ben az első értekezés egy tisztán logikára épülő adatmodellről, az elterjedésére nem volt ideje.
  • 1982-re, amikor az első ipari alkalmazásra is bevethető Datalog adatbázis-kezelőt létrehozzák, már számos cégnek teljesen önálló relációs adatmodell alapú terméke van a piacon.


  • Az adatbázisok létrehozására és kezelésére megszülettek az önálló adatbázis-kezelő nyelvek. Számos nyelv jött létre, ami viszont ismét hozzáférési problémákat/gondokat okozott.
  • 1980-as évek elejére az IBM [5] kidolgozott egy később szabványnak is elfogadott nyelvet, a mi SQL[6] néven vált ismerté. Rövid történeti áttekintésként annyit, hogy az SQL[7] nyelv elméleti alapjait E. F. Codd fektette le a relációs adatmodellről szóló 1970-ben megjelent tanulmányában.
  • 1973/74-ben készült el a nyelv első megvalósítása az IBM-nél[8] Sequel néven.
  • 1985-ben az ANSI (American National Standards Institute - Amerikai Szabványosítási Hivatal) elfogadott egy SQL szabványt, amit azóta módosítottak, és az ISO (International Organization for Standardization - Nemzetközi Szabványügyi Szervezet) is elfogadott. Az SQL[9] ma már az adatlekérdezés világszabványa, amit minden korszerű adatbázis-kezelőnek ismernie kell.
  • 1986-ban az SQL[10] mint a relációs adatbázisok lekérdezőnyelve az Egyesült Államokban is, és Európában is szabványossá válik, ami a többi adatbázisról még nagyon sokáig nem mondható el.
  • 1990-es évek elején egy új programozási szemléletmód, az objektumorientáltság jelent meg. Mivel a legtöbb programozási nyelvet aránylag hamar kiszorította, sokáig úgy tűnt az adatbázisok világában is megtöri a relációs adatbázisok uralmát. Ez azonban korántsem következett be. Jelenleg az adatbázis-piac kevesebb, mint 3% objektumorientált adatbázis.
  • Manapság a legfontosabb intézményi információs rendszerek alapját maguk az adatbázisok alkotják, ugyanakkor tipikusan objektumorientált programozási nyelveken írt alkalmazások használnak relációs adatbázisokat. Ezt a fajta tudathasadást egy öszvér megoldással igyekeznek napjainkban áthidalni, nevezetesen objektumszerűen lehet elérni relációs adatbázistartalmakat. Erre, mint tudjuk, a logikai adatbázis fogalma eleve lehetőséget ad, de szabványban, formális módon is rögzítették ennek mikéntjént; ez az SQL[11]
  • A fejlődés persze azóta sem állt meg, bár lényegesen lelassult.
  • 1999-ben hirdette meg a szemantikus Web programját (Tim Berners-Lee, az Internet atyja), amely többek között az XML nyelv általános elterjédéséhez vezetett. Ezzel párhuzamosan pedig megjelentek az első XML dokumentumokra épülő adatbázisok. A félreértés elkerülése végett az XML adatbázisok alapvetően nem, vagy nem tipikusan XML struktúrákban tárolják az adatokat (felesleg helypazarlás lenne) - nem a fizikai adatbázis változott meg, hanem ismét csak a logikai. Az XML dokumentumok lekérdezésére létrehozták a W3C konzorcium ajánlásaként az XQuery és XPath lekérdezőnyelveket. Az XML alapú adatbázisok elterjedéséhez az adja az alapot, hogy az uralkodó trendek szerint ma nem a felhasználók, hanem szoftverek, szoftverügynökök állítanak elő és dolgoznak fel automatikusan és félautomatikusan lekérdezéseket. Az XQuery és XPath alapú megoldások az ilyen jellegű elvárásoknak sokkal jobban megfelelnek, mint a főleg emberi intelligenciát igénylő SQL[12] alapú rendszerek. Megjegyzendő, hogy a kérdések automatikus lekérdezőnyelvre való automatikus átírásával a természetes nyelvű adatbázis-interfészek foglalkoznak

Definíciós modul

  • Az adat valamilyen ismeret megjelenített formája, valakinek vagy valaminek egy jellemző tulajdonsága. Tartalmi szempontból érthetőnek kell lennie (a témát ismerő személy számára), formailag pedig mechanikusan (számítógéppel) feldolgozhatónak. Adat pl. a telefonkönyvben a személyek neve, címe vagy telefonszáma. A szövegszerűen közölt vagy tárolt ismeretre (pl. egy jogszabály gyűjteményre) azt mondjuk, hogy az nem adatszerű, mert – legalábbis jelenlegi szoftver eszközeinkkel – nem tudjuk értelmezni. Csupán tárolni, és eredeti alakjában visszakeresni. Ha pl. a vasútállomáson olyan szöveges formában írnák ki a táblára a vonatok indulását, ahogy a hangosbemondó közli, akkor nehéz lenne eligazodni rajta. Ebben a formában egy számítógép is csak folyamatos szövegként tudná kezelni. Az induló vonatok táblája már világosan csoportosítja az adatokat célállomás, indulási idő és vágány szerint. Ha ezt visszük be egy számítógépbe, akkor az képes akár célállomás, akár indulási idő szerint rendezve megjeleníteni az adatokat, mert a két oszlop mechanikusan elkülöníthető.

Információ alatt az új ismeretet hordozó adatot értjük. Ez a megfogalmazás feltételezi az adatot értelmező személyt, hiszen ugyanaz az adat lehet valakinek ismert, másnak nem. A tárolás és visszakeresés mellett az adatok feldolgozásának az is célja, hogy ezáltal további új ismeretekhez, tehát információhoz jussunk. Pl. egy menetrendből kikereshető, hogy naponta hány vonat indul egy bizonyos állomásra. Ez még annak is új információ, aki kívülről tudja a menetrendet. A gyakorlatban akkor beszélünk adatfeldolgozásról, ha az adatok összegyűjtése és tárolása valamilyen rendszer szerint történik. Úgy, hogy az adatok mások számára is érthetőek és használhatóak legyenek. Ez feltételezi, hogy a résztvevők értik az adatok tartalmát, összefüggéseit, és ismerik az adatokhoz való hozzáférés szabályait. A vonatok indulását megadó táblára gondolva látható, hogy az adatfeldolgozás során kiemeljük a dolgoknak az adott szempont szerinti lényegi tulajdonságait. Az utasok számára nem érdekes, hogy hívják a mozdonyvezetőt. A forgalomirányítás szempontjából viszont ez egy fontos adat. Az állomás életét leíró adatokat tehát úgy kell elrendezni, hogy minden érdekelt hozzáférjen a számára szükséges információhoz. Az adatok elrendezését meghatározó elvi struktúrát nevezzük adatmodellnek[13]. Az adatmodell tehát nem konkrét adatértékeket tartalmaz, hanem az adatok tulajdonságait, szerkezetét, lehetséges kapcsolatait írja le. Magukat az adatokat az adatbázis tartalmazza, ami az adatoknak az adatmodell szerint szervezett együttese. Ennek részletes tárgyalása előtt azonban röviden áttekintjük a táblázatkezelés elemeit.

  • SQL[14]:A név strukturált lekérdező nyelv (Structured Query Language) rövidítése. Ez a nyelv logikai szinten kezeli az adatbázisokat, így nagy előnye,hogy nem csak a már konkrétan megvalósított adatbázisokkal dolgozhatunk. Lehetőségünk nyílik különböző környezetben is futó, úgynevezett hordozható alkalmazások létrehozására, valamint a párbeszédes, a beszélt nyelvhez közelálló formában megadható lekérdezésre is.Angol nyelvterületen 'eszkjuel' a kiejtése. A hagyományokhoz való hűség jegyében sokan 'szíkvel'-nek ejtik, ugyanis korábban Structured English Query Language (SEQUEL) volt az elnevezés, és ezt rövidítették le.


  • Táblakezelő:A táblázatkezelő alkalmas az adatok összegyűjtésére és rendszerezett formában való tárolása mellett arra is, hogy műveleteket végezünk az adatokkal, illetve, hogy az adatokat áttekinthető formában, grafikusan is megjelenítsük. Legelterjedtebb táblakezelő az Excel, de táblakezelő még:Quattro, Lotus 1-2-3, GrafCalc és a VisiCalc. A táblakezelő szoftverben a tárolt adatokkal számos műveletet végezhetsz, és az adatok közötti összefüggéseket is tárolhatod. A matematikai és pénzügyi számítások mellett adataidat diagramokon, ábrákon is képes megjeleníteni; számoszlopok helyett színes oszlopokkal, vonalakkal, felületekkel lehet érzékeltetni az értékeket.

Ajánlott irodalmak modulja

  • Rozgonyi-Borus Ferenc és Dr.Kokas Károly: Informatika középiskolásoknak: Számítástechnika és könyvtárhasználat (MOZAIK Kiadó)
  • Informatikai kifejezések lexikona [15]
  • WIKIPÉDIA A szabad lexikon [16]