Tezaurusz
Angol megnevezés: Tezaurus
Tartalomjegyzék
Történeti modul
- 1969— Petőfi S. János külön monográfiában próbálta meg félreverni a harangokat.
- 1970 Megalkották az első Tezauruszokat azóta 49 db hoztak létre melynek többségét alig vagy egyáltalábban nem is használták.
- Ilyen pl:
- ELEKTROTECHNIKAI / Ungváry. - KGTMTI, 1975. ALIG HASZNÁLTÁK
- ÉPÍTÉSTUDOMÁNYI. - ÉTI, 1975. ALIG HASZNÁLTÁK
- KÖNYVTÁRI / Kövendi D. - OSzK KMK, 1976. HASZNÁLATBAN
- GAZDASÁGSTATISZTIKAI / KSH, 1976. NEM HASZNÁLTÁK
- FÉMTÖMEGCIKKIPARI / Ungváry R. - KGTMTI, 1975-77. NEM HASZNÁLTÁK
- SZÁMÍTÁSTECHNIKAI / Ungváry R. - SzÁMALK, 1982. HASZNÁLATBAN
- KÜLGAZDASÁGI / Kónya B. - 1983. NEM HASZNÁLTÁK
- OSZTAURUSZ / Ungváry R., Pap I.-né. - OSZK, 1983-84., 1995. HASZNÁLATBAN
- A tezaurusz olyan szótár vagy szójegyzék, amelyben az egyes szavak mint fogalmak az egymáshoz viszonyított és jelzett értékeik (alá- fölérendeltség stb.) szerint vannak felsorolva. Nabgyon jó segédeszköz mindenféle munkához melynél fontos a kategorizálás.[2]
- A tezaurusz szavak közötti összefüggéseket tartalmazó szótár, amely ötleteket adhat a minél pontosabb, hatékonyabb kereséshez. Hasonlít a szinonimaszótárra, de annál lényegesen többet tud, egy olyan egynyelvű szótár, amelyben a szavak fogalmi körök, logikai, vagy jelentésbeli összefüggések alapján vannak elrendezve.[3]
Ontológiai modul
"ez egy" kapcsolattípus:
- RELEX (program tezaurusz futatására)
- Tezaurusz adatmodell
- Deszkriptorok
- Nemdeszkriptorok
- OWL ( ontológialeíró-nyelv)
- ...
"van neki, része a címszónak" kapcsolattípus:
"a címszó része valaminek (a címszóval egyenrangú fogalmak)" kapcsolattípus:
- tárgyszójegyzéke
- bibliographia
- Az ETO „laza” hierarchiája
- Ontológia
...
Ellentmondások és vitatott kijelentések modulja
Szerkesztői javaslat:
- Mi az összefüggés a tezaurusz, az ontológia, a konzisztencia, a természetes nyelvek mesterséges intelligencia alapú elemzése között?
- Mi az összefüggés a hírügynökség, a tezaurusz és a keresési idő és a találatok értékének optimális aránya között?
Válasz a szerkeztői javaslatra
1. Definiciók
- Tezaurusz A tezaurusz olyan szótár, melyben a szókészletet a szavak expliciten kifejezett összefüggéseivel együtt adják meg. Ezért nevezik strukturált szótárnak. A szócikkek (tezauruszcikkek) azonban nem csak a szemantikai és morfológiai (együttesen paradigmatikus) összefüggéseket hanem a vezérszóval összefüggő magyarázatokat, meghatározásokat, használati, történeti, forrás stb. megjegyzéseket is tartalmaznak, ezért a tezaurusz a terminológiai szótárra is emlékeztet. Elvileg sokféle tezaurusz készülhet (nyelvészeti, terminológiai, információkereső)
- Ontológia Az ontológiákat általában egy logikán alapuló nyelven fogalmazzák meg úgy, hogy részletes, pontos, egyértelmű, megbízható és értelmes megkülönböztetéseket tehessünk osztályok, tulajdonságok és viszonyok között. Néhány ontológiai eszköz képes automatikus következtetéseket is levonni az ontológiák révén, és ezáltal fejlett szolgáltatásokat képes nyújtani olyan modern alkalmazásokhoz, mint pl. a fogalmi/szemantikai alapú keresés, a szoftver ágensek, a döntéstámogatás, a természetesnyelv-értés, a tudásbázis-kezelés, az intelligens adatbázisok és az elektronikus kereskedelem.
- Konzisztencia Ellentmondás-mentesség. Csak akkor lehet biztosítani, ha minden adat és ezek keletkezési módja pontosan dokumentált, illetve az egymással oksági kapcsolatba hozható adatok kapcsolatrendszerét leíró táblázat adott, mely alapján a szakmai hibaelemzés elvégezhető
- Természetes nyelvek mesterséges intelligencia alapú elemzéseA mesterséges intelligencia
fejlődése megmutatta, hogy az ember nagyon bonyolult feladatok megoldására is képes számítógéppel, de a módszerek jelentős része a Neumann-féle számítógép – alapvetően soros – architektúrájára és nem az agyéra épít, így a hatékonyság-növelés következtében egyre számítógép-orientáltabbak lettek a mesterségesintelligencia-elméletek, következésképp az emberi nyelvfeldolgozás valódi modellálása is a háttérbe szorult.A 70-es évek elejének gépi nyelvészetét ismerők számára köztudott, hogy sok gépi nyelvmodell valamely mesterségesintelligencia-laboratóriumban keletkezett. Ezek elsősorban kísérletek voltak és nem eladásra szánt szoftvertermékek. A mesterséges intelligencia eközben elsősorban határterületeket produkált a nyelvfeldolgozásnak, lévén nem a nyelvészetért, hanem
a teljes kognitív folyamat modellezéséért felelős tudományterület. Ilyenek a logika, a
számítástechnika, de ilyen a látás vagy mozgás tanulmányozásával foglalkozó kutatás is. Hogy a nyelvi modellek mesterségesintelligencia-környezetben való kezelése miért halványodott el, ahhoz elég megemlíteni azt, hogy a jelentés pontos, egységes, átfogó és jól gépesíthető formális kezelésével – minden pozitív eredménye ellenére – még ma is adós a tudomány. Ugyanakkor a szöveg- és beszédfeldolgozás más aspektusaival foglalkozó fejlesztők – saját, nem közvetlenül a mesterséges intelligencia világából származó módszereikkel – óriás léptekkel haladtak előre. A 90-es évek végén tehát nyugodtan leszögezhetjük, hogy a nyelvhelyesség-ellenőrzők, az automatikus elválasztók és a beszédfelismerők korában (Prószéky 2000) e területek jeles kutatói a valószínűség-számítás, a matematikai statisztika, a formális nyelvészet, az információfeldolgozás világát kötötték össze elsősorban a hatékony hardverekével, és szinte olyan nyelvészeti módszer, melyet eredendően mesterségesintelligencia- módszernek nevezhetnénk, nem jött létre az elmúlt jó néhány évben. A változás azonban éppen a közeljövőben, azaz a fent emlegetett módszerek megszilárdulása után fog jelentkezni, méghozzá valószínűleg a nyelvészetben egy ideje kissé elhanyagolt mesterségesintelligencia-módszerek „újraélesztésével”. Szándékosan használtuk az „újraélesztés” kifejezést, hiszen a mai nyelvtechnológiai módszereinek nagy része nem más, mint a korábban kevésbé hatékonynak ítélt elmélet „felmelegítése” a mai hardverviszonyok közepette. Ma ugyanis nem egy korábban lassúnak tűnő nyelvészeti módszer kielégítő eredményt ad – a sebességviszonyok és a tárolókapacitás megnövekedése miatt. A fenti áttekintés után, a jelen helyzet ismeretében nyugodtan állíthatjuk, hogy az utóbbi időben kissé hanyagolt mesterségesintelligencia-módszerek napjainkban ismét egyre komolyabb segítséget nyújtanak a számítógépes nyelvészeti kutatóknak.
1. Defiiciók közötti összefüggés
2. Definiciók
- Hírügynökség A hírügynökség (más szóval hírszolgálat, régies kifejezéssel távirati iroda) kereskedelmi, egyes helyeken állami, hírszolgálati vállalat, amelynek fő feladata a sajtó friss hírekkel való ellátása. A hírügyökségek között a verseny azért folyik, hogy egy adott ügynökség a leghamarabb közölje a hírt. A hírügynökségi újságírói munka annyiban hasonlít a lexikonszerkesztéshez, hogy a szöveg lényegét a számokhoz, nevekhez, rangokhoz köthető tények összegyűjtése adja. Következésképpen az ezekbe becsúszó hibák a legkényesebbek, azok (nevek, számok, rangok) elírásából szokott botrány lenni
- Tezaurusz A tezaurusz olyan szótár, melyben a szókészletet a szavak expliciten kifejezett összefüggéseivel együtt adják meg. Ezért nevezik strukturált szótárnak. A szócikkek (tezauruszcikkek) azonban nem csak a szemantikai és morfológiai (együttesen paradigmatikus) összefüggéseket hanem a vezérszóval összefüggő magyarázatokat, meghatározásokat, használati, történeti, forrás stb. megjegyzéseket is tartalmaznak, ezért a tezaurusz a terminológiai szótárra is emlékeztet. Elvileg sokféle tezaurusz készülhet (nyelvészeti, terminológiai, információkereső)
- Keresési idő Egy adott információ előkereséséhez szükséges idő. A keresési idő merevlemezek esetében azt az időtartamot jelenti, amíg a meghajtó író/olvasó fejét egy megadott szektor fölé mozgatja, hogy abból adatokat tudjon beolvasni, vagy oda adatokat tudjon kiírni
- Találatok értékének optimális aránya' Abszolút mértékegysége természetesen nincs a jó találatok számának, csak józan ésszel áttekinthetetlen a több ezer találatból álló lista. A másik oldalról megközelítve, ha nem kapunk találatot (vagy csak kevés számút), akkor is eredménytelen a keresés, hacsak a kevés számú találatokban véletlenül nincs benne az, amelyiket kerestük. A találati lista szűkítésére megfelelő eszköz lehet a találatok közötti további keresés (ahol ez engedélyezve van) vagy az összetett keresés. Túl kevés találat tipikusan akkor fordul elő (az elgépelésektől eltekintve), ha az összetett keresésben szigorú feltételeket adunk meg. Segíthet a feltételek „enyhítése”, például az együttes előfordulás keresése a pontos egyezés helyett. Általában növeli a találatok számát ha a keresésbe a rokon jelentésű szavakat is bevonjuk (például növényvédőszer helyett vagy mellett a peszticid, fungicid stb. szavakra is keresünk). Általában a szakszavak előfordulása tudományos munkákban gyakoribb, hétköznapi anyagokban kevésbe, így például a burgonya termesztésről szóló szakirodalomban a burgonya és a „Solanum tuberosum L.” kifejezés fordul elő, míg egy receptben a krumpli, népnyelvi környezetben a pityóka stb.
2. Defiiciók közötti összefüggés
Definíciós modul
- A tezaurusz olyan szótár, melyben a szókészletet a szavak expliciten kifejezett összefüggéseivel együtt adják meg. Ezért nevezik strukturált szótárnak. A szócikkek (tezauruszcikkek) azonban nem csak a szemantikai és morfológiai (együttesen paradigmatikus) összefüggéseket hanem a vezérszóval összefüggő magyarázatokat, meghatározásokat, használati, történeti, forrás stb. megjegyzéseket is tartalmaznak, ezért a tezaurusz a terminológiai szótárra is emlékeztet. Elvileg sokféle tezaurusz készülhet (nyelvészeti, terminológiai, információkereső)
- A tezauruszokban rejlő tartalomfeltárási és információkeresési lehetőségek egyelőre kihasználatlanak. Hiányzanak ugyanis azok a szoftverek, melyekkel a tezauruszokat maradéktalanul hasznosítani lehetne. Ebből a szempontból édes mindegy, hogy hagyományos lokálisan vagy az interneten keresztül on-line elérhető adatbázisrendszerekről (például könyvtári, egészségügyi, államigazgatási vagy pénzügyi rendszerekről) vagy eleve az interneten megjelenő webes rendszerekről, indexelő szolgáltatásokról (például AltaVizsla, Ariadne, Google), ill. internetkatalógusokról (például HuDir, Yahoo!) van szó.
TEZAURUSZCIKK PÉLDÁJA Az alábbi formában megjelenő tezauruszcikk esetén:
- kisebbségi kérdés
- HELYETT kisebbségtudomány
- HELYETT V nyelvhasználat
- ÁTFOGÓBBAN nemzetiségi kérdés
- EGÉSZE politika
- RÉSZE kisebbség
- LÁSD MÉG autonómia
- függetlenségi mozgalom
- kollektív jogok
- nemzetiségi elszakadás
- OKA szeparatizmus
- LD MÉG nemzetiségi kérdés
- nemzetiségi kérdés
- ÁTFOGÓBBAN kisebbségi kérdés
- SPECIÁLIS nemzeti kisebbségek helyzete mint külpolitikai probléma
- nemzetiségi tisztogatás
- EREDMÉNYE szeparatizmus
- LD MÉG anyanyelv
- nacionalizmus
- nemzet
- nemzetiség
- Szabványos Felhasználóbarát jelölés
- L = Lásd szinonimáját
- L = Lásd még
- LV = Lásd vagy
- F = Lásd még általánosabban
- A = Lásd még speciálisabban
- T = Lásd még átfogóbban
- P = Lásd még részletesebben
- R = Lásd még oksági összefüggésben
- E = Lásd még okozati összefüggésben
- X = Lásd még egyéb összefüggésben
- H = Lásd szinonimáját
- H = Lásd még
- HV = Lásd vagylagosan
- ≠ = Más értelemben lásd
Tesztkérdések modul
- Az első magyar tezauruszt 1969 ben készitették?
- (Hamis, mert csak 1970 ben készült el az első magyar ilyen tipusú szótár)
- A tezaurusz az egy egyszerü webes szógyüjtemény?
- (Hamis, mert egyébb értelmezési-fogalmi kapcsolatokon alapuló ontológiai szótár)
- A tezauruszban a ≠ jel az jelőli hogy nincs kapcsolat a szavak között?
- (Igaz)