„Természetes nyelvek kezelése” változatai közötti eltérés

A Miau Wiki wikiből
(Tesztkérdések modul)
(Tesztkérdések modul)
97. sor: 97. sor:
  
 
== Tesztkérdések modul ==
 
== Tesztkérdések modul ==
 +
* Igaz-e, hogy a természetesnyelv-feldolgozásnak csak két részterülete van? HAMIS. (Hiszen a  legfontosabb részterületei: -természetesnyelv-megértés, -természetesnyelv-generálás, gépi fordítás stb.)
 
* Foglalkozik-e a természetes nyelvek leírásával, ill. modellezéséve?(Nem,mivel
 
* Foglalkozik-e a természetes nyelvek leírásával, ill. modellezéséve?(Nem,mivel
 
* Igaz-e, hogy a kontextusfüggőség megnehezíti a természetes nyelvek mesterséges rendszerekbe történő beillesztését? (Igaz.)
 
* Igaz-e, hogy a kontextusfüggőség megnehezíti a természetes nyelvek mesterséges rendszerekbe történő beillesztését? (Igaz.)

A lap 2005. december 30., 22:59-kori változata

Angol megnevezés: Natural Languages Excise

Történeti modul

1993: A természetesnyelveket mint információhordozókat tanulmányozó tudomány. Célja olyan megvalósítható mesterséges rendszerek vizsgálata, amelyek az ember-gép kommunikáció eszközeként a természetes nyelveket használják, tehát elsősorban a –pragmatikára összpontosít: -természetes nyelvű interszférák, adatbázis-lekérdezés, -gépi fordítás, automatikus indexelés és kivonatolás, párbeszédes rendszerek stb. Nem foglalkozik viszont a természetes nyelvek leírásával, ill. modellezésével, bár az ilyen típusú kutatási eredmények is egyre jobban beépülnek rendszerébe. Két fő irányzata van. Az általános természetesnyelv-feldolgozás az emberi nyelvhasználatot próbálja modellezni a számítógépes megvalósíthatóság szempontjából, ezért elsősorban a –kognitív pszichológia módszertanát használja. Az alkalmazott természetesnyelv-feldolgozás viszont kevésbé foglalkozik a kognitív szimulációval, célkitűzése elsősorban az, hogy olyan rendszereket valósítson meg, amelyek megfelelően reagálnak a természetes nyelvű bemenetekre. A MI-kutatások fejlődésével a két irányzat egyre jobban összemosódik. A természetesnyelv-feldolgozás legfontosabb részterületei: -természetesnyelv-megértés, -természetesnyelv-generálás, gépi fordítás stb. [1]

1994: A természetesnyelv- feldolgozás a mesterségesintelligencia-kutatás egyik kutatási területe, olyan eszközök kifejlesztésére irányul . amelyek segítségével emberi (tehát nem számítógépes)nyelven kommunikálhatunk a számítógéppel. Ez a kommunikáció történhet írásban és szóban is.
Miután nyelvünkben az intelligenciánk is kifejlődik, aligha meglepő hogy a számítógéppel csak úgy értethetjük meg a mondanivalónkat, ha teljesen intelligenssé tesszük. Az MI kutatóinak, miközben a természetesnyelv-feldolgozás kérdéseivel bajlódnak, szembe kell nézniük ezzel a ténnyel, és abba is bele kell törődniük, hogy az ő életükben valószínűleg nem jön létre az igazi természetes nyelvű ember-gép-párbeszéd.
Eközben a természetesnyelv-feldolgozás továbbra is izgalmas kutatási terület marad a nyelvészet, filozófia, pszichológia és számítógép-tudomány találkozási pontján.
Ahhoz, hogy a számítógép értelmezni tudja az emberi nyelvet, a következő típusú tudásra van szükség:

  1. A mondatban szereplő szavak elfogadható sorrendjének ismerete
  2. annak ismerete, hogy az emberek hogyan használják a szavakat gondolataik kifejezésére
  3. a beszélgetés törvényeinek ismerete, ezen belül egy modell a személyiségről, attitüdjeiről, a beszélgetőpartner megértésének szintjéről
  4. A világ általános(hétköznapi)ismerete. [2]

1998:A kérdés egyben szintaxis és szemantika kapcsolatához is kötődik. A szimbólummanipulációs rendszerek tisztán szintaktikaiak; az algoritmus a szimbólumok egymásba való komputációs átalakítását és kapcsolatrendszerét határozza meg. Az interpretáció itt sem hoz megnyugtató megoldást, mivel a szemantika a gép számára megintcsak külső lesz. Ezen kívül a metamatikai reprezentáció meglehetősen szegényes nyelvet tesz lehetővé. A természetes nyelvek gazdagsága nem egykönnyen implantálható mesterséges rendszerekbe (olyan okok miatt, mint pl. a kontextusfüggőség), ez pedig megkérdőjelezi, hogy a gépi szimbólumfeldolgozás ténylegesen az emberét modellálja-e.[3]

1999: Mesterséges Intelligencia

Lévén, hogy a szakértői rendszerek “mesterséges intelligenciáknak” tekinthetőek – a teljesség igénye nélkül – néhány szóban vázolom a MI kutatási területét:

  • az ember és gép között természetes nyelven történő kommunikáció lehetőségeinek kutatása,
  • az automatikus programozás és bizonyítás kidolgozása,
  • gépi tanulás elveinek vizsgálata,
  • a képfelismerés lehetővé tétele,
  • a robotika és pl.
  • a szakértői rendszerek fejlesztése.

A valóságban az MI keretében folyó munkák tehát nem elvont célokat követnek, hanem csak azt akarják a gépekkel automatizáltan végrehajtatni, amit mi emberek nap mint nap megtenni kényszerülünk. (Pitlik, 1996)[4]

2000: Egyesek azzal érvelnek, hogy ezek a rendszerek eltávolodtak az emberi gondolkodás lényegétől és csak egyes elemeiben utánozzák azt. Szükségünk van az emberi intelligencia meghatározására. Az intelligencia probléma megoldó és meglátó képesség, kreativitás, intuíció, véletlen elemekkel átszőtt ötletszerűség az algoritmizált lépésekkel szemben heurisztikákat megvalósító, természetes nyelven kommunikáló, és a legfontosabb tudatos komplex egység. Ma már úgy vélekedünk hogy ilyen értelemben nem beszélhetünk mesterséges intelligenciáról és a közeljövőben esély sincsen rá, hogy az eddigi eszközökkel valami hasonlót is alkossunk. Tehát a Mesterséges Intelligencia ezen értelmezése megmarad a Since-Ficktion területén. Mégis ha használjuk, és használjuk ezt a fogalmat a jelen kutatásainkra akkor el kell gondolkoznunk azon mit is értsünk alatta. Ilyen formán Turing nézete ki a számítógépes Mesterséges Intelligencia kutatás úttörője volt egy gép akkor cselekszik intelligensen, ha az emberi felhasználót ¬ aki a terminálon keresztül beszél vele - meg tudja győzni arról, hogy partnere nem gép, egyszerre tekinthető kezdetlegesnek és túlságosan haladónak aszerint, hogy mit értünk mögötte tudatos gépet vagy önbecsapást.
A mesterséges intelligencia kutatásban tehát általánosan elfogadott definíció híján leginkább a tevékenységi területtel tudjuk leírni a fejlesztéseket. A mesterséges intelligencia fogalmi körében kutatott területeket általánosságban a következőképpen csoportosítanám olyan szerzők nyomán mit (P.Wagner, K.Krubel, Gábor A., Borgulya I.):

  • természetes kommunikáció ember és gép között (beszéd felismerés, megértés és generálás)
  • analitika (érzékelő és felismerő, valamint elemző, összefüggés kereső rendszerek)
  • irányítás (robotika, vezérlés/szabályozás, érzékelés, felismerés, gépi látás)
  • intelligens, szabálysorozatokra épülő program rendszerek (szimuláció, bizonyítás, új ismeret feltárás meglévő tudás bázisból, automatikus programgeneráló rendszerek, ismeret bázis építő rendszerek)
  • szakértői rendszerek[5]


2001:Napjaink elméleti nyelvészetét a Chomsky által lassan fél évszázada bevezetett (Chomsky 1957) és azóta – sokak, többek között Chomsky által is – módosított generatív grammatika valamely variánsának a használata jellemzi. E szerint a természetes nyelvek végtelen sok mondata leírható egy véges szótár és egy – szintén véges számú rekurzív szabályból álló – szabályrendszer segítségével. A szótárban azért van véges számú elem, mert mindössze a nyelv egy adott időpillanatbeli állóképét rögzíti, minthogy a Chomsky-modellben nem a nyelvi változás, hanem az egy adott időpontban a beszélő által működtetett nyelvi modell leírása a cél. Az általa egyébként performanciának nevezett terület hivatott a nyelvhasználatot kezelni, de a nyelvi képesség, azaz a nyelv „igazi” tudása, az ún. kompetencia a generatív nyelvleírás valódi tárgya. Jogosan jegyezhetjük meg, hogy az ember nyelvi képességeinek effajta felfogása elég nehezen kezelhető, ha arra gondolunk, hogy egyetlen nem ismert szó még nem jelenti az emberi információfeldolgozás végét, sőt, magát az ismeretlen értelmű szót is általában meg tudjuk nevezni. Például Petőfi magyar nyelvi képességeit senki sem kérdőjelezi meg, még akkor sem, amikor a latinos műveltségűek számára nyilvánvalóan jobban, mások számára kevésbé pontosan érthetők a Diligenter frekventáltam iskoláim egykoron, Szekundába ponált mégis sok szamár professzorom. sorok egyes részei.[6]

2004: A természetes nyelvek egyik sajátossága a rájuk jellemző karakter eloszlások és sajátos karakter szekvencia eloszlások. Például az angolban jóval gyakoribb egy nagy dokumentum korpusz esetén a *th* karakter szekvencia, mint a magyar nyelvben. Ez szemléletesen azt jelenti, hogy több olyan szó van az angol nyelvben, amely tartalmaz *th* karakterpárt. Sok nyelvnek vannak sajátos karakterei is, amelyek más nyelvek karakterkészletének nem elemei, mint például az ékezetes betűk, vagy extrém eseteket említve, az arab, kínai vagy japán nyelv karakterei. Azonban ilyen karakterek érzékelése esetén sem mondhatjuk egyértelműen, hogy az egész dokumentum pl. német nyelvű, mert előfordulhat, hogy csak egy német kifejezés vagy tulajdonnév fordul elő egy spanyol szövegben. [7]

2005: A filozófia története során akadtak olyan filozófusok, akik úgy vélték, hogy (1) a természetes nyelvek kétértelműségük és homályosságuk miatt alkalmatlanok a szabatos gondolatok megfogalmazásra (2) létrehozható és létrehozandó egy olyan mesterséges nyelv (esetleg egy természetes nyelv formalizálásával), mely már mentes ezektől a hibáktól és mely ebből adódóan a filozófia valódi nyelve (is) lehet.

A fenti állásponttal szemben sok minden felvethető:

-Miért van az, hogy ténylegesen senki sem használ ilyen nyelveket teljes filozófiai értekezések írására?

-Hogyan vezetnénk be az új nyelvet? Ha természetes nyelvek segítségével, akkor nem "fertőzi-e" meg a természetes nyelv "kétes" szemantikája a mesterséges nyelvet is?

-Nem azt mutatja-e a filozófia története, hogy a kétértelműségek mindig kiküszöbölhetőek megfelelő természetesnyelvi parafrázis segítségével? [8]

Ontológiai modul

  • "ez egy" kapcsolattípus:
  • "van neki, része a címszónak" kapcsolattípus:
    • adatbázis-lekérdezés
    • gépi fordítás
    • párbeszédes rendszerek
    • természetesnyelv-megértés
    • természetesnyelv-generálás
  • "a címszó része valaminek (a címszóval egyenrangú fogalmak)" kapcsolattípus:
    • mestertséges intelligencia alkalmazások (szakértői rendszer, mesterséges élet, természetes nyelvek kezelése, robotika)

Ellentmondások és vitatott kijelentések modulja

  • Nem találtam ellentmondást a címszó terén végzett kutatásaim során.

Szerkesztői javaslat: Lehetséges-e a természetes nyelvi szövegek (hanganyagok) automatikus keresése? Lehetséges-e emberi gondolatfolyamok (pl. politikai viták) konzisztenciájának mérése?

Definíciós modul

  • A mesterségesintelligencia-kutatás egyik kutatási területe.Az emberi nyelvhasználatot próbálja modellezni a számítógépes megvalósíthatóság szempontjából, annak érdekében, hogy a kommunikáció gördülékenyen működjön ember és gép között. Ez a kommunikáció megtörténhet szóban és írásban is.

Tesztkérdések modul

  • Igaz-e, hogy a természetesnyelv-feldolgozásnak csak két részterülete van? HAMIS. (Hiszen a legfontosabb részterületei: -természetesnyelv-megértés, -természetesnyelv-generálás, gépi fordítás stb.)
  • Foglalkozik-e a természetes nyelvek leírásával, ill. modellezéséve?(Nem,mivel
  • Igaz-e, hogy a kontextusfüggőség megnehezíti a természetes nyelvek mesterséges rendszerekbe történő beillesztését? (Igaz.)

Ajánlott irodalmak modulja

  • Jodál Endre: Mesterséges intelligencia [9]
  • Jenny Roggett - William Bains: Mesterséges intelligencia A-Z [10]
  • Lehmann Miklós: Az intelligencia kialakítása [11]
  • Prószéky Gábor: A nyelvtechnológia és a modern nyelvészet viszonyáról [12]
  • Vázsonyi Miklós: Nyelvdetekció Rejtett Markov Modell Alkalmazásával [13]
  • Simonyi András: Természetes és mesterséges nyelvek a filozófiában [14]
  • Gyenge Balázs: A mezőgazdaságban alkalmazható szakértői rendszerek, döntéstámogató rendszerek és mesterséges intelligenciák egymáshoz való viszonya, alkalmazásuk előnyei[15]
  • Kese-Nemes Áron: 1 Bevezetés[16]