Magyar Internetes Agrárinformatikai Újság No 04 HU ISSN 1419-1652

<SZÖVEGES NAVIGÁCIÓ> <NAVIGATION WITHOUT GRAPHICS>

<IMPRESSZUM> <AKTUÁLIS> <ARCHÍVUM> <HAZAI TÉMÁK>
<NEMZETKÖZI ROVAT> <SZOLGÁLTATÁSOK>


Mesterséges intelligencia kutatások hasznosítása az elorejelzés készítésében
Mesterséges intelligencia kutatások hasznosítása az előrejelzés készítésében

Pásztor Márta Zsuzsanna
egyetemi tanársegéd

Gödöllői Agrártudományi Egyetem
Gazdaság- és Társadalomtudományi Kar
Gazdasági Informatika Tanszék

Tartalomjegyzék

Tartalomjegyzék *

  1. Bevezetés *

2. A Mesterséges intelligencia jelentősége *

3. Függvény- és Mintázatgenerátor *

3.1. Az eljáráscsalád módszertana *

3.2. Módszeralkalmazási esettanulmány mezőgazdasági termékek termelésének és kereskedelmének adatbázisán *

3.3. Alkalmazás a paradicsom várható termésmennyiségének és öntözési szükségletének előrejelzésében *

3.4. Alkalmazási esettanulmány az árutojás árának prognózisára *

4. (Trianguláris) WAM módszerrel készített előrejelzések * 4.1. A WAM eljárás technikája *

4.2. Alkalmazás a tenyésztett és a vadon élő állatállományok létszámalakulására *

4.3. Olajipari termékek árelőrejelzése WAM módszerrel *

5. Hasonlósági függvények alkalmazása (CBR és AAA) * 5.1. Módszertan *

5.1. Módszeralkalmazás az értékpapírpiac árainak előrejelzésére *

5.2. Portfólió összeállításának támogatása CBR módszerrel *

6. Összegzés *

Irodalom *

1. Bevezetés A mesterséges intelligencia (MI) módszerek többféle típusát fejlesztettük és teszteltük a Gödöllői Agrártudományi Egyetem Gazdaság- és Társadalomtudományi Karának Gazdasági Informatika Tanszékén az elmúlt években.

A vizsgálatok során az adott MI módszer előrejelző képességét hasonlítottuk össze más, hagyományosnak számító matematikai-statisztikai módszerekkel, illetve bizonyos esetben a szakértői előrejelzéseken alapuló prognózisokkal. A vizsgált módszerek sokfélesége, és az összehasonlításra általánosan alkalmazható elvek hiánya miatt, az előrejelző képességek mérésénél általában az képezte az összehasonlítás alapját, hogy az összes lehetséges esetben hány alkalommal jelzi helyesen a változás irányát az adott módszer.

E kutatásokból összeállított esettanulmányok segítségével szeretnék rámutatni a mesterséges intelligencia kutatásokban rejlő alkalmazási lehetőségekre az előrejelzések készítésében.

2. A Mesterséges intelligencia jelentősége A számítógép megjelenése óta a kutatókat mindig is foglalkoztatta a GPS (General Problem Solver, az általános érvényű problémamegoldás) gondolata. Néhány eufórikus és szkeptikus fázis után mára letisztulni és kikristályosodni látszik egy újszerű világkép (a mesterséges intelligencia, artificial intelligence), melynek jelen tanulmány szempontjából tekintett lényege a klasszikus statisztikai-matematika önkorlátozó jellegének feloldása révén olyan új ismeretszerzési és ismeretábrázolási formák kidolgozása, melyek segítségével régóta ismert feladatok új megvilágításba kerülhetnek.

Mesterséges intelligencia kutatásnak nevezhető – a legegyszerűbb megközelítés szerint – mindaz, ami a számítógépet képessé teszi arra, amit eddig csak az ember tudott (pl. kép-, hangfelismerés, sakkjáték, elemzés, stb.). A definícióból adódóan a mesterséges intelligencia kutatásnak számtalan területe létezik, ezek között az egyik a problémák konkrét tartalmi vonatkozásaitól mentes automatikus ismeretszerzés (context free automatical knowledge acquisition), ezen belül is számtalan látszólag egymástól nagyban különböző eljáráscsalád (technika) alakult ki.

A “context free” jellegnek és a módszertani karakternek megfelelően az alkalmazási területek szinte felölelik a valóság teljességét. Ezen belül azonban az egyik legperspektivikusabb feladatcsoportot a prognosztikai feladatok jelentik.

A prognosztika alapkérdései nagyon egyszerűek: Hogyan és milyen pontossággal lehet a valóságról eddig rendelkezésre álló tapasztalatok (objektum-attribútum-idő-érték-tömb) alapján tetszőleges objektum tetszőleges attribútumának tetszőleges időbeli értékét (várható intervallumát, a változás irányát) levezetni?

A megoldás lehetőségének elvi alapját a “megzabolázott” kombinatorikai robbanás jelenti. Más megközelítésben ez úgy fogalmazható meg, hogy adott keresési cél esetén a lehetséges megoldások (függvények) halmazának hatékony szűkítésére létrejött technikák alapján egy relatíve gyors és fokozatos közeledés biztosítható a megcélzott összefüggésformák felé. Így a számítógép segítségével olyan – a komplex jelenségeket is jól közelítő – összefüggések is feltárhatók, melyek létezése az ember előtt esetleg örökre rejtve maradt volna (pl. időjárás-előrejelzés, árprognózisok).

A józan kritika oldaláról közelítve a mesterséges intelligenciák adta lehetőséghez el kell mondani, hogy a hatékony technikák elméleti korlátja pontosan az egyetlen kiindulási feltételben keresendő, vagyis abban, hogy senki és soha nem tud olyan célfüggvényt megfogalmazni, mely magától értetődően biztosítja azt, hogy a múltbeli adatokra vonatkozó (ex post) modelleredmények a jövőben is legalább ilyen szinten igazak legyenek. Vagyis nem helyálló a hétköznapi logikai megközelítés, miszerint ami a múltban elég sokszor igaz volt, az egy törvényszerűség, tehát a jövőben is általában igaz lesz.

3. Függvény- és Mintázatgenerátor 3.1. Az eljáráscsalád módszertana A Függvény- és Mintázatgenerátor két, hasonló elven működő, legjobban mesterséges neuronális hálókhoz (MNH) hasonlítható eljárás. Legfontosabb tulajdonságuk, hogy nem parametrizált függvénykapcsolatokkal dolgoznak, hanem véletlenszerűen választott műveletekkel állítják elő a függvényt. Működésük során a (1. ábra) meglévő adatokat általában egy nagyobb tanuló, és egy kisebb tesztadat részre osztjuk a tanuló – input – adatokat transzformálva hipotézisfüggvényt hoz létre (összefüggés keresés). A tanulásban elért függvény illeszkedésének helyességét a tesztadatokon vizsgáljuk.

1. ábra
A Függvénygenerátor működési vázlata

A függvény adatsorhoz való optimális illeszkedésének a futtatási idő, illetve a felhasználó (alkalmazó) igényei szabnak határt. Általánosságban megállapítható, hogy amennyiben a tanulás során a legteljesebb illeszkedésre törekszünk életbe lép a “túltanulás” jelensége, vagyis a tanuló adatokra “tökéletesen” illeszkedő függvény nagyon gyengén közelíti a tesztadatok alakulását. Fontos tehát megtalálni azt a függvényt, amikor a két adatbázist megközelítően ugyanolyan pontossággal írja le. Az előrejelzések során ez biztosítja a legeredményesebb (a valóságot legjobban közelítő) prognózist.

A függvénygenerátor az eljárás alapját képezi (Pitlik, 1994/a), a mintázatgenerátor a függvénygenerátor outputadataira épülve, azok statisztikai jellegű kiértékelésével javíthatja az előrejelzés helyességét (Pitlik, 1994/b).

3.2. Módszeralkalmazási esettanulmány mezőgazdasági termékek termelésének és kereskedelmének adatbázisán A Függvény- és Mintázatgenerátor előrejelzési képességeit hasonlítottam össze más statisztikai módszerekkel – Markov lánc, Exponenciális simítás, Mozgóátlagok módszere, “Egyszerű trend”, Analitikus trendszámítás – előállítható (Pásztor, 1995), illetve szakértők által becsült (Pásztor, 1997/a) előrejelzésekkel.

A vizsgálatokat minden esetben a Food and Agricultural Organization (FAO) éves (1981-1991) jelentései alapján a búza-, kukorica-, baromfi-, szarvasmarha termelés, export és import – a világ összes, és kategóriánként vezető tíz ország – adatainak felhasználásával végeztem. Az adatok nagy részét a tanulási részben használtam, két év adatai szerepelnek a tesztben.

Az előrejelzésben a jövendőbeli változás irányát (növekedés, illetve csökkenés) a MI módszerek a többi eljáráshoz viszonyítva jóval nagyobb arányban “találták el”, a mintázatgenerátor átlagosan 80%-os eredményt produkált, egyes problématípusoknál meghaladta a 90%-ot, a legjobb statisztikai módszer, az analitikus trendszámítás segítségével elért maximális találati arány 62%.

A szakértői becslések átlaga jóval alatta maradt a legegyszerűbb logikai módszerrel következtethető releváns szintnek, és csak egyetlen ember érte el a mintázatgenerátor által felállított előrejelzési szintet (Pásztor, 1997/b).

3.3. Alkalmazás a paradicsom várható termésmennyiségének és öntözési szükségletének előrejelzésében A vizsgálatok során Popovics (1995) 20 év időjárási (napi minimum, maximum hőmérséklet és csapadékadatok) és évenként 4 kezelés (azaz 80 különböző vízellátottságú állomány) termésének adataiból álló adatbázison különböző cél- és szükségszerű összevonások után a függvénygenerátorral végzett előrejelzési kísérleteket. A kísérletben az adatok kétharmadát a tanulásban használta fel, az utolsó harmad képezte a tesztadatokat.

A prognózisok két területen megfigyelhető változások előrejelzésére készültek. Az első a paradicsom várható termésmennyiségének becslésére vonatkozott, erre a célra a függvénygenerátor nem bizonyult alkalmasnak, mivel a termésmennyiség évenként nagy ingadozást mutat, de többnyire egy átlag körül mozog, a tanulási algoritmus nem kezeli a szabálytalan időközönként kiugró értékeket (a tanulásban nulla súllyal kezeli, azaz figyelmen kívül hagyja).

A másik vizsgálati terület az öntözési igény előrejelzése, ahol az adott év alapján a következő év vízpótlási igényének megfelelő (szükséges lesz-e, vagy sem) prognózisa volt a cél. A tanulási folyamatban 92%-os eredményt hozott a függvénygenerátor, a tesztben minden esetet eltalált.

3.4. Alkalmazási esettanulmány az árutojás árának prognózisára Az árutojás árának prognózisa során Szabó (1995) egy tipikus piaci termék értékmérőjének előrejelzését kísérelte meg. A rendelkezésre álló adatbázis 196 munkanap során összegyűjtött árutojás felhozatal mennyisége, piaci minimum, maximum, és átlagár adatokat tartalmazott. A tanuláshoz-teszthez felezte az adatbázist, az első fél év adatain tanult a függvénygenerátor, a másodikon tesztelt.

Kérdésként az merült fel a vizsgálat során, hogy az árutojás ára nő, vagy csökken az utolsó ismert áralakulás utáni negyedik kereskedési napon. A több mint 80%-os tanulási eredmény után a tesztben 65%-os biztonsággal klasszifikálhatónak bizonyult a függvénygenerátor alkalmazásával. A felhozott mennyiség tekintetében végzett vizsgálat ennél is jobb, 70%-os biztonsággal jelezte előre, hogy növekszik-e a piacra kerülő termék mennyisége.

4. (Trianguláris) WAM módszerrel készített előrejelzések 4.1. A WAM eljárás technikája A trianguláris WAM (Weight-Activity-Modell = Súlyok és aktivitások) módszer lényege, hogy az alapadatok transzformációjával létrehozunk egy olyan idősorosan oszloponként egy helyi értékkel elcsúsztatott mátrixot, amely az egymás után időben következő adatok egymáshoz viszonyított növekedését (1), illetve csökkenését (0) tükrözi. Ezekhez véletlenszerűen generálunk egy számot, és egy műveleti jelet, majd e három érték (0/1, a hozzá tartozó szám és műveleti jel) összefűzésével újabb mátrixot kapunk. Ennek a mátrixnak a visszanyúlási mélységnek megfelelő sor és oszlopértékeinek összegzésével kapjuk a változás irányát jelző értéket, ha összehasonlítjuk a véletlenszerűen generált küszöbértékkel, mely a mátrix minimum és maximumeleme között helyezkedik el (0/1), ha az első mátrixban található értékkel megegyezik az adat, akkor jó az előrejelzés. 4.2. Alkalmazás a tenyésztett és a vadon élő állatállományok létszámalakulására A trianguláris WAM eljárással készített előrejelzéseket Farkas (1996), és összehasonlította más algoritmikus módszerekkel készített előrejelzésekkel (Lineáris trendszámítás, Hárompontos mozgóátlagolás, Exponenciális simítás). Adatbázisként a hazánkban tenyésztett legfontosabb állatfajok – szarvasmarha, sertés, ló, juh, tyúk, liba, kacsa, pulyka –, valamint a vadállomány – szarvas, dámvad, őz, muflon, vaddisznó, mezei nyúl, fácán, fogoly – állományi létszámának alakulását vette 1960-1994 között.

A trianguláris WAM vizsgálatok az állatállományok növekedésének, illetve csökkenésének előrejelzésére vonatkoztak, tehát a változás előjele volt a kérdés.

A vizsgálat 1-11 évig terjedő visszanyúlásra – heurisztikus mutatószám képzés – készült el, egy éves előrejelzésre a különböző visszanyúlásokra vonatkoztatott legjobb találati arányok (a legrosszabb találatok inverzét is számítva) 76-97% között mozognak, átlagosan több mint 82%-os aránnyal. Két és három évre előre történő prognózisnál az átlag valamennyi állatfajt figyelembe véve 78-97% között ingadozik, átlagban több mint 85%. Minden állatfaj legjobb előrejelzési eredményeit figyelembe véve átlagosan 87%-os találati arány érhető el. Ez átlagosan 12%-al haladja meg a más vizsgált módszerekkel elérhető eredményt.

4.3. Olajipari termékek árelőrejelzése WAM módszerrel Az 1988 januárja és 1996. márciusa között kialakult mediterrán térségi USD/t-ben kifejezett jegyzések havi átlagárait vette alapul Monori (1996) hat kőolajipari termék (szuperbenzin, gázolaj, kerozin, vegyipari benzin, 1%-os és 3,5%-os fűtőolaj) és a Kőolaj Brent esetében, előrejelzési vizsgálatának adatbázisához.

A WAM módszer az egyszerű döntési algoritmusoknál (véletlenszerű találgatás, illetve az árak monoton növekedését, vagy csökkenését feltételezve), valamint a lineáris trendszámításnál is relevánsan jobb eredményt produkált, az össze feldolgozott eset mintegy kétharmad részében “eltalálva” a különböző termékek árváltozásának irányát.

5. Hasonlósági függvények alkalmazása (CBR és AAA) 5.1. Módszertan Az eset alapú következtetés (CBR = Case Based Reasoning) az emberi gondolkodás algoritmikus közelítésével működik, a múltbéli események (esetgyűjtemény) között keres olyan jelenséget, amely hasonlít a jelenbeliekhez, és a múltban hasonló után következő eseménye(k) – a hasonlóság alapján megfelelően transzformálva – képezi(k) az előrejelzési értéke(ke)t. Az adatptív autonóm ágensek (adaptív döntési automaták, AAA) a hasonlóság gondolatvilágából kiindulva müködnek, de futás közben a jelen események folyamatos feldolgozásra kerülnek (bővítve az esetgyűjteményt), és a hasonlóság dinamikus újraértelmezésre kerül. Így a jelenben zajló események folyamatosan befolyásolják az előrejelzést. 5.1. Módszeralkalmazás az értékpapírpiac árainak előrejelzésére A módszer kipróbálására az értékpapírpiac árainak előrejelzése során került sor. A CBR módszer értékpapírpiaci alkalmazásának elméleti alapjait Heves (1997) írta le, a működő autonóm adaptív ágens alkalmazások elkészítése Bunkóczi (1998) munkája.

A vizsgálat alapjául a Budapesti Értéktőzsde (BÉT) 46 értékpapírjának 1996-97 évi árfolyam, és forgalom adatai szolgáltak.

A döntési automaták által az adott adatbázison elért eredmények arra mutatnak, hogy az egyéb módszerekhez képest az előrejelzési képesség nem is javul számottevően, a valós adatokhoz képest kevésbé szóródnak a CBR módszerrel számított értékek. A legjobb automata által adott prognózist további feldolgozással (szakértői rendszerrel kombinált CBR) jó előrejelzési eredményt produkáló portfóliók állíthatók össze.

5.2. Portfólió összeállításának támogatása CBR módszerrel Hosszabb időszakra vonatkozó portfóliók összeállítására készített eljárás (Pitlik, 1998) két részből áll, az első hagyományos statisztikai módszerekkel hozam szerint rangsorolja a részvényeket eltérő befektetési időszakokra. A második lépésben a legjobbnak bizonyult részvények részhalmazán 2-6 hétre vonatkozó előrejelzés készül, a vételre javasolt, illetve nem javasolt részvényeket eltérő színekkel megjelölve. A vizsgálat során 430 kereskedelmi nap adatai álltak rendelkezésre a tanuláshoz, és 34 nap a teszteléshez. A becslések két hét után ellenőrizve 79%-os beválást mutattak 19 részvényre vonatkoztatva. Az egyes részvények megítélése alapján a potenciális befektető egyéni kockázatvállalásának megfelelően választhat közöttük. Ez az eljárás képezi a magját a jelenleg tesztelés alatt álló Internet alapú tőzsdei szolgáltatásnak (STOCKNET, by EcoControl&Pitlik), mely lehetőséget teremt a felhasználónak ara, hogy a kliens oldalon telepített program segítségével a szerveroldali adatbázisokból (FORNAX, REUTERS) a számára releváns adatok leválogatássa és az optimalizáló előrejelző rutin kezdőparamétereinek beállítsa (visszanyúlási mélység, előrejelzendő intervallum, tesztelés módja), majd a szerver által elvégzett előrejelzést lokálisan értelmezze. Az gépi elemzés eredménye az utolsó ismert árfolyamadathoz illesztett adott hosszúságú görbe. EzEz az

Összegzés

A bemutatott esettanulmányok, a különböző adatbázisokon elvégzett más-más mesterséges intelligencia módszerekkel végzett előrejelzések egyéb módszerekhez viszonyított eredményessége igazolja a módszer hasznosságát. A prognosztizált értékek azonban csak akkor telnek meg értelemmel, ha a különböző szintű döntéshozók felhasználják ezeket munkájukban, azaz bíznak az előrejelzés pontosságában, és ez alapján döntenek.

A módszertannal támogatott előrejelzések akkor jelenthetnek valódi konkurenciát az intuitív döntéshozóknak, ha ők kénytelenek szembesülni az általuk vélt jövőkép megvalósulásának helyességével (Pitlik, 1996).

Ideális jövőképnek tehát az tekinthető, ha a szakértői intuíciót, ösztönös tanulóképességet ötvözzük a számítógépes programok precizitásával, nagy adatfeldolgozó képességével és gyorsaságával (Pásztor, 1997/a; Pitlik, 1998).

Irodalom

Bunkóczi, L. (1998): Hagyományos és mesterséges intelligencia alapú tőzsdei prognózisok, valamint erre épülő döntési automaták kísérleti fejlesztése, diplomadolgozat, GATE, Gödöllő

Heves, R. (1997): Tőzsdei prognózisok CBR-technikával, diplomadolgozat, GATE, Gödöllő

Farkas, M. (1996): Algoritmikus előrejelzések megbízhatósága és alkalmazása mezőgazdaságban, TDK dolgozat, GATE, Gödöllő

Monori, E. (1996): Információs logisztikai esettanulmány a kombinatorikai prognosztika módszertanának bázisán, logisztikai szakdolgozat, GATE, Gödöllő

Pásztor, M. Zs. (1995): Prognosztikai módszerek összehasonlító vizsgálata és alkalmazásuk a marketingben, OTDK dolgozat, GATE, Gödöllő

Pásztor, M. Zs. (1997/a): Intuitív és algoritmikus prognosztikai módszerek összehasonlító elemzése, OTDK dolgozat, GATE, Gödöllő

Pásztor, M. Zs. (1997/b): Emberi döntési minták és gépi algoritmusok, “Vállalati környezet és alkalmazkodás az élelmiszertermelésben” Tudományos Konferencia, Gödöllő, 1997. október 9-10.

Pitlik, L. (1994/a): Új módszertani lehetőség a döntéselőkészítésben, Gazdálkodás 94/2

Pitlik, L. (1994/b): Pattern-Generator, GT Kari Tudományos Napok, Poszter, GATE, Gödöllő

Pitlik, L. (1994/c): Rendhagyó gondolatok az előrejelzés módszertanáról, Ipar-Gazdaság, 94/11

Pitlik, L. (1996): Új technikák az automatikus ismeretszerzés gyakorlatához, V. Agrárökonómiai Tudományos Napok, Gyöngyös, 1996. március 26-27.

Pitlik, L. (1998): Hasonlósági függvények elemzési célokra, VI. Agrárökonómiai Tudományos Napok, Gyöngyös, 1998. március 24-25.

Popovics, A. (1995): Az öntözés várható hatása a paradicsom termésmennyiségére, előrejelzések mesterséges neuronális hálózat segítségéve, diplomadolgozat, GATE, Gödöllő

Szabó, Zs. (1995): Az árutojás árának prognózisa, TDK dolgozat, GATE, Gödöllő


DOC version


Az utolsó módosítás: 2005.05.29.
© miau