A MIAÚ szerver-statisztikáinak értékelése
Pitlik László, GATE

Mint köztudott, egy szervert érõ hívások esetén regisztrálható(k) többek között a hívógép neve / IP címe, a hívás ideje, s a hívás célja, vagyis a meghívott oldal, vagy szolgáltatás adatai, ezen belül is pl. keresés jellemzõi, s fõleg a keresett szavak, szótöredékek.

Az említett adatok kiértékelésébõl a következõ, fontosabb kérdésekre kaphatunk választ:

  1. Hogyan változik egy szolgáltatás forgalma, nézettsége?
  2. Kik érdeklõdnek egy szolgáltatás iránt? (mérték, arány, tartalom)
  3. Milyen a keresõgépek, a proxy-szerverek és közvetlen hívások aránya?
  4. Mely országokból érkezik hívás? (mérték, arány, tartalom)
  5. Mely napokon nagyobb az aktivitás? (heti ritmus, ünnepnapok hatása, dinamikája)
  6. Hogyan néz ki a napon belüli aktivitás? (munkaidõ és éjszaka aránya, dinamikája)
  7. Mely HTML-oldalak a legnépszerûbbek?
  8. Letöltésre kerülnek-e a nem HTML-dokumentumok (DOC, RTF, XLS)?
  9. A grafikus vagy a szöveges navigációt részesítik-e a felhasználók elõnyben?
  10. Keresettek-e az idegen nyelvû dokumentumok?
  11. Milyen szavakhoz/szótöredékekhez, kombinációkhoz várnak találatokat a felhasználók?
Mielõtt a válaszokra kerülne sor, fontos tudni, hogy az ún. LOG-file-ok nem csak a külsõ hívások adatait, hanem az üzemeltetõk, a fejlesztõk/tesztelõk saját, belsõ forgalmát is tükrözik, melyek természetesen az értékelés elõtt kiszûrendõk. Így történik ez a MIAÚ statisztikáinak készítésekor is. Az elõzetes szûrések biztosítják a saját hatáskörben végzett hívások leválasztása mellett a zömmel háttérként és logo-ként használt grafikus file-ok (jpg, gif) kizárását is. Már itt érdemes utalni rá, hogy a grafikus vs. szöveges navigáció arányának kiértékelését a háttér és logo-file-ok leválogatása nem zavarja, hiszen a menük HTML-dokumentumként kerülnek meghívásra. (Az alábbi válaszok háttéradatainak kiszámításához egyrészt a webalizer program által kidolgozott statisztikák, másrészt saját szûrések szolgáltak.)

Most pedig a feltett kérdések sorrendjében következzenek a válaszok:

1. Hogyan változik egy szolgáltatás forgalma, nézettsége?

Monthly Statistics
1. ábra: Havi statisztikák grafikusan a MIAÚ külsõ hívásaira vonatkozóan
1998. szeptembre és 1999. február 22-e között (forrás: webalizer)


 
Summary by Month / Havi forgalom 
Month / Hónap Daily Avg
Napi átlagok
Monthly Totals / Havi összeg
Hits Files Sites Kbytes Files Hits
February 99 356 335 671 156903 7386 7840
January 99 240 222 609 96208 6904 7443
December 98 165 146 398 50588 4532 5129
November 98 155 121 337 65349 3650 4660
October 98 33 28 116 14492 882 1026
September 98 17 15 41 1728 349 394
Totals 2172 385268 23703 26492
1. táblázat: Havi statisztikák táblázatosan a MIAÚ külsõ hívásaira vonatkozóan
(forrás: webalizer)

A MIAÚ 1998. szeptemberében indult, s mint jól látható - a februári törthónap ellenére is - folyamatosan nõ olvasottsága/látogatottsága. A szeptemberi törthónap és az arányos októberi növekedés után, valamint a novemberi hirtelen megugrást követõen decemberben - részben az ünnepek miatt, s részben a decemberre kiérlelt szolgáltatási formák felvevõ piacának telítõdése miatt is - megtorpanás észlelhetõ. A januárban bekövetkezett koncepcióváltás (pl. egyszerûsödõ navigáció) ismét új lendületet adott a felhasználásnak, mely februárban - feltehetõen a kérdõíves felhívásokra is visszavezethetõen - nem mutat még telítõdési jeleket.
A márciusra várható prognózis szerint az egyenletesen növekvõ trend a jelenlegi koncepció mellett tartható, hiszen a Giessen-Gödöllõ egyetemi szimpózium újszerû, tartalmas szolgáltatásokkal áll elõ a folyamatosan aktualizált program általános reklámerejére támaszkodva, ill. a MIAÚ bevonásra kerül az oktatásba és a tananyagok disztribúciójába.
Általánosságban kijelenthetõ az elmúlt néhány hónap tapasztalatai alapján, hogy dinamikus növekedés csak akkor biztosítható, ha a tartalmi szolgáltatás spektruma, s ezáltal a potenciális célcsoport mérete bõvül. Ellenkezõ esetben a telítõdés jelei elkerülhetetlenek. A bõvülés hátterében két fontos erõtér tapintható ki:

2. Kik érdeklõdnek egy szolgáltatás iránt?
Erre a kérdésre pontos választ a log-file-ok alapján csak nehézkesen, ill. csak nehezen értelmezhetõen lehet adni (pl. a nagy szolgáltatók és a proxy-szerverek sok mindent elfedõ hatása miatt). Azt azonban ki lehet jelenteni, hogy az ars virtualica-ban kitûzött cél elérését, miszerint a szakmai közönséghez szeretnénk szólni, az egyetemek és kapcsolódó agrárintézmények beazonosítása alapján meg lehet erõsíteni.

3. Milyen a keresõgépek, a proxy-szerverek és közvetlen hívások aránya?
A MIAÚ-ra vonatkozó hívások elemzett dokumentumának mérete 2,6 MB volt. A nagy, személytelen hívások (pl. proxy, vizsla, jumper, imagelock, neptunus, search.com 193.225.205.108, cache) leválogatása után 1,5 MB állomány maradt fenn, azaz - további finomításokat alapul véve -  kb. a hívások fele tekinthetõ személyes, közvetlen megkeresésnek.

4. Mely országokból érkezik hívás?
A MIAÚ-t szeptember óta 28 országból keresték meg (Australia, Austria, Belgium, Brazil, Bulgaria, Canada, Denmark, Finland, France, Germany, Hungary, Italy, Japan, Lebanon, Netherlands, Network, Non-Profit Organization, Oldstyle Arpanet(arpa), Poland, Romania, SlovakRepublic, Sweden, Switzerland, Ukraine, United Kingdom, Unresolved/Unknown, USCommercial, Yugoslavia). A forgalom (files) magyarországi aránya havi bontásban az alábbiak szerint alakult:
 
1998 szeptember
1998 október
1998 november
1998 december
1999 január
1999 február
70.77%
55.67%
63.95%
54.06%
28.74%
39.45%

2. táblázat: A magyarországi forgalom (files) aránya havonta (forrás: webalizer)

Az apróbb ingadozások ellenére elmondható, hogy a hazai felhasználás trendje csökkenõ. Ennek okát két fõ tényezõre lehet visszavezetni:

5. Mely napokon nagyobb az aktivitás?
Az aktivitás napi dinamikája kb. heti ritmust mutat, kb. hét közepi csúcsokkal. Ennek a karakterisztikus mintázatnak oka lehet pl. 6. Hogyan néz ki a napon belüli aktivitás?
 
Hourly statisticsHourly statisticsHourly statistics
1998. szeptember         -         1998. október         -         1998. november
Hourly statisticsHourly statisticsHourly statistics
1998. december         -         1999. január         -         1999. február
2. ábra: Napon belüli forgalom alakulása (Forrás: webalizer)

A napon belüli forgalom alakulására egyértelmûen jellemzõ egy ebéd utáni csúcs, ill. a hajnali minimum. A napon belüli és a hónapon belüli ritmus jól köthetõ a munkahelyi böngészéshez, vagyis az aktív, célorientált tájékozódáshoz. Feltételezhetõen a MIAÚ potenciális olvasóinak zöme a munkahelyi Internet hálózatot használja, szemben az éjszakai forgalmat feltételezõ modemes kapcsolattal. A közvetlenül modemként beazonosítható hívások aránya marginális (2.6 MB <--> 4KB). Meg kell jegyezni, hogy a keresõgépek a kevésbé terhelt éjszakai órákat használják fel az indexálás elvégzésére.

7. Mely HTML-oldalak a legnépszerûbbek?
Minthogy számos HTML oldal -  köztük sok navigációt segítõ - került kidolgozásra, így klasszikus top-lista nehezen készíthetõ. Elmondható azonban, hogy az adott hónapra jellemzõ tartalmi újdonságok az adott hónaptól kezdõdõen folyamatosan keresettek (pl. tematikus számok, vezérlõpult, remete, tartalomjegyzékek, keresés). Értelemszerûen nagy forgalmat bonyolítanak, de csak egy-egy hónapban/idõszakban az akciókhoz kötõdõ oldalak, (pl. kérdõív, szimpózum-program, tdk) is.

8. Letöltésre kerülnek-e a nem HTML-dokumentumok?
A nem HTML-dokumentumok (DOC, RTF, XLS, PPT, ZIP) szerepe nem más, mint a nyomtatás, a továbbfelhasználás megkönnyítése. A szûréskor tapasztalt arány 150 KB a 2,6 MB-hoz ugyan marginálisnak tûnik, de lényegesen kedvezõbb a kép, ha az összes bejegyzésbõl levonjuk a keresõgépek forgalmát (kb. 1 MB), a navigációs dokumentumok arányát (kb. további 600 KB), s a fennmaradó 1000 KB állítjuk szembe a letöltése 15 KB-s értékével.

9. A grafikus vagy a szöveges navigációt részesítik-e a felhasználók elõnyben?
A grafikus navigáció a fõmenü és az aládefiniált 6 almenü miatt gyakorlatilag min. 7 oldalt érint (nem beszélve az oda-vissza ugrások forgalmáról), szemben a szöveges navigáció egyetlen központi oldalával. Ezért a text-grafika szûrés arányaként kijött 120KB:400KB arány min. 7*120:400-ként értelmezendõ, azaz a szöveges navigáció kétszer-háromszor népszerûbb, mint a grafikus.

10. Keresettek-e az idegen nyelvû dokumentumok?
Az idegen nyelvû dokumentumokra vonatkozó hívások beazonosítása automatikusan nem megoldott, azonban a file-nevekben használt GER (German) és ENG (English) utalások alapján 60 KB találat figyelhetõ meg, amely ugyan nem elhanyagolható, hiszen - ez csak kb. fele lehet a teljes idegen nyelvû forgalomnak, azaz -  arányos a tényleges idegen nyelvû tartalommal (vö. 1000 KB-nyi kalkulált, tartalomorientált hívás),  de ezen adat alapján valószínûsíthetõ, hogy a külföldi hívások jórésze is magyarul tudóktól érkezik.

11. Milyen szavakhoz/szótöredékekhez, kombinációkhoz várnak találatokat a felhasználók?
A szerver keresõszolgáltatását nem elhanyagolható arányban (180 KB) vették igénybe a felhasználók. A keresett kifejezések zöme egy teljes (szak)szóra irányult, de néhány esetben megfigyelhetõ volt a logikai kifejezések használata is. A keresett kifejezéseket csoportosítva az alábbi kategóriák alakíthatók ki:

Összefoglalás

1. Általános értékelés

A MIAÚ eddigi tapasztalatai azt mutatják, hogy az Internetes kommunikáció továbbfejlõdése elkerülhetetlen. Tartalmas és színvonalas szolgáltatások azonban csak szerkesztett fórumokon, relatíve nagy emberi erõforrásfelhasználással valósíthatók meg. A tartalomszolgáltatás alapfeltétele egyrészt az informálni akaró közegek jelenléte (ami ma még nem tipikus), másrészt az állandó piacfelmérés (kérdõívek, log-file elemzések). A hirdetések, katalógusok mellett, melyek jól mûködtethetõk piaci alapokon, szükséges lenne, hogy a vállalkozások/hivatalok egyre nagyobb számban mutatkozzanak meg az Interneten referenciaértékû anyagokkal.

2. Szaktanácsadás

A szaktanácsadás oldaláról nézve a MIAÚ mûködését, világossá válik, hogy a hivatkozásgyûjtemények önmagukban nem jelenthetik egy információs rendszer magját, még akkor sem, ha adatbázisok és keresési algortimusok támogatják a továbblépés hasznos irányainak gyors feltárását. A tartalomszolgáltatás másik nagy blokkja a cikkek, tanulmányok elemzések megjelenítése, mely a klasszikus hírügynökségi tevékenységhez hasonlít, s ezért nagyon drága, ill. számos copyright problémával terhelt. A szöveges híranyagokban való eligazodás ráadásul nehézkes (letöltés, nyomtatás, olvasás). Ezért lenne ajánlatos a meglévõ tudás szakértõi rendszerek formájában való preparálása, vagyis annak felkínálása, hogy adott kérdés kapcsán a gép (szerver) elõre megfogalmazott háttérkérdések és válaszlehetõségek alapján kiértékeli a felhasználó helyzetét, s a választ www-n vagy e-mail-en keresztül juttatja vissza.

Gödöllõ, 1999. március 1.