Lexicography on Internet


This is the HTML version of my article published in NeT, Internet Magazine, 1997;13:51-3.

Also available at URL: http://www.net.hr/net_13/leksikografija.html


Leksikografija na Internetu

Pise: Dr.sc. Zdenko Franic
franic@imi.hr

Najprimitivniji oblici leksikografskog rada na koje nailazimo od antike do današnjih vremena jesu popisi riječi nekog stranog jezika koje su iz praktičnih razloga ili naprosto iz kurioziteta sastavljali trgovci, hodočasnici ili putnici.

Od najstarijih rječnika (pisanih klinastim pismom na glinenim pločicama u Ninivi), aleksandrijske knjižnice, naših Fausta Vrančića i Belostenca (Gazophylacium) do Champolliona i kamena iz Rosete (http://tqd.advanced.org/3011/egypt1g.htm) do suvremenih lingvista, ljudi neumorno sakupljaju i objašnjavaju riječi. Dvadeseto stoljeće zapečatilo je (to i vrapci na grani već pjevaju!) prevlast engleskog jezika u znanosti i tehnici. Tako više nitko ne zna kolike milijune riječi engleski jezik zapravo ima. Procjenjuje se da ima npr. preko 750000 naziva samo za različite insekte. Nove su se riječi stvarale tolikom brzinom da je popratna logistika (rječnici) to jedva mogla slijediti. I onda se pojavio Internet (vrapci!), čiji su hiperlinkovi postali početna točka gdje svaki ozbiljniji istraživač, analitičar, znanstvenik, obavještajac... može gotovo trenutno dobiti informacije o doslovno svakom predmetu. Potrebno je samo razraditi strategiju pretraživanja, upoznati se s osnovama Booleove algebre, te u Bookmark pribilježiti URL-ove alata za pretraživanje (search engines) i dobrih on-line rječnika. Kao i njihova papirnata braća, rječnici se na Internetu dijele po načinu kako su izrađeni, jezičnom području koji obuhvaćaju, te svrsi kojoj su namijenjeni. To su jednojezični rječnici (etimologijski, povijesni, književni, sinonimni, sinonimno-antonimni itd.) U ovoj su grupi naročito interesantni enciklopedijski rječnici (tj. leksikoni), te stručni rječnici koji ograničavaju izbor i tumačenje riječi na područje neke teorijske ili praktične svrhe (medicina, filozofija, tehnika, poljoprivreda, pomorstvo itd.)

Enciklopedije
Enciklopedije stoga nisu ništa drugo nego rječnici pretežno predmetno informativne namjene, a obuhvaćaju osobe, zemljopisna imena te znanstveno stručne termine. Pristup poznatijim enciklopedijama (kao Britannica, Encyclopedia Americana, Grolier Multimedia Encyclopedia, Compton's Interactive Encyclopedia, Microsoft Encarta97 Encyclopedia, McGraw-Hill Multimedia Encyclopedia itd.), preko Interneta se uglavnom plaća, te se ovakve (većinom multimedijske) enciklopedije najčešće prodaju na CD ROM-ovima. Cijene se kreću od pedesetak pa do nekoliko tisuća dolara. No, i cijena je proporcionalna kakvoći. Srećom postoji i Free Internet Encyclopedia na http://clever.net/cam/encyclopedia.html, koja je zapravo veliki indeks linkova. Sudeći po posjećenosti, te broju raznih nagrada od uglednih časopisa ili rating servisa, uključujući i Magellan (http://www.mckinley.com/), poslužitelj je odličan. Odlične je kakvoće, također s brojnim nagradama (Top 5% of Internet sites) i ENCYBERPEDIA, odnosno enciklopedija Cyberspace-a na http://www.encyberpedia.com/ency.htm. Zbog sve veće integracije biznisa i visoke tehnologije, potrebno je spomenuti i odličan poslužitelj International Financial Encyclopaedia na http://www.euro.net/innovation/Finance_Base/Fin_encyc.html. Tu možete naći tisuće termina vezanih uz financije, uključujući i termine koje je normirala International Organization for Standardization (http://www.iso.ch/welcome.html). Više o enciklopedijama pogledajte na: http://www.yahoo.com/text/Reference/Encyclopedia/.
I na koncu, FAQ (frequently ask questions) arhive nepresušni su (uglavnom i najažurniji) izvor informacija i znanja, često kvalitetniji od enciklopedija. FAQfinder projekt na http://infolab.cs.uchicago.edu/faqfinder/ je automatizirani sustav za pitanja-odgovore koji rabi akumuliranu mudrost mnogih USENET grupa. Ostale FAQ arhive možete lako pronaći pomoću nekog alata za pretraživanje (http://www.altavista.digital.com, http://www.hotbot.com) ili na nekoj od lista s popisom FAQ-ova, npr.: http://www.cis.ohio-state.edu/text/faq/usenet/.

Glosariji
Glosariji, odnosno popisi manje poznatih riječi u nekome tekstu imaju tradiciju još od legendarne aleksandrijske biblioteke: http://www.byu.edu/acd1/ed/InSci/286/Egypt/AlexandriaLibrary.html kao i http://pharos.bu.edu/Egypt/Alexandria/links.html#library. Glosarijima su bliske nomenklature: popisi riječi koji trebaju samo fiksirati službeno prihvaćene nazive za određeno područje, grupu predmeta postupak i sl., a koji su popraćeni paralelnim stručnim izrazima na nekom stranom jeziku. Gosariji i nomenklature koji se mogu naći na Mreži imaju jednu zgodnu vrlinu: neke možete spremiti na svoje računalo, te koristiti i kasnije. Logika je stvari da ima najviše priloga iz računalstva i samoga Interneta. Tako i zagrebačka Školska knjiga ima informatički rječnik na: gopher://shk.skok.com.hr:70/77/hrv/test/.index/rjecnik Još neke zgodne adrese su: The Free On-line Dictionary of Computing (FOLDOC) na http://wombat.doc.ic.ac.uk/, Software Technology Interest Group (STING) Software Engineering Glossary http://dxsting.cern.ch/sting/glossary-intro.html, zatim Mathematical Programming Glossary: http://www-math.cudenver.edu/~hgreenbe/glossary/glossary.html, te HTML, the complete guide: http://math-www.uni-paderborn.de/HTML/Dictionaries/HTML-Dictionary/. Za one pak koji (još) nisu prešli na WIN95 (zar ima i takvih?), a trebaju se snaći u šumi akronima, evo adrese poslužitelja Windows95 Internet Hyper-Glossary: http://www.windows95.com/connect/glossary.html. Svakako posjetite i The New Hacker's Dictionary na: http://www.ccil.org/jargon/jargon_toc.html. Tu ćete naći iscrpnu zbirku hakerskog slanga, folklora, kulture i humora. Nažalost, nema alata za pretraživanje, nego se učitavaju cijeli (poveliki) dokumenti.

Jednojezični rječnici
Dva najpoznatija englesko-engleska rječnika su svakako Webster (američki engleski) i Oxford (britanski engleski). Izvrsno hipertekst sučelje, s vrlo detaljnim uputama za Webster je na http://c.gp.cs.cmu.edu:5103/prog/webster?. No, na adresi http://www.onelook.com/ je hipertekst sučelje za čak 74 indeksirana rječnika. Brzo i odlično! Na istom mjestu provode se i istraživanja o izgovoru pojedinih pojmova u svezi Interneta, koji začudo, još uvijek nisu standardizirani (URL, GIF, Internet, Gigabyte itd.). Uključite soundblastere i na Mrežu! Uz rječnike, u traganju za riječima i frazama, pomažu i thesaurusi. Jedan od vrlo dobrih jest: Roget's Internet Thesaurus na: http://www.thesaurus.com/ . Websterov je thesaurus na istoj adresi kao i rječnik.

Dvojezični rječnici
Uz jednojezične rječnike najčešći su dvojezični rječnici koji riječi i izraze jednog jezika objašnjavaju riječima i izrazima drugoga jezika. Po logici stvari, na Mreži se uglavnom mogu pronaći dvojezični riječnici između engleskog i još nekog jezika (od mongolskog pa do dijalekata američkih Indijanaca). Možda najkompletniju listu dvojezičnih rječnika možete pronaći na http://www.yahoo.com/text/Reference/Dictionaries/. Posjetite također, već spomenuti Magellan (http://www.mckinley.com/) i utipkajte: dictionary.

Pravopisna provjera teksta
Tako veliko obilje leksikografskih baza podataka iskorišteno je i pri kreiranju programa za pravopisnu provjeru tekstova te programa za prevođenje. Svaki bolji tekst procesor, kao i HTML editor već ima ugrađen speller checker. No, za nas je posebno interesantan HACHECK, tj. (on-line) Hrvatski Akademski Speller CHECKer :), kojim je strojno provjeren tekst Hrvatskog leksikona. Pošaljite elektroničkom poštom neki tekst na adresu hacheck@tel.fer.hr, tako da se deklarira: "Subject: provjera", te ćete ubrzo dobiti elektroničku poruku koja će neke riječi vašega teksta svrstati u četiri kategorije: ekstremno sumnjivi slovni niz, veoma sumnjivi slovni niz, umjereno sumnjivi slovni niz i gotovo nesumnjivi slovni niz. Za hrvatske dijakritičke znakove treba koristiti 7-bitovnu ASCII kodnu shemu. Ako je tekst izvorno nastao u nekom word-procesoru, treba ga eksportirati kao text-file, vodeći računa o eventualnoj konverziji znakova. Upute možete dobiti pošaljete li HACHECKU elektroničku poruku sa subjectom upute. U NeT-u 11 (str. 33) spominje se i HSC, DOS program za pravopisnu provjeru tekstova na hrvatskom jeziku koji se može pronaći na ftp://gnjilux.cc.fer.hr/pub/msdos/util/hsc150.zip. Za one koji često elektroničkom poštom komuniciraju s engleskim govornim područjem, a koriste Netscape, CyberSpell je zgodan plug-in koji je namijenjen radu s Mailom, a može se naći na: http://www.inso.com/consumer/cyberspell/democybr.htm.

Strojno prevođenje
U svezi prevođenja, shareware program imena WT4W40CR.zip, tvrtke Translation Experts Limited (http://www.tranexp.com) najnovija je inačica programa za prevođenje s engleskog na hrvatski i obratno :). Na istom mjestu pronaći ćete programe za prevođenje između engleskog i mnogih drugih jezika. I na koncu, zbog mnogo linkova, HTML inačicu ovoga članka možete naći na: http://mimi.imi.hr/~franic/articles.html. Nadam se da je članak cool, a što to zapravo znači u kontekstu Interneta, provjerite na Mreži u nekome od gore navedenih rječnika, slijedeći put kada budete on-line.

Croatian Line

Last Update: 12 Feb 1997.

[http://mimi.imi.hr/~franic]

Webtechs Cougar Checked
Webtechs Cougar Checked!