Quality Control of WWW Pages


This is the HTML version of my article recently published in NeT, Internet Magazine, 1997;14:56-9.

Also available at URL: http://www.net.hr/net_14/kontrola_kakvoce.html


Kontrola kakvoće WWW stranica

Piše: Dr.sc. Zdenko Franić
franic@imi.hr

Kreirali ste WWW stranicu, zadovoljni ste svojim djelom i poslali ste ga na Mrežu. Da, Vi ste zadovoljni, ali...

Nemojte dopustiti da se Vaša stranica nađe recimo na http://www.webpagesthatsuck.com/home.html ili nekom drugom sličnom mjestu kao primjer (iz bilo kojeg razloga) lošeg poslužitelja. Na spomenutoj adresi možete kroz zorni uvid u loše WWW stranice stošta naučiti o kreiranju zaista dobrih. Kakvoća (kvaliteta) WWW stranica se, uostalom kako i Kakvoća svega ostalog, može definirati kao stupanj do kojega su zadovoljeni određeni zahtjevi, odnosno kriteriji. Nitko od Vas ne očekuje da koristite ISO 9000 standarde kao temelj za razvoj sustava kakvoće Vaših stranica, ali i bez toga, one mogu biti, uz malo dodatnog truda, korektne i kvalitetne.

Još otkako je legendarni Vannevar Bush, daleke 1945. godine objavio vizionarski članak "As We May Think" ( http://www.isg.sfu.ca/~duchier/misc/vbush/ ) koji se smatra početkom modernog hiperteksta/hipermedije, moglo se naslutiti da će (ispravni) HTML dokumenti biti jedan od ključnih čimbenika razvoja (tada tek sanjane) Mreže. Danas je za kreiranje HTML dokumenata na raspolaganju, uz obične editore i sve više WYSIWYG editora, te nije potrebno poznavati niti jednu HTML naredbu. Dodatna se podešavanja ipak moraju načiniti ručno. Tijekom različitih faza nastajanja HTML dokumenta uvećava se i mogućnost nastajanja grešaka. Učitani HTML dokumenti pak moraju približno isto izgledati na prebirnicima iste generacije. Prebirnici koji su trenutno "in" zaista su vrlo brzi i intuitivni. Naime, kao i kod HTML editora, korisnici očekuju "da stvari rade", nije ih briga kako. Netscape ili Internet Explorer će najčešće naprosto zanemariti neku grešku u HTML kodu te stoga nisu dobar alat za provjeru kakvoće koda. No samo je pitanje je vremena kada će se pojaviti prebirnik koji će imati upozoravajući "Bad HTML Tag". Uz takvo upozorenje na ekranu, svatko bi se zapitao i o kakvoći sadržaja. Neki alati npr. HTML editor HotMetal, (naći ćete ga na http://www.sq.com/index.html ) ne mogu niti učitati nesukladne dokumente.

Što više alata namjeravate rabiti (a već sada Vam je na raspolaganju zaista zbunjujuće mnoštvo), to Vaši dokumenti trebaju biti sukladniji s normama (čitaj: biti ispravni).

Provjera HTML koda

Početni korak kontrole kakvoće WWW stranica, koja je, naravno, moguća i on-line, svakako jest provjera samoga HTML koda. No, prije toga, potrebne su određene predradnje. Potrebno je naime, specificirati o kojem se narječju (inačici) HTML-a radi. To se pak specificira naredbom <!DOCTYPE...> u zaglavlju HTML dokumenta. Ukoliko se ta naredba ne rabi, HTML prebirnik podrazumijeva da se radi o HTML 2 inačici. Naredba:

<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 3//EN">

pokriva korištenje HTML inačica 0, 1, 2 i 3, ali bez ekstenzija karakterističnih npr. za Netscape.

Ukoliko pak koristite Netscapeove ekstenzije za HTML, na početak Vašeg dokumenta ćete staviti:

<!DOCTYPE HTML PUBLIC "-//Netscape Comm. Corp.//DTD HTML//EN">

Kako Netscape nije nikada dao SGML (Standard Generalized Markup Language) DTD (Document Type Definition) za svoje ekstenzije, gornja je naredba "iskonstruirana unatrag", te mozda nije u potpunosti kompatibilna sa svim inačicama HTML-a. SGML je ISO (http://www.iso.com) standard (ISO 8879:1986) kojim je dan formalizam za definiciju tzv. generalized markup languages. Više o SGML-u te slaganju SGML-a s međunarodnim ISO standardom može se naći na adresi http://www.jclark.com/sp/index.htm kao i na adresi http://www.sil.org/sgml/sgml.html .

Valja napomenuti da su moguće i druge <!DOCTYPE...> naredbe; spomenute su samo one najčešće. Nakon sto ste ispravno napisali HTML dokument, zajedno s pripadnom <!DOCTYPE...> naredbom, te ga FTP-om ga poslali na Mrežu možete pristupiti on-line provjeri. Odlično mjesto za početak jest:

WebTechs HTML Validation Service

Radi se o vrlo popularnom poslužitelja za kontrolu HTML kodova. Nalazi se na adresi: http://www.webtechs.com/html-val-svc/ . Odjednom se može provjeriti i vise URL-ova. U ponuđeni formular potrebno je samo upisati URL dokumenta kojeg se želi provjeriti. Može se koristiti desetak razina: Strict, Level 2, Level 3, Level 3.2 (Wilbur), Level 3.2+ (Cougar), Mozilla, SoftQuad, AdvaSoft, Microsoft IE, te Microsoft IE 3.0 Beta.

Za one koji on-line pišu neki HTML dokument, dobrodošla je i opcija provjere pojedinih manjih dijelova HTML-a. Ukoliko je sve u redu s provjeravanim dokumentom, dobit ćete (za Vas prekrasnu) poruku: No errors found.

Također, dobit ćete i ikonicu s pripadnim HTML kodom koji ćete staviti ili pri vrhu ili pri dnu Vaše stranice, kao dokaz da je s Vašom stranicom sve u redu. Npr.:

<P><A HREF="http://www.webtechs.com/html-val-svc/">
<IMG SRC="http://www.webtechs.com/html-val-svc/images/valid_html.mcom.gif"

ALT="WebTechs Mozilla Checked!"></A>

To izgleda ovako:

Webtechs Mozilla Checked
Webtechs Mozilla Checked!

Ne treba elaborirati da spomenuta ikonica predstavlja jedan od vrlo vrijednih dokaza kakvoće WWW stranica.

Kinder, Gentler Validator

Taj se poslužitelj nalazi na adresi http://ugweb.cs.ualberta.ca/~gerald/validate/. Ovdje ćete naći i mnoge druge korisne informacije, te linkove na neke druge slične sustave za provjeru. Radi se o prijateljskom, easy to-use HTML validacijskom servisu koji se osniva na SGML rasčlambi. Po učinku je vrlo sličan WebTechs-u, međutim, pronađene su greške mnogo shvatljivije, te stoga i laganije za ispravku. Uz to, vrlo je zgodno sto za svaku grešku ovaj servis nudi i objašnjenje, a čak upozorava i na neke stilske pogreške. Malo teorije je naime uvijek dobro došlo. Za ispravnu razinu provjere, potrebno je, naravno, <!DOCTYPE...> naredbom specificirati HTML inačicu koju ste rabili u svome dokumentu. I ovdje ćete, ako je sve u redu, dobiti pohvalu, primjerice:

No errors found!, Congratulations, this document validates as Netscape HTML!

Nadalje, kako biste pokazali da ste odgovorni net.citizen, i ovdje ćete kao i kod WebTechsa dobiti ikonicu s pripadnim dijelom HTML koda koju ćete postaviti na svaku provjerenu stranicu:

<P><A HREF="http://ugweb.cs.ualberta.ca/~gerald/validate/">
<IMG SRC="http://ugweb.cs.ualberta.ca/~gerald/validate/valid_mcom.gif"
ALT="Netscape-HTML Checked!"></A>

Odnosno:

Netscape-HTML Checked!
Netscape-HTML Checked!

Naravno, uspješna provjera Vašega dokumenta nekim validacijskim servisom još ne znači da je dokument i dobro dizajniran (slično kao sto uspješno kompajliranje nekog programa ne zna či da je taj program bez bagova), no to je svakako važan korak na putu pouzdane prezentacije Vaših ideja na Internetu.

Možete se malo i igrati. Provjerite npr. kojim od spomenutih sustava za provjeru kakvoću HTML koda nekog "razvikanog" poslužitelja. Mogli bi se vrlo iznenaditi!

Linkovi

WWW stranice bez linkova!? Pa po tome je Mreža, (WEB) dobila ime! No, koliko ste puta naletili na linkove koji su iz nekog razloga "mrtvi"? Koji put razlog mrtvoga linka leži u nezatvorenim navodnicima kod <A HREF="http://..."> naredbe. Ipak, takvu bi grešku otklonila i provjera WebTechsom odnosno Kinder & Gentler Validatorom. Nevažeći linkovi veliki su problem kako korisnicima, tako i Webmasterima. Naravno, mogu se provjeravati i "ručno", odnosno jedan po jedan. Ukoliko se radi o većem broju linkova, to može biti prilično zamoran posao, te je bolje uposliti računalo koje će linkove provjeriti brže i učinkovitije. Postoji nekoliko softverskih paketa koji s različitim stupnjevima sofisticiranosti provjeravaju linkove. Vrlo je popularan MOMSpider (Multi-owner Maintenance Spider) na http://www.ics.uci.edu/pub/websoft/MOMspider/ te CyberSpyder na http://www.cyberspyder.com/cslnkts1.html.

Ipak, ne propustite nabaviti odličan program Infolink na adresi http://www.biggbyte.com/ , koji provjerava WWW stranice, grafiku,preusmjerene dokumente, gopher poslužtelje, news grupe te čak i e-mail adrese. No, spomenuti je program 32-bitni, te radi pod Windowsima 95. Zar jos niste prešli na Windowse 95?

Brzina učitavanja

Dobro je negdje u dokumentu dati pregled statistike dokumenta, pogotovo ako se radi o većem dokumentu s obimnijim tekstom i većim brojem slika (znanstveni izvještaji primjerice). Bitni dio statistike jest predviđeno vrijeme učitavanja WWW stranice 14400 bps modemom, (brzina kojeg je postala neka vrsta Benchmarka). Neki noviji HTML editori, (bolje rečeno kompletni alati za Web autore) kao npr. Claris Home Page, editor tvrtke Claris na http://www.claris.com , (koja je vjerojatno vrlo dobro znana korisnicima Macintosh računala), imaju već ugrađenu i tu opciju.

Provjera pravopisnih pogrešaka

Bilo da su Vaše stranice pisane hrvatskim ili engleskim jezikom, vrlo ružnu sliku ostavljaju pogrešno napisane riječi. Naravno, po Murphyjevim zakonima, ( http://ai.kaist.ac.kr/~joony/Text/Murphy_Law.html ) najgrublje pogreške nalaze se uvijek u naslovu. Stoga, potrebno je provjeriti spelovanje. Ukoliko se radi o nekom ASCII odnosno TXT dokumentu, zadatak je trivijalan. Za hrvatski jezik, na raspolaganju je HACHECK (upute se dobiju slanjem e-mail poruke na adresu hacheck@tel.fer.hr).

No, kako provjeriti spelovanje u već kreiranom HTML dokumentu? U slučaju hrvatskog jezika, malo teže. Glede engleskog jezika, gotovo svi sofisticiraniji HTML editori imaju ugrađeni SpellerChecker. Vi naravno ne rabite obični Notepad!?

Ukoliko su Vaše WWW stranice na hrvatskom jeziku, poželjno je negdje specificirati i ISO standard koji koristite za prikaz naših slova.

Grafika

Nikako ne treba pretjeravati s grafikom, barem na prvoj stranici (naravno to je .../index.html) Vasega poslužitelja, nemaju svi brze modeme. Nadalje, mnogi surferi koji ciljano traže određene informacije, naprosto na svojim prebirnicima isključe mogućnost učitavanja slika jer ih zanima samo tekst. (Čudno, ali istinito, neki još uvijek kao prebirnik rabe Lynx.) Stoga, kod svake slike potrebno je staviti i tekstualno pojašnjenje koristeći naredbu <ALT="opis slike">. Naravno, koristit ćete i ostale naredbe koje se odnose na slike, kao sto su HEIGHT, WIDTH, BORDER (po volji) itd.

Na neki način, u grafički dizajn stranica spadaju i okviri (frames). Poželjno je zbog korisnika čiji prebirnici ne podržavaju okvire, ili ih naprosto ne vole, ponuditi i tekstualnu inačicu WWW stranica.

Razglašavanje stranica

I sve ste načinili kako treba. Sada Vam predstoji (mukotrpno) razglašavanje vašeg URL-a.

AltaVista, HotBot, Yahoo, Lycos... pročitali su (gotovo) svaku WWW stranicu na Internetu, te indeksirali riječi koje se na njima pojavljuju. Svi takvi sustavi imaju Add URL formulare. Korištenjem Web Page Submission Form na http://www.infospace.com/submit.html prijavljivanje je izuzetno olakšano. To je jedan od najpopularnijih takvih servisa, kojim odjednom mozete svoj URL poslati na adrese preko 300 Search Enginsa odnosno raznih indeksa/kataloga. No, to je pasivan način: prijavili ste se sustavima za pretraživanje i sada čekate da Vas netko pronade po ključnim riječima. (Za dodavanje naredbe <META NAME="ključne rijeci"> u zaglavlje dokumenta, pogledajte NeT br. 10, članak o robotima). Vi bi ste svakako i sami na neki način pučanstviu Interneta trebali "nametnuti" Vasu WWW stranicu. LinkExchange na adresi http://www.linkexchange.com/ je možda najveća oglasna on-line mreža s preko 85000 aktivno učlanjenih WWW poslužitelja. Ideja je jednostavna: Na Vašim stranicama Vi oglasite nekoga, netko na svojim stranicama oglasi Vas itd. I sve je to besplatno... Odlično za Web poduzetnike.

Brojač posjeta

Svaki Webmaster, autor, kao i vlasnik WWW stranica (to ne mora nužno biti ista osoba), ali i korisnik, žele znati tko, kako i kada pristupa određenom poslužitelju. Ta se informacija, naravno može dobiti i od administratora sustava. Ipak, zgodnije je imati ugrađeni brojač posjeta na glavnoj stranici, te tako statistiku pristupanja učiniti javnom. Nedavno se na listi hrvatskih Webmastera vodila živa rasprava o brojačima (korisnost, svrhovitost itd.). No, o ukusima se ne raspravlja. Neosporno je ipak da prateći statistiku pristupa Vašim WWW stranicama, možete dobiti dragocjene informacije. Druga je stvar koliko su Vam te informacije važne i kako ćete ih iskoristiti. Npr., općenito se smatra da je najveći broj pristupa prosječnim WWW stranicama srijedom, naprosto zato sto srijedom širom Interneta surfa najveći broj ljudi. Stoga, ukoliko se radi o stranicama koje se relativno brzo mijenjaju, update treba biti u srijedu. Da li je tako i s Vašim stranicama? Nisu li one zbog nečega specifične? Ugradite brojač i pozabavite se statistikom. Na adresi http://www.digits.com/ naći ćete vrlo popularni, javni, dakle besplatni (ali takoder uslijed sve veće zagušenosti i notorno nepouzdani) Web counter. Valja napomenuti da Web-counter ne dopušta "napuhavanje" broja posjeta Reload (Refresh) tipkom prebirnika. Isto tako, zbog zagušenosti, u posljednje vrijeme na spomenutom poslužitelju nisu primali nove URL-ove. Ipak provjerite!

"Ovjera podobnosti"

Na Vašim stranicama, naravno, nemate pornografskog, rasističkog ili nekog drugog uvredljivog odnosno bezobraznog sadržaja. Postoji softver sve vise raširen po USA koji učitavanje WWW stranice s takvim sadržajima automatski onemogućuje. Dobra je ideja Vaš URL prijaviti službama kao što su Recreational Software Advisory Council na http://www.rsac.org/ (usmjerene na mlađu populaciju) ili The Original Internet Rating System na adresi http://www.safesurf.com/index.html (svi uzrasti).

Primjer za uporabu prvoga, može se vidjeti na NeT-ovim WWW stranicama na http://www.net.hr :-). Glede zaštite dostojanstva, slobode govora, te borbe protiv kriminala na Internetu posjetite i CyberAngels na http://www.cyberangels.org/who-are-we.html . Možda im se i pridružite!

Malo (samo)hvale

Dobijete li neku nagradu pohvalu ili slično... podrazumijeva se da nećete propustiti to razglasiti na Vašim stranicama. Ukoliko ste te sreće, negdje pri vrhu ili dnu stranice stavit ćete odgovarajuću ikonicu, uz poruku da je ova WWW stranica bila izabrana za Cool site... u izboru... Naravno, ako je takvih nagrada veći broj, otvorit ćete i poseban dokument Awards...

Umjesto zaključka...

Kreiranje korektnih WWW stranica ponekad može biti zaista težak posao. Ključni je moment svakako ispravni HTML kod, koji je najbolje testirati pomoću nekoliko različitih popularnijih (ali i manje popularnih) prebirnika. To su svakako Netscape (začudili biste se koliko još ljudi rabi inačicu 1.0), MS Internet Explorer, ali i Lynx. Poslije toga, potrebno je valjanost HTML koda provjeriti na nekom od gore spomenutih servisa za validaciju. Ipak, najvažniji jest sadržaj stranica. Ukoliko imate dobar sadržaj, stil će slijediti sam po sebi.I na koncu želim svima Vama, hrabrim HTML autorima i WebMasterima koji sate i sate svoga svakidašnjeg rada šaljete na Mrezu, sretno provjeravanje i izvrsnost Vaših HTML stranica.

Croatian Line

Last Update: 02 April 1997.

[http://mimi.imi.hr/~franic]

Webtechs Cougar Checked
Webtechs Cougar Checked!

However, please note there are some non SGML characters in text