sivut.web

ohjeita web-sivuston tekijälle

Osoitteen valinta

Lyhyesti: On väliä, missä osoitteessa web-sivujansa säilyttää. Tässä vinkissä tutustutaan tekniikoihin, joilla valitaan pitkäikäiset ja toimivat osoitteet koko sivustolle.

Osoitteen anatomia

Osoitteet (URI, myös URL) mahdollistavat internet-palveluiden (esimerkiksi WWW, FTP, sähköposti) saatavuuden määrämuotoisen esittämisen. URI:ssa esitetään käytettävä protokolla, palvelinkoneen ja resurssin nimi.

Esimerkiksi tämän sivun URI voidaan hajottaa osiin:

http://www.sivut.org/sivusto/vinkit/osoitteen_valinta.php
 |      |    |    |     |      |           |
 |      |    |    |     |      |           |
 |      |    |    |     |      |           +-- Tiedostonimi
 |      |    |    |     |      +-- 2. tason hakemisto
 |      |    |    |     +-- 1. tason hakemisto
 |      |    |    + 1. tason domain-nimi, "top level domain, TLD"
 |      |    +-- 2. tason domain-nimi, ns. "domain"
 |      +-- 3. tason domain-nimi, ns. "alidomain"
 +-- Tiedonsiirrossa käytettävä protokolla

Osoitteet kertovat

Osoite on muutakin kuin tekninen tapa merkitä sivun sijainti. Osoite kertoo muun maussa sivuston sisäisestä rakenteesta sekä sivun sisällön laajuudesta ja tärkeydestä.

Osoite voi antaa vinkin sivun sisällöstä.

Hyvin rakennettu osoite kertoo, mihin sivu kuuluu. Esimerkiksi lehdistötiedote voisi kuulua tiedotus-pääkategorian lehdistö-alakategoriaan. Tämänmallinen rakenne voitaisiin kuvata esimerkiksi osoitteella http://www.yritys.fi/tiedotus/lehdisto/tiedote.html.

Osoite kertoo myös dokumentin laajuudesta. Syvällä hakemistorakenteessa sijaitseva dokumentti mielletään yleensä yksityiskohtaiseksi tai tarkkaa tietoa sisältäväksi sivuksi. Vastaavasti ylemmällä tasolla hakemistorakenteessa sijaitsevan dokumentin sisältö mielletään yleiseksi tai yleistetyksi.

Osoitteen pituus tai hakemistorakenteen syvyys voi kieliä myös dokumentin tärkeydestä. Tärkeät asiat tavataan laittaa myös web-palvelimilla mahdollisimman lähelle juurta.

Hyvä osoite toimii sivuston navigaation tukena. Valitettavasti monet päivitysohjelmat tuottavat käsittämättömiä (mutta teknisesti täysin toimivia) osoitteita, joista ei ole ihmiselle mitään hyötyä.

Osoitejärjestelmät

Osoitejärjestelmällä tarkoitetaan sivuston sisäistä tapaa jakaa osoitteita eri dokumenteille. Osoitejärjestelmä näkyy usein hakemistorakenteessa ja noudattaa usein sivuston navigaatiorakennetta.

Esimerkki hyvin toimivasta, navigaatiota tukevasta osoitejärjestelmästä on Open Directory Project:n tapa luokitella tietoa hakemistoihin. Esimerkiksi Marylandin osavaltiossa julkaistava Baltimore Sun-lehti löytyy hakemistosta News : Newspapers : Regional : United States : Maryland.

Toinen esimerkki hyvin suunnitellusta osoitejärjestelmästä on webbipäiväkirjoissa (web log, blog) usein tavattu hakemistorakenne /vuosi/kuukausi/päivä/. Esimerkiksi 14.6.2004 lisätty merkintä voitaisiin sijoittaa hakemistoon /2004/06/14/.

Esimerkki huonosti toimivasta osoitejärjestelmästä on automaattisten julkaisujärjestelmien tuottamat käsittämättömät osoitteet, jotka ovat teknisesti täysin toimivia, mutta ihmisille täysin hyödyttömiä. Mihin seuraavat osoitteet vievät?

Nämä sivut voitaisiin julkaista osoitteessa, joka kertoo heti (tai antaa edes vinkin), mistä on kyse:

Arvattavat osoitteet

Ihanteellinen osoite on sellainen, että sen voi jopa arvata. Tätä sääntöä sovelletaan erityisesti domain-nimiin.

Suomalaisyritysten web-sivustojen oletetaan yleensä löytyvän osoitteesta http://www.yrityksennimi.fi/.

Otetaanpa esimerkki vaikeasti arvattavasta domain-nimestä. Ympäristöalan yritys Lassila & Tikanojalla on vaikea nimi siinä mielessä, että siitä on mahdoton muodostaa yksikäsitteisesti oikeaa domain-nimeä. Mikä on yrityksen web-sivuston osoite? Itselleni tuli mieleen seuraavat vaihtoehdot:

Oikea osoite on kuitenkin http://www.lassila-tikanoja.fi/. &-merkki on ilmeisesti korvattu viivalla luettavuuden nimissä. Ehkä yritys olisi voinut varata useita domain-nimiä (nyt kun se on fi-domainin alla mahdollista) ja tehdä automaattiset siirrot oikeaan osoitteeseen. Käyttäjän kannalta on turhauttavaa arvailla sivuston osoitetta.

Mikäli yrityksellä tai muulla yhteisöllä on tarkoitus toimia aktiivisesti internetissä, kannattaa nimeä miettiessä miettiä nimeä myös domain-nimen kannalta. Kannattaa myös tarkistaa, että haettava domain-nimi on vapaana. Esimerkiksi matkapuhelinoperaattori DNA joutui tyytymään dnafinland.fi-domain-nimeen, koska dna.fi-domain on ollut Paikallisverkkoyhdistyksen (Domestic Network Association) hallussa vuosikausia.

Vanhentuneet osoitteet

URIs don't change: people change them. (URIt eivät muutu: ihmiset muuttavat niitä) - Tim Berners-Lee (WWW:n keksijä)

Joskus kuitenkin osoite vanhentuu. Dokumentin sisältö voi vanhentua ja se voidaan kokonaan poistaa verkosta. Sivuston rakennetta voidaan muuttaa niin, että osoitteet muuttuvat. Tällainen kehitys on sisällön kannalta hyvä, mutta aiheuttaa muutamia ongelmia, joihin tosin on yksinkertaiset ratkaisut.

Vanhentuneet, poistetut sivut voidaan poistaa, mutta tilalle ei kannata jättää pelkkää 404 Not Found-virheilmoitusta. HTTP-protokollassa on itse asiassa oma virhekoodi 410 Gone sellaista tilaisuutta varten, jossa dokumentti on ollut joskus olemassa, mutta on sittemmin poistettu. Tätä virhekoodia kannattaa käyttää hyödykseen esimerkiksi Apache-web-palvelinohjelmiston Rewrite-modulia käyttämällä. Näin vanhentuneihin osoitteisiin tulevat haut voidaan hoitaa siten, että käyttäjälle tulee kohtelias ilmoitus sivun poistosta osoitteen pysyessä muuttumattomana.

Mikäli osoitteet muuttuvat dokumenttien muuttaessa osoitejärjestelmässä, tarvitaan ohjaus vanhoihin osoitteista uusiin. Tämä käyttäjälle läpinäkyvä tekniikka toteutetaan lähettämällä selaimelle HTTP-protokollan mukainen virhe 301 Moved Permanently. Virhekoodin merkitys on, että dokumentin osoite on muuttunut pysyvästi ja viittauksia (linkkejä, kirjanmerkkejä) pyydetään osoittamaan uuteen osoitteeseen.

Sallitut ja kielletyt merkit

Osoitteessa ei saa käyttää mitä tahansa merkkejä. Osoitteen määrämuotoiseen esittämiseen liittyy tietty joukko merkkejä, joilla on oma merkityksensä ja joita ei näin ollen saa käyttää mihinkään muuhun.

Eri osissa osoitetta on käytössä eri joukkoja varattuja merkkejä. Seuraavia merkkejä ei kannata yleisesti käyttää osoitteissa: ";", "/", "?", ":", "@", "&", "=", "+", "$", ",".

Vastaavasti seuraavia erikoismerkkejä voi vapaasti käyttää osoitteissa: "-", "_", ".", "!", "~", "*", "'", "(" ja ")".

Ääkkösiä ei kannata käyttää osoitteissa siitä syystä, että suuri osa internetiä ei tänäkään päivänä kykene ymmärtämään niitä koodaamattomina. Ääkköset voidaan korvata a (ä, å)- ja o (ö)-kirjaimilla tai vaihtoehtoisesti lausuntatapaa kuvaavilla kirjainyhdistelmillä ae (ä), ao (å) ja oe (ö). Varminta on pysyä kirjaimissa välillä a-z.

Tarkemmat säännöt osoitteiden sallituista merkeistä löytää URI:n määrittelevästä standardista RFC 2396

Tämä sivu on luotu 14.6.2004 ja viimeksi päivitetty 21.6.2004.

Lisätietoja:
Cool URIs don't change (Tim Berners-Lee)
Understanding URIs (W3C)
URL as UI (Jacob Nielsen)
Choose URIs wisely (W3C)


Käyttäjien kommentit

2.2.2005 19:55
enar

Oikea osoite on kuitenkin http://www.lassila-tikanoja.fi/. &-merkki on ilmeisesti korvattu viivalla luettavuuden nimissä. Ehkä yritys olisi voinut varata useita domain-nimiä (nyt kun se on fi-domainin alla mahdollista) ja tehdä automaattiset siirrot oikeaan osoitteeseen. Käyttäjän kannalta on turhauttavaa arvailla sivuston osoitetta.

Tätä varten on kuule Google

14.10.2005 11:47
?

voiko olla esim seuraavanlainen osoite:
www.eka.toka.kolmas.fi?

29.11.2005 12:39
Anselmi <arctice@gmail.com>

Voi olla.

23.2.2006 20:34
Jukka

Osoite voi olla vaikka:
kolmas.fi
eka.toka.kolmas.fi

Eli www ei ole pakollinen, mutta se on ihan hyvä olla. Se, mitä on varatun domain-nimen(yritys.fi) vasemmalla puolella, riippuu palvelimen asetuksista.

15.5.2007 11:40
Santanen

Noita lopun ae- ja oe-yhdistelmiä käytetään vain saksan kielessä. Suomessa ääkköset korvataan a:lla ja o:lla.

22.6.2007 00:17
pääsekasin1 <gameplanet_z@hotmail.com>

Mä oon ymmärtänyt alun tästä nettisivujen tekemisestä, mutta nyt menee yli mun ymmärryksen
miten minä saan loppujen lopuksi ton osoitteenn??
voiko joku tuhatkauno kertoo?? :D
kirjoittakaa myös ihmeessä mulle sähköpostitse jos jaksatte

18.11.2007 21:06
Viutilo <lollokipi@luukku.com>

Älyttömän hyvät sivut, jotka ovat olleet minulle suuresti hyödyksi. :D Enää vain sellainen ongelma, että miten minä saan se osoitteen käyttöön ja kaiken kaman laitettua nettiin sille sivulle? Eli siis miten sen sivun voi tehdä? Olisin tosi kiitollinen tästä tiedosta, voi kertoa vaikka sähköpostitse. :) Kiitos jo etukäteen. :D

Lisää oma kommentti


Juha-Pekka Järvenpää
jp@sivut.org
http://www.jarvenpaa.net/