Metatietotageja

  1. Doctype etc.
  2. Meta
  3. Link
  4. Dublin Core
  5. Muuta
  6. Lähteitä

1. Doctype etc.

1.1. HTML 4.01 Strict, Transitional, Frameset

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN" "http://www.w3.org/TR/html4/frameset.dtd">

1.2. XHTML 1.0 Strict, Transitional, Frameset

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Frameset//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-frameset.dtd">

1.3. XHTML 1.1 DTD

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">

1.4. Muuta

<?xml version="1.0" encoding="utf-8"?> (Vapaaehtoinen, aiheuttaa ongelmia joissain selaimissa, joten kannattaa jättää pois)

<html xmlns="http://www.w3.org/1999/xhtml">

<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">

<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fi" lang="fi">

2. Meta

Tarkempaa tietoa: W3C & Daviel 2003

Meta-tageihin voidaan liittää lang-attribuutti, joka kertoo content-attribuutin sisällön kielen. Scheme-attribuutilla taas tajotaan muuta lisätietoa content:in sisällöstä. Esim. <meta scheme="ISBN" name="identifier" content="951-857-429-4" / >

2.1. Http-equiv

Palvelin voi lähettää nämä tiedot lähetetään HTTP-otsikokentässä.

<meta http-equiv="Content-Language" content="fi, en" />

<meta http-equiv="Content-Style-Type" content="text/css" />

<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" /> (Charsets: iso-8859-1 (Western/ISO Latin-1), utf-8 (Unicode), windows-1252)

<meta http-equiv="Description" Content="Collection of some meadata-tags" />

<meta http-equiv="Expires" content="Tue, 20 Aug 1996 14:00:00 GMT" />

<meta http-equiv="Imagetoolbar" content="false" />

<meta http-equiv="Pragma" content="no-cache" />

<meta http-equiv="Refresh" content="10; URL=next.html" />

2.2. Name

<meta name="Abstract" content="HTML-codes" />

<meta name="Author" content="Heikkinen, Mikko" />

<meta name="Copyright" content="Copyright (c) 1997-2003 Mikko Heikkinen / biomi.org" />

<meta name="Distribution" content="global" /> (Content voi sisältää: global, local tai iu (=Internal Use))

<meta name="Doc-class" content="Living Document" />

<meta name="Generator" content="Dreamweaver MX" />

<meta name="Keywords" Content="tags, header, meta" />

<meta name="Last-Modified" content=" 2004-09-18 " />

<meta name="MSSmartTagsPreventParsing" content="true" />

<meta name="Rating" content="General" />

<meta name="Revisit-after" content="2 Days" />

<meta name="Robots" content="all" /> (Content voi sisältää: all, none, index, noindex, follow, nofollow)

<meta name="resource-type" content="document" />

<meta name="Classification" content="Travel">

<meta name="reply-to" content="email@address.invalid">

<meta name="document-rights" content="Copyrighted Work">

<meta name="document-type" content="Web Page">

<meta name="document-state" content="Dynamic">

<meta name="cache-control" content="Public">

<meta name="MSSmartTagsPreventParsing" content="true" />

3. Link

Tarkempaa tietoa: W3C & Daviel 2003

  • rel = related link
  • rev = reverse link

<link rev="Made" href="mailto:email@address.invalid" />

<link rel="Stylesheet" href="red-screen.css" type="text/css" media="screen" /> (Lisää mediatyypejä: ks. CSS-sivu, rel-vaihtoehtoja: stylesheet, alternate stylesheet)

<link rel="Shortcut Icon" href="favicon.ico" type=image/ico />

<link rel="Zeldman.com" href="http://www.zeldman.com" title="The Daily Report" /> (Tällä voi linkata mielestään tärkeään sivuun/sivustoon)

<link rel="DC.identifier" type="text/plain" href="http://www.biomi.org/internet/metadata.html"> (Jos metadatan arvona on osoite, voi metadatan määrittää LINK-elementillä)

<link rel="alternate" href="link-reference" type="application/rss+xml" title="RSS" / > (Vaihtoehtoinen tiedosto, esim. weblog RSS-muodossa)

<link rel="start" href="link-reference" />

<link rel="chapter" href="link-reference" />

<link rel="section" href="link-reference" />

<link rel="subsection" href="link-reference" />

<link rel="appendix" href="link-reference" />

<link rel="bookmark" href="link-reference" />

<link rel="contents" title="archives" href="/archives">

3.1. Seuraavat toimivat ainakin Opera 7.11:ssa: ikkunan ylälaitaan tulee lista saatavilla olevista linkeistä.

<link rel="Previous" href="doc4.html" title="Document 4" />

<link rel="Up" href="./" title="Index" />

<link rel="Next" href="doc6.html" title="Document 6" />

<link rel="Help" href="http://www.biomi.org/about" title="Help page" />

<link rel="First" href="doc1.html" title="Document 1" />

<link rel="Last" href="doc10.html" title="Document 10" />

<link rel="Copyright" href="http://www.biomi.org/copyright.html" title="Copyright information" />

<link rel="Author" href="http://www.biomi.org/copyright.html" title="Information about the author" />

<link rel="Home" href="http://www.biomi.org/" title="Home page" />

<link rel="Index" href="http://www.biomi.org/index-words.html" title="Index" />

<link rel="Contents" href="http://www.biomi.org/content.html" title="Table of contents" />

<link rel="Search" href="http://www.biomi.org/searchpage.html" title="Search page" />

<link rel="Glossary" href="http://www.biomi.org/glossary.html" title="Glossary of terms used" />

4. Dublin Core Metadata Initiative

Lähteenä tässä osiossa on käytetty lähinnä Helsingin yliopiston kirjaston Dublin Core -kotisivua.

Dublin Core standardi koostuu 15 elementistä, joita rakentamassa on ollut kansainvälinen, eri alojen ammattilaisista koostuva yhteisö. Jokainen elementti on vapaaehtoinen ja myös toistettavissa. Jos elementillä on useampia arvoja (esim. monta tekijää), erotetaan jokainen omaksi tagikseen. Useimmilla elementeillä on myös tarkenteita, joiden avulla elementin merkitystä pystytään tarkentamaan. Metadata-elementtien järjestyksellä ei ole merkitystä. Dublin Coressa lukemisen parantamiseksi käytetään etuliitettä "DC", joka kirjoitetaan versaalein (isot kirjaimet) ja elementin nimi aloitetaan isolla kirjaimella.

4.1. Yksinkertainen metadata

Dublin Core määrittelee 15 peruskenttää:

<meta name="DC.Title" content="Otsikko" />

<meta name="DC.Creator" content="Sukunimi, Etunimi" />

<meta name="DC.Subject" content="Avainsana" /> (Jos käytät useampia avainsanoja, ne kannatta laittaa kukin omaan tagiinsa. Käytä mielellään kontrolloituja sanastoja, kuten Yleistä suomalaista asiasanastoa (YSA).)

<meta name="DC.Description" content="Kuvaus" /> (Kuvaus voi olla esim. tiivistemä tai sisällysluettelo. Käytä tarkenteita tarvittaessa.)

<meta name="DC.Publisher" content="Julkaisija" /> (Jos tekijä ja julkaisija ovat yksi ja sama, ei nimeä toisteta enää julkaisija-kentässä.)

<meta name="DC.Contributor" content="Information goes here" /> (Esim. kuvittajan tai toimittajan nimi)

<meta name="DC.Date" content="2003-07-30" /> (Luontipäivämäärä ISO-8601 -standardin mukaan. Ks. tarkenteita alla.)

<meta name="DC.Type" content="Image.Photograph" />
<meta name="DC.Type" content="Text.Poem" />

<meta name="DC.Format" content="text/html" /> (Käytä MIME-tyyppejä tm. kontrolloitua sanastoa)
<meta name="DC.Format" content="550 KB" />
(Koon voi merkitä tarvittaessa)

<meta name="DC.Identifier" content="id" /> (Käytä mielellään virallisia ja yksilöllisiä yksilöintitunnuksia (ISBN, ISSN, URN) tai sivun osoitetta.)

<meta name="DC.Source" content="id" /> (Käytä mielellään virallisia ja yksilöllisiä yksilöintitunnuksia (ISBN, ISSN, URN) tai sivun osoitetta.Tämä elementti voi myös sisältää päivämäärän, tekijän, formaatin, identifikaatiotunnuksen tai muuta metadataa koskien toista tallennetta kun katsotaan että siitä on hyötyä kuvailtavana olevan tallenteen löytymiselle. )

<meta name="DC.Language" content="English" />

<meta name="DC.Relation" content="Information goes here" /> (Ks. alla)

<meta name="DC.Coverage.spatial" content="Finland" /> (Tiedoston ajallinen tai maantieteellinen kate. Tarkenteiden käyttö on pakollista, ks. alla.)

<meta name="DC.Rights" content="Public domain" /> (Tietoa tekijänoikeuksista tms. tai linkki sivulle, jossa tietoa niistä)

4.2. Tarkennettu metadata

Kenttien nimiä voi tarkentaa name-attribuutissa pisteellä (.) erottettuna. Esim.: name="DC.Creator.Email"

Content-attribuutin lajeja voi myös määritellä itse aloittamalla laji merkinnällä X-. Esim. content="Text.Article.X-Refereed".

Scheme- ja lang-attribuutteilla ilmaistaan auktoriteettiin viittaamalla miten metadatakentän arvoa tulee tulkita. Termit valitaan tavallisesti kontrolloidusta termien listasta.

<meta name="DC.Subject" scheme="YSA" content="elektroninen julkaisutoiminta" />

<meta name="DC.Subject" lang="en" content="electronic publishing" />

Dublin Coren Structured Values –syntaksi (DCSV) (ei vielä vahvistettu?): DCSV tarjoaa erityisen strukturointimetodin käytettäväksi silloin kun mitään muuta sopivaa skeemaa/standardia ei ole hyödynnettävissä. DCSV-syntaksi käyttää välimerkkejä seuraavalla tavalla:

  • kaksoispisteet (:) erottavat rakenteisten arvokomponenttien nimien merkinnät arvojen merkinnöistä
  • puolipisteet (;) erottavat vaihtoehtoisiksi merkityt arvot listassa
  • pisteet (.) ilmaisevat tarvittaessa hierarkkisen rakenteen arvojen merkinnöissä.

Esim. <meta name="DC.Element" scheme="DCSV" content="VaihtoehtoA; VaihtoehtoB:Arvo1; VaihtoehtoC:Arvo1.beta">

Katso tarkempia tietoja HYK:n Dublin Core -sivuilta sekä ISO-standardista.

4.2.1. Esimerkkejä tarkennetusta metadatasta

<meta name="DC.Creator.PersonalName" content="Heikkinen, Mikko">

<meta name="DC.Creator.PersonalName.Address" content="email@address.invalid">

<meta name="DC.Creator.Email" content="email@address.invalid" />

<meta name="DC.Creator" content="Laitos.Osasto.Tarkempi osasto" />

<meta name="DC.Creator.PersonalName" content=" Meik&auml;l&auml;inen, Matti">

 

<meta name="DC.Subject" scheme="YSA" content="ty&ouml;tt&ouml;myys -- Suomi">

<meta name="DC.Subject" scheme="YSA" content="ty&ouml;voimapolitiikka">

<meta name="DC.Subject" lang="en" content="unemployment -- Finland">

<meta name="DC.Subject" lang="en" content="labour policy">

<meta name="DC.Subject" scheme="UDC" content="331.567">

<meta name="DC.Subject" scheme="UDC" content="331.57">

<meta name="DC.Subject" scheme="YSA" content="evoluutio" />

<meta name="DC.Subject" scheme="YSA" content="luonnonvalinta" />

<meta name="DC.Subject" scheme="UDC" content="56.41" />

<meta name="DC.Subject" scheme="LCC" content="QH359-425" />

 

<meta name="DC.Description.abstract" content="Tiivistelm&auml; sivun sis&auml;ll&ouml;st&auml;" />

 

<meta name="DC.Date.Created" scheme="ISO8601" content ="1999-06-27" />

<meta name="DC.Date.X-MetadataLastModified" scheme="ISO8601" content="2003-07-28" />

<meta name="DC.Date.issued" scheme="W3C-DTF" content="1999-01-22" />

<meta name="DC.Date.DataGathered" scheme="ISO8601" content="1996-03-01/1997-03-01">

<meta name="DC.Date.Issued" scheme="ISO8601" content="1997-10-15">

<meta name="DC.Date.issued" scheme="W3C-DTF" content="1999-01-22" />
<meta name="DC.Date.issued" scheme="ISO8601" content="1999-01" />

  • Created - Tallenteen luontiaika. Esimerkiksi alkuperäisen dokumentin ilmestymisvuosi (Kalevala 1835)
  • Issued - Tallenteen julkistamisaika (oletusarvo, ellei tarkennetta ole määritelty) Esim. Kalevala CD-ROM 1996
  • Accepted - Päivämäärä jolloin tallenne (esim. väitöskirja) on hyväksytty.
  • Available - Aika - usein ajanjakso - jolloin tallenne on tai tulee olemaan käytettävissä
  • Acquired - Päivämäärä, jolloin tallenne on hankittu kuvailijaorganisaation kokoelmiin.
  • DataGathered - Aika jolloin tallenteen sisältämät tiedot on koottu.
  • Valid - Tallenteen voimassaoloaika (yleensä ajanjakso, esim. aikataulun voimassaoloaika)

 

<meta name="DC.Type" scheme="DCMIType" content="Text" />

  • teksti - tallenne jossa sisältö on pääasiassa luettavaksi tarkoitettua tekstiä: esim. monografiat, artikkelit, kirjeet, tutkielmat, runot, kotisivut. (Text.Monograph, Text.Article, Text.Correspondence.Letter , Text.Thesis, Text.Poem, Text.Homepage...)
  • kuva - sisältö on pääasiassa kaksiulotteinen kuva eikä teksti: esim. valokuvat, maalaukset, animaatiot, kaaviot (Image, Image.Photograph, Image.Animation...)
  • ääni - sisältö on pääasiassa ääntä: esim. musiikkia, puhetta, tallennettuja ääniä (Sound, Sound.Music, Sound.Speech...)
  • data - informaatio koodattuna: lista, taulukko, tietokanta tms. joka on usein valmiissa formaatissa prosessoitavaksi: esim. taulukkolaskentasheetit, tietokannat, GIS data (Data.Numeric, Data.Statistical...)
  • ohjelma - tietokoneohjelmien lähdekoodi tai koottu muoto joka voi olla asennettavissa pitkäaikaisesti toiselle koneelle. (esim. Software.Source)
  • vuorovaikutteinen - tallenteet, jotka vaativat vuorovaikutusta käyttäjältä: esim. www-sivujen kaavakkeet, multimediakohteet (Interactive.Multimedia, Interactive.Games...)
  • fyysinen kohde - kolmiulotteiset kohteet tai substanssit, jotka eivät ole pääosin tekstiä tai kuvaa: esim. henkilö, tietokone, pyramidi, veistos, jne.

 

<meta name="DC.Format" scheme="IMT" content="text/html" />

<meta name="DC.Format.medium" content="computerFile" />

<meta name="DC.Format" scheme="IMT" content=" application/pdf; 457 kB">

 

<meta name="DC.Identifier" scheme="URN" content=" URN:NBN:fi-fe19971234">

<meta name="DC.Identifier" scheme="URL" content="http://www.addy.fi/file.pdf">

<meta name="DC.Identifier" content="http://www.biomi.org/biologia/" />

<meta name="DC.Identifier" scheme="URN" content="URN:NBN:fi-fe20031234" />

 

<meta name="DC.Language" scheme="ISO639-2" content="fi" />

<meta name="DC.Language" scheme="ISO639-1" content="fi">

 

<meta name="DC.Relation.HasPart" scheme="URL" content="http://www.addy.fi/file.pdf">

<meta name="DC.Relation.HasVersion" scheme="URL" content="http://www.addy.fi/file.pdf">

  • IsPartOf
  • HasPart
  • IsVersionOf
  • HasVersion
  • IsFormatOf
  • HasFormat
  • References
  • IsReferenceBy
  • IsBasedOn
  • IsBasisFor
  • Requires
  • IsRequiredBy

 

<meta name="DC.Coverage.Spatial" content="Suomi">

<meta name="DC.Coverage.PlaceName" content="Suomi, Finland"> Tallenteen ajallinen tai maantieteellinen kate. Tarkenteita ajallisen (temporal) tai maantieteellisen (spatial) kattavuuden ilmaisemiseksi on pakko käyttää.

 

<meta name="DC.Rights" content="http://www.addy.fi/rights.html" />

<meta name="DC.Rights" scheme="URL" content="http://www.addy.fi/rights.html ">

4.3. Suosituksia

Etuliite on syytä kirjoittaa isoilla kirjaimilla ja kenttien nimet isoilla alkukirjaimilla. Attribuuttien arvot sijoitetaan lainausmerkkien (") sisään. Uusi META-kenttä aloitetaan uudelta riviltä.

On olemassa kaksi tapaa toistaa arvoja Dublin Core –metadatakentissä:koko <META NAME="DC.Element" …> -kentän toistaminen tietyn kentän saamilla eri arvoilla tai toistettavien arvojen tallentaminen yhden <META>-kentän sisään, jolloin arvot erotellaan DCSV:n ";" erotusmerkillä.

5. Muuta

<base target="_top" /> (Vapauttaa kehyksistä, ei sisälly XHTML 1.0 Strictiin)

<base href="http://www.domain.com/" /> (Tämän avulla juurihakemistolinkit toimivat myös muualle tallennetuissa tiedostoissa)

<meta name="geo.position" content="60.1333; 25.0000" />

<meta name="geo.placename" content="Helsinki, Etel&auml;-Suomen L&auml;&auml;ni" />

<meta name="geo.country" content="FI" />

<meta name="tgn.id" content="7001923" /> (?)

<meta name="tgn.name" content="Helsinki" />

<meta name="tgn.nation" content="Finland" />

6. Lähteitä