Biologisten näytevalokuvien metadata

Yhteenveto artikkelista Morris, R. A. 2005: Image metadata standards and practices. In: Häuser et al. (eds.): Digital Imaging of Biological Type Specimens. A Manual of Best Practice. Results from a study of the European Network for Biodiversity Information: 19-34. Stuttgart. Saatavissa verkosta.

Artikkeli antaa suosituksia tyyppinäytteistä otettavien valokuvien metadatasta: mitä tietoja kannattaa tallentaa ja mihin sekä miten ne kannattaa jakaa verkossa. Suosituksia Käytä tietoja, jotka on esitetty joko standardissa DIG35 tai Z39.87. Kerro myös kameran tallentaman metadatan merkistökoodaus.

Minimitiedot:

Tallenna ainakin seuraavat tiedot kustakin kuvasta:

  • Alkuperäinen digitointiresoluutio
  • Alkuperäisen digitointiresoluution mittäyksikkö
  • Alkuperäinen digitointikoko
  • Alkuperäisen digitointikoon mittayksikkö
  • Värimalli tai ICC-profiili
  • Kuvauspäivämäärä
  • Kuvausaika
  • Tekijänoikeustiedot
  • ”Biota of interest” (?)

Metadatastandardeja

EXIF:iä käytetään yleisesti kameran ja kuvaustilanteen teknisten tietojen tallentamiseen suoraan kuvatiedostoon. Useimmissa ohjelmointikielissä on tuki EXIF-tiedon käsittelyyn.

DIG35 on monipuolinen kuvametadatastandardi, joka on kuitenkin helppokäyttöinen koska suuri osa sen kentistä ei ole pakollisia.

Z39.87 on luonnosasteella oleva standardi. Se keskittyy lähes yksinomaan kuvausvälineen teknisiin tietoihin ja värinhallintaan. Koska Z39.87 ei tarjoa metadataa sisällön kuvailuun, sitä käytettäessä metadataa pitäisi täydentää jonkin muun standardin kentillä.

IPTC on kehitetty erityisesti median tarpeisiin. Se sisältää joitakin ontologisia elementtejä. Sen mukauttaminen biologiseen käyttöön ei liene järkevää koska muut ontologistandardit todennäköisesti tulevat suosituimmiksi.

TDWG UBIF ja SDD. TDWG:illa (Taxonomic Data Working Group) on useita luonnoksia metadatastandardeista, joita voi käyttää myös kuvien kuvailuun. UBIFaa (Unified Biological Information Schema🙂 ehdotetaan käytettäväksi internetissä vaihdettavan biologisen tiedon yleiseen kuvailuun. SDD (Structure of Descriptive Data) sopii objektien kuvailuun. Se tukee yhteisöllisesti tuettuja sanastoja taksonien kuvailuun.

JPEG2000 on uusi kuvanpakkausstandardi, joka tukee suurempaa määrää metadataa kuin nykyinen JPG-standardi.

Kuvametadatan hallinta – neuvoja

Älä liitä metadataa kuvien tai hakemistojen nimiin, ellet tallenna sitä myös muualle. On parempi käyttää lähes minkä tyyppistä tietokantaa kuin tallentaa tietoa pelkästään nimiin.

Kaikilla kuvilla pitäisi olla yksilöllinen tunniste (GUID, Globally Unique ID), jota voi myös käyttää primääriavaimena kuvanhallintatietokannassa. Tunnisteen pitäisi olla globaalisti yksilöllinen ja pysyvä ajan kuluessa. (Lisää GUID:ien vaatimuksista (ZIP-tiedosto))

Oikea tietokanta helpottaa metadatan tallennusta, säilömistä ja jakamista. Esim. usein toistuvat paikannimet kannattaa tallentaa omaan taulunsa, ja hakea ne käyttöön sieltä. Tämä vähentää erilaisista kirjoitusasuista johtuvia ongelmia. Kuvametadatan voi myös yhdistää suoraan kokoelmatietokantaan ja näin varmistaa tietojen eheyden.

Jos aiot julkaista metadataa verkossa, on suositeltavaa tehdä se XML-muodossa käyttäen sovittua sanastoa ja skeemaa. Monissa tietokannoissa on sisäänrakennettu XML-tuki (tai mahdollisuus sellaiseen).

Käytä kellonajoissa UTC-viitattuja aikoja. W3C suosittelee käytettäväksi ISO 8601 -standardia, johon aikavyöhykekin sisältyy.

Kuvien sisältämä EXIF-metadata kannattaa poimia niistä itsestään, jotta kuvaan ja metadatatietokantaan tallennetut tiedot eivät eroaisi toisistaan.

Yksi kommentti

1. Biologisten näytekuvien hallinta - biomi.org/blogi

[…] Liitä kuviin aina niitä kuvaileva metadata, joka kannattaa tallentaa kuvanhallintajärjestelmään. […]

Tämän jutun kommentointi on suljettu.