Life Science Identifiers (LSID)

(Jatkossa tämän jutun kaltaiset bioinformatiikkaan liittyvät tekniset artikkelit löytyvät aiheen bio-info alta. Bio-aiheen alla julkaisen luontoon, ympäristöön tai yleisbiologiaan liittyvät jutut. Voit halutessasi lukea vain yhtä aihealuetta RSS-virtana.)

LSID on standardoitu URN (Uniform Resource Name) -protokolla (protocol, spesification, scheme), joka tarjoaa yksiselitteisen tavan erilaisten biologisten tietovarantojen (data resources) nimeämiseen ja tunnistamiseen. Jokaiselle nimettävälle kohteelle annetaan yksilöllinen nimi, jonka avulla sen voi tunnistaa sijainnista riippumatta. LSID-tunnisteen määrittelemä kohde on muuttumaton; muuttuessa sille määritellään uusi LSID-tunniste. Kohde voi olla esimerkiksi lajinimi, havaintotietue tai kokoelmayksilötietue.

LSID-protokolla määrittelee myös standarditavan datan löytämiseen (tästä lisää myöhemmin).

Jokainen LSID-tunniste koostuu viidestä osasta:

  • verkkotunniste (Network Identifier (NID))
  • nimeäjätahon nimi, tavallisesti juuritason DNS-nimi (root DNS name)
  • nimeäjätahon valitsema nimiavaruus (namespace)
  • yksilöllinen tunniste ko. nimiavaruudessa (object id)
  • vapaaehtoinen versionumero (revision id).

Osia erottaa kaksoispiste. Esimerkki: urn:lsid:ncbi.nlm.nig.gov:GenBank:T48601:2 (entry GenBankissa, toinen versio).

LSID-tunnisteita voidaan käyttää esimerkiksi tunnistamaan ovatko eri lähteistä kootut tiedot samoja tai yksilöimään käytetyt tietolähteen yksiselitteisesti.

Lähteitä