Suomen kansallisbibliografia julkaistu avoimena datana

FENNICA-tietokanta - Suomen kansallisbibliografia on suomalaisen julkaisutuotannon tietovaranto, jota tuotetaan Kansalliskirjastossa. Fennica on nyt julkaistu avoimena datana CC0-lisenssillä, joka antaa mahdollisuuden sen vapaaseen hyödyntämiseen esimerkiksi sovelluksissa ja datan visualisoinneissa.

Suomen kansallisbibliografia sisältää seuraavia kuvailutietoja:

  • suomalaiset kirjat vuodesta 1488
  • sarja-aineistot, mm. lehdet vuodesta 1771
  • kartat 1540-luvulta lähtien
  • audiovisuaaliset aineistot
  • digitoituja vanhoja aineistoja
  • pienpainatekokoelman aiheenmukaiset ryhmäluettelot
  • verkkosivujen teemakeräyksistä tehtyjä ryhmäkuvailuja vuodesta 2008
  • kustantajien ennakkotiedot tulevista julkaisuista
  • valikoidut e-kirjat n. vuodesta 2008 alkaen.

Palvelu sisältää tiedot noin miljoonasta suomalaisesta teoksesta. Pääset selaamaan Fennican tietoja avoimen datan päälle rakennetun käyttöliittymän avulla osoitteessa http://data.nationallibrary.fi/. Jokainen teos, henkilö, organisaatio, paikka ja aihe näyttäytyy sivuna, jotka linkittyvät toisiinsa erilaisin suhtein, esimerkiksi teoksella on yleensä tekijä, joka on henkilö ja teoksen versiolla tai painoksella yleensä kustantaja, joka on organisaatio. Sivuja on yhteensä noin 2 miljoonaa.

Linkitettyyn dataan pääsee käsiksi usealla eri tavalla. Teoksille ja muille resursseille on annettu URI-tunnisteet, jotka tarjoavat myös koneluettavaa dataa mm. JSON-LD-, Turtle- ja RDF/XML-formaateissa. Tarjolla on myös SPARQL- ja Linked Data Fragments -kyselyrajapinnat, joiden avulla aineistoon voidaan kohdistaa laajempia kyselyitä. Koko aineisto on myös ladattavissa sekä RDF-muodossa että alkuperäisinä MARC-tietueina.

Samalla avataan myös lukuisia muita Kansalliskirjaston tietovarantoja ja rajapintoja, joista löydät lisätietoa Kansalliskirjaston datakatalogista https://www.kiwi.fi/display/Datacatalog

Kansalliskirjaston tehtävänä on ottaa vastaan ja säilyttää tuleviakin sukupolvia varten Suomessa levitettäväksi tarkoitetut painotuotteet ja tallenteet sekä asettaa ne kuvailutietoineen yleisön saataville. Avoin data parantaa tutkimuksen edellytyksiä ja tukee kansalaisyhteiskuntaa. Kansalliskirjasto toivookin tietovarannoilleen uusia käyttäjiä ja uusia käyttötapoja. Aiemmin on jo avattu Kansalliskirjaston tuottamat asiasanastot, ontologiat ja yhteisönimet. Datan käyttöluvat sallivat myös kaupallisen hyödyntämisen. Suomalaisten julkaisujen tekijöiden ja kohdehenkilöiden nimimuodot tullaan julkaisemaan myöhemmin, koska ne vaativat tietosuojaan liittyviä varmistustoimenpiteitä.

Lisätietoja: Tietojärjestelmäpäällikkö Nina Hyvönen, nina.hyvonen(at)helsinki.fi, puh. 050 415 4844 ja tietojärjestelmäasiantuntija Osma Suominen, osma.suominen(at)helsinki.fi