Avoin kulttuuridata hyötykäyttöön

Avoin kulttuuridata hyötykäyttöön Mobilizing open cultural data

Tavoitteemme on luoda suomalainen osaamisverkosto alan harrastajista, tutkijoista, käyttäjistä ja kehittäjistä. Järjestämme verkoston kesken kaksi perehdyttämistyöpajaa. Valmistaudumme tukemaan organisaatioita tiedon viemisessä Wikidataan.

Kuuluu Wikimedia Suomen ohjelmaan: Tekniikka
Liittyy Wikiprojekteihin: Wikidata
Toteuttaa ensisijaisesti seuraavaa Wikimedia-säätiön strategista tavoitetta: Increase reach
Websivu: Wikipedia:Wikiprojekti Avoin kulttuuridata hyötykäyttöön
Projektisuunnitelma: Hakemus
Kontakti: Susanna Ånäs

Rahoitus


Projektin esittely

Wikidata on Wikimedian sisarprojekti, jonka tarkoituksena on Wikipedioissa olevan tiedon kokoaminen yhteen keskitettyyn tietokantaan, jota kuka tahansa voi muokata. Wikidatasta on tulossa lisäksi monen alan keskeisen tiedon viitetietokanta.

Wikidatasta löytyy jo tieto jokaisesta ihmisen geenistä.[1] Projektissa Sum of all paintings[2] pyritään kokoamaan tiedot maailman museoiden maalauksista mahdollisimman kattavasti, vaikka teoskuvat eivät olisikaan saatavilla Wikimedia Commonsissa. Wikidatan kautta mahdollistuu Wikipedia-artikkeleiden täydentäminen toisen kielen artikkelia hyödyntämällä. Monimutkaiset haut tulevat mahdollistamaan useita eri kyselyjä hyödyntävät hakutulokset.

Suomessa Wikidatan hyödyntäminen on vielä vähäistä. Yle siirtyy käyttämään Wikidata-viitteitä asiasanoituksessa, sillä heidän nykyisin käyttämänsä Freebase lopettaa[3] ja siirtää oman tietämyksensä Wikidataan.

Wikidatan osaamisverkosto ja tilaisuudet

Tavoitteemme on luoda suomalainen osaamisverkosto alan harrastajista, tutkijoista, käyttäjistä ja kehittäjistä. Järjestämme verkoston kesken kaksi perehdyttämistyöpajaa, jonka kouluttajiksi kutsumme päteviä ulkomaisia kouluttajia Wikidata-organisaatiosta tai kansainvälisestä verkostosta.

Ensimmäinen järjestetään heti projektikauden aluksi verkoston käynnistämiseksi ja aiheen esittelemiseksi. Toinen järjestetään projektikauden puolivälissä. Wikimedia Suomi maksaa luennoijan kulut ja odottaa organisaatiokumppaneiden tarjoavan tilan ja ruokailun.

Kulttuurin datasetit Wikidataan

Valmistaudumme tukemaan organisaatioita tiedon viemisessä Wikidataan. Opiskelemme käytännön kautta. Viemme Kansallisgallerian teos- ja taiteilijatietokannan Wikidataan osana Sum of All Paintings -projektia. Pyrimme viemään Wikidataan myös Museoviraston paikkatietoaineiston[4], mikäli sen lisensointi on yhteensopiva. Wikidatan aineiston lisenssi on CC0, joten sinne voi lisätä ainoastaan yhtä avointa aineistoa.

Kulttuuriset paikkatietoaineistot ovat kansainvälisten Wiki Loves Monuments[5] ja Wiki Loves Earth[6] -kilpailujen käyttövoimaa. Wikimedia Suomi ei ole ottanut osaa näihin kilpailuihin aikaisempina vuosina, koska aineistojen siirtäminen Wikimediaan on ollut tekemättä.

Wikidata-hackit Wikipäivissä

Wikimedia Suomi alkaa järjestää kuukausittaisia Wikipäiviä Helsingissä Lasipalatsissa. Wikipäivien tavoitteena on luoda puitteet Wikimedian projekteja ja muita avoimia ympäristöjä ja aineistoja yhdistävälle innovoinnille ja oppimiselle. Wikimedia Suomi ry:n hallituksen jäsen Kimmo Virtanen on mm. ehdottanut, että suomenkielisen Wikipedian oikeellisuutta voidaan tarkentaa Wikidataan ladattavia Kansallisgallerian tietoja vasten. Joissain tapauksissa tietoa voidaan esittää Wikipediassa suoraan Wikidatasta.

Parhaat käytännöt -ohjeistus

Tuotamme suomenkielistä ohjeistusta Wikidatan hyötykäyttöön:

  1. Wikidatan käyttäminen viitetietokantana
  2. Tiedon tuottaminen Wikidataan massalatauksilla ja yksittäisillä muokkauksilla
  3. Tiedon hakeminen Wikidatasta
  4. Tiedon hyödyntäminen APIen kautta sekä Wikimedian projekteissa sisäisesti.

Infopaketti tulee sisältämään yleistajuista esittelevää tekstiä, sillä ajantasaisimmat ja täydellisimmät tiedot Wikidatan toiminnasta tulevat sijaitsemaan Wikidata-sivuilla, usein myös suomeksi käännettynä.

Aikataulu

1.7.2015–30.6.2016

  • 1. workshop todennäköisesti lokakuussa 2015
  • 2. workshop 2016
  • Pilottilataukset koko projektin ajan
Dokumentaatio ja ohjeistusdokumentit
  • kerätään ja rakentuvat online projektin ajan
  • paketoidaan julkaisuksi tai muotoillaan online 30.6.2016 mennessä

Logic model

Input Output Outcome
What we invest What we do Who we reach Short term Medium term Long term impact
We will employ a dedicated coordinator to run a networking and learning affort on WIkidata. Create a network for learning, arrange 2 workshops, conduct data imports. Users of Wikidata for indexing (i.e. The Finnish Broadcasting Company), open data advocates, public sector actors producing and maintaining open data. Learn about the use of Wikidata Be capable of advocating and consulting the use of Wikidata. Initiate projects that take extensive use of Wikidata.

Riskianalyysi

Mittarit

Yhteistyötahot ja aineistot

  • Yleisradio: Migraatio asiasanoituksessa Freebasestä mahdollisesti Wikidataan
  • Laji.fi: Suomalaisten lajinimien päivitys
  • Linked Data Finland: Historialliset paikannimet ym.
  • Kuntaliitto, Perusfaktat Suomen kunnista
  • Avoin tiede ja tutkimus
Yhteistyötä on lisäksi tiedusteltu seuraavilta
  • Kansallisgallerian taiteilija- ja teostietokanta
  • Museovirasto, Muinaismuistorekisteri, ei vielä sovittu
  • Kansalliskirjasto, Finto, ei vielä keskusteltu
  • Finna, avoin

Dokumentaatio

Viitteet

  1. http://blog.wikimedia.de/2014/10/22/establishing-wikidata-as-the-central-hub-for-linked-open-life-science-data/
  2. https://www.wikidata.org/wiki/Wikidata:WikiProject_sum_of_all_paintings
  3. https://plus.google.com/109936836907132434202/posts/bu3z2wVqcQc
  4. http://www.nba.fi/fi/tietopalvelut/tietojarjestelmat/kympariston_tietojarjestelma/aineistojen_kuvaus
  5. http://www.wikilovesmonuments.org/
  6. http://wikilovesearth.org/