Halusin kokeilla harrastusmielessä uutta ohjelmointiprojektia; jotakin joka ei liity biologiaan (=töihin), ja jossa voisi kehittää uusia taitoja. Myös datan avoin julkaiseminen kiinnosti (vastapainoksi kädenväännölle julkisuudesta tiedontuottajien kanssa). Dataopasta lukiessa mielenkiintoni heräsi viranomaisdataa kohtaan ja viimeistään Samuli Sairasen Eduskunnan vahtikoira -idea saivat innostumaan rajapinnan tekemisestä Eduskunnan äänestystietoihin. Alkujaan ajattelin että joku olisi jo tehnyt tällaisen, mutta en löytänyt tietoja julkaistuista toteutuksista. USA:ssa New York Times on kyllä tehnyt vastaavan Congress-API:n.
No, pari tuntia Simple HTML DOM -parserin parissa tuotti hyviä tuloksia, ja nyt muutama viikko myöhemmin yksinkertainen rajapinta (API) on käyttövalmis ja julkinen. Katso esim. tiedot XML-muodossa tuoreimmasta äänestyksestä, ympäristönsuojelulain muuttamisesta.
Rajapinnan päälle voi rakentaa kaikenlaista kivaa, helpoimmasta päästä vaikka em. äänestyksen tulokset värikkäässä muodossa.
Eduskunta on kertomansa mukaan parhaillaan selvittämässä äänestysten ja muidenkin täysistuntotietojen rajapinnan toteutusvaihtoehtoja. Jotain vastaavaa, virallista ja laajempaa on siis tulossa, mutta aikataulusta en tiedä.
Kunnollinen rajapinta olisi joka tapauksessa huomattavasti monimutkaisempi (=hitaampi tehdä) kuin tässä julkaistu. Äänestykset eivät esimerkiksi aina ole niin suoraviivaisia kuin voisi kuvitella, esim. sähköisen viestinnän tietosuojalain muutoksesta (“Lex Nokia”) päätettiin seitsemässä erillisessä äänestyksessä. Näiden välisten loogisten suhteiden pitäisi olla määriteltyinä rajapinnassa. Lisäksi moni muukin asia kuin pelkät äänestykset pitäisi saada esille rajapintana. Rajapinnan pysyvyyteen pitää myös panostaa.
Mutta tässä epävirallinen aloitus.
Kommentit
1 Biomi: Rajapinta Eduskunnan äänestystietoihin « Sorvipenkki (12.3.2010 klo 8.32)
[...] taustoista: Rajapinta Eduskunnan äänestystietoihin Rajapinta: [...]
2 Antti Poikola (12.3.2010 klo 12.47)
Mahtavaa, että dataopas jo ennen julkistustaan on toiminut inspiraationa :) Tervetuloa kirjan julkkaritilaisuuteen 25.3. klo 10-11 Postitalolla
Jos intoa riittää, niin suosittelen osallistumaan tämän vuoden Apps for Democracy kilpailuun.
3 Petri Kola (13.3.2010 klo 1.19)
Vau! Sormet syyhyävät, että pääsee Dataoppaan kirjoittamiskiireiden jälkeen vähän koodailemaan ja kokeilemaan rajapintaa.
4 Ilkka Pirttimaa (13.3.2010 klo 9.22)
Hienoa, hyvältä näyttää. Onneksi Eduskunta lienee sen verran hidas liikkeissään, että sinun Screen Scraping-tekniikka ei ihan heti mene rikki…
Mikäli käytän rajapintaa, voinko linkittää lisätietourlin tuohon visualisointipalveluun, esim. http://www.biomi.org/tools/eduskunta/aanestys/a1_11-2010 ?
5 Mikko Heikkinen (13.3.2010 klo 13.46)
Juu saa linkittää.
Kuulisin mielellään myös parannusehdotuksia. XML-tiedoston edustajien nimistä ajattelin ainakin vielä tehdä.
6 Erkka Piirainen (13.3.2010 klo 14.43)
Mahtavuutta, Mikko!
7 Mikko Heikkinen (13.3.2010 klo 19.25)
Suurimmaksi taakaksi API:n ylläpidossa voi muodostua juuri screen scrapingin ongelmat: sivujen rakenteen muuttuminen tai muut yllätykset, joihin en ole osannut varautua.
Esim. eilisessä äänestyksessä (a1_23-2010) Seppo Kääriäisen puolueeksi oli merkitty “kesk puhemiehenä”. Tämä aiheutti tallennettaessa tietokantavirheen.
Tämä myös estää tallennusvastuun jakamisen: tallentajalla pitää olla ylläpito-oikeudet, jotta virheet pääsee heti korjaamaan.
8 Ilkka Pirttimaa (14.3.2010 klo 23.29)
Minulla pyörii nyt serverprosessi, joka käy vartin välein katsomassa, onko uusia äänestyksiä ja tarvittaessa tekee Twitteriin tweetin: http://twitter.com/search?q=%23eduskuntaäänestys
9 Ilkka Pirttimaa (16.3.2010 klo 23.09)
Siirsin nuo Twitter-tilin @Arkadianmaki alle, eli jatkossa löytyy urlista http://twitter.com/Arkadianmaki
10 Hanna Koivula (26.3.2010 klo 14.16)
Tulin juuri “Avoin yhdistetty tieto Suomessa” tilaisuudesta, jossa Sitran kehitysjohtaja aloitti puheensa yhteisöllisyydestä ja innovaatioista. Seuraavaksi Mikko mainittiin nimeltä ja API sekä sen päälle muiden toimesta syntyneitä sovelluksia käytettiin esimerkkinä…
Hieno juttu! Kuulijoina mm. Suvi Lindén ja Mikael Jungner.
11 Avoin tieto Suomessa: Tietoyhteiskunta ja tiedon avaaminen -sessio « Sorvipenkki (28.3.2010 klo 14.03)
[...] kotimainen esimerkki on Mikko Heikkisen työstämä rajapinta Eduskunnan äänestystietoihin (Rajapinta eduskunnan äänestystietoihin, [...]
RSS-syöte tämän viestin kommenteista • TrackBack URI
Jätä kommentti