Kyllä minä niin mieleni pahoitin, kun piti yhdistää useamman Moodle-kurssin dataa saamaan oppimisanalytiikkavisualisointiin.
Tiedolla johtamisen osaajakoulutuksella tuottavuutta työelämään – TIEJOT-hankkeessa toteutettiin useita opintojaksoja eri Moodle-alustoilla, joihin samat opiskelijat kirjautuivat useilla eri tunnuksilla. Näistä kaikista piti koostaa yhtenäinen visualisointikokoelma, joissa edistymistä voidaan seurata opiskelijakohtaisesti aina kahden perättäisen toteutuksen kesken. Käyttäjätiedot pseudonymisoitiin kehitystyötä varten, ja visualisointi toteutettiin Oppikoppi-järjestelmän PowerBI-visualisointipohjaan.
Mielensäpahoittajan oppimisanalytiikkaa -artikkelisarjan ensimmäisessä osassa käsiteltiin Webropol-kyselyiden tietojen tuomista PowerBI:hin ja yhdistämistä Moodlen sekä ulkoisen arviointidatan kanssa.
Lähtökohtaisesti yhdellä opiskelijalla on ainoastaan yksi uniikki tunniste ja sähköpostiosoite, kuten on havainnollistettu kuvassa 1. Tässä artikkelissa tarkastellaan millä eri tavoin mielensä voi pahoittaa, kun yhdistää dataa useamman Moodle-toteutuksen sekä Webropol-palautekyselyn kesken.
Kyllä minä niin mieleni pahoitin, kun Moodle-palvelin vaihtui välissä
Ensimmäisen koostevisualisointiin yhdistettiin Tavoitteena tiedolla johtaminen sekä Datalähtöinen toiminta ja kehittäminen -opintojaksototeutusten data.
Näiden kahden toteutuksen aikana tapahtui Moodlen palveluntarjoajan vaihdos, jolloin Tavoitteena tiedolla johtaminen sijaitsi eri Moodle-palvelimella kuin muut. Datan yhdistämisen näkökulmasta tämä tarkoitti sitä, että samaa opiskelijaa kohti on kaksi eri käyttäjätunnistetta, jotka vaihtuvat uudemmalle palvelimelle siirryttäessä. Tilannetta havainnollistaa kuva 2, jossa ainoastaan Moodlen id-arvo vaihtuu muiden tietojen pysyessä samoina eri palvelimilla.
Koska Oppikoppi pyrkii tuottamaan yhdistetyn datan Moodlen käyttäjätunnisteiden ja sähköpostiosoitteiden perusteella, on niiden oltava samoja molempien työtilojen datassa. Siksi oli valittava molemmille kursseille käyttöön samat tunnisteet opiskelijoille, ja päivitettävä ne toiseen lokitiedostoon vastaaviksi.
Käytännössä tämä tarkoitti, että käyttäjänimien perusteella luotiin muunnostaulukko (kuva 3), jota käytettiin muuntamaan käyttäjien tunnisteet samoiksi lokitiedostoissa.
Kyllä minä niin mieleni pahoitin, kun käyttäjät kirjautuivat eri tunnuksilla samaan Moodle-työtilaan
Haka-kirjautuminen mahdollistaa Moodleen kirjautumisen oman oppilaitoksen tunnuksilla. Opiskelijat käyttivät tätä varsin innokkaasti hyväkseen, mutta valitettavasti myös saman toteutuksen aikana. Opiskelijoiden toiminnasta kertova data oli lokitiedostoissa tallessa nyt ainakin kolmen eri käyttäjätunnisteen takana: ensiksi Moodlen alustan vaihtuessa tapahtunut käyttäjätunnisteiden päivittyminen, sen jälkeen vielä kirjautumistavan takia tapahtunut vaihtuminen.
Tämä vaati lisää huomioitavaa muunnosskriptejä tehtäessä. Sen lisäksi, että käyttäjätunniste vaihtuu lokidatoissa, myös arvosanadatassa oleva sähköpostiosoite vaihtui. Samaa käyttäjää kuvaa tässä vaiheessa jo kolme erillistä yhdistelmää, kuten kuvasta 4 on nähtävissä.
Tietojen yhdistämistä varten täytyi lisätä vielä oma muunnostaulukkonsa, joka muuntaa sähköpostiosoitteet samoiksi eri kurssien välillä, ja päivittää HAKA-kirjautumisella luodun datan tunnisteet vastaamaan aiempia. Tämä vaatii jonkin verran lokitietojen ja käyttäjätunnisteiden tutkimista, että soveltuvat arvot saatiin haettua muunnosskriptiä varten. Muunnostaulukko tässä vaiheessa on nähtävissä kuvasta 5.
Kyllä minä niin mieleni pahoitin, kun sama toteutus jaettiin kahteen eri Moodle-työtilaan
Tiedolla johtamisen data-analytiikkaa –opintojakson toteutus oli pilkottu syksyn ja kevään osalta kahteen erilliseen Moodle-työtilaan, ja näiden kahden Moodle-työtilan kokonaisuutta piti käsitellä yhtenä. Tavoitteena pilkkomiselle kahteen oli tarve saada opiskelijoille käyttöön tietyn oppilaitoksen tunnukset. Tätä tarvittiin, koska oppilaitoksen hyödyntämiin automatisoituihin tehtäviin täytyi tunnistautua kyseisen oppilaitoksen omilla tunnuksilla. Tämä puolestaan loi käyttäjille jo neljännen tunnistetiedon, mikä on nähtävissä kuvasta 6, sekä lisäksi säännön kurssitunnisteiden yhdistämiselle.
Kehittäjän kannalta tämä monimutkaisti datan yhdistämistä entisestään. Edellisten käyttäjätunnistemuunnoksen lisäksi lokidatasta piti päivittää myös kurssien tunnistenumerot samoiksi. Prosessi on tässä vaiheessa jo kohtalaisen raskas, sillä kehittäjän täytyy varmistua jo useamman tiedoston datan yhteneväisyydestä. Tähän kuuluu mahdolliset muuttuneiden tietojen etsintä monen kurssin osalta. Päivitettyjen muunnostaulukoiden sisältö nähtävissä kuvasta 7.
Kyllä minä niin mieleni pahoitin, kun nimet sai vapaasti kirjoittaa
Sähköpostiosoite on usein käytetty tapa käyttäjän yksilöintiin. Jos sähköpostiosoitetta ei voi käyttää tunnistamaan käyttäjää, sen voi yhä tehdä etu- ja sukunimen perusteella. Tätä ominaisuutta hyödynnettiin, kun yhdistettiin Webropol-kyselydataa ja ulkoisista järjestelmistä tulevaa arvosanadataa Moodlen lokidatan kanssa.
Yksittäisillä käyttäjillä oli sukunimi vaihtunut opintojakson suorittamisen aikana, mikä osaltaan haittaisi tietojen yhdistämistä pelkän nimen perusteella. Onneksi näitä ei ollut kovin montaa, ja sulkemalla muut vaihtoehdot pois, vastauksen etunimen perustella sen pystyi kohdentamaan oikeaan käyttäjään.
Yllätyksiä sen sijaan tuli monipuolisista tavoista kirjoittaa nimi. Onko nimessä mukana toinen ja kolmas nimi, vai käytetäänkö vain ensimmäistä. Tai onko kyseessä väliviivalla oleva virallinen etunimi, mutta käyttäjä tunnetaan useimmiten lyhemmällä versiolla. Joissain tilanteissa käyttäjä oli jättänyt nimensä kokonaan kirjoittamatta, vaikka sitä erikseen pyydettiin.
Ensimmäinen Webropol-palautekysely jaettiin julkisen linkin kautta, jossa erikseen pyydettiin etu- ja sukunimi. Toinen kysely toimitettiin henkilökohtaisten linkkien kautta, ja siinä pyydettiin lisäksi tietyn opetusorganisaation sähköpostiosoite.
Sähköpostiosoitekentästä saattoi välillä puuttua pyydetyn organisaation sähköpostiosoite, mutta henkilökohtaisten linkkien avulla saatiin vastaajien sähköpostiosoitteet selville vastausten aikaleimojen avulla. Tämä avulla puuttuvat vastaajien nimet sai selvitettyä. Nimi- ja sähköpostidata täytyi taas muuntaa tietoja vastaamaan kullekin opiskelijalle valittua sähköpostiosoitetta sen opintojaksototeutusparin sisällä, johon Webropol-kyselydata liitettiin. Samalle käyttäjälle kertyy siis useita tunnistetietoja, jotka pitää muuntaa vastaamaan yhtä ja samaa perustietuetta. Lisäksi kurssin tunnisteetkin voivat vaihtua osittain. Tilannetta on havainnollistettu kuvassa 8 ja sitä vastaavat tietojen muunnostaulukot ovat nähtävissä kuvasta 9.
Kyllä minä mieleni niin pahoitin, että yhteenveto piti kirjoittaa
Tässä vaiheessa käsin on varmistettava jollakin menetelmällä kuusi erilaista arvoa per käyttäjä, ja luotava tarvittavat muunnoskäskyt. Jos osallistuja opintojaksolle on 70 kappaletta, näitä muunnosrivejä tarvitaan pahimmassa tapauksessa 420 kappaletta, että tunnisteet pysyvät yhtenäisenä kaikkien käsiteltävien toteutusten datan kesken. Käytännössä määrä on todennäköisesti pienempi.
Kun mielensäpahoittaja ryhtyy yhdistämään eri kurssien lokitietoja, on syytä siis ottaa huomioon seuraavat asiat:
- Tee muunnostaulukot Moodlen käyttäjä- ja kurssitunnisteita, sähköpostiosoitteita, ja käyttäjänimiä varten.
- Valitse jokaiselle käyttäjälle kaikissa datoissa käytettävä Moodlen tunniste, sähköpostiosoite ja nimi, johon kaikki muut tiedot palautetaan. Etsi ja lisää sääntöjä sitä mukaa kun niitä löytyy.
- Muunna kaikki datat aina samoilla muunnostaulukoilla. Silloin on mahdollista pseudonymisoida kaikki datat samalla kertaa, ja hajauttaa eri visualisointeihin.
- Pyydä palautteet Webropoliin henkilökohtaisen linkin kautta, jolloin vastaukset saa hankalissa tilanteissa kohdistettua oikeisiin käyttäjiin.
Mielensäpahoittanut kirjoittaja:
Anssi Gröhn, tietojenkäsittelyn lehtori, Karelia-ammattikorkeakoulu
Artikkeli on kirjoitettu Tiedolla johtamisen osaajakoulutuksella tuottavuutta työelämään – TIEJOT -hankkeessa. Hankkeen rahoittaja on JOTPA Jatkuvan oppimisen ja työllisyyden palvelukeskus.