Denne artikkelen tar deg stegvis gjennom innhentiing og bearbeiding av data på ssb.no/statbank, og så må vi bearbeide tabellen før vi kan vise den i Datawrapper.
Eksempeltabellen er denne:
https://www.ssb.no/statbank/table/11422
I ein statistikk kan du velge ulike variablar. Avhengig av kva du vil vise i historien din kan du gjere lulike valg. Kanskje du vil vise ulikeheiter i lønn mellom ulike yrker? Eller mellom kjønn eller ulike regionar? Du kan velge om du vil ha ei samanligning over tid eller for eit enkelt år.
For denne øvelsen har eg valgt desse variablane:

Denne spørringa gir først denne tabellen:

Dette er ikkje eit veldig nyttig tabellformat for å lage en graf. For å få ein fin graf i datawrapper ønsker vi eit tabellformat som dette:
år | yrke 1 lønn | yrke 2 lønn | yrke 3 lønn | yrke 4 lønn |
2019 | ||||
2020 | ||||
2021 | ||||
2022 | ||||
2023 |
På ssb.no/statbank har vi en del valg for å justére strukturen på tabellen. Du må ofte prøve deg litt fram med en kombinasjon av å Rotére tabellen og å endre visning:


Du kan også velge linjediagram frå SSB som resulterer i eit statisk bitmap bilde, altså ikkje ein interaktiv graf. For denne tabellen ser den slik ut:

Dette er ei ok framstilling, men den er litt tung å lese. Det er ingen interaktivitet på dei grafiske elementa så brukaren må sjekke farge under og så lese ut farge på tabellen og så sjekke posisjonen mot y aksen på venstre side. Det er altså en liten prosess brukaren må gjennom for å lese denne tabellen. Dette kan vi forbedre masse gjennom Datawrapper. Vi må altså jobbe litt meir for at brukaren skal jobbe mindre i prosessen med å lese og forstå datasettet.
Vel å velge ‘Tabell – Visning 2’ og så trykke rotér ein eller fleire gangar får vi denne tabellen. Eg meinar dette tabellformatet gir bra utgangspunkt for vidare jobbing i Datawrapper:

Ulike yrker er på øverste rad, eller egentlig nest øverste i denne tabellen så vi må rydde litt. Men vi har lønn årvis i kolonner så dette er grovstrukturen vi treng for å få ei bra visning i Datawrapper.
Du kan lagre data u ulike format. For bruk med eit regnark program (Excel, Open Office calc eller Google sheets) anbefalar eg .xlsx eller Semikolonseparert med overskrift. Vi må uansett jobbe meir med strukturen i denne tabellen i eit regneark program.
Du kan laste ned .csv fila eg fekk frå SSB her:
Du kan åpne fila i eit regneark program. Til dette eksempelet er Googe sheets i bruk. For å laste opp .csv data til google sheet å du først åpne:
https://drive.google.com/drive/home
In google sheets velg ‘+ new’ og så filopplasting:
Last opp .csv fila
Når den er last opp så velg ‘Open with’ ig så Google sheets. Tabellen eg lasta opp kan du sjå på lenka under og så kan du lage en kopi som du kan redigere vidare:
https://docs.google.com/spreadsheets/d/1jQ4jCtc0-qau11ll3SNdDegSyFw4_1BDhvses8un0fM/edit?usp=sharing
Tabellen ser sånn ut:

Her er det en del rader og kolonner som ikkje er nødvendig. Vi kan kvitte oss med rad 1 og 2:

Vi kan kvitte oss med kolonnene frå B til F:

Då endar vi opp med denne tabellen:

https://docs.google.com/spreadsheets/d/1BX0Cbaac7_xru1cFkcMcYAY5XvgrBw9HntI4Zp5IbZA/edit?usp=sharing
Det er mulig ‘å’ i år kan skape trøbbel for Datawrapper fordi det er eit spesialtegn, men kanskje det går også? Vi prøvar men det er en ting å være ob på. Enkelte system kan streike med et spesialtegn i øveste rekker som vil bli variabelnavn i Datawrapper. Som sagt, vi prøvar.
På tide å starte Datawrapper
I dagtawrapper kan du få inn data på ulike måtar og i ulke format:

I dette eksempelet har vi brukt Google sheets så da er det ganske enkelt. Hvis du har datasettet i Excel kan du lagre som .xls eller .csv og laste opp i Datawrapper. Du kan og copy-paste data frå ein tabell men det kan fort bli knotete hvis du har en stor tabell. I dette tilfellet skal vi fortsette med Google sheets data.
For at Datawrapper skal kunne lese regnearket vårt må vi først gjere det tilgjengeleg. Det gjer vi ved å trykke på ‘Share’ knappen på google regnearket:

Velg at ‘anyone with the link’ kan være ‘Viewer’ og trykk på Copy link. Så kan du trykke på ‘Connect google sheet.
Hvis regnearket er ok og Datawrapper kan lese det får ei grøn hake på lenka:

Vi kan fortsette (trykk Proceed):

Her må du sjekke at innhaldet i datasettet fungerer i Datawrapper. Sjå etter celler farga i ruødt. Vær også obs på kva datatype som blir gjekjent og sjekk fargekodene som er beskrive. Det er av betydning om cellene er gjenkjent som tekst, tallverdiar eller datoar.
Hvis ingenting er raudt og datatypane stemmer kan du fortsette til visualisering:

I neste vindu kan du velge type visualisering. Datawrapper har mykje på by på men vledig ofte er det dei enklaste formene for visualisering som fungerer best. Hvis datasettet har en tidsakse er det ofte riktig å velge linjegraf, mens hvis tid ikkje er en variabel er det ofte bedre å velge søyle. Datawrapper velger ofte en bra form for visualisering, men du kan også overstyre. I dette tilfellet er linje eit bra valg.

Andre typar: Søylediagram bør være velkjent. Kakediagram kan fungere bra for prosentvis visning hvis det ikkje er for mange datapunkt. Hvis du har en tabell med fleire kolonner med tallverdiar er Scatterplot en bra måte å utforske datasettet på, og kan og fungere bra som endeleg visning.
Men, her skal vi fortsette med linjegraf.
Under ‘Visualize’ er det fire faner med mange valg. Vi kan fortsette til ‘Refine’.
Custom Range – Sidespor eksempel: Tennisranking Casper Ruud
Tidlegare på dette kurset brukte vi å visualisere Casper Ruud sin ATP rank, og i eit linjediagram. Fordi dette datasettet har en ranking der 1 er maksverdi måtte vi senne en ‘Custom range’ på den vertikale aksen. Custom range gjekk da frå lavaste ranking (høgaste nummer) som minimumsverdi og 1 som maksverdi. Det er eit eksempel på kor du av og til må tilpasse visninga av datasettet. Her er grafen med ATP ranking:
I vårt SSB eksempel treng vi ikkje snu om på visninga. Høgare lønn skal være øverst.
Vidare under ‘Refine’ kan du velge kor mange ticks (ertikettar på aksane) du skal ha og du kan velge å ha ‘Custom ticks’. I tennisgrafen over er feks. 1 satt som en custom tick for at vi skal få en etikett øverst. Det er generelt anbefalt å rydde bort det meste av overfløding infomrasjon. Det kan og bety å redusere antall ticks.
Du kan og velge å utheve ei linje med ein annan farge:


Tooltip
Tooltip er eit viktig virkemiddel for å vise eksakte verdiar rett i grafen. Det er verdt å bruke litt ekstra tid for å forbedre tooltipen. Den bør være så enkel og inutitiv som mogleg. Her er tooltipen uten justeringar:

Denne er ok bortsett frå at tid er angitt med en spesifikk dato. Det er fordi datawrapper og lignande system opperer med veldig presise tidspunkt sjølv om vi har lagt inn år som einheit. Her bør vi sjå på alternativ på ‘Dates format(x)’.

Heile år uten dato gir meir meining i dette tilfellet:

Annotate
Gi grafen en tittel og en beskrivelse hvis nødvendig. Du bør og oppgi kilde til datasettet og lenke til den. I dette tilfellet er SSB kilde sjølv om vi har brukt Google sheets som datafeed. Vi bør og lenke til SSB statistikken og ikkje til google regnearket. ‘Alternative description’ er eit EU krav for alt bildemateriale som skal publiserast på nett. Det skal erstatte det visuelle materialet for brukarar som ikkje kan sjå grafen. Det er vanskeleg å erstatte en graf med en kort beskrivelse, vi kan ikkje får erstatta innhaldet med ein kort beskrivelse så ein enkel beskrivelse må holde.

Under annotate kan du og legge til tekst etikettar og du kan markere eit område i grafen.
Publish & Embed
Vi er klare for å publisere grafen. Inntil du har trykt publiser kan du kun laste ned eit bilde (.png) av grafen. Trykk ‘Publish now’.
For å bygge grafen inn i ei publiseringsløysing (feks. Journalen / Drupal) kan vi velge ulike måtar. Ein vanleg måte er å bruke iframe. Dette er ei eldre løysing som fortsatt fungerer. Du bør bruke ‘responsive iframe’ osm sørgar for at grafen tilpassar seg sida den er på og ulike skjermstørrelsar. Hvis det fungerer kan du godt bruke ‘Embed with script’.