Snødybde

Datasettet snodybde.xls er lastet ned fra Norsk Klimaservicesenter https://seklima.met.no/ og inneholder observasjoner av snødybde målt på Biri i Gjøvik kommune vinteren 2019/2020. Vi har lagret filen som .xls fordi biblioteket xlrd (https://pypi.org/project/xlrd/) av sikkerhetshensyn ikke aksepterer .xlsx-filer.

Læringsmål: Kontinuerlige data

Delmål

  1. Lese inn .xls (excel) fil og gjøre seg kjent med et enkelt datasett
  2. Regne ut oppsummerende tall
  3. Plotte histogram og boksplott

Hva er relevant for tellende vurdering? Erfaringen med å håndtere datasett i Python får du nytte av i den tellende prosjektoppgaven, og i resten av utdanningen din. Du skal ikke skrive kode selv på eksamen, men du må kunne lese, tolke og forklare utskrift og plott fra ulike statistikk-beregninger i Python.

Steg 1: Laste inn nødvendige python-moduler

Notebook-tips: Kjør koden som henter inn modulene ved å trykke på feltet under og deretter knappen "Run" øverst på kommandolinja, eller bruk tastatursnarveien cmd + enter.

Steg 2: Lese inn data

Steg 3: Regne ut oppsummerende tall

Python-tips: Hvordan kjenner vi til alle disse funksjonene? Det er rimelig å anta at de vanligste statistikkfunksjonene er ferdig kodet i en eller annen python-modul. Et raskt google-søk på "mean median and standard deviation in python" gir oss med en gang informasjon om modulen "statistics", og funksjonene i denne modulen kan man lese om her: https://docs.python.org/3/library/statistics.html

Steg 4: Tabell og histogram

Siden variasjonsbredden er på 61 cm ser vi det som rimelig å samle dataene i intervaller på 10 cm (fra 0 til og med 70 cm).

Steg 5: Boksplott