import pandas as pd # lese data fra csv-fil
import seaborn as sns # plotting
sns.set(style = 'whitegrid', font_scale = 1.5) # utseende av plott
import matplotlib.pyplot as plt # og mer plotting
import numpy as np # matematikk


df = pd.read_csv('https://www.math.ntnu.no/emner/IST100x/python_felles/personbildata.csv',index_col=0) # lese inn datasettet (cvs-fil med radnavn)


df.shape  # Dimensjonen til datasettet

(13, 4)


df # se på hele datasettet (dette kan vi gjøre fordi dimensjonen er liten)


df2020 = df.iloc[12,].to_frame().transpose()  # Hente ut rad 12 (2020) til ny pandas DataFrame
df2020


df2020 = df2020.div(df2020.sum(axis=1),axis=0) # Bytte ut antall med andel
df2020


palette = sns.color_palette(["#d55e00","#0072b2","#009e73", "#f0e442"]) 
# palette = farger for de fire drivstoff-kategoriene
# Har hentet fargeblind-vennlige palett fra https://www.color-hex.com/color-palette/49436

sns.barplot(data = df2020, palette = palette) 
# Plotter et enkelt stolpediagram (barplot) med Seaborn-modulen

<AxesSubplot:>


df2020sort = df2020.sort_values(by = 2020,axis=1,ascending=False)
# Sorterer dataene fra største til minste andel
df2020sort


# Plotter de sorterte dataene (og sorterer fargene) 
palette_sort = sns.color_palette(["#0072b2","#d55e00","#009e73", "#f0e442"])

sns.barplot(data = df2020sort,palette = palette_sort)


df_andel = df.div(df.sum(axis=1),axis=0) # Lager et datasett med årlige andeler i stedet for antall

# Plotter utvikling i andeler av hver kategori med et Seaborn lineplot
sns.lineplot(data = df_andel,palette = palette)
plt.ylim(0,1); plt.xlim(2008,2020)

(2008.0, 2020.0)

	bensin	diesel	el	annet
2008	1596852	597391	1693	126
2009	1550434	690560	1776	131
2010	1500841	804384	2068	144
2011	1448232	922986	3909	180
2012	1408198	1025220	8031	357
2013	1368625	1110621	17770	2070
2014	1328380	1186194	38652	999
2015	1295739	1243235	69134	1013
2016	1196148	1276947	97532	91054
2017	1139998	1294493	138983	144630
2018	1075179	1290442	195351	189650
2019	1031207	1281019	260692	226926
2020	950131	1246671	340002	272314

Personbiler i Norge¶

Læringsmål: Kategoriske data¶

Delmål¶

Steg 1: Laste inn nødvendige python-moduler¶

Steg 2: Lese inn og se på datasettet¶

Steg 3: Stolpediagram for andeler av hver drivstofftype i år 2020¶

Steg 4: Plotte utvikling over tid¶