import pandas as pd
Handout (pandas & plotly)
Zeitreihenanalyse der Luftqualität
Pandas
Import
Pandas-Bibliothek für Datenanalyse importieren.
Daten einlesen
Daten aus einer CSV-Datei in einen DataFrame einlesen.
# CSV-Datei einlesen
= pd.read_csv("data/example.csv", parse_dates=True, index_col=0)
df # Dataframe anzeigen
df
value | category | |
---|---|---|
date | ||
2024-01-01 | 10.5 | a |
2024-01-02 | 11.0 | a |
2024-01-03 | 10.7 | b |
2024-01-04 | 12.2 | b |
2024-01-05 | 13.1 | b |
2024-01-06 | 12.8 | c |
Spalten selektieren
Eine bestimmte Spalte aus dem DataFrame auswählen.
# Spalte value selektieren
= df["value"]
values values
date
2024-01-01 10.5
2024-01-02 11.0
2024-01-03 10.7
2024-01-04 12.2
2024-01-05 13.1
2024-01-06 12.8
Name: value, dtype: float64
Daten filtern mit Bedingungen
Daten anhand einer Bedingung auswählen (z.B. Werte größer als 11).
# Bedingung festlegen
= df["value"] > 11
cond # Bedingung anwenden
= df[cond]
filtered filtered
value | category | |
---|---|---|
date | ||
2024-01-04 | 12.2 | b |
2024-01-05 | 13.1 | b |
2024-01-06 | 12.8 | c |
Gruppieren & Aggregieren
Werte nach Kategorien gruppieren und aggregieren (z.B. Mittelwert berechnen).
# Daten nach Spalte category gruppieren
= df.groupby("category")
grouped # Mittelwert berechnen
'value'].mean() grouped[
category
a 10.75
b 12.00
c 12.80
Name: value, dtype: float64
Resampling
Zeitreihen-Daten nach Zeitintervallen zusammenfassen und aggregieren.
# Monatlicher Mittelwert
"MS")['value'].mean()
df.resample(# Einträge pro Jahr
"YS")['value'].count() df.resample(
date
2024-01-01 6
Freq: YS-JAN, Name: value, dtype: int64
Plotly Express
Daten visualisieren
Import
Plotly Express für interaktive Visualisierungen importieren.
import plotly.express as px
Liniendiagramm
Verlauf einer Variable über die Zeit darstellen.
Balken- und Säulendiagramm
Werte nach Kategorien als Säulen darstellen.
Werte nach Kategorien als Balken darstellen.
Streudiagramm
Zusammenhang zwischen zwei Variablen darstellen.
Boxplot
Verteilung von Werten innerhalb von Gruppen analysieren.
Wiederverwendung
Zitat
@online{sparmann2025,
author = {Sparmann, Sören},
title = {Handout (pandas \& plotly)},
date = {2025-05-30},
url = {https://climate-data-entrepreneurial-club.netlify.app/modul_2/submodules/01_luftqualitaet/03_handout.html},
langid = {de}
}