import pandas as pdHandout (pandas & plotly)
Zeitreihenanalyse der Luftqualität
Das Handout bietet eine kompakte Referenz zu den wichtigsten Funktionen der Python-Bibliotheken pandas und plotly für die Datenanalyse und -visualisierung.
Pandas
Import
Pandas-Bibliothek für Datenanalyse importieren.
Daten einlesen
Daten aus einer CSV-Datei in einen DataFrame einlesen.
# CSV-Datei einlesen
df = pd.read_csv(
"data/example.csv",
index_col=0,
parse_dates=True
)
# Dataframe anzeigen
df| value | category | |
|---|---|---|
| date | ||
| 2024-01-01 | 10.5 | a |
| 2024-01-02 | 11.0 | a |
| 2024-01-03 | 10.7 | b |
| 2024-01-04 | 12.2 | b |
| 2024-01-05 | 13.1 | b |
| 2024-01-06 | 12.8 | c |
Spalten selektieren
Eine bestimmte Spalte aus dem DataFrame auswählen.
# Spalte value selektieren
values = df["value"]
valuesdate
2024-01-01 10.5
2024-01-02 11.0
2024-01-03 10.7
2024-01-04 12.2
2024-01-05 13.1
2024-01-06 12.8
Name: value, dtype: float64
Daten filtern mit Bedingungen
Daten anhand einer Bedingung auswählen (z.B. Werte größer als 11).
# Bedingung festlegen
cond = df["value"] > 11
# Bedingung anwenden
filtered = df[cond]
filtered| value | category | |
|---|---|---|
| date | ||
| 2024-01-04 | 12.2 | b |
| 2024-01-05 | 13.1 | b |
| 2024-01-06 | 12.8 | c |
Gruppieren & Aggregieren
Werte nach Kategorien gruppieren und aggregieren (z.B. Mittelwert berechnen).
# Daten nach Spalte category gruppieren
grouped = df.groupby("category")
# Mittelwert berechnen
grouped['value'].mean()category
a 10.75
b 12.00
c 12.80
Name: value, dtype: float64
Resampling
Zeitreihen-Daten nach Zeitintervallen zusammenfassen und aggregieren.
# Monatlicher Mittelwert
df.resample("MS")['value'].mean()
# Einträge pro Jahr
df.resample("YS")['value'].count()date
2024-01-01 6
Freq: YS-JAN, Name: value, dtype: int64
Plotly Express
Daten visualisieren
Import
Plotly Express für interaktive Visualisierungen importieren.
import plotly.express as pxLiniendiagramm
Verlauf einer Variable über die Zeit darstellen.
Balken- und Säulendiagramm
Werte nach Kategorien als Säulen darstellen.
Werte nach Kategorien als Balken darstellen.
Streudiagramm
Zusammenhang zwischen zwei Variablen darstellen.
Boxplot
Verteilung von Werten innerhalb von Gruppen analysieren.
Wiederverwendung
Zitat
Mit BibTeX zitieren:
@online{sparmann2026,
author = {Sparmann, Sören},
title = {Handout (pandas \& plotly)},
date = {2026-03-09},
url = {https://material.cdec.io/modul_2/submodules/01_luftqualitaet/03_handout.html},
langid = {de}
}
Bitte zitieren Sie diese Arbeit als:
Sparmann, Sören. 2026. “Handout (pandas & plotly).”
March 9, 2026. https://material.cdec.io/modul_2/submodules/01_luftqualitaet/03_handout.html.




