Handout (pandas & plotly)

Zeitreihenanalyse der Luftqualität

Das Handout bietet eine kompakte Referenz zu den wichtigsten Funktionen der Python-Bibliotheken pandas und plotly für die Datenanalyse und -visualisierung.

Autor:in

Zugehörigkeit

Sören Sparmann

Universität Paderborn

Veröffentlichungsdatum

22. Mai 2026

PDF

Pandas

Import

Pandas-Bibliothek für Datenanalyse importieren.

import pandas as pd

Daten einlesen

Daten aus einer CSV-Datei in einen DataFrame einlesen.

# CSV-Datei einlesen
df = pd.read_csv(
    "data/example.csv",
    index_col=0,
    parse_dates=True
)
# Dataframe anzeigen
df

	value	category
date
2024-01-01	10.5	a
2024-01-02	11.0	a
2024-01-03	10.7	b
2024-01-04	12.2	b
2024-01-05	13.1	b
2024-01-06	12.8	c

Spalten selektieren

Eine bestimmte Spalte aus dem DataFrame auswählen.

# Spalte value selektieren
values = df["value"]
values

date
2024-01-01    10.5
2024-01-02    11.0
2024-01-03    10.7
2024-01-04    12.2
2024-01-05    13.1
2024-01-06    12.8
Name: value, dtype: float64

Daten filtern mit Bedingungen

Daten anhand einer Bedingung auswählen (z.B. Werte größer als 11).

# Bedingung festlegen
cond = df["value"] > 11
# Bedingung anwenden
filtered = df[cond]
filtered

	value	category
date
2024-01-04	12.2	b
2024-01-05	13.1	b
2024-01-06	12.8	c

Gruppieren & Aggregieren

Werte nach Kategorien gruppieren und aggregieren (z.B. Mittelwert berechnen).

# Daten nach Spalte category gruppieren
grouped = df.groupby("category")
# Mittelwert berechnen
grouped['value'].mean()

category
a    10.75
b    12.00
c    12.80
Name: value, dtype: float64

Resampling

Zeitreihen-Daten nach Zeitintervallen zusammenfassen und aggregieren.

# Monatlicher Mittelwert
df.resample("MS")['value'].mean()
# Einträge pro Jahr
df.resample("YS")['value'].count()

date
2024-01-01    6
Freq: YS-JAN, Name: value, dtype: int64

Plotly Express

Daten visualisieren

Import

Plotly Express für interaktive Visualisierungen importieren.

import plotly.express as px

Liniendiagramm

Verlauf einer Variable über die Zeit darstellen.

fig = px.line(df, y="value", title="Liniendiagramm", height=200)
fig.show()

Balken- und Säulendiagramm

Werte nach Kategorien als Säulen darstellen.

fig = px.bar(df, x="category", y="value", title="Säulendiagramm", height=200)
fig.show()

Werte nach Kategorien als Balken darstellen.

fig = px.bar(df, x="value", y="category", title="Balkendiagramm", orientation='h', height=200)
fig.show()

Streudiagramm

Zusammenhang zwischen zwei Variablen darstellen.

fig = px.scatter(df, y="value", color="category", title="Scatterplot", height=200)
fig.show()

Boxplot

Verteilung von Werten innerhalb von Gruppen analysieren.

fig = px.box(df, x="category", y="value", title="Boxplot", height=200)
fig.show()

Wiederverwendung

CC BY-SA 4.0

Zitat

Mit BibTeX zitieren:

@online{sparmann2026,
  author = {Sparmann, Sören},
  title = {Handout (pandas \& plotly)},
  date = {2026-05-22},
  url = {https://material.cdec.io/modul_2/submodules/01_luftqualitaet/03_handout.html},
  langid = {de}
}

Bitte zitieren Sie diese Arbeit als:

Sparmann, Sören. 2026. “Handout (pandas & plotly).” May 22. https://material.cdec.io/modul_2/submodules/01_luftqualitaet/03_handout.html.

--- title: "Handout (pandas & plotly)" subtitle: "Zeitreihenanalyse der Luftqualität" description: "Das Handout bietet eine kompakte Referenz zu den wichtigsten Funktionen der Python-Bibliotheken pandas und plotly für die Datenanalyse und -visualisierung." number-sections: false format: html: default handout-pdf: default --- ```{python} #| echo: false import plotly.io as pio pio.renderers.default = "png" pio.defaults.default_height = 200 ``` :::{.content-visible when-format="html"} <a href="03_handout.pdf" class="btn btn-primary">{{< iconify bi:filetype-pdf >}} PDF</a> ::: ## Pandas ### Import Pandas-Bibliothek für Datenanalyse importieren. ```{python} import pandas as pd ``` ### Daten einlesen Daten aus einer CSV-Datei in einen DataFrame einlesen. ```{python} # CSV-Datei einlesen df = pd.read_csv( "data/example.csv", index_col=0, parse_dates=True ) # Dataframe anzeigen df ``` ### Spalten selektieren Eine bestimmte Spalte aus dem DataFrame auswählen. ```{python} # Spalte value selektieren values = df["value"] values ``` ### Daten filtern mit Bedingungen Daten anhand einer Bedingung auswählen (z.B. Werte größer als 11). ```{python} # Bedingung festlegen cond = df["value"] > 11 # Bedingung anwenden filtered = df[cond] filtered ``` ### Gruppieren & Aggregieren Werte nach Kategorien gruppieren und aggregieren (z.B. Mittelwert berechnen). ```{python} # Daten nach Spalte category gruppieren grouped = df.groupby("category") # Mittelwert berechnen grouped['value'].mean() ``` ### Resampling Zeitreihen-Daten nach Zeitintervallen zusammenfassen und aggregieren. ```{python} # Monatlicher Mittelwert df.resample("MS")['value'].mean() # Einträge pro Jahr df.resample("YS")['value'].count() ``` --- ## Plotly Express Daten visualisieren ### Import Plotly Express für interaktive Visualisierungen importieren. ```{python} import plotly.express as px ``` ### Liniendiagramm Verlauf einer Variable über die Zeit darstellen. ```{python} fig = px.line(df, y="value", title="Liniendiagramm", height=200) fig.show() ``` ### Balken- und Säulendiagramm Werte nach Kategorien als Säulen darstellen. ```{python} fig = px.bar(df, x="category", y="value", title="Säulendiagramm", height=200) fig.show() ``` Werte nach Kategorien als Balken darstellen. ```{python} fig = px.bar(df, x="value", y="category", title="Balkendiagramm", orientation='h', height=200) fig.show() ``` ### Streudiagramm Zusammenhang zwischen zwei Variablen darstellen. ```{python} fig = px.scatter(df, y="value", color="category", title="Scatterplot", height=200) fig.show() ``` ### Boxplot Verteilung von Werten innerhalb von Gruppen analysieren. ```{python} fig = px.box(df, x="category", y="value", title="Boxplot", height=200) fig.show() ```