Skip to content
Programmeren in Python, leer de nieuwste technieken
Programmeren in PythonProgrammeren in Python
  • Home
  • Blog
  • Documentatie
  • Cursussen
Programmeren in PythonProgrammeren in Python
  • Home
  • Blog
  • Documentatie
  • Cursussen

Introductie

4
  • 1.1 Wat is Python?
  • 1.2 Python installatie
  • 1.2.1 Python installeren voor MacOS
  • 1.3 PyCharm Installatie

Basisprogrammering

6
  • 2.1 Python Basis: Variabelen, Datatypes en Operatoren
  • 2.2 Python if else (en elif)
  • 2.3 Python list (Array, Lijsten)
  • 2.4 Python Lussen: for loop, while loop, break, continue
  • 2.5 Python Functies: Definities, Parameters en Terugkeerwaarden
  • 2.6 Foutafhandeling: try, except, else, finally

Datatypes

13
  • 3.1 Introductie tot Geavanceerde Datatypes
  • 3.2 Python Tuple
  • 3.3 Python Set
  • 3.4 Python Dictionary
  • 3.5 Werken met Strings en String-methoden
  • 3.6 Collections Module: Krachtige Tools in Python
  • 3.7 Iterators en Generators
  • 3.8 List Comprehensions
  • 3.9 Geavanceerde Sortering
  • 3.10 Werken met Multi-dimensionale Data
  • 3.11 Typing en Datatypes
  • 3.12 Itertools voor Geavanceerde Iteraties
  • 3.13 Data Conversies

Modules

8
  • 4.1 Wat zijn Modules en Waarom zijn ze Belangrijk?
  • 4.2 Werken met Ingebouwde Modules
  • 4.3 Installeren en Gebruiken van Externe Pakketten
  • 4.4 Eigen Modules Maken
  • 4.5 Introductie tot Pakketten
  • 4.6 Importeren en Namespaces Begrijpen
  • 4.7 Geavanceerd: Relatief Importeren
  • 4.8 Organiseren van Grotere Projecten

Data Analyse

3
  • 5.1 Python Dataframe en Data Opschonen met Pandas
  • 5.2 Python Pandas Basisstatistieken en Data-analyse
  • 5.3 Python Numpy (NpArray): De Kracht van Numerieke Berekeningen

Webontwikkeling

5
  • 7.1 Inleiding tot Webontwikkeling
  • 7.2 HTTP-Verzoeken met requests: Communiceren met het Web
  • 7.3 Webscraping met BeautifulSoup: Data van het Web Halen als er geen APIs zijn
  • 7.4 Python Flask, een webserver & API tutorial
  • 7.5 WSGI & WebOb

Deploy

1
  • Deploy met Supervisor op Ubuntu

Object Georiënteerd Programmeren

8
  • Wat is Objectgeoriënteerd Programmeren (OOP) in Python?
  • Python class & object maken
  • self en __init__ uitgelegd (met voorbeelden)
  • Attributen afschermen: @property (getters/setters)
  • Overerving in Python + super() (en wanneer je het beter níet doet)
  • Dunder methods: __str__, __repr__, vergelijken (en waarom dit je OOP-code “Pythonic” maakt)
  • @dataclass: snelle nette classes (minder boilerplate, meer duidelijkheid)
  • OOP in de praktijk: design & structuur
View Categories
  • Home
  • Documentatie
  • Data Analyse
  • 5.1 Python Dataframe en Data Opschonen met Pandas

5.1 Python Dataframe en Data Opschonen met Pandas

4 minuten leestijd

Wanneer je begint met data-analyse in Python, is Pandas een van de krachtigste tools die je kunt gebruiken. Met Pandas (Python dataframe) kun je gegevens eenvoudig laden, manipuleren en analyseren. Het is speciaal ontworpen om met gestructureerde data te werken, zoals tabellen of spreadsheets.

In dit hoofdstuk duiken we in wat Pandas is, hoe je data laadt in een DataFrame, en hoe je die data opschoont om klaar te maken voor verdere analyse. Laten we beginnen! 🚀

Wat is Pandas? #

Pandas is een open-source Python-bibliotheek die wordt gebruikt voor gegevensmanipulatie en -analyse. Het biedt twee belangrijke datastructuren:

  1. Series: Een één-dimensionale array met labels, vergelijkbaar met een kolom in een spreadsheet.
  2. DataFrame: Een twee-dimensionale tabel met rijen en kolommen, vergelijkbaar met een Excel-spreadsheet of een relationele database.

Met Pandas kun je gegevens:

  • Laden uit verschillende bronnen (zoals CSV, Excel, SQL, of JSON).
  • Opschonen, filteren, en transformeren.
  • Analyseer met eenvoudige methoden zoals groeperen, aggregeren, of sorteren.

Data Laad Je in een DataFrame #

Het eerste wat je doet bij data-analyse is het laden van je dataset in een DataFrame. Een DataFrame is een tabel waarin elke kolom een Series is, en waarmee je gemakkelijk bewerkingen kunt uitvoeren.

Data laden uit een CSV-bestand #

Voorbeeld: Een CSV-bestand laden

import pandas as pd

# Laad een CSV-bestand
data = pd.read_csv("voorbeeld.csv")

# Toon de eerste 5 rijen
print(data.head())
Python

Wat gebeurt hier?

  • pd.read_csv() leest een CSV-bestand en zet het om in een DataFrame.
  • data.head() toont de eerste 5 rijen van je dataset, zodat je een idee krijgt van de structuur en inhoud.

Andere bronnen laden #

Pandas ondersteunt ook andere formaten, zoals Excel, SQL-databases, en JSON:

  • Excel: pd.read_excel("bestand.xlsx")
  • JSON: pd.read_json("bestand.json")
  • SQL: pd.read_sql(query, connection)

Het Inspecteren van Je DataFrame #

Na het laden van je data is het belangrijk om een overzicht te krijgen van de inhoud en structuur.

1. De eerste en laatste rijen bekijken

print(data.head())  
# Eerste 5 rijen
print(data.tail())  
# Laatste 5 rijen
Python

  1. Algemene informatie over je dataset
print(data.info())
Python

  1. Dit toont het aantal rijen, kolommen, datatype van elke kolom, en of er ontbrekende waarden zijn.
print(data.describe())
Python

Dit geeft statistieken zoals gemiddelde, mediaan, en standaarddeviatie voor numerieke kolommen.

Data Opschonen #

Gegevens zijn zelden perfect. Vaak zijn er fouten, ontbrekende waarden, of inconsistenties. Met Pandas kun je je data opschonen en voorbereiden op verdere analyse.

1. Ontbrekende waarden opsporen #

Ontbrekende waarden kunnen analyses verstoren. Gebruik isnull() om te controleren of je dataset ontbrekende waarden bevat:

print(data.isnull().sum())
Python

Dit toont hoeveel ontbrekende waarden elke kolom bevat.

2. Ontbrekende waarden behandelen #

Afhankelijk van je data kun je ontbrekende waarden op verschillende manieren behandelen:

  1. Invullen met een standaardwaarde
data.fillna(0, inplace=True)  
# Vervang ontbrekende waarden door 0
Python

  1. Verwijderen van rijen met ontbrekende waarden
data.dropna(inplace=True)
Python

  1. Invullen met het gemiddelde of mediaan
data["Leeftijd"].fillna(data["Leeftijd"].mean(), inplace=True)
Python

3. Onnodige kolommen verwijderen #

Soms bevat je dataset kolommen die je niet nodig hebt voor je analyse. Je kunt deze eenvoudig verwijderen met drop().

Voorbeeld:

data.drop("OnnodigeKolom", axis=1, inplace=True)
Python

  • axis=1 betekent dat je een kolom verwijdert (voor rijen gebruik je axis=0).

4. Gegevens formatteren #

Zorg ervoor dat gegevens zoals datums en getallen in het juiste formaat staan. Dit voorkomt fouten in verdere analyses.

Voorbeeld: Datums omzetten naar datetime-formaat

data["Datum"] = pd.to_datetime(data["Datum"])
Python

Voorbeeld: Strings formatteren

data["Naam"] = data["Naam"].str.strip()  
# Verwijdert spaties aan het begin/einde
data["Naam"] = data["Naam"].str.capitalize()  
# Zorgt voor hoofdletters aan het begin
Python

Een Praktisch Voorbeeld #

Stel dat je een dataset hebt geladen uit een CSV-bestand, en je wilt deze opschonen.

Stap 1: Data laden

import pandas as pd

data = pd.read_csv("voorbeeld.csv")
print(data.head())
Python

Stap 2: Ontbrekende waarden controleren

print(data.isnull().sum())
Python

Stap 3: Ontbrekende waarden invullen

data["Leeftijd"].fillna(data["Leeftijd"].mean(), inplace=True)
Python

Stap 4: Onnodige kolommen verwijderen

data.drop(["OnnodigeKolom"], axis=1, inplace=True)
Python

Stap 5: Datum formatteren

data["Datum"] = pd.to_datetime(data["Datum"])
Python

Waarom Pandas voor data opschonen? #

  1. Efficiëntie:
    Pandas kan grote datasets snel verwerken.
  2. Flexibiliteit:
    Je kunt eenvoudig verschillende operaties uitvoeren, zoals filteren, groeperen, en sorteren.
  3. Integratie:
    Pandas werkt naadloos samen met andere Python-tools, zoals numpy en matplotlib.

Samenvatting #

Pandas is een krachtige bibliotheek waarmee je data eenvoudig kunt laden, inspecteren en opschonen. Door je gegevens in een DataFrame te plaatsen, kun je snel fouten opsporen en corrigeren, waardoor je klaar bent voor verdere analyse. Experimenteer met de voorbeelden en ontdek hoe Pandas je data-analyseproces kan transformeren! 🎉🚀

Updated on februari 17, 2025

What are your Feelings

5.2 Python Pandas Basisstatistieken en Data-analyse
Inhoudsopgave
  • Wat is Pandas?
  • Data Laad Je in een DataFrame
    • Data laden uit een CSV-bestand
    • Andere bronnen laden
  • Het Inspecteren van Je DataFrame
  • Data Opschonen
    • 1. Ontbrekende waarden opsporen
    • 2. Ontbrekende waarden behandelen
    • 3. Onnodige kolommen verwijderen
    • 4. Gegevens formatteren
  • Een Praktisch Voorbeeld
  • Waarom Pandas voor data opschonen?
  • Samenvatting
Programmeren in Python

Leer python op je eigen tempo met mooie interactieve hedendaagse voorbeelden.

© Copyright 2026 Programmeren in Python.
Sign inSign up

Sign in

Don’t have an account? Sign up
Lost your password?

Sign up

Already have an account? Sign in