{"id":18733,"date":"2020-10-18T14:33:37","date_gmt":"2020-10-18T14:33:37","guid":{"rendered":"https:\/\/pythoncursus.nl\/?p=18733"},"modified":"2023-11-21T11:25:54","modified_gmt":"2023-11-21T11:25:54","slug":"python-pandas","status":"publish","type":"post","link":"https:\/\/datasciencepartners.nl\/python-pandas\/","title":{"rendered":"Python Pandas: Wat is Pandas? [de basis + voorbeelden]"},"content":{"rendered":"<div class=\"vgblk-rw-wrapper limit-wrapper\">\n<pre><code><p>Het Python <strong>Pandas package<\/strong> is een open source library met data analyse functionaliteit die gebruikt wordt binnen de <strong><a href=\"https:\/\/datasciencepartners.nl\/wat-is-python\/\">programmeertaal Python<\/a><\/strong>. Pandas is het meestgebruikte package door <a href=\"https:\/\/datasciencepartners.nl\/wat-is-een-data-scientist\/\"><strong>data scientists<\/strong><\/a> en het is essentieel om te beheersen als je aan data analyse of <a href=\"https:\/\/datasciencepartners.nl\/data-science\/\"><strong>data science<\/strong><\/a> vraagstukken werkt.<\/p><\/code><\/pre>\n<p>In deze tutorial vind je een overzicht van de basisfunctionaliteit van Pandas. We gaan in op:<\/p>\n<ul>\n<li><a href=\"#pandas-installeren\"><strong>Python Pandas installeren<\/strong><\/a><\/li>\n<li><a href=\"#pandas-importeren\"><strong>Pandas importeren<\/strong><\/a><\/li>\n<li><a href=\"#pandas-series-dataframes\"><strong>Pandas Series en DataFrames<\/strong><\/a><\/li>\n<li><a href=\"#selecteren-van-data\"><strong>Selecteren van data uit een DataFrame op diverse manieren<\/strong><\/a><\/li>\n<li><a href=\"#berekeningen-pandas\"><strong>(standaard) berekeningen uitvoeren<\/strong><\/a><\/li>\n<li><a href=\"#missende-waarden-pandas\"><strong>Omgaan met missende waarden in Pandas<\/strong><\/a><\/li>\n<li><a href=\"#tekst-manipuleren-pandas\"><strong>Tekst manipuleren in Pandas<\/strong><\/a><\/li>\n<li><a href=\"#data-samenvoegen\"><strong>Data samenvoegen<\/strong><\/a><\/li>\n<li><a href=\"#draaitabellen-pandas\"><strong>Draaitabellen in Pandas<\/strong><\/a><\/li>\n<li><a href=\"#pandas-visualiseren\"><strong>Pandas data visualisatie mogelijkheden<\/strong><\/a><\/li>\n<li><a href=\"#openen-opslaan-pandas\"><strong>Data in verschillende bestandstypes openen en opslaan<\/strong><\/a><\/li>\n<\/ul>\n<!-- This site is converting visitors into subscribers and customers with OptinMonster - https:\/\/optinmonster.com :: Campaign Title: Cheatsheet inline -->\n<div id=\"om-xzn5asfsy4ouhuahjqhr-holder\"><\/div>\n<script>(function(d,u,ac){var s=d.createElement('script');s.type='text\/javascript';s.src='https:\/\/a.omappapi.com\/app\/js\/api.min.js';s.async=true;s.dataset.user=u;s.dataset.campaign=ac;d.getElementsByTagName('head')[0].appendChild(s);})(document,77079,'xzn5asfsy4ouhuahjqhr');<\/script>\n<!-- \/ OptinMonster -->\n<h2 id=\"pandas-installeren\"><strong>Python Pandas installeren<\/strong><\/h2>\n<p>Allereerst is het van belang om <a href=\"https:\/\/datasciencepartners.nl\/python-installeren\/\"><strong>Python te installeren<\/strong><\/a> voordat je met Pandas aan de slag kunt.<\/p>\n<p>Pandas installeren kan op verschillende manieren. De ontwikkelaars van het packages raden aan om Anaconda te gebruiken. Anaconda kun je gebruiken om het beheer van al je packages te vereenvoudigen. Zo kun je met Anaconda gemakkelijk duizenden packages installeren en zorgt Anaconda er voor dat packages up-to-date zijn en dat afhankelijkheden correct geconfigureerd blijven.<\/p>\n<p>Als je Anaconda installeert dan heb je direct toegang tot o.a. Pandas. Lees hier hoe je Anaconda installeert op:<\/p>\n<ul>\n<li><strong><a href=\"https:\/\/docs.continuum.io\/anaconda\/install\/windows\/\" target=\"_blank\" rel=\"noopener\">Windows<\/a><\/strong><\/li>\n<li><strong><a href=\"https:\/\/docs.continuum.io\/anaconda\/install\/mac-os\/\" target=\"_blank\" rel=\"noopener\">Mac<\/a><\/strong><\/li>\n<li><strong><a href=\"https:\/\/docs.continuum.io\/anaconda\/install\/linux\/\" target=\"_blank\" rel=\"noopener\">Linux<\/a><\/strong><\/li>\n<\/ul>\n<p>Pandas is standaard bij de installatie in begrepen, maar packages kunnen apart ge\u00efnstalleerd worden met het volgende commando:<\/p>\n<p><code>conda install pandas<\/code><\/p>\n<p>Voor wie geen Anaconda wil gebruiken is het mogelijk om Python Pandas te installeren via pip. Je voert dan in de command prompt (Windows) of terminal (Mac) de volgende code in:<\/p>\n<p><code>pip install pandas<\/code><\/p>\n<h2 id=\"pandas-importeren\"><strong>Pandas importeren<\/strong><\/h2>\n<p>Wij adviseren om <strong><a href=\"https:\/\/datasciencepartners.nl\/jupyter-notebook\/\">Jupyter Notebook te installeren<\/a><\/strong> zodat je mee kunt doen met de voorbeelden.<\/p>\n<p>Het is gebruikelijk om zowel Numpy als Pandas te importeren. Voor een deel overlapt de functionaliteit van deze packages, maar in veel data analyses heb je specifieke functionaliteit van Numpy nodig als aanvulling op de Pandas functionaliteit.<\/p>\n<p>In\u00a0[1]:\nimport numpy as np\nimport pandas as pd<\/p>\n<h2 id=\"pandas-series-dataframes\"><strong>Pandas Series en DataFrames<\/strong><\/h2>\n<p>Binnen Pandas zitten data in een Series of een DataFrame. Een series is een \u00e9\u00e9ndimensionale reeks met waarden. Een series kan ieder datatype bevatten, ook door elkaar heen. De reeks krijgt labels meegegeven door Pandas, deze labels wordt de 'index' genoemd.<\/p>\n<p>In\u00a0[2]:\neen_tot_tien = pd.Series(range(1,11))\nprint(een_tot_tien)<\/p>\n<p>0     1\n1     2\n2     3\n3     4\n4     5\n5     6\n6     7\n7     8\n8     9\n9    10\ndtype: int64<\/p>\n<p>In bovenstaand voorbeeld genereren we een reeks van \u00e9\u00e9n tot tien. Je kunt zien dat de index de waarden nul tot negen bevat.<\/p>\n<p>Een DataFrame is een tweedimensionale datastructuur met rijen en kolommen. Je kunt dit het best vergelijken met een Excel-sheet. Ook binnen een DataFrame is het mogelijk met verschillende soorten data te werken.<\/p>\n<p>Voor deze blog maken we zelf een kleine dataset met tien personen waarvan we de lengt, het geslacht, en de geboortedatum kennen.<\/p>\n<p>In\u00a0[3]:\nlengtes = 5 * np.random.randn(10)+170\ngeslacht = [&quot;vrouw&quot;, &quot;vrouw&quot;, &quot;man&quot;, &quot;vrouw&quot;, &quot;vrouw&quot;, &quot;vrouw&quot;, &quot;man&quot;, &quot;man&quot;, &quot;vrouw&quot;, &quot;vrouw&quot;]\ngeboortedatum = np.array(['1957-01-01', '1975-03-02', '1991-07-03', '1939-11-04',\n'1929-01-05', '1995-12-06', '1975-03-02', '1975-03-02', '1939-11-04', '2000-04-01'], dtype='datetime64[ns]')<\/p>\n<p>Je kunt een nieuw DataFrame maken met pd.DataFrame(). In ons geval stellen we de dataset samen met behulp van een <a href=\"https:\/\/datasciencepartners.nl\/python-dictionary\/\"><strong>dictionary<\/strong><\/a> waardoor we direct kolomnamen kunnen meegeven. Het is mogelijk om de index andere waarden mee te geven met de parameter 'index' en kolomnamen kunnen meegegeven worden met parameter 'columns'.<\/p>\n<p>In\u00a0[4]:\ndf = pd.DataFrame({\n&quot;geboortedatum&quot; : geboortedatum,\n&quot;geslacht&quot; : geslacht,\n&quot;lengte&quot; : lengtes\n})\nprint(df)\nprint(df.dtypes)<\/p>\n<p>geboortedatum geslacht      lengte\n0    1957-01-01    vrouw  164.922945\n1    1975-03-02    vrouw  165.122392\n2    1991-07-03      man  166.654339\n3    1939-11-04    vrouw  174.941112\n4    1929-01-05    vrouw  174.348120\n5    1995-12-06    vrouw  172.129023\n6    1975-03-02      man  163.659517\n7    1975-03-02      man  173.502233\n8    1939-11-04    vrouw  176.749675\n9    2000-04-01    vrouw  168.478365\ngeboortedatum    datetime64[ns]\ngeslacht                 object\nlengte                  float64\ndtype: object<\/p>\n<p>Je ziet dat we een klein DataFrame hebben gemaakt met behulp van Pandas. We zien dat het frame verschillende datatypes bevat in de verschillende kolommen. In <a href=\"https:\/\/datasciencepartners.nl\/python-numpy\/\"><strong>Numpy<\/strong><\/a> is het niet mogelijk om in \u00e9\u00e9n ndarray met verschillende datatypes te werken.<\/p>\n<p>Om een vlugge indruk te krijgen van een dataset kun je df.info() en df.describe() gebruiken.<\/p>\n<p>In\u00a0[5]:\nprint(df.info())\nprint(df.describe())<\/p>\n<p>&lt;class 'pandas.core.frame.DataFrame'&gt;\nRangeIndex: 10 entries, 0 to 9\nData columns (total 3 columns):\ngeboortedatum    10 non-null datetime64[ns]\ngeslacht         10 non-null object\nlengte           10 non-null float64\ndtypes: datetime64<a href=\"1\">ns<\/a>, float64(1), object(1)\nmemory usage: 320.0+ bytes\nNone\nlengte\ncount   10.000000\nmean   170.050772\nstd      4.818132\nmin    163.659517\n25%    165.505379\n50%    170.303694\n75%    174.136648\nmax    176.749675<\/p>\n<p>We zien dat df.info() informatie geeft over het DataFrame op het gebied van de kolommen, de <a href=\"https:\/\/datasciencepartners.nl\/python-data-types\/\"><strong>Python data types<\/strong><\/a>, het aantal (missende) waarden, en de grootte van de dataset. En df.describe() geeft een aantal veelgebruikte berekeningen voor alle numerieke kolommen. In het geval van onze dataset is dat alleen de lengte-kolom.<\/p>\n<p>Met vertrouwen waardevolle inzichten halen uit data? Schrijf je in voor een van onze trainingen.<br \/>\n<a href=\"https:\/\/datasciencepartners.nl\/python-cursus\/\"><button>Python cursus voor data science<\/button><\/a><br \/>\n<a href=\"https:\/\/datasciencepartners.nl\/python-machine-learning-training\/\"><button>Python machine learning training<\/button><\/a><br \/>\n<a href=\"https:\/\/datasciencepartners.nl\/data-science-opleiding\/\"><button>Data Science opleiding (4 dagen)<\/button><\/a><br \/>\n<a href=\"https:\/\/datasciencepartners.nl\/data-science-bootcamp\/\"><button>Data Science bootcamp (10 dagen)<\/button><\/a><\/p>\n<h2 id=\"selecteren-van-data\"><strong>Selecteren van data uit een DataFrame op diverse manieren<\/strong><\/h2>\n<p><strong>Basis<\/strong><br \/>\nAls je een DataFrame hebt gemaakt of geopend dan wil je over het algemeen een snelle indruk krijgen van de dataset. Je kunt in Pandas de eerste of juist de laatste rijen selecteren met df.head() en df.tail(). Daarnaast zul je vaak de index-reeks of kolomnamen nodig hebben. Ook deze kun je eenvoudig selecteren.\nIn\u00a0[6]:\nprint(df.head(2))\nprint(df.tail(2))\nprint(df.index)\nprint(df.columns)<\/p>\n<p>geboortedatum geslacht      lengte\n0    1957-01-01    vrouw  164.922945\n1    1975-03-02    vrouw  165.122392\ngeboortedatum geslacht      lengte\n8    1939-11-04    vrouw  176.749675\n9    2000-04-01    vrouw  168.478365\nRangeIndex(start=0, stop=10, step=1)\nIndex(['geboortedatum', 'geslacht', 'lengte'], dtype='object')<\/p>\n<p><strong>Selectie op basis van label<\/strong><br \/>\nIn Pandas kun je kolommen en rijen of gedeeltes daarvan op twee manieren selecteren: door de <strong>labels<\/strong> te specificeren of door de <strong>positie<\/strong> te specificeren. Laten we beginnen met het selecteren van data op basis van labels. Dit doe je met df.loc[rij(en), kolom(men)]. Tussen de blokhaken geeft je de rij(en) en kolom(men) aan om te selecteren.\nIn\u00a0[8]:\nprint(df.loc[0,'lengte'])\nprint(df.loc[0:3,'geslacht'])\nprint(df.loc[8:,'geslacht':])<\/p>\n<p>164.92294489526012\n0    vrouw\n1    vrouw\n2      man\n3    vrouw\nName: geslacht, dtype: object\ngeslacht      lengte\n8    vrouw  176.749675\n9    vrouw  168.478365<\/p>\n<p>We maken drie selecties. Allereerst selecteren we de lengte van de eerste persoon. In de tweede selectie maken we gebruik van 'slicing' waarmee we vier rijen tegelijk selecteren met \"0:3\". In de laatste selectie maken we gebruik van slicing voor zowel de rijen als de kolommen. \"8:\" betekent 'ik wil alle rijen selecteren vanaf indexnummer 8'.<\/p>\n<p><strong>Selectie op basis van positie<\/strong><br \/>\nWe kunnen exact dezelfde selecties maken op basis van positie in het DataFrame als we df.iloc gebruiken in plaats van df.loc.\nIn\u00a0[9]:\nprint(df.iloc[0,2])\nprint(df.iloc[0:3,1])\nprint(df.iloc[8:,1:])<\/p>\n<p>164.92294489526012\n0    vrouw\n1    vrouw\n2      man\nName: geslacht, dtype: object\ngeslacht      lengte\n8    vrouw  176.749675\n9    vrouw  168.478365<\/p>\n<p><strong>Selectie op basis van logische criteria<br \/>\n<\/strong>We kunnen logica in onze selecties bouwen met &quot;boolean indexing&quot;. Als we bijvoorbeeld alleen de vrouwen uit de dataset willen selecteren dan maken we eerst een boolean series.\nIn\u00a0[10]:\nvrouwen_bool = df['geslacht'] == &quot;vrouw&quot;\nprint(vrouwen_bool)<\/p>\n<p>0     True\n1     True\n2    False\n3     True\n4     True\n5     True\n6    False\n7    False\n8     True\n9     True\nName: geslacht, dtype: bool<\/p>\n<p>Deze series gebruiken we vervolgens om de rijen uit de dataset te selecteren waardoor de bool \"True\" is.<\/p>\n<p>In\u00a0[11]:\ndf_vrouwen = df[vrouwen_bool]\nprint(df_vrouwen)<\/p>\n<p>geboortedatum geslacht      lengte\n0    1957-01-01    vrouw  164.922945\n1    1975-03-02    vrouw  165.122392\n3    1939-11-04    vrouw  174.941112\n4    1929-01-05    vrouw  174.348120\n5    1995-12-06    vrouw  172.129023\n8    1939-11-04    vrouw  176.749675\n9    2000-04-01    vrouw  168.478365<\/p>\n<p>Op deze manier kun je op basis van logica allerlei selecties maken. We zouden bijvoorbeeld mensen die langer zijn dan 170cm kunnen selecteren met een bool lengte &gt; 170. Je kunt deze logica ook combineren en alleen vrouwen langer dan 170cm selecteren.<\/p>\n<p>In\u00a0[12]:\nlange_vrouwen = (df['geslacht'] == &quot;vrouw&quot;) &amp; (df['lengte'] &gt; 170)\nprint(df[lange_vrouwen])<\/p>\n<p>geboortedatum geslacht      lengte\n3    1939-11-04    vrouw  174.941112\n4    1929-01-05    vrouw  174.348120\n5    1995-12-06    vrouw  172.129023\n8    1939-11-04    vrouw  176.749675<\/p>\n<h2 id=\"berekeningen-pandas\"><strong>(standaard) berekeningen uitvoeren<\/strong><\/h2>\n<p>Binnen Python Pandas kun je allerlei berekeningen uitvoeren op een Series of DataFrame. Met DataFrame.functie(0) pas je de functie toe op de kolommen en met DataFrame.functie(1) op de rijen. Veelgebruikte functies zijn bijvoorbeeld:<\/p>\n<table>\n<thead>\n<tr>\n<th>Functie<\/th>\n<th>Beschrijving<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td><code>count<\/code><\/td>\n<td>Telt het aantal niet-missende waarden<\/td>\n<\/tr>\n<tr>\n<td><code>sum<\/code><\/td>\n<td>Som van de waarden<\/td>\n<\/tr>\n<tr>\n<td><code>mean<\/code><\/td>\n<td>Gemiddelde<\/td>\n<\/tr>\n<tr>\n<td><code>median<\/code><\/td>\n<td>Mediaan van de waarden<\/td>\n<\/tr>\n<tr>\n<td><code>min<\/code><\/td>\n<td>Minimum<\/td>\n<\/tr>\n<tr>\n<td><code>max<\/code><\/td>\n<td>Maximum<\/td>\n<\/tr>\n<tr>\n<td><code>mode<\/code><\/td>\n<td>Modus<\/td>\n<\/tr>\n<tr>\n<td><code>abs<\/code><\/td>\n<td>Geeft de absolute waarde<\/td>\n<\/tr>\n<tr>\n<td><code>std<\/code><\/td>\n<td>Standaardafwijking<\/td>\n<\/tr>\n<tr>\n<td><code>var<\/code><\/td>\n<td>Variantie<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Met vertrouwen waardevolle inzichten halen uit data? Schrijf je in voor een van onze trainingen.<br \/>\n<a href=\"https:\/\/datasciencepartners.nl\/python-cursus\/\"><button>Python cursus voor data science<\/button><\/a><br \/>\n<a href=\"https:\/\/datasciencepartners.nl\/python-machine-learning-training\/\"><button>Python machine learning training<\/button><\/a><br \/>\n<a href=\"https:\/\/datasciencepartners.nl\/data-science-opleiding\/\"><button>Data Science opleiding (4 dagen)<\/button><\/a><br \/>\n<a href=\"https:\/\/datasciencepartners.nl\/data-science-bootcamp\/\"><button>Data Science bootcamp (10 dagen)<\/button><\/a><\/p>\n<h2 id=\"missende-waarden-pandas\"><strong>Omgaan met missende waarden in Pandas<\/strong><\/h2>\n<p>We voegen eerst twee missende waarden toe met Pandas voordat we dit gedeelte toelichten.<\/p>\n<p>In\u00a0[13]:\ndf.iloc[3,2] = np.nan\ndf.iloc[6,1] = np.nan\nprint(df)<\/p>\n<p>geboortedatum geslacht      lengte\n0    1957-01-01    vrouw  164.922945\n1    1975-03-02    vrouw  165.122392\n2    1991-07-03      man  166.654339\n3    1939-11-04    vrouw         NaN\n4    1929-01-05    vrouw  174.348120\n5    1995-12-06    vrouw  172.129023\n6    1975-03-02      NaN  163.659517\n7    1975-03-02      man  173.502233\n8    1939-11-04    vrouw  176.749675\n9    2000-04-01    vrouw  168.478365<\/p>\n<p>We missen nu van \u00e9\u00e9n persoon de lengte en van \u00e9\u00e9n persoon het geslacht.<\/p>\n<p><strong>Missende waarden verwijderen<\/strong><br \/>\nMet Pandas is het mogelijk om alle rijen of kolommen met missende waarden te verwijderen. Dit doe je met DataFrame.dropna() en met parameter 'axis' kun je met waarde '0' rijen met missende waarden en met &quot;1&quot; kolommen met missende waarden verwijderen.\nIn\u00a0[14]:\ndf_missing = df.copy()\ndf_geen_missing = df_missing.dropna().reset_index(drop = True)\nprint(df_geen_missing)<\/p>\n<p>geboortedatum geslacht      lengte\n0    1957-01-01    vrouw  164.922945\n1    1975-03-02    vrouw  165.122392\n2    1991-07-03      man  166.654339\n3    1929-01-05    vrouw  174.348120\n4    1995-12-06    vrouw  172.129023\n5    1975-03-02      man  173.502233\n6    1939-11-04    vrouw  176.749675\n7    2000-04-01    vrouw  168.478365<\/p>\n<p>We zien dat we na deze bewerking met Pandas nog acht rijen over hebben. Dat klopt met onze verwachting, omdat er twee rijen met missende waarde in het DataFrame zaten.<\/p>\n<p><strong>Missende waarden opvullen<br \/>\n<\/strong>In sommige situaties is het wenselijk om missende waarden op te vullen in plaats van de totale observaties te verwijderen. Met DataFrame.fillna() is het mogelijk om missende waarden op te vullen. Je kunt een standaardwaarde meegeven voor missende waarden, maar je kunt het gat ook opvullen op een andere manier. Zo kun je bijvoorbeeld het gemiddelde, de modus, of de mediaan gebruiken.\nIn\u00a0[15]:\ndf_missing = df.copy()\ndf['geslacht'] = df['geslacht'].astype('category')\ndf_missing['geslacht'] = df['geslacht'].fillna(df['geslacht'].mode()[0])\ndf_missing['lengte'] = df['lengte'].fillna(df['lengte'].mean())\ndf_missing<\/p>\n<p>Out[15]:<\/p>\n<style scoped>\n    .dataframe tbody tr th:only-of-type {<br \/>        vertical-align: middle;<br \/>    }\n<p>    .dataframe tbody tr th {<br \/>        vertical-align: top;<br \/>    }<\/p>\n    .dataframe thead th {<br \/>        text-align: right;<br \/>    }<br \/><\/style>\n<table border=\"1\">\n<thead>\n<tr>\n\n<th>geboortedatum<\/th>\n<th>geslacht<\/th>\n<th>lengte<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<th>0<\/th>\n<td>1957-01-01<\/td>\n<td>vrouw<\/td>\n<td>164.922945<\/td>\n<\/tr>\n<tr>\n<th>1<\/th>\n<td>1975-03-02<\/td>\n<td>vrouw<\/td>\n<td>165.122392<\/td>\n<\/tr>\n<tr>\n<th>2<\/th>\n<td>1991-07-03<\/td>\n<td>man<\/td>\n<td>166.654339<\/td>\n<\/tr>\n<tr>\n<th>3<\/th>\n<td>1939-11-04<\/td>\n<td>vrouw<\/td>\n<td>169.507401<\/td>\n<\/tr>\n<tr>\n<th>4<\/th>\n<td>1929-01-05<\/td>\n<td>vrouw<\/td>\n<td>174.348120<\/td>\n<\/tr>\n<tr>\n<th>5<\/th>\n<td>1995-12-06<\/td>\n<td>vrouw<\/td>\n<td>172.129023<\/td>\n<\/tr>\n<tr>\n<th>6<\/th>\n<td>1975-03-02<\/td>\n<td>vrouw<\/td>\n<td>163.659517<\/td>\n<\/tr>\n<tr>\n<th>7<\/th>\n<td>1975-03-02<\/td>\n<td>man<\/td>\n<td>173.502233<\/td>\n<\/tr>\n<tr>\n<th>8<\/th>\n<td>1939-11-04<\/td>\n<td>vrouw<\/td>\n<td>176.749675<\/td>\n<\/tr>\n<tr>\n<th>9<\/th>\n<td>2000-04-01<\/td>\n<td>vrouw<\/td>\n<td>168.478365<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>In bovenstaand voorbeeld vullen we ter illustratie het geslacht aan op basis van de modus en de lengte op basis van het gemiddelde.<\/p>\n<h2 id=\"tekst-manipuleren-pandas\"><strong>Tekst manipuleren in Pandas<\/strong><\/h2>\n<p>Binnen Pandas is het mogelijk om op allerlei manieren strings (tekst) te bewerken. Je past een dergelijke bewerking op een Series of kolom uit een dataframe toe als volgt: Series.str.functie(). Hier volgen enkele voorbeelden voor de kolom 'geslacht'.<\/p>\n<p>In\u00a0[16]:\nprint(df['geslacht'].str.upper())\nprint(df['geslacht'].str.get(0))\nprint(df['geslacht'].str.len())\nprint(df['geslacht'].str.startswith(&quot;v&quot;))<\/p>\n<p>0    VROUW\n1    VROUW\n2      MAN\n3    VROUW\n4    VROUW\n5    VROUW\n6      NaN\n7      MAN\n8    VROUW\n9    VROUW\nName: geslacht, dtype: object\n0      v\n1      v\n2      m\n3      v\n4      v\n5      v\n6    NaN\n7      m\n8      v\n9      v\nName: geslacht, dtype: object\n0    5.0\n1    5.0\n2    3.0\n3    5.0\n4    5.0\n5    5.0\n6    NaN\n7    3.0\n8    5.0\n9    5.0\nName: geslacht, dtype: float64\n0     True\n1     True\n2    False\n3     True\n4     True\n5     True\n6      NaN\n7    False\n8     True\n9     True\nName: geslacht, dtype: object<\/p>\n<p>We tonen vier verschillende bewerkingen. Ten eerste transformeren we alle tekst naar hoofdletters, vervolgens pakken we de eerste letter van iedere string, en tenslotte tellen we de lengte van de string.<\/p>\n<p>Er zijn enorm veel mogelijkheden binnen Python Pandas, waarvan we er hier enkele opsommen:<\/p>\n<table id=\"text-summary\">\n<thead>\n<tr>\n<th>Methode<\/th>\n<th>Omschrijving<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td><code>split()<\/code><\/td>\n<td>Splitst strings op een te kiezen scheidingsteken (standaard een spatie)<\/td>\n<\/tr>\n<tr>\n<td><code>get()<\/code><\/td>\n<td>Geeft het i-de element uit de string<\/td>\n<\/tr>\n<tr>\n<td><code>contains()<\/code><\/td>\n<td>Geeft een boolean array die aangeeft of iedere string een bepaald patroon of <a href=\"https:\/\/datasciencepartners.nl\/regular-expressions-python\/\"><strong>regular expression<\/strong><\/a> bevat<\/td>\n<\/tr>\n<tr>\n<td><code>replace()<\/code><\/td>\n<td>Vervangt patronen of woorden met een andere string<\/td>\n<\/tr>\n<tr>\n<td><code>repeat()<\/code><\/td>\n<td>Herhaalt de string i keer<\/td>\n<\/tr>\n<tr>\n<td><code>pad()<\/code><\/td>\n<td>Voeg spaties toe voor en\/ of achter de string<\/td>\n<\/tr>\n<tr>\n<td><code>count()<\/code><\/td>\n<td>Telt hoe vaak een patroon voorkomt<\/td>\n<\/tr>\n<tr>\n<td><code>findall()<\/code><\/td>\n<td>Maakt een lijst van alle keren dat een patroon binnen een string voorkomt<\/td>\n<\/tr>\n<tr>\n<td><code>strip()<\/code><\/td>\n<td>Verwijdert spaties aan de linker en rechter kant van de string<\/td>\n<\/tr>\n<tr>\n<td><code>lower()<\/code><\/td>\n<td>Maakt lowercase letters van alle tekens<\/td>\n<\/tr>\n<tr>\n<td><code>upper()<\/code><\/td>\n<td>Transformeert tekens naar hoofdletters<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<h2 id=\"data-samenvoegen\"><strong>Databronnen samenvoegen<\/strong><\/h2>\n<p>Je zult als data scientist vaak werken met data uit verschillende bronnen. Je wilt deze data dan zo samenvoegen dat je \u00e9\u00e9n DataFrame krijgt waar je berekeningen op kunt uitvoeren. Je kunt hier pd.concat([databron1, databron2]) voor gebruiken. Met de 'axis' parameter kun je aangeven of de datasets op elkaar of naast elkaar moeten komen. In onderstaand voorbeeld voegen we een nieuwe rij toe aan ons DataFrame.<\/p>\n<p>In\u00a0[17]:\ngewicht = pd.Series([75, 88, 57, 77, 83, 77, 66, 51, 95, 71], dtype=int, name=&quot;gewicht&quot;)\ndf = pd.concat([df, gewicht], axis = 1)\nprint(df)<\/p>\n<p>geboortedatum geslacht      lengte  gewicht\n0    1957-01-01    vrouw  164.922945       75\n1    1975-03-02    vrouw  165.122392       88\n2    1991-07-03      man  166.654339       57\n3    1939-11-04    vrouw         NaN       77\n4    1929-01-05    vrouw  174.348120       83\n5    1995-12-06    vrouw  172.129023       77\n6    1975-03-02      NaN  163.659517       66\n7    1975-03-02      man  173.502233       51\n8    1939-11-04    vrouw  176.749675       95\n9    2000-04-01    vrouw  168.478365       71<\/p>\n<p>Je komt niet altijd uit met de functionaliteit van pd.concat(). Met pd.merge() kunnen bronnen op geavanceerdere manieren samengevoegd worden.<\/p>\n<h2 id=\"draaitabellen-pandas\"><strong>Draaitabellen in Pandas<\/strong><\/h2>\n<p>Net als in Excel heb je de mogelijkheid om met Python Pandas draaitabellen te maken. Dit doe je met pd.pivot_table(). Binnen deze functie kun je de waarden, kolommen, en rijen specificeren met parameters. Daarnaast kun je aangeven wat je met de waarden wilt doen (denk aan optellen, tellen, gemiddelde, etc.).<\/p>\n<p>In\u00a0[18]:\nprint(pd.pivot_table(df, values='gewicht', columns='geslacht', aggfunc='mean'))\nprint(pd.pivot_table(df, values='gewicht', index=['geslacht', 'geboortedatum'], aggfunc='mean'))<\/p>\n<p>geslacht   man      vrouw\ngewicht   54.0  80.857143\ngewicht\ngeslacht geboortedatum<br \/>\nman      1975-03-02          51\n1991-07-03          57\nvrouw    1929-01-05          83\n1939-11-04          86\n1957-01-01          75\n1975-03-02          88\n1995-12-06          77\n2000-04-01          71<\/p>\n<p>Met onze eerste draaitabel vinden we dat we een dataset hebben met relatief zware vrouwen en lichte mannen. Dat zegt op deze sample size natuurlijk niet zo veel. In de tweede draaitabel gebruiken we twee kolommen als input voor de index van de draaitabel.<\/p>\n<h2 id=\"pandas-visualiseren\"><strong>Pandas data visualisatie mogelijkheden<\/strong><\/h2>\n<p>Binnen Pandas is het mogelijk om allerlei visualisaties te produceren. Pandas maakt onder de motorkap gebruik van Matplotlib (een visualisatie package). Met df.plot(kind=soort_grafiek) kunnen veel grafieken geplot worden. Op de plek van 'soort_grafiek' kun je het grafiektype ingeven. Zo kun je eenvoudig <a href=\"https:\/\/datasciencepartners.nl\/python-scatter-plot\/\"><strong>scatterplots<\/strong><\/a>, bar charts, pie charts, boxplots, en vele andere visualisaties maken.<\/p>\n<p>In\u00a0[21]:\nprint(df.plot.scatter(x='lengte', y='gewicht'))<\/p>\n<p>AxesSubplot(0.125,0.125;0.775x0.755)<\/p>\n<img decoding=\"async\" src=\"data:image\/png;base64,iVBORw0KGgoAAAANSUhEUgAAAX4AAAEGCAYAAABiq\/5QAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+\/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4xLjAsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+17YcXAAAWAElEQVR4nO3df3BlZ33f8ff3ZmWtbG1qWbt2zSrumqwDSYgQsBjaxSaJgaRpuvZEjOPQmTqpp046FEg7ya7pD0hCpwHlVztJJoMpMNuZmJhY0HUDNZAthDT1GHbNWraxKWBjrB3\/WKvadAVaofX99o97FiRZ8l7BHt1793m\/ZjRX97m\/PivrfHT83HPPE5mJJKkcjU4HkCRtLItfkgpj8UtSYSx+SSqMxS9JhdnU6QDt2Lp1a+7YsaPTMSSppxw+fPiZzNy2crwnin\/Hjh0cOnSo0zEkqadExGOrjTvVI0mFsfglqTAWvyQVxuKXpMJY\/JJUGItfkrrQzNwC9z1+nJm5hbP+3D1xOKckleTAkaPsm5yir9FgsdlkYnyUPWPbz9rzu8cvSV1kZm6BfZNTnFxscmLhFCcXm+ydnDqre\/4WvyR1kenZefoay6u5r9Fgenb+rL2GxS9JXWRkaIDFZnPZ2GKzycjQwFl7DYtfkrrI8GA\/E+OjbO5rsKV\/E5v7GkyMjzI82H\/WXsM3dyWpy+wZ287unVuZnp1nZGjgrJY+WPyS1JWGB\/vPeuGf5lSPJBXG4pekwlj8klQYi1+SCmPxS1JhLH5JKozFL0mFsfglqTAWvyQVxuKXpMJY\/JJUGItfkgpj8UtSYSx+SSqMxS9Jham1+CPibRHxQEQ8GBG\/Wo1dFBGfiogvV5dDdWaQJC1XW\/FHxEuAfw5cCbwU+NmI2AncAhzMzCuAg9V1SdIGqXOP\/4eBezLzm5l5Cvgr4OeAa4H91X32A9fVmEGStEKdxf8AcFVEDEfE+cDPAD8AXJKZT1T3eRK4ZLUHR8TNEXEoIg4dO3asxpiSVJbaij8zHwLeA3wSuAs4Ajy74j4J5BqPvzUzd2Xmrm3bttUVU5KKU+ubu5n5\/sx8RWZeDcwC\/wd4KiIuBagun64zgyRpubqP6rm4uryM1vz+bcCdwI3VXW4EDtSZQZK03Kaan38yIoaBReDNmXk8It4NfDgibgIeA66vOYMkaYlaiz8zr1plbAa4ps7XlSStzU\/uboCZuQXue\/w4M3MLnY4iSbVP9RTvwJGj7Jucoq\/RYLHZZGJ8lD1j2zsdS1LB3OOv0czcAvsmpzi52OTEwilOLjbZOznlnr+kjrL4azQ9O09fY\/mPuK\/RYHp2vkOJJMnir9XI0ACLzeayscVmk5GhgQ4lkiSLv1bDg\/1MjI+yua\/Blv5NbO5rMDE+yvBgf6ejSSqYb+7WbM\/Ydnbv3Mr07DwjQwOWvqSOs\/g3wPBgv4UvqWs41SNJhbH4JakwFr8kFcbil6TCWPySVBiLX5IKY\/FLUmEsfkkqjMUvSYWx+CWpMBa\/JBXG4pekwlj8klQYi1+SCmPxS+pJM3ML3Pf4cdew\/i54Pn5JPefAkaPsm5yir9FgsdlkYnyUPWPbOx2rZ7jHL6mnzMwtsG9yipOLTU4snOLkYpO9k1Pu+a+DxS+pp0zPztPXWF5dfY0G07PzHUrUeyx+ST1lZGiAxWZz2dhis8nI0ECHEvUei19STxke7GdifJTNfQ229G9ic1+DifFR17VeB9\/cldRz9oxtZ\/fOrUzPzjMyNGDpr5PFL6knDQ\/2W\/jfJad6JKkwFr8kFcbil6TCWPySVBiLX5IKU2vxR8S\/iogHI+KBiPhQRGyOiMsj4p6I+EpE3B4R59WZQZK0XG3FHxHbgbcCuzLzJcD3ATcA7wH+IDN3ArPATXVlkCQ9V91TPZuAgYjYBJwPPAH8JHBHdft+4LqaM0iSlqit+DPzKPC7wNdpFf7fAoeB45l5qrrbNOC5VCVpA9U51TMEXAtcDrwAuAD46XU8\/uaIOBQRh44dO1ZTSkkqT51TPa8DHs3MY5m5CHwE2A1cWE39AIwAR1d7cGbempm7MnPXtm3baowpSWWps\/i\/Drw6Is6PiACuAb4IfBp4Y3WfG4EDNWaQJK1Q5xz\/PbTexL0XuL96rVuBfcC\/joivAMPA++vKIEl6rlrPzpmZ7wTeuWL4EeDKOl9XkrQ2P7krSYWx+CWpMBa\/JBXG4pekwlj8klQYi18qyMzcAvc9fpyZuYVOR1EHudi6VIgDR46yb3KKvkaDxWaTifFR9ox5qqwSuccvFWBmboF9k1OcXGxyYuEUJxeb7J2ccs+\/UBa\/VIDp2Xn6Gss3975Gg+nZ+Q4lUie1VfwR0d\/OmKTuNDI0wGKzuWxssdlkZGigQ4nUSe3u8d\/d5pikLjQ82M\/E+Cib+xps6d\/E5r4GE+OjDA+6\/1ai531zNyL+Lq2FUgYi4mVAVDd9P60VtST1iD1j29m9cyvTs\/OMDA1Y+gU701E9PwX8Iq3z5v\/+kvETwL+pKZOkmgwP9lv4ev7iz8z9wP6IGM\/MyQ3KJEmqUbvH8f9FRLwJ2LH0MZn5W3WE6nUzcwv+77SkrtVu8R\/gO4ule+Dv8\/BDMpK6XbvFP5KZbS+UXqqlH5I5SevQub2TU+zeudU9f0ldo93DOf93RPxYrUnOAX5IRlIvONPhnPcDWd3vlyLiEVpTPQFkZo7WH7F3+CEZSb3gTFM9P7shKc4Rpz8ks3fFHL\/TPJK6yZkO53wMICJeDTyYmSeq698P\/DDwWO0Je4wfkpHU7dp9c\/dPgJcvuT63ypgqfkhGUjdr983dyMw8fSUzm3guf0nqSe0W\/yMR8daI6Ku+3gY8UmcwSVI92i3+XwH+AXAUmAZeBdxcVyhJUn3amq7JzKeBG2rOIknaAGc6jn9vZk5ExB\/SOp5\/mcx8a23JJEm1ONMe\/0PV5aG6g0iSNsaZjuP\/79W3\/yszv7oBeSRJNWv3kMwPRMQI8Hngr4HPZub99cWSJNWl3Td3XxsR5wGvBH4c+FhEDGbmRXWGkySdfW0Vf0S8Briq+roQ+Atae\/6SpB7T7lTPZ2gtwvLbwMcz81u1JZIqrmQm1aPd4t8K7AauBt4aEU3g7sz897UlU9FcyUyqT1uf3M3M47RO0fAo8ATwg7T+CEhn3dKVzE4snOLkYpO9k1PMzLnqp3Q2tFX81QIsvwdcROusnC\/KzNfWGUzlciUzqV7tTvXsrM7I2baIeBFw+5KhFwLvAP5rNb4D+BpwfWbOrue5dW5zJTOpXu2epG1nRByMiAcAImI0Iv7d8z0gM7+UmWOZOQa8Avgm8FHgFuBgZl4BHKyuS992eiWzzX0NtvRvYnNfw5XMpLOo3T3+9wG\/DrwXIDOnIuI24D+0+fhrgK9m5mMRcS2tzwIA7Kd1xNC+dgOrDK5kJtWn3eI\/PzM\/FxFLx06t43VuAD5UfX9JZj5Rff8kcMk6nkcFcSUzqR7tTvU8ExE\/SHWGzoh4I62je86o+sTvHuDPV95Wrer1nLN+Vo+7OSIORcShY8eOtRlTknQm7Rb\/m2lN87w4Io4Cv0prcZZ2\/EPg3sx8qrr+VERcClBdPr3agzLz1szclZm7tm3b1uZLSZLOpN2pnuuAjwOfpvXH4hvA6yLicGYeOcNjf4HvTPMA3AncCLy7ujywrsSSpO9Ju3v8u2jt4Q\/ROlfPLwM\/DbwvIvau9aCIuAB4PfCRJcPvBl4fEV8GXlddlyRtkHb3+EeAl2fmHEBEvBP4GK1P7x4GJlZ7UGZ+AxheMTZD6ygfSVIHtLvHfzGw9PPyi7SOzplfMS5J6nLt7vH\/KXBPRJyej\/\/HwG3VVM4Xa0kmSapFuwuxvCsi\/getM3QC\/Epmnl6H95\/UkkySVIt29\/ipit5F1yWpx7U7xy9JOkdY\/JJUGItfkgpj8UtSYSx+SSqMxS9JhTmni39mboH7Hj\/uIt2StETbx\/H3mgNHjrJvcoq+RoPFZpOJ8VH2jG3vdCxJ6rhzco9\/Zm6BfZNTnFxscmLhFCcXm+ydnHLPX5I4R4t\/enaevsbyf1pfo8H07HyHEklS9zgni39kaIDFZnPZ2GKzycjQQIcSSVL3OCeLf3iwn4nxUTb3NdjSv4nNfQ0mxkdduFuSOIff3N0ztp3dO7cyPTvPyNCApS9JlXO2+KG152\/hS9Jy5+RUjyRpbRa\/JBXG4pekwlj8klQYi1+SCmPxS1JhLH5JKozFL0mFsfglqTAWvyQVxuKXpMJY\/JJUGItfkgpj8UtSYSx+SSqMxS9JhbH4JakwFr8kFabW4o+ICyPijoh4OCIeioi\/HxEXRcSnIuLL1eVQnRkkScvVvcf\/n4G7MvPFwEuBh4BbgIOZeQVwsLouSdogtRV\/RPwd4Grg\/QCZ+a3MPA5cC+yv7rYfuK6uDJKk56pzj\/9y4BjwwYj4QkT8l4i4ALgkM5+o7vMkcMlqD46ImyPiUEQcOnbsWI0xJaksdRb\/JuDlwJ9k5suAb7BiWiczE8jVHpyZt2bmrszctW3bthpjSlJZ6iz+aWA6M++prt9B6w\/BUxFxKUB1+XSNGSRJK9RW\/Jn5JPB4RLyoGroG+CJwJ3BjNXYjcKCuDJKk59pU8\/O\/BfjTiDgPeAT4JVp\/bD4cETcBjwHX15xBkrRErcWfmUeAXavcdE2drytJWpuf3JWkwlj8klQYi1+SCmPxS1JhLH5JKozFX6CZuQXue\/w4M3MLnY4iqQPqPo5fXebAkaPsm5yir9FgsdlkYnyUPWPbOx1L0gZyj78gM3ML7Juc4uRikxMLpzi52GTv5JR7\/lJhLP6CTM\/O09dY\/p+8r9Fgena+Q4kkdYLFX5CRoQEWm81lY4vNJiNDAx1KJKkTLP6CDA\/2MzE+yua+Blv6N7G5r8HE+CjDg\/2djiZpA\/nmbmH2jG1n986tTM\/OMzI0YOlLBbL4CzQ82G\/hSwVzqkeSCmPxS1JhLH5JKozFL0mFsfglqTAWvyQVxuKXpMJY\/JJUGItfkgpj8UtSYSx+SSqMxS9JhbH4JakwFr8kFcbil6TCWPySVBiLX5IKY\/FLUmEsfkkqjMUvacPMzC1w3+PHmZlb6HSUornYuqQNceDIUfZNTtHXaLDYbDIxPsqese2djlUk9\/gl1W5mboF9k1OcXGxyYuEUJxeb7J2ccs+\/Qyx+SbWbnp2nr7G8bvoaDaZn5zuUqGy1TvVExNeAE8CzwKnM3BURFwG3AzuArwHXZ+ZsnTkkddbI0ACLzeayscVmk5GhgQ4lKttG7PH\/RGaOZeau6votwMHMvAI4WF2XdA4bHuxnYnyUzX0NtvRvYnNfg4nxUYYH+zsdrUideHP3WuDHq+\/3A58B9nUgh6QNtGdsO7t3bmV6dp6RoQFLv4PqLv4EPhkRCbw3M28FLsnMJ6rbnwQuWe2BEXEzcDPAZZddVnNMSRtheLDfwu8CdRf\/azLzaERcDHwqIh5eemNmZvVH4TmqPxK3AuzatWvV+0iS1q\/WOf7MPFpdPg18FLgSeCoiLgWoLp+uM4Mkabnaij8iLoiILae\/B94APADcCdxY3e1G4EBdGSRJz1XnVM8lwEcj4vTr3JaZd0XE54EPR8RNwGPA9TVmkCStUFvxZ+YjwEtXGZ8BrqnrdSVJzy8yu\/9904g4Ruv\/DuqwFXimpueuW69mN\/fG69XsvZobuiP738vMbSsHe6L46xQRh5Z8uKyn9Gp2c2+8Xs3eq7mhu7N7rh5JKozFL0mFsfirD4n1qF7Nbu6N16vZezU3dHH24uf4Jak07vFLUmEsfkkqzDlf\/BHxgYh4OiIeWDH+loh4OCIejIiJFbddFhFzEfFrG5t2WYZ15Y6I0Yi4uxq\/PyI2b3zqb2dpO3tE9EXE\/irzQxHx9s6kXj13RNweEUeqr69FxJElt709Ir4SEV+KiJ\/qTOr15Y6I10fE4ernfTgifrJTuas86\/qZV7d35fZ5ht+Vrtk+AcjMc\/oLuBp4OfDAkrGfAP4S6K+uX7ziMXcAfw78Wi\/kpvUJ7CngpdX1YeD7eiT7m4A\/q74\/n9aqbDu6JfeK238PeEf1\/Y8A9wH9wOXAVzv1M19n7pcBL6i+fwlwtFO\/J+vNvmSsK7fP5\/mZd9X2mZkdWYhlQ2XmZyNix4rhfwG8OzMXqvt8+wyhEXEd8CjwjY3KuJp15n4DMJWZ91XjMxuVczXrzJ7ABRGxCRgAvgX8vw2KuswauQGI1kmnrgdO7yFfS+sP1gLwaER8hdbZZ+\/egKjLrCd3Zn5hyc0PAgMR0X\/6v8tGW+fPvNu3T2DV3F21fUIBUz1r+CHgqoi4JyL+KiJeCRARg7RWA\/vNjqZb26q5q\/GMiE9ExL0RsbeDGdeyVvY7aG3ETwBfB343M\/9vp0I+j6uApzLzy9X17cDjS26frsa6zcrcS40D93aq9NuwLHsPbJ+nrfyZd932ec7v8a9hE3AR8GrglbTOFvpC4DeAP8jMudYf7a6zVu5NwGuqsW8CByPicGYe7FjS51or+5XAs8ALgCHgryPiL7N1kr9u8gvAhzod4ruwau6I+FHgPbT2RrvVyuy\/QXdvn6etzN1122epxT8NfCRbE26fi4gmrRMqvQp4Y\/XG44VAMyJOZuYfdTDrUmvlngY+m5nPAETEx2nNP3ZT8a+V\/U3AXZm5CDwdEX8D7AK6pviraaifA16xZPgo8ANLro9UY11jjdxExAithZH+aWZ+tRPZzmSN7N2+fa6Vu+u2z1Knev4brTcbiYgfAs4DnsnMqzJzR2buAP4T8B+76ZeKNXIDnwB+LCLOr37xXgt8sWMpV7dW9q9TzYVGa8GeVwMPr\/EcnfI64OHMnF4ydidwQ0T0R8TlwBXA5zqSbm3PyR0RFwIfA27JzL\/pWLIze072Htg+YfXfla7bPs\/54o+ID9F6w+1FETEdrQVgPgC8sDoU68+AG6s90a6xntyZOQv8PvB54AiteduP9UJ24I+BwYh4kFb+D2bmVBflBriBFdMlmfkg8GFaG\/BdwJsz89mNzHvaenID\/xLYCbxjyaGHF29g3GXWmb1rrPN3pau2T\/CUDZJUnHN+j1+StJzFL0mFsfglqTAWvyQVxuKXpMJY\/CpeRMzV8JxjEfEzZ\/t5pbPB4pfqMQZY\/OpKFr+0RET8ekR8PiKmIuI3q7Ed0Vor4H3V+dQ\/GRED1W2vrO57JCJ+JyIeiIjzgN8Cfr4a\/\/mIuCBa53D\/XER8ISKu7eS\/U2Wz+KVKRLyB1qkXrqS1x\/6KiLi6uvkK4I8z80eB47TObAnwQeCXM3OM1snmyMxvAe8Abs\/Mscy8Hfi3wP\/MzCtpnbrid6pTVEgbzuKXvuMN1dcXgHuBF9MqfIBHM\/P0ikqHgR3VeW+2ZObpc\/DfdobnviVaqzJ9BtgMXHZ240vtKfXsnNJqAvjtzHzvssHWghtLz1n\/LK1FY9b73OOZ+aXvJaB0NrjHL33HJ4B\/Vi34QURsf74TmGXmceBERLyqGrphyc0ngC0rnvst1epMRMTLzmpyaR0sfqmSmZ+kNV1zd0TcT2t1sC3P\/yhuAt5XTeFcAPxtNf5p4EdOv7kLvAvoA6aqM5G+q45\/g9QOz84pfQ8iYjAz56rvbwEuzcy3dTiW9Lyc45e+N\/8oIt5Oa1t6DPjFzsaRzsw9fkkqjHP8klQYi1+SCmPxS1JhLH5JKozFL0mF+f8bW5G4p5WpzQAAAABJRU5ErkJggg==\" \/>\n<p>In\u00a0[20]:\nprint(df['lengte'].plot(kind='box'))<\/p>\n<p>AxesSubplot(0.125,0.125;0.775x0.755)<\/p>\n<img decoding=\"async\" src=\"data:image\/png;base64,iVBORw0KGgoAAAANSUhEUgAAAXcAAAD4CAYAAAAXUaZHAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+\/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4xLjAsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+17YcXAAAOZUlEQVR4nO3df6zddX3H8edrKSgCkWgvydTVq5llyhAmF\/QPOy1hbBlZMOigXXSSkdSYjeyP+aNmicKmWYeC\/9Q\/VpNaCbGWGGeWoWLGnE1MI9xigRZrcKFud1vorT86K1oIvPdHvzc7XM\/lnHvOvb3tp89HctNzP99zvvfdP\/rsN5\/7PfemqpAkteXXVnoASdLSM+6S1CDjLkkNMu6S1CDjLkkNWrXSAwCsXr26JicnV3oMSTqt7N2790hVTfQ7dkrEfXJykunp6ZUeQ5JOK0l+uNAxt2UkqUHGXZIaZNwlqUHGXZIaZNwlqUHGXZIaZNwlqUHGXZIadEq8iUk6WZKclK\/j70nQSvPKXWeUqlr0x6s\/\/M+Lfo200oy7JDXIuEtSg4y7JDXIuEtSg4y7JDXIuEtSgwbGPcn2JIeT7O9Z25VkX\/dxKMm+nmNvTLInyYEkjyZ58XINL0nqb5g3Me0AtgJ3zS1U1Y1zj5PcARztHq8C7gbeU1UPJ3k58MxSDixJGmxg3Ktqd5LJfsdy4u1+NwBXdUvXAI9U1cPda3+0NGNKkhZj3D33dcCTVfV49\/laoJLcl+ShJB8a8\/ySpBGM+7NlNgI7553vrcAVwFPA\/Un2VtX981+YZBOwCWDNmjVjjiFJ6jXylXu3v349sKtneQbYXVVHquop4KvAm\/q9vqq2VdVUVU1NTEyMOoYkqY9xtmWuBg5W1UzP2n3AJUle0sX\/bcBj4wwoSVq8YW6F3AnsAS5KMpPk5u7QBp6\/JUNV\/QS4E3gQ2Ac8VFX3Lu3IkqRBhrlbZuMC6zctsH43J26HlCStEN+hKkkNMu6S1CDjLkkNMu6S1CDjLkkNMu6S1CDjLkkNMu6S1CDjLkkNMu6S1CDjLkkNMu6S1CDjLkkNMu6S1CDjLkkNMu6S1CDjLkkNMu6S1CDjLkkNMu6S1CDjLkkNMu6S1KCBcU+yPcnhJPt71nYl2dd9HEqyb95r1iQ5luQDyzG0JOmFrRriOTuArcBdcwtVdePc4yR3AEfnveZO4GtLMJ8kaQQD415Vu5NM9juWJMANwFU9a+8AngB+vjQjSpIWa9w993XAk1X1OECS84APA7cNemGSTUmmk0zPzs6OOYYkqde4cd8I7Oz5\/Fbg01V1bNALq2pbVU1V1dTExMSYY0iSeg2z595XklXA9cDlPctvBt6V5HbgAuC5JL+sqq3jjSlJWoyR4w5cDRysqpm5hapaN\/c4ya3AMcMuSSffMLdC7gT2ABclmUlyc3doA8\/fkpEknSKGuVtm4wLrNw143a2jjSRJGpfvUJWkBo2z5y6tuEtv+wZHf\/HMsn+dyc33Luv5X3rOWTz8sWuW9WvozGLcdVo7+otnOLTl2pUeY2zL\/Z+Hzjxuy0hSg4y7JDXIuEtSg4y7JDXIuEtSg4y7JDXIuEtSg4y7JDXIuEtSg4y7JDXIuEtSg4y7JDXIuEtSg4y7JDXIuEtSg4y7JDXIuEtSg4y7JDVoYNyTbE9yOMn+nrVdSfZ1H4eS7OvWfy\/J3iSPdn9etZzDS5L6G+Z3qO4AtgJ3zS1U1Y1zj5PcARztPj0C\/FFV\/XeS3wbuA165ZNNKkoYyMO5VtTvJZL9jSQLcAFzVPfe7PYcPAOckeVFVHR9\/VEnSsMbdc18HPFlVj\/c59k7goYXCnmRTkukk07Ozs2OOIUnqNW7cNwI75y8muRj4e+B9C72wqrZV1VRVTU1MTIw5hiSp1zB77n0lWQVcD1w+b\/1VwD8Cf1pV\/z7eeJKkUYxz5X41cLCqZuYWklwA3AtsrqpvjzucJGk0w9wKuRPYA1yUZCbJzd2hDfzqlsxfAL8JfLTnVskLl3RiSdJAw9wts3GB9Zv6rH0c+Pj4Y0mSxuE7VCWpQcZdkhpk3CWpQcZdkhpk3CWpQcZdkhpk3CWpQcZdkhpk3CWpQcZdkhpk3CWpQcZdkhpk3CWpQcZdkhpk3CWpQcZdkhpk3CWpQcZdkhpk3CWpQcZdkhpk3CWpQQPjnmR7ksNJ9ves7Uqyr\/s4lGRfz7GPJPlBku8n+f3lGlyStLBVQzxnB7AVuGtuoapunHuc5A7gaPf4DcAG4GLgFcC\/JFlbVc8u4cySpAEGXrlX1W7gx\/2OJQlwA7CzW7oO+GJVHa+qJ4AfAFcu0aySpCGNu+e+Dniyqh7vPn8l8J89x2e6tV+RZFOS6STTs7OzY44hSeo1btw38v9X7YtSVduqaqqqpiYmJsYcQ5LUa5g9976SrAKuBy7vWf4v4Dd6Pn9VtyZJOonGuXK\/GjhYVTM9a\/8EbEjyoiSvAV4HPDDOgJKkxRvmVsidwB7goiQzSW7uDm1g3pZMVR0A7gEeA74O\/Ll3ykjSyTdwW6aqNi6wftMC658APjHeWJKkcfgOVUlqkHGXpAYZd0lqkHGXpAYZd0lqkHGXpAYZd0lqkHGXpAYZd0lqkHGXpAYZd0lqkHGXpAYZd0lqkHGXpAYZd0lqkHGXpAYZd0lq0Mi\/IFs6FZz\/+s1c8vnNKz3G2M5\/PcC1Kz2GGmLcdVr72fe2cGjL6R\/Fyc33rvQIaozbMpLUIOMuSQ0aGPck25McTrJ\/3votSQ4mOZDk9m7trCSfT\/Joku8l+chyDS5JWtgwe+47gK3AXXMLSdYD1wGXVtXxJBd2h\/4YeFFVXZLkJcBjSXZW1aGlHVuS9EIGXrlX1W7gx\/OW3w9sqarj3XMOzz0dODfJKuAc4Gngf5duXEnSMEbdc18LrEvynSTfSnJFt\/4l4OfA\/wD\/AXyqqub\/xwBAkk1JppNMz87OjjiGJKmfUeO+CngZ8Bbgg8A9SQJcCTwLvAJ4DfBXSV7b7wRVta2qpqpqamJiYsQxJEn9jBr3GeDLdcIDwHPAauBPgK9X1TPdVs23gamlGVWSNKxR4\/4VYD1AkrXA2cARTmzFXNWtn8uJK\/uD448pSVqMYW6F3AnsAS5KMpPkZmA78Nru9sgvAu+tqgI+A5yX5ADwIPC5qnpk+caXJPUz8FbIqtq4wKF393nuMU7cDilJWkG+Q1WSGmTcJalBxl2SGmTcJalBxl2SGmTcJalBxl2SGmTcJalBxl2SGmTcJalBxl2SGmTcJalBxl2SGmTcJalBxl2SGmTcJalBxl2SGmTcJalBxl2SGmTcJalBxl2SGjQw7km2JzmcZP+89VuSHExyIMntPetvTLKnW380yYuXY3BJ0sJWDfGcHcBW4K65hSTrgeuAS6vqeJILu\/VVwN3Ae6rq4SQvB55Z8qklSS9o4JV7Ve0Gfjxv+f3Alqo63j3ncLd+DfBIVT3crf+oqp5dwnklSUMYdc99LbAuyXeSfCvJFT3rleS+JA8l+dDSjClJWoxhtmUWet3LgLcAVwD3JHltt\/7Wbu0p4P4ke6vq\/vknSLIJ2ASwZs2aEceQJPUz6pX7DPDlOuEB4Dlgdbe+u6qOVNVTwFeBN\/U7QVVtq6qpqpqamJgYcQxJUj+jxv0rwHqAJGuBs4EjwH3AJUle0n1z9W3AY0sxqCRpeAO3ZZLsBN4OrE4yA3wM2A5s726PfBp4b1UV8JMkdwIPAgV8taruXa7hJUn9DYx7VW1c4NC7F3j+3Zy4HVKStEJ8h6okNci4S1KDjLskNci4S1KDjLskNci4S1KDjLskNci4S1KDRv3BYdIpY3Lz6f8m6Jeec9ZKj6DGGHed1g5tuXbZv8bk5ntPyteRlpLbMpLUIOMuSQ0y7pLUIOMuSQ0y7pLUIOMuSQ0y7pLUIOMuSQ0y7pLUIOMuSQ0y7pLUIOMuSQ0aGPck25McTrJ\/3votSQ4mOZDk9nnH1iQ5luQDSz2wJGmwYa7cdwB\/0LuQZD1wHXBpVV0MfGrea+4EvrYUA0qSFm\/gj\/ytqt1JJuctvx\/YUlXHu+ccnjuQ5B3AE8DPl25MSdJijLrnvhZYl+Q7Sb6V5AqAJOcBHwZuG3SCJJuSTCeZnp2dHXEMSVI\/o8Z9FfAy4C3AB4F7kgS4Ffh0VR0bdIKq2lZVU1U1NTExMeIYkqR+Rv1NTDPAl6uqgAeSPAesBt4MvKv7BusFwHNJfllVW5dmXEnSMEaN+1eA9cA3k6wFzgaOVNW6uSckuRU4Ztgl6eQbGPckO4G3A6uTzAAfA7YD27vbI58G3ttdxUuSTgE5FZo8NTVV09PTKz2GzgAnvjW0\/E6Ff1dqX5K9VTXV79io2zLSacno6kzhjx+QpAYZd0lqkHGXpAYZd0lqkHGXpAYZd0lqkHGXpAYZd0lq0CnxDtUks8APV3oOaQGrgSMrPYTUx6urqu+P1T0l4i6dypJML\/QWb+lU5baMJDXIuEtSg4y7NNi2lR5AWiz33CWpQV65S1KDjLskNci464yQ5NgynPOyJH+41OeVloJxl0Z3GWDcdUoy7jrjJPlgkgeTPJLktm5tMsn3knw2yYEk30hyTnfsiu65+5J8Msn+JGcDfwPc2K3fmOTcJNuTPJDku0muW8m\/p85sxl1nlCTXAK8DruTElfflSX63O\/w64DNVdTHwU+Cd3frngPdV1WXAswBV9TTwUWBXVV1WVbuAvwb+taquBNYDn0xy7kn6q0nPY9x1prmm+\/gu8BDwW5yIOsATVbWve7wXmExyAXB+Ve3p1r8w4Nybk+wD\/g14MbBmaceXhrNqpQeQTrIAf1dV\/\/C8xWQSON6z9CxwzgjnfmdVfX+cAaWl4JW7zjT3AX+W5DyAJK9McuFCT66qnwI\/S\/LmbmlDz+GfAefPO\/ctSdKd+3eWdHJpEYy7zihV9Q1ObK3sSfIo8CWeH+h+bgY+2223nAsc7da\/Cbxh7huqwN8CZwGPJDnQfS6tCH\/8gDRAkvOq6lj3eDPw61X1lys8lvSC3HOXBrs2yUc48e\/lh8BNKzuONJhX7pLUIPfcJalBxl2SGmTcJalBxl2SGmTcJalB\/wd18tBZgCB7NgAAAABJRU5ErkJggg==\" \/>\n<p><strong>Wil je nog veel meer leren over Python en Data Science? Schrijf je dan in voor onze\u00a0<a href=\"https:\/\/datasciencepartners.nl\/python-cursus\/\">Python cursus<\/a> voor data science, onze <a href=\"https:\/\/datasciencepartners.nl\/python-machine-learning-training\/\">machine learning training<\/a>, of voor onze <a href=\"https:\/\/datasciencepartners.nl\/data-science-opleiding\/\">data science opleiding<\/a> en leer met vertrouwen te programmeren en analyseren in Python. Nadat je een van onze trainingen hebt gevolgd kun je zelfstandig verder aan de slag. Je kunt ook altijd even contact opnemen als je een vraag hebt.<\/strong><\/p>\n<p><a href=\"https:\/\/datasciencepartners.nl\/opleidingsbrochures\/\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/datasciencepartners.nl\/wp-content\/uploads\/2020\/07\/opleidingsbrochures-data-science-en-python-trainingen.png\" alt=\"\" width=\"410\" height=\"336\" \/><\/a><\/p>\n<p><strong><a href=\"https:\/\/datasciencepartners.nl\/opleidingsbrochures\/\">Download \u00e9\u00e9n van onze opleidingsbrochures voor meer informatie<\/a><\/strong><\/p>\n<\/div><!-- .vgblk-rw-wrapper -->","protected":false},"excerpt":{"rendered":"<p>Het Python Pandas package is een open source library met data analyse functionaliteit die gebruikt wordt binnen de programmeertaal Python. Pandas is het meestgebruikte package door data scientists en het is essentieel om te beheersen als je aan data analyse of data science vraagstukken werkt. In deze tutorial vind je een overzicht van de basisfunctionaliteit&#8230;<\/p>\n","protected":false},"author":4,"featured_media":18734,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"om_disable_all_campaigns":false,"footnotes":""},"categories":[111,110,112],"tags":[],"class_list":["post-18733","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-science-blogs","category-python","category-tutorial"],"yoast_head":"<!-- This site is optimized with the Yoast SEO Premium plugin v26.7 (Yoast SEO v27.5) - https:\/\/yoast.com\/product\/yoast-seo-premium-wordpress\/ -->\n<title>Python Pandas: Wat is Pandas? [de basis + voorbeelden]<\/title>\n<meta name=\"description\" content=\"Python Pandas is een data analyse package. Het is het meest gebruikte package door data scientists en essentieel om te beheersen.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/datasciencepartners.nl\/python-pandas\/\" \/>\n<meta property=\"og:locale\" content=\"nl_NL\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Python Pandas: Wat is Pandas? [de basis + voorbeelden]\" \/>\n<meta property=\"og:description\" content=\"Python Pandas is een data analyse package. Het is het meest gebruikte package door data scientists en essentieel om te beheersen.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/datasciencepartners.nl\/python-pandas\/\" \/>\n<meta property=\"og:site_name\" content=\"Data Science Partners | Trainingen Data Science in Python, SQL &amp; R\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/Data-Science-Partners-102566501086560\" \/>\n<meta property=\"article:published_time\" content=\"2020-10-18T14:33:37+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2023-11-21T11:25:54+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/datasciencepartners.nl\/wp-content\/uploads\/2020\/10\/python-pandas-voorbeelden-basis-tutorial.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1501\" \/>\n\t<meta property=\"og:image:height\" content=\"767\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"Rik van der Wardt\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Geschreven door\" \/>\n\t<meta name=\"twitter:data1\" content=\"Rik van der Wardt\" \/>\n\t<meta name=\"twitter:label2\" content=\"Geschatte leestijd\" \/>\n\t<meta name=\"twitter:data2\" content=\"13 minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\\\/\\\/datasciencepartners.nl\\\/python-pandas\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/datasciencepartners.nl\\\/python-pandas\\\/\"},\"author\":{\"name\":\"Rik van der Wardt\",\"@id\":\"https:\\\/\\\/datasciencepartners.nl\\\/#\\\/schema\\\/person\\\/720090a3a16c8f4c9eab203325fc2a63\"},\"headline\":\"Python Pandas: Wat is Pandas? [de basis + voorbeelden]\",\"datePublished\":\"2020-10-18T14:33:37+00:00\",\"dateModified\":\"2023-11-21T11:25:54+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/datasciencepartners.nl\\\/python-pandas\\\/\"},\"wordCount\":2426,\"publisher\":{\"@id\":\"https:\\\/\\\/datasciencepartners.nl\\\/#organization\"},\"image\":{\"@id\":\"https:\\\/\\\/datasciencepartners.nl\\\/python-pandas\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/datasciencepartners.nl\\\/wp-content\\\/uploads\\\/2020\\\/10\\\/python-pandas-voorbeelden-basis-tutorial.jpg\",\"articleSection\":[\"Data Science\",\"Python\",\"Tutorial\"],\"inLanguage\":\"nl-NL\"},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/datasciencepartners.nl\\\/python-pandas\\\/\",\"url\":\"https:\\\/\\\/datasciencepartners.nl\\\/python-pandas\\\/\",\"name\":\"Python Pandas: Wat is Pandas? [de basis + voorbeelden]\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/datasciencepartners.nl\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/datasciencepartners.nl\\\/python-pandas\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/datasciencepartners.nl\\\/python-pandas\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/datasciencepartners.nl\\\/wp-content\\\/uploads\\\/2020\\\/10\\\/python-pandas-voorbeelden-basis-tutorial.jpg\",\"datePublished\":\"2020-10-18T14:33:37+00:00\",\"dateModified\":\"2023-11-21T11:25:54+00:00\",\"description\":\"Python Pandas is een data analyse package. Het is het meest gebruikte package door data scientists en essentieel om te beheersen.\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/datasciencepartners.nl\\\/python-pandas\\\/#breadcrumb\"},\"inLanguage\":\"nl-NL\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/datasciencepartners.nl\\\/python-pandas\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"nl-NL\",\"@id\":\"https:\\\/\\\/datasciencepartners.nl\\\/python-pandas\\\/#primaryimage\",\"url\":\"https:\\\/\\\/datasciencepartners.nl\\\/wp-content\\\/uploads\\\/2020\\\/10\\\/python-pandas-voorbeelden-basis-tutorial.jpg\",\"contentUrl\":\"https:\\\/\\\/datasciencepartners.nl\\\/wp-content\\\/uploads\\\/2020\\\/10\\\/python-pandas-voorbeelden-basis-tutorial.jpg\",\"width\":1501,\"height\":767,\"caption\":\"python pandas voorbeelden basis tutorial\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/datasciencepartners.nl\\\/python-pandas\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/datasciencepartners.nl\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Python Pandas: Wat is Pandas? [de basis + voorbeelden]\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/datasciencepartners.nl\\\/#website\",\"url\":\"https:\\\/\\\/datasciencepartners.nl\\\/\",\"name\":\"Data Science Partners | Trainingen Data Science & AI in Python, SQL & R\",\"description\":\"\",\"publisher\":{\"@id\":\"https:\\\/\\\/datasciencepartners.nl\\\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/datasciencepartners.nl\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"nl-NL\"},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/datasciencepartners.nl\\\/#organization\",\"name\":\"Data Science Partners\",\"url\":\"https:\\\/\\\/datasciencepartners.nl\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"nl-NL\",\"@id\":\"https:\\\/\\\/datasciencepartners.nl\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"https:\\\/\\\/datasciencepartners.nl\\\/wp-content\\\/uploads\\\/2021\\\/02\\\/data-science-partners.png\",\"contentUrl\":\"https:\\\/\\\/datasciencepartners.nl\\\/wp-content\\\/uploads\\\/2021\\\/02\\\/data-science-partners.png\",\"width\":655,\"height\":329,\"caption\":\"Data Science Partners\"},\"image\":{\"@id\":\"https:\\\/\\\/datasciencepartners.nl\\\/#\\\/schema\\\/logo\\\/image\\\/\"},\"sameAs\":[\"https:\\\/\\\/www.facebook.com\\\/Data-Science-Partners-102566501086560\",\"https:\\\/\\\/www.linkedin.com\\\/company\\\/23709861\\\/\"],\"description\":\"Data Science Partners helpt organisaties met Data Science & AI. We werken voornamelijk met Python, SQL & R. We geven trainingen en doen consultancy opdrachten.\",\"email\":\"info@datasciencepartners.nl\",\"telephone\":\"0202443146\",\"legalName\":\"Data Science Partners B.V.\",\"foundingDate\":\"2019-10-01\",\"vatID\":\"NL863566261B01\",\"numberOfEmployees\":{\"@type\":\"QuantitativeValue\",\"minValue\":\"11\",\"maxValue\":\"50\"}},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/datasciencepartners.nl\\\/#\\\/schema\\\/person\\\/720090a3a16c8f4c9eab203325fc2a63\",\"name\":\"Rik van der Wardt\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"nl-NL\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/ea1de6dc79c964ff397cde12784a8a7863522853762d25b10d1732b783192c26?s=96&d=mm&r=g\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/ea1de6dc79c964ff397cde12784a8a7863522853762d25b10d1732b783192c26?s=96&d=mm&r=g\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/ea1de6dc79c964ff397cde12784a8a7863522853762d25b10d1732b783192c26?s=96&d=mm&r=g\",\"caption\":\"Rik van der Wardt\"},\"description\":\"Rik is data scientist, AI engineer en marketeer bij Data Science Partners. Vanuit zijn achtergrond op de Technische Universiteit Eindhoven heeft hij veel affiniteit met data. Na zijn studie heeft hij als consultant altijd met data gewerkt en tevens ervaring opgedaan in het geven van trainingen.\",\"sameAs\":[\"https:\\\/\\\/www.linkedin.com\\\/in\\\/rikvanderwardt\\\/\"],\"honorificPrefix\":\"Heer\",\"honorificSuffix\":\"Ir.\",\"birthDate\":\"1989-04-03\",\"gender\":\"mannelijk\",\"knowsAbout\":[\"AI\",\"Data Science\",\"Agile\",\"Data-Driven Marketing\"],\"knowsLanguage\":[\"Nederlands\",\"Engels\"],\"jobTitle\":\"AI engineer, Data-driven marketeer\",\"worksFor\":\"Data Science Partners\",\"url\":\"https:\\\/\\\/datasciencepartners.nl\\\/author\\\/rik-van-der-wardt\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO Premium plugin. -->","yoast_head_json":{"title":"Python Pandas: Wat is Pandas? [de basis + voorbeelden]","description":"Python Pandas is een data analyse package. Het is het meest gebruikte package door data scientists en essentieel om te beheersen.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/datasciencepartners.nl\/python-pandas\/","og_locale":"nl_NL","og_type":"article","og_title":"Python Pandas: Wat is Pandas? [de basis + voorbeelden]","og_description":"Python Pandas is een data analyse package. Het is het meest gebruikte package door data scientists en essentieel om te beheersen.","og_url":"https:\/\/datasciencepartners.nl\/python-pandas\/","og_site_name":"Data Science Partners | Trainingen Data Science in Python, SQL &amp; R","article_publisher":"https:\/\/www.facebook.com\/Data-Science-Partners-102566501086560","article_published_time":"2020-10-18T14:33:37+00:00","article_modified_time":"2023-11-21T11:25:54+00:00","og_image":[{"width":1501,"height":767,"url":"https:\/\/datasciencepartners.nl\/wp-content\/uploads\/2020\/10\/python-pandas-voorbeelden-basis-tutorial.jpg","type":"image\/jpeg"}],"author":"Rik van der Wardt","twitter_card":"summary_large_image","twitter_misc":{"Geschreven door":"Rik van der Wardt","Geschatte leestijd":"13 minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/datasciencepartners.nl\/python-pandas\/#article","isPartOf":{"@id":"https:\/\/datasciencepartners.nl\/python-pandas\/"},"author":{"name":"Rik van der Wardt","@id":"https:\/\/datasciencepartners.nl\/#\/schema\/person\/720090a3a16c8f4c9eab203325fc2a63"},"headline":"Python Pandas: Wat is Pandas? [de basis + voorbeelden]","datePublished":"2020-10-18T14:33:37+00:00","dateModified":"2023-11-21T11:25:54+00:00","mainEntityOfPage":{"@id":"https:\/\/datasciencepartners.nl\/python-pandas\/"},"wordCount":2426,"publisher":{"@id":"https:\/\/datasciencepartners.nl\/#organization"},"image":{"@id":"https:\/\/datasciencepartners.nl\/python-pandas\/#primaryimage"},"thumbnailUrl":"https:\/\/datasciencepartners.nl\/wp-content\/uploads\/2020\/10\/python-pandas-voorbeelden-basis-tutorial.jpg","articleSection":["Data Science","Python","Tutorial"],"inLanguage":"nl-NL"},{"@type":"WebPage","@id":"https:\/\/datasciencepartners.nl\/python-pandas\/","url":"https:\/\/datasciencepartners.nl\/python-pandas\/","name":"Python Pandas: Wat is Pandas? [de basis + voorbeelden]","isPartOf":{"@id":"https:\/\/datasciencepartners.nl\/#website"},"primaryImageOfPage":{"@id":"https:\/\/datasciencepartners.nl\/python-pandas\/#primaryimage"},"image":{"@id":"https:\/\/datasciencepartners.nl\/python-pandas\/#primaryimage"},"thumbnailUrl":"https:\/\/datasciencepartners.nl\/wp-content\/uploads\/2020\/10\/python-pandas-voorbeelden-basis-tutorial.jpg","datePublished":"2020-10-18T14:33:37+00:00","dateModified":"2023-11-21T11:25:54+00:00","description":"Python Pandas is een data analyse package. Het is het meest gebruikte package door data scientists en essentieel om te beheersen.","breadcrumb":{"@id":"https:\/\/datasciencepartners.nl\/python-pandas\/#breadcrumb"},"inLanguage":"nl-NL","potentialAction":[{"@type":"ReadAction","target":["https:\/\/datasciencepartners.nl\/python-pandas\/"]}]},{"@type":"ImageObject","inLanguage":"nl-NL","@id":"https:\/\/datasciencepartners.nl\/python-pandas\/#primaryimage","url":"https:\/\/datasciencepartners.nl\/wp-content\/uploads\/2020\/10\/python-pandas-voorbeelden-basis-tutorial.jpg","contentUrl":"https:\/\/datasciencepartners.nl\/wp-content\/uploads\/2020\/10\/python-pandas-voorbeelden-basis-tutorial.jpg","width":1501,"height":767,"caption":"python pandas voorbeelden basis tutorial"},{"@type":"BreadcrumbList","@id":"https:\/\/datasciencepartners.nl\/python-pandas\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/datasciencepartners.nl\/"},{"@type":"ListItem","position":2,"name":"Python Pandas: Wat is Pandas? [de basis + voorbeelden]"}]},{"@type":"WebSite","@id":"https:\/\/datasciencepartners.nl\/#website","url":"https:\/\/datasciencepartners.nl\/","name":"Data Science Partners | Trainingen Data Science & AI in Python, SQL & R","description":"","publisher":{"@id":"https:\/\/datasciencepartners.nl\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/datasciencepartners.nl\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"nl-NL"},{"@type":"Organization","@id":"https:\/\/datasciencepartners.nl\/#organization","name":"Data Science Partners","url":"https:\/\/datasciencepartners.nl\/","logo":{"@type":"ImageObject","inLanguage":"nl-NL","@id":"https:\/\/datasciencepartners.nl\/#\/schema\/logo\/image\/","url":"https:\/\/datasciencepartners.nl\/wp-content\/uploads\/2021\/02\/data-science-partners.png","contentUrl":"https:\/\/datasciencepartners.nl\/wp-content\/uploads\/2021\/02\/data-science-partners.png","width":655,"height":329,"caption":"Data Science Partners"},"image":{"@id":"https:\/\/datasciencepartners.nl\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/Data-Science-Partners-102566501086560","https:\/\/www.linkedin.com\/company\/23709861\/"],"description":"Data Science Partners helpt organisaties met Data Science & AI. We werken voornamelijk met Python, SQL & R. We geven trainingen en doen consultancy opdrachten.","email":"info@datasciencepartners.nl","telephone":"0202443146","legalName":"Data Science Partners B.V.","foundingDate":"2019-10-01","vatID":"NL863566261B01","numberOfEmployees":{"@type":"QuantitativeValue","minValue":"11","maxValue":"50"}},{"@type":"Person","@id":"https:\/\/datasciencepartners.nl\/#\/schema\/person\/720090a3a16c8f4c9eab203325fc2a63","name":"Rik van der Wardt","image":{"@type":"ImageObject","inLanguage":"nl-NL","@id":"https:\/\/secure.gravatar.com\/avatar\/ea1de6dc79c964ff397cde12784a8a7863522853762d25b10d1732b783192c26?s=96&d=mm&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/ea1de6dc79c964ff397cde12784a8a7863522853762d25b10d1732b783192c26?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/ea1de6dc79c964ff397cde12784a8a7863522853762d25b10d1732b783192c26?s=96&d=mm&r=g","caption":"Rik van der Wardt"},"description":"Rik is data scientist, AI engineer en marketeer bij Data Science Partners. Vanuit zijn achtergrond op de Technische Universiteit Eindhoven heeft hij veel affiniteit met data. Na zijn studie heeft hij als consultant altijd met data gewerkt en tevens ervaring opgedaan in het geven van trainingen.","sameAs":["https:\/\/www.linkedin.com\/in\/rikvanderwardt\/"],"honorificPrefix":"Heer","honorificSuffix":"Ir.","birthDate":"1989-04-03","gender":"mannelijk","knowsAbout":["AI","Data Science","Agile","Data-Driven Marketing"],"knowsLanguage":["Nederlands","Engels"],"jobTitle":"AI engineer, Data-driven marketeer","worksFor":"Data Science Partners","url":"https:\/\/datasciencepartners.nl\/author\/rik-van-der-wardt\/"}]}},"_links":{"self":[{"href":"https:\/\/datasciencepartners.nl\/wp-json\/wp\/v2\/posts\/18733","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/datasciencepartners.nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/datasciencepartners.nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/datasciencepartners.nl\/wp-json\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/datasciencepartners.nl\/wp-json\/wp\/v2\/comments?post=18733"}],"version-history":[{"count":2,"href":"https:\/\/datasciencepartners.nl\/wp-json\/wp\/v2\/posts\/18733\/revisions"}],"predecessor-version":[{"id":21068,"href":"https:\/\/datasciencepartners.nl\/wp-json\/wp\/v2\/posts\/18733\/revisions\/21068"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/datasciencepartners.nl\/wp-json\/wp\/v2\/media\/18734"}],"wp:attachment":[{"href":"https:\/\/datasciencepartners.nl\/wp-json\/wp\/v2\/media?parent=18733"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/datasciencepartners.nl\/wp-json\/wp\/v2\/categories?post=18733"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/datasciencepartners.nl\/wp-json\/wp\/v2\/tags?post=18733"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}