Python Pandas Tutorial: DataFrame, Date Range, Use of Pandas

ฮคฮน ฮตฮฏฮฝฮฑฮน ฯ„ฮฟ Pandas Python?

ฮ ฮฌฮฝฯ„ฮฑ ฮตฮฏฮฝฮฑฮน ฮผฮนฮฑ ฮฒฮนฮฒฮปฮนฮฟฮธฮฎฮบฮท ฮฑฮฝฮฟฮนฯ‡ฯ„ฮฟฯ ฮบฯŽฮดฮนฮบฮฑ ฯ€ฮฟฯ… ฯƒฮฑฯ‚ ฮตฯ€ฮนฯ„ฯฮญฯ€ฮตฮน ฮฝฮฑ ฮบฮฌฮฝฮตฯ„ฮต ฯ‡ฮตฮนฯฮนฯƒฮผฯŒ ฮบฮฑฮน ฮฑฮฝฮฌฮปฯ…ฯƒฮท ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ Python. ฮ ฮฌฮฝฯ„ฮฑ Python ฮ— ฮฒฮนฮฒฮปฮนฮฟฮธฮฎฮบฮท ฯ€ฯฮฟฯƒฯ†ฮญฯฮตฮน ฯ‡ฮตฮนฯฮนฯƒฮผฯŒ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ ฮบฮฑฮน ฮปฮตฮนฯ„ฮฟฯ…ฯฮณฮฏฮตฯ‚ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ ฮณฮนฮฑ ฮฑฯฮนฮธฮผฮทฯ„ฮนฮบฮฟฯฯ‚ ฯ€ฮฏฮฝฮฑฮบฮตฯ‚ ฮบฮฑฮน ฯ‡ฯฮฟฮฝฮฟฯƒฮตฮนฯฮญฯ‚. ฮคฮฑ Panda ฯ€ฮฑฯฮญฯ‡ฮฟฯ…ฮฝ ฮญฮฝฮฑฮฝ ฮตฯฮบฮฟฮปฮฟ ฯ„ฯฯŒฯ€ฮฟ ฮดฮทฮผฮนฮฟฯ…ฯฮณฮฏฮฑฯ‚, ฯ‡ฮตฮนฯฮนฯƒฮผฮฟฯ ฮบฮฑฮน ฮปฮฟฮณฮฟฮผฮฑฯ‡ฮฏฮฑฯ‚ ฯ„ฯ‰ฮฝ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ. ฮ•ฮฏฮฝฮฑฮน ฯ‡ฯ„ฮนฯƒฮผฮญฮฝฮฟ ฯ€ฮฌฮฝฯ‰ ฯƒฯ„ฮฟ NumPy, ฯƒฮทฮผฮฑฮฏฮฝฮตฮน ฯŒฯ„ฮน ฯ‡ฯฮตฮนฮฌฮถฮตฯ„ฮฑฮน NumPy ฮณฮนฮฑ ฮฝฮฑ ฮปฮตฮนฯ„ฮฟฯ…ฯฮณฮฎฯƒฮตฮน.

ฮ“ฮนฮฑฯ„ฮฏ ฮฝฮฑ ฯ‡ฯฮทฯƒฮนฮผฮฟฯ€ฮฟฮนฮฎฯƒฮตฯ„ฮต Pandas;

ฮŸฮน ฮตฯ€ฮนฯƒฯ„ฮฎฮผฮฟฮฝฮตฯ‚ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ ฮบฮฌฮฝฮฟฯ…ฮฝ ฯ‡ฯฮฎฯƒฮท ฯ„ฯ‰ฮฝ Pandas ฯƒฯ„ฮฟ Python ฮณฮนฮฑ ฯ„ฮฑ ฮฑฮบฯŒฮปฮฟฯ…ฮธฮฑ ฯ€ฮปฮตฮฟฮฝฮตฮบฯ„ฮฎฮผฮฑฯ„ฮฌ ฯ„ฮฟฯ…:

  • ฮงฮตฮนฯฮฏฮถฮตฯ„ฮฑฮน ฮตฯฮบฮฟฮปฮฑ ฯ„ฮฑ ฮดฮตฮดฮฟฮผฮญฮฝฮฑ ฯ€ฮฟฯ… ฮปฮตฮฏฯ€ฮฟฯ…ฮฝ
  • ฮงฯฮทฯƒฮนฮผฮฟฯ€ฮฟฮนฮตฮฏ ฮฃฮตฮนฯฮฌ ฮณฮนฮฑ ฮผฮฟฮฝฮฟฮดฮนฮฌฯƒฯ„ฮฑฯ„ฮท ฮดฮฟฮผฮฎ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ DataFrame ฮณฮนฮฑ ฯ€ฮฟฮปฯ…ฮดฮนฮฌฯƒฯ„ฮฑฯ„ฮท ฮดฮฟฮผฮฎ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ
  • ฮ ฮฑฯฮญฯ‡ฮตฮน ฮญฮฝฮฑฮฝ ฮฑฯ€ฮฟฯ„ฮตฮปฮตฯƒฮผฮฑฯ„ฮนฮบฯŒ ฯ„ฯฯŒฯ€ฮฟ ฮบฮฟฯ€ฮฎฯ‚ ฯ„ฯ‰ฮฝ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ
  • ฮ ฮฑฯฮญฯ‡ฮตฮน ฮญฮฝฮฑฮฝ ฮตฯ…ฮญฮปฮนฮบฯ„ฮฟ ฯ„ฯฯŒฯ€ฮฟ ฯƒฯ…ฮณฯ‡ฯŽฮฝฮตฯ…ฯƒฮทฯ‚, ฯƒฯ…ฮฝฮญฮฝฯ‰ฯƒฮทฯ‚ ฮฎ ฮฑฮฝฮฑฮผฯŒฯฯ†ฯ‰ฯƒฮทฯ‚ ฯ„ฯ‰ฮฝ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ
  • ฮ ฮตฯฮนฮปฮฑฮผฮฒฮฌฮฝฮตฮน ฮญฮฝฮฑ ฮนฯƒฯ‡ฯ…ฯฯŒ ฮตฯฮณฮฑฮปฮตฮฏฮฟ ฯ‡ฯฮฟฮฝฮฟฯƒฮตฮนฯฯŽฮฝ ฮณฮนฮฑ ฮตฯฮณฮฑฯƒฮฏฮฑ

ฮœฮต ฮปฮฏฮณฮฑ ฮปฯŒฮณฮนฮฑ, ฯ„ฮฟ Pandas ฮตฮฏฮฝฮฑฮน ฮผฮนฮฑ ฯ‡ฯฮฎฯƒฮนฮผฮท ฮฒฮนฮฒฮปฮนฮฟฮธฮฎฮบฮท ฮฑฮฝฮฌฮปฯ…ฯƒฮท ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ. ฮœฯ€ฮฟฯฮตฮฏ ฮฝฮฑ ฯ‡ฯฮทฯƒฮนฮผฮฟฯ€ฮฟฮนฮทฮธฮตฮฏ ฮณฮนฮฑ ฯ„ฮทฮฝ ฮตฮบฯ„ฮญฮปฮตฯƒฮท ฮตฯ€ฮตฮพฮตฯฮณฮฑฯƒฮฏฮฑฯ‚ ฮบฮฑฮน ฮฑฮฝฮฌฮปฯ…ฯƒฮทฯ‚ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ. ฮคฮฑ Panda ฯ€ฮฑฯฮญฯ‡ฮฟฯ…ฮฝ ฮนฯƒฯ‡ฯ…ฯฮญฯ‚ ฮบฮฑฮน ฮตฯฯ‡ฯฮทฯƒฯ„ฮตฯ‚ ฮดฮฟฮผฮญฯ‚ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ, ฮบฮฑฮธฯŽฯ‚ ฮบฮฑฮน ฯ„ฮฑ ฮผฮญฯƒฮฑ ฮณฮนฮฑ ฮณฯฮฎฮณฮฟฯฮท ฮตฮบฯ„ฮญฮปฮตฯƒฮท ฮปฮตฮนฯ„ฮฟฯ…ฯฮณฮนฯŽฮฝ ฯƒฮต ฮฑฯ…ฯ„ฮญฯ‚ ฯ„ฮนฯ‚ ฮดฮฟฮผฮญฯ‚.

ฮ ฯŽฯ‚ ฮฝฮฑ ฮตฮณฮบฮฑฯ„ฮฑฯƒฯ„ฮฎฯƒฮตฯ„ฮต ฯ„ฮฑ Pandas;

ฮคฯŽฯฮฑ ฯƒฮต ฮฑฯ…ฯ„ฯŒ Python ฮŸฮดฮทฮณฯŒฯ‚ Pandas, ฮธฮฑ ฮผฮฌฮธฮฟฯ…ฮผฮต ฯ€ฯŽฯ‚ ฮฝฮฑ ฮตฮณฮบฮฑฯ„ฮฑฯƒฯ„ฮฎฯƒฮฟฯ…ฮผฮต ฯ„ฮฑ Pandas Python.

ฮ“ฮนฮฑ ฮฝฮฑ ฮตฮณฮบฮฑฯ„ฮฑฯƒฯ„ฮฎฯƒฮตฯ„ฮต ฯ„ฮท ฮฒฮนฮฒฮปฮนฮฟฮธฮฎฮบฮท Pandas, ฮฑฮฝฮฑฯ„ฯฮญฮพฯ„ฮต ฯƒฯ„ฮฟฮฝ ฮฟฮดฮทฮณฯŒ ฮผฮฑฯ‚ ฮ ฯŽฯ‚ ฮฝฮฑ ฮตฮณฮบฮฑฯ„ฮฑฯƒฯ„ฮฎฯƒฮตฯ„ฮต ฯ„ฮฟ TensorFlow. ฮคฮฟ Pandas ฮตฮฏฮฝฮฑฮน ฮตฮณฮบฮฑฯ„ฮตฯƒฯ„ฮทฮผฮญฮฝฮฟ ฮฑฯ€ฯŒ ฯ€ฯฮฟฮตฯ€ฮนฮปฮฟฮณฮฎ. ฮฃฮต ฮฑฯ€ฮฟฮผฮฑฮบฯฯ…ฯƒฮผฮญฮฝฮท ฯ€ฮตฯฮฏฯ€ฯ„ฯ‰ฯƒฮท, ฯ„ฮฑ ฯ€ฮฌฮฝฯ„ฮฑ ฮดฮตฮฝ ฮตฮฏฮฝฮฑฮน ฮตฮณฮบฮฑฯ„ฮตฯƒฯ„ฮทฮผฮญฮฝฮฑ-

ฮœฯ€ฮฟฯฮตฮฏฯ„ฮต ฮฝฮฑ ฮตฮณฮบฮฑฯ„ฮฑฯƒฯ„ฮฎฯƒฮตฯ„ฮต ฯ„ฮฑ Panda ฯ‡ฯฮทฯƒฮนฮผฮฟฯ€ฮฟฮนฯŽฮฝฯ„ฮฑฯ‚:

  • Anaconda: conda install -c anaconda panda
  • In Jupyter ฮฃฮทฮผฮตฮนฯ‰ฮผฮฑฯ„ฮฌฯฮนฮฟ :
import sys
!conda install --yes --prefix {sys.prefix} pandas

ฮคฮน ฮตฮฏฮฝฮฑฮน ฯ„ฮฟ Pandas DataFrame;

Pandas DataFrame ฮตฮฏฮฝฮฑฮน ฮญฮฝฮฑฯ‚ ฮดฮนฯƒฮดฮนฮฌฯƒฯ„ฮฑฯ„ฮฟฯ‚ ฯ€ฮฏฮฝฮฑฮบฮฑฯ‚ ฮผฮต ฮตฯ€ฮนฯƒฮทฮผฮฑฯƒฮผฮญฮฝฮท ฮดฮฟฮผฮฎ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ ฯ€ฮฟฯ… ฮญฯ‡ฮตฮน ฮดฮนฮฑฯ†ฮฟฯฮตฯ„ฮนฮบฮฟฯฯ‚ ฯ„ฯฯ€ฮฟฯ…ฯ‚ ฯƒฯ„ฮทฮปฯŽฮฝ. ฮคฮฟ DataFrame ฮตฮฏฮฝฮฑฮน ฮญฮฝฮฑฯ‚ ฯ„ฯ…ฯ€ฮนฮบฯŒฯ‚ ฯ„ฯฯŒฯ€ฮฟฯ‚ ฮฑฯ€ฮฟฮธฮฎฮบฮตฯ…ฯƒฮทฯ‚ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ ฯƒฮต ฮผฮฟฯฯ†ฮฎ ฯ€ฮฏฮฝฮฑฮบฮฑ, ฮผฮต ฯƒฮตฮนฯฮญฯ‚ ฮณฮนฮฑ ฯ„ฮทฮฝ ฮฑฯ€ฮฟฮธฮฎฮบฮตฯ…ฯƒฮท ฯ„ฯ‰ฮฝ ฯ€ฮปฮทฯฮฟฯ†ฮฟฯฮนฯŽฮฝ ฮบฮฑฮน ฯƒฯ„ฮฎฮปฮตฯ‚ ฮณฮนฮฑ ฯ„ฮทฮฝ ฮฟฮฝฮฟฮผฮฑฯƒฮฏฮฑ ฯ„ฯ‰ฮฝ ฯ€ฮปฮทฯฮฟฯ†ฮฟฯฮนฯŽฮฝ. ฮ“ฮนฮฑ ฯ€ฮฑฯฮฌฮดฮตฮนฮณฮผฮฑ, ฮท ฯ„ฮนฮผฮฎ ฮผฯ€ฮฟฯฮตฮฏ ฮฝฮฑ ฮตฮฏฮฝฮฑฮน ฯ„ฮฟ ฯŒฮฝฮฟฮผฮฑ ฮผฮนฮฑฯ‚ ฯƒฯ„ฮฎฮปฮทฯ‚ ฮบฮฑฮน ฯ„ฮฟ 2,3,4 ฮผฯ€ฮฟฯฮตฮฏ ฮฝฮฑ ฮตฮฏฮฝฮฑฮน ฮฟฮน ฯ„ฮนฮผฮญฯ‚ ฯ„ฮนฮผฮฎฯ‚.

ฮคฮฟ Data Frame ฮตฮฏฮฝฮฑฮน ฮณฮฝฯ‰ฯƒฯ„ฯŒ ฮฑฯ€ฯŒ ฯ„ฮฟฯ…ฯ‚ ฯƒฯ„ฮฑฯ„ฮนฯƒฯ„ฮนฮบฮฟฮปฯŒฮณฮฟฯ…ฯ‚ ฮบฮฑฮน ฮฌฮปฮปฮฟฯ…ฯ‚ ฮตฯ€ฮฑฮณฮณฮตฮปฮผฮฑฯ„ฮฏฮตฯ‚ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ.

ฮšฮฌฯ„ฯ‰ ฮฑฯ€ฯŒ ฮผฮนฮฑ ฮตฮนฮบฯŒฮฝฮฑ ฮตฮฝฯŒฯ‚ ฯ€ฮปฮฑฮนฯƒฮฏฮฟฯ… ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ Panda:

Pandas DataFrame

ฮคฮน ฮตฮฏฮฝฮฑฮน ฮผฮนฮฑ ฮฃฮตฮนฯฮฌ;

ฮœฮนฮฑ ฯƒฮตฮนฯฮฌ ฮตฮฏฮฝฮฑฮน ฮผฮนฮฑ ฮผฮฟฮฝฮฟฮดฮนฮฌฯƒฯ„ฮฑฯ„ฮท ฮดฮฟฮผฮฎ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ. ฮœฯ€ฮฟฯฮตฮฏ ฮฝฮฑ ฮญฯ‡ฮตฮน ฮฟฯ€ฮฟฮนฮฑฮดฮฎฯ€ฮฟฯ„ฮต ฮดฮฟฮผฮฎ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ ฯŒฯ€ฯ‰ฯ‚ ฮฑฮบฮญฯฮฑฮนฮฟฯ‚, float ฮบฮฑฮน ฯƒฯ…ฮผฮฒฮฟฮปฮฟฯƒฮตฮนฯฮฌ. ฮ•ฮฏฮฝฮฑฮน ฯ‡ฯฮฎฯƒฮนฮผฮฟ ฯŒฯ„ฮฑฮฝ ฮธฮญฮปฮตฯ„ฮต ฮฝฮฑ ฮตฮบฯ„ฮตฮปฮญฯƒฮตฯ„ฮต ฯ…ฯ€ฮฟฮปฮฟฮณฮนฯƒฮผฮฟฯฯ‚ ฮฎ ฮฝฮฑ ฮตฯ€ฮนฯƒฯ„ฯฮญฯˆฮตฯ„ฮต ฮญฮฝฮฑฮฝ ฮผฮฟฮฝฮฟฮดฮนฮฌฯƒฯ„ฮฑฯ„ฮฟ ฯ€ฮฏฮฝฮฑฮบฮฑ. ฮœฮนฮฑ ฯƒฮตฮนฯฮฌ, ฮตฮพ ฮฟฯฮนฯƒฮผฮฟฯ, ฮดฮตฮฝ ฮผฯ€ฮฟฯฮตฮฏ ฮฝฮฑ ฮญฯ‡ฮตฮน ฯ€ฮฟฮปฮปฮญฯ‚ ฯƒฯ„ฮฎฮปฮตฯ‚. ฮ“ฮนฮฑ ฯ„ฮทฮฝ ฯ„ฮตฮปฮตฯ…ฯ„ฮฑฮฏฮฑ ฯ€ฮตฯฮฏฯ€ฯ„ฯ‰ฯƒฮท, ฯ‡ฯฮทฯƒฮนฮผฮฟฯ€ฮฟฮนฮฎฯƒฯ„ฮต ฯ„ฮท ฮดฮฟฮผฮฎ ฯ„ฮฟฯ… ฯ€ฮปฮฑฮนฯƒฮฏฮฟฯ… ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ.

Python ฮ— ฯƒฮตฮนฯฮฌ Pandas ฮญฯ‡ฮตฮน ฯ„ฮนฯ‚ ฮฑฮบฯŒฮปฮฟฯ…ฮธฮตฯ‚ ฯ€ฮฑฯฮฑฮผฮญฯ„ฯฮฟฯ…ฯ‚:

  • ฮ”ฮตฮดฮฟฮผฮญฮฝฮฑ: ฮผฯ€ฮฟฯฮตฮฏ ฮฝฮฑ ฮตฮฏฮฝฮฑฮน ฮปฮฏฯƒฯ„ฮฑ, ฮปฮตฮพฮนฮบฯŒ ฮฎ ฮฒฮฑฮธฮผฯ‰ฯ„ฮฎ ฯ„ฮนฮผฮฎ
pd.Series([1., 2., 3.])
0    1.0
1    2.0
2    3.0
dtype: float64

ฮœฯ€ฮฟฯฮตฮฏฯ„ฮต ฮฝฮฑ ฯ€ฯฮฟฯƒฮธฮญฯƒฮตฯ„ฮต ฯ„ฮฟ ฮตฯ…ฯฮตฯ„ฮฎฯฮนฮฟ ฮผฮต ฮตฯ…ฯฮตฯ„ฮฎฯฮนฮฟ. ฮ’ฮฟฮทฮธฮฌ ฮฝฮฑ ฮฟฮฝฮฟฮผฮฌฯƒฮฟฯ…ฮผฮต ฯ„ฮนฯ‚ ฯƒฮตฮนฯฮญฯ‚. ฮคฮฟ ฮผฮฎฮบฮฟฯ‚ ฯ€ฯฮญฯ€ฮตฮน ฮฝฮฑ ฮตฮฏฮฝฮฑฮน ฮฏฯƒฮฟ ฮผฮต ฯ„ฮฟ ฮผฮญฮณฮตฮธฮฟฯ‚ ฯ„ฮทฯ‚ ฯƒฯ„ฮฎฮปฮทฯ‚

pd.Series([1., 2., 3.], index=['a', 'b', 'c'])

ฮ ฮฑฯฮฑฮบฮฌฯ„ฯ‰, ฮดฮทฮผฮนฮฟฯ…ฯฮณฮตฮฏฯ„ฮต ฮผฮนฮฑ ฯƒฮตฮนฯฮฌ Pandas ฮผฮต ฮผฮนฮฑ ฯ„ฮนฮผฮฎ ฯ€ฮฟฯ… ฮปฮตฮฏฯ€ฮตฮน ฮณฮนฮฑ ฯ„ฮนฯ‚ ฯ„ฯฮฏฯ„ฮตฯ‚ ฯƒฮตฮนฯฮญฯ‚. ฮฃฮทฮผฮตฮฏฯ‰ฯƒฮท, ฮปฮตฮฏฯ€ฮฟฯ…ฮฝ ฯ„ฮนฮผฮญฯ‚ Python ฯƒฮทฮผฮตฮนฯŽฮฝฮฟฮฝฯ„ฮฑฮน ยซNaNยป. ฮœฯ€ฮฟฯฮตฮฏฯ„ฮต ฮฝฮฑ ฯ‡ฯฮทฯƒฮนฮผฮฟฯ€ฮฟฮนฮฎฯƒฮตฯ„ฮต ฯ„ฮฟ numpy ฮณฮนฮฑ ฮฝฮฑ ฮดฮทฮผฮนฮฟฯ…ฯฮณฮฎฯƒฮตฯ„ฮต ฯ„ฮตฯ‡ฮฝฮทฯ„ฮฌ ฯ„ฮทฮฝ ฯ„ฮนฮผฮฎ ฯ€ฮฟฯ… ฮปฮตฮฏฯ€ฮตฮน: np.nan

pd.Series([1,2,np.nan])

ฮ ฮฑฯฮฑฮณฯ‰ฮณฮฎ

0    1.0
1    2.0
2    NaN
dtype: float64

ฮ”ฮทฮผฮนฮฟฯ…ฯฮณฮฎฯƒฯ„ฮต Pandas DataFrame

ฮคฯŽฯฮฑ ฯƒฮต ฮฑฯ…ฯ„ฯŒ ฯ„ฮฟ ฯƒฮตฮผฮนฮฝฮฌฯฮนฮฟ Pandas DataFrame, ฮธฮฑ ฮผฮฌฮธฮฟฯ…ฮผฮต ฯ€ฯŽฯ‚ ฮฝฮฑ ฮดฮทฮผฮนฮฟฯ…ฯฮณฮฟฯฮผฮต Python ฮ ฮปฮฑฮฏฯƒฮนฮฟ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ Pandas:

ฮœฯ€ฮฟฯฮตฮฏฯ„ฮต ฮฝฮฑ ฮผฮตฯ„ฮฑฯ„ฯฮญฯˆฮตฯ„ฮต ฮญฮฝฮฑฮฝ ฯ€ฮฏฮฝฮฑฮบฮฑ numpy ฯƒฮต ฯ€ฮปฮฑฮฏฯƒฮนฮฟ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ pandas ฮผฮต ฯ„ฮฟ pd.Data frame(). ฮคฮฟ ฮฑฮฝฯ„ฮฏฮธฮตฯ„ฮฟ ฮตฮฏฮฝฮฑฮน ฮตฯ€ฮฏฯƒฮทฯ‚ ฯ€ฮนฮธฮฑฮฝฯŒ. ฮ“ฮนฮฑ ฮฝฮฑ ฮผฮตฯ„ฮฑฯ„ฯฮญฯˆฮตฯ„ฮต ฮญฮฝฮฑ Pandas Data Frame ฯƒฮต ฯ€ฮฏฮฝฮฑฮบฮฑ, ฮผฯ€ฮฟฯฮตฮฏฯ„ฮต ฮฝฮฑ ฯ‡ฯฮทฯƒฮนฮผฮฟฯ€ฮฟฮนฮฎฯƒฮตฯ„ฮต ฯ„ฮฟ np.array()

## Numpy to pandas
import numpy as np
h = [[1,2],[3,4]] 
df_h = pd.DataFrame(h)
print('Data Frame:', df_h)

## Pandas to numpy
df_h_n = np.array(df_h)
print('Numpy array:', df_h_n)
Data Frame:    0  1
0  1  2
1  3  4
Numpy array: [[1 2]
 [3 4]]

ฮœฯ€ฮฟฯฮตฮฏฯ„ฮต ฮตฯ€ฮฏฯƒฮทฯ‚ ฮฝฮฑ ฯ‡ฯฮทฯƒฮนฮผฮฟฯ€ฮฟฮนฮฎฯƒฮตฯ„ฮต ฮญฮฝฮฑ ฮปฮตฮพฮนฮบฯŒ ฮณฮนฮฑ ฮฝฮฑ ฮดฮทฮผฮนฮฟฯ…ฯฮณฮฎฯƒฮตฯ„ฮต ฮญฮฝฮฑ ฯ€ฮปฮฑฮฏฯƒฮนฮฟ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ Pandas.

dic = {'Name': ["John", "Smith"], 'Age': [30, 40]}
pd.DataFrame(data=dic)
ฮ—ฮปฮนฮบฮฏฮฑ ฮŒฮฝฮฟฮผฮฑ
0 30 ฮ“ฮนฮฌฮฝฮฝฮทฯ‚
1 40 ฮฃฮนฮดฮตฯฮฌฯ‚

ฮ”ฮตฮดฮฟฮผฮญฮฝฮฑ Pandas Range

ฮคฮฑ Panda ฮญฯ‡ฮฟฯ…ฮฝ ฮญฮฝฮฑ ฮฒฮฟฮปฮนฮบฯŒ API ฮณฮนฮฑ ฮฝฮฑ ฮดฮทฮผฮนฮฟฯ…ฯฮณฮฎฯƒฮฟฯ…ฮฝ ฮญฮฝฮฑ ฮตฯฯฮฟฯ‚ ฮทฮผฮตฯฮฟฮผฮทฮฝฮนฯŽฮฝ. ฮ‘ฯ‚ ฮผฮฌฮธฮฟฯ…ฮผฮต ฮผฮต Python ฮ ฮฑฯฮฑฮดฮตฮฏฮณฮผฮฑฯ„ฮฑ Panda:

pd.data_range(ฮทฮผฮตฯฮฟฮผฮทฮฝฮฏฮฑ, ฯ€ฮตฯฮฏฮฟฮดฮฟฯ‚, ฯƒฯ…ฯ‡ฮฝฯŒฯ„ฮทฯ„ฮฑ):

  • ฮ— ฯ€ฯฯŽฯ„ฮท ฯ€ฮฑฯฮฌฮผฮตฯ„ฯฮฟฯ‚ ฮตฮฏฮฝฮฑฮน ฮท ฮทฮผฮตฯฮฟฮผฮทฮฝฮฏฮฑ ฮญฮฝฮฑฯฮพฮทฯ‚
  • ฮ— ฮดฮตฯฯ„ฮตฯฮท ฯ€ฮฑฯฮฌฮผฮตฯ„ฯฮฟฯ‚ ฮตฮฏฮฝฮฑฮน ฮฟ ฮฑฯฮนฮธฮผฯŒฯ‚ ฯ„ฯ‰ฮฝ ฯ€ฮตฯฮนฯŒฮดฯ‰ฮฝ (ฯ€ฯฮฟฮฑฮนฯฮตฯ„ฮนฮบฯŒ ฮตฮฌฮฝ ฮญฯ‡ฮตฮน ฮบฮฑฮธฮฟฯฮนฯƒฯ„ฮตฮฏ ฮท ฮทฮผฮตฯฮฟฮผฮทฮฝฮฏฮฑ ฮปฮฎฮพฮทฯ‚)
  • ฮ— ฯ„ฮตฮปฮตฯ…ฯ„ฮฑฮฏฮฑ ฯ€ฮฑฯฮฌฮผฮตฯ„ฯฮฟฯ‚ ฮตฮฏฮฝฮฑฮน ฮท ฯƒฯ…ฯ‡ฮฝฯŒฯ„ฮทฯ„ฮฑ: ฮทฮผฮญฯฮฑ: 'D', ฮผฮฎฮฝฮฑฯ‚: 'M' ฮบฮฑฮน ฮญฯ„ฮฟฯ‚: 'Y'.
## Create date
# Days
dates_d = pd.date_range('20300101', periods=6, freq='D')
print('Day:', dates_d)

ฮ ฮฑฯฮฑฮณฯ‰ฮณฮฎ

Day: DatetimeIndex(['2030-01-01', '2030-01-02', '2030-01-03', '2030-01-04', '2030-01-05', '2030-01-06'], dtype='datetime64[ns]', freq='D')
# Months
dates_m = pd.date_range('20300101', periods=6, freq='M')
print('Month:', dates_m)

ฮ ฮฑฯฮฑฮณฯ‰ฮณฮฎ

Month: DatetimeIndex(['2030-01-31', '2030-02-28', '2030-03-31', '2030-04-30','2030-05-31', '2030-06-30'], dtype='datetime64[ns]', freq='M')

ฮ•ฯ€ฮนฮธฮตฯŽฯฮทฯƒฮท ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ

ฮœฯ€ฮฟฯฮตฮฏฯ„ฮต ฮฝฮฑ ฮตฮปฮญฮณฮพฮตฯ„ฮต ฯ„ฮทฮฝ ฮบฮตฯ†ฮฑฮปฮฎ ฮฎ ฯ„ฮทฮฝ ฮฟฯ…ฯฮฌ ฯ„ฮฟฯ… ฯƒฯ…ฮฝฯŒฮปฮฟฯ… ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ ฮผฮต head(), ฮฎ tail() ฯ€ฯฮนฮฝ ฮฑฯ€ฯŒ ฯ„ฮฟ ฯŒฮฝฮฟฮผฮฑ ฯ„ฮฟฯ… ฯ€ฮปฮฑฮนฯƒฮฏฮฟฯ… ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ ฯ„ฮฟฯ… panda, ฯŒฯ€ฯ‰ฯ‚ ฯ†ฮฑฮฏฮฝฮตฯ„ฮฑฮน ฯƒฯ„ฮฟ ฯ€ฮฑฯฮฑฮบฮฌฯ„ฯ‰ ฯ€ฮฑฯฮฌฮดฮตฮนฮณฮผฮฑ Panda:

ฮ’ฮฎฮผฮฑ 1) ฮ”ฮทฮผฮนฮฟฯ…ฯฮณฮฎฯƒฯ„ฮต ฮผฮนฮฑ ฯ„ฯ…ฯ‡ฮฑฮฏฮฑ ฮฑฮบฮฟฮปฮฟฯ…ฮธฮฏฮฑ ฮผฮต ฯ€ฮฟฮปฮปฮฟฮฏ. ฮ— ฮฑฮบฮฟฮปฮฟฯ…ฮธฮฏฮฑ ฮญฯ‡ฮตฮน 4 ฯƒฯ„ฮฎฮปฮตฯ‚ ฮบฮฑฮน 6 ฯƒฮตฮนฯฮญฯ‚

random = np.random.randn(6,4)

ฮ’ฮฎฮผฮฑ 2) ฮฃฯ„ฮท ฯƒฯ…ฮฝฮญฯ‡ฮตฮนฮฑ, ฮดฮทฮผฮนฮฟฯ…ฯฮณฮตฮฏฯ„ฮต ฮญฮฝฮฑ ฯ€ฮปฮฑฮฏฯƒฮนฮฟ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ ฯ‡ฯฮทฯƒฮนฮผฮฟฯ€ฮฟฮนฯŽฮฝฯ„ฮฑฯ‚ panda.

ฮงฯฮทฯƒฮนฮผฮฟฯ€ฮฟฮนฮฎฯƒฯ„ฮต dates_m ฯ‰ฯ‚ ฮตฯ…ฯฮตฯ„ฮฎฯฮนฮฟ ฮณฮนฮฑ ฯ„ฮฟ ฯ€ฮปฮฑฮฏฯƒฮนฮฟ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ. ฮฃฮทฮผฮฑฮฏฮฝฮตฮน ฯŒฯ„ฮน ฯƒฮต ฮบฮฌฮธฮต ฯƒฮตฮนฯฮฌ ฮธฮฑ ฮดฮฟฮธฮตฮฏ ฮญฮฝฮฑ ยซฯŒฮฝฮฟฮผฮฑยป ฮฎ ฮญฮฝฮฑ ฮตฯ…ฯฮตฯ„ฮฎฯฮนฮฟ, ฯ€ฮฟฯ… ฮฑฮฝฯ„ฮนฯƒฯ„ฮฟฮนฯ‡ฮตฮฏ ฯƒฮต ฮผฮนฮฑ ฮทฮผฮตฯฮฟฮผฮทฮฝฮฏฮฑ.

ฮคฮญฮปฮฟฯ‚, ฮดฮฏฮฝฮตฯ„ฮต ฮญฮฝฮฑ ฯŒฮฝฮฟฮผฮฑ ฯƒฯ„ฮนฯ‚ 4 ฯƒฯ„ฮฎฮปฮตฯ‚ ฮผฮต ฯ„ฮนฯ‚ ฯƒฯ„ฮฎฮปฮตฯ‚ ฮฟฯฮนฯƒฮผฮฌฯ„ฯ‰ฮฝ

# Create data with date
df = pd.DataFrame(random,
                  index=dates_m,
                  columns=list('ABCD'))

ฮ’ฮฎฮผฮฑ 3) ฮงฯฮฎฯƒฮท ฯ„ฮทฯ‚ ฮปฮตฮนฯ„ฮฟฯ…ฯฮณฮฏฮฑฯ‚ ฮบฮตฯ†ฮฑฮปฮฎฯ‚

df.head(3)
A B C D
2030-01-31 1.139433 1.318510 -0.181334 1.615822
2030-02-28 -0.081995 -0.063582 0.857751 -0.527374
2030-03-31 -0.519179 0.080984 -1.454334 1.314947

ฮ’ฮฎฮผฮฑ 4) ฮงฯฮฎฯƒฮท ฯ„ฮทฯ‚ ฮปฮตฮนฯ„ฮฟฯ…ฯฮณฮฏฮฑฯ‚ ฮฟฯ…ฯฮฌฯ‚

df.tail(3)
A B C D
2030-04-30 -0.685448 -0.011736 0.622172 0.104993
2030-05-31 -0.935888 -0.731787 -0.558729 0.768774
2030-06-30 1.096981 0.949180 -0.196901 -0.471556

ฮ’ฮฎฮผฮฑ 5) ฮœฮนฮฑ ฮตฮพฮฑฮนฯฮตฯ„ฮนฮบฮฎ ฯ€ฯฮฑฮบฯ„ฮนฮบฮฎ ฮณฮนฮฑ ฮฝฮฑ ฯ€ฮฌฯฮตฯ„ฮต ฮผฮนฮฑ ฮนฮดฮญฮฑ ฯƒฯ‡ฮตฯ„ฮนฮบฮฌ ฮผฮต ฯ„ฮฑ ฮดฮตฮดฮฟฮผฮญฮฝฮฑ ฮตฮฏฮฝฮฑฮน ฮฝฮฑ ฯ‡ฯฮทฯƒฮนฮผฮฟฯ€ฮฟฮนฮฎฯƒฮตฯ„ฮต ฯ„ฮฟ describe(). ฮ ฮฑฯฮญฯ‡ฮตฮน ฯ„ฮฟ ฯ€ฮปฮฎฮธฮฟฯ‚, ฯ„ฮฟ ฮผฮญฯƒฮฟ ฯŒฯฮฟ, ฯ„ฮฟ std, ฯ„ฮฟ min, ฯ„ฮฟ max ฮบฮฑฮน ฯ„ฮฟ ฮตฮบฮฑฯ„ฮฟฯƒฯ„ฮทฮผฯŒฯฮนฮฟ ฯ„ฮฟฯ… ฯƒฯ…ฮฝฯŒฮปฮฟฯ… ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ.

df.describe()
A B C D
ฮผฮตฯ„ฯฮฌฮฝฮต 6.000000 6.000000 6.000000 6.000000
ฮตฮฝฮฝฮฟฯŽ 0.002317 0.256928 -0.151896 0.467601
std 0.908145 0.746939 0.834664 0.908910
ฯ€ฯฮฑฮบฯ„ฮนฮบฮฌ -0.935888 -0.731787 -1.454334 -0.527374
25% -0.643880 -0.050621 -0.468272 -0.327419
50% -0.300587 0.034624 -0.189118 0.436883
75% 0.802237 0.732131 0.421296 1.178404
max 1.139433 1.318510 0.857751 1.615822

Slice Data

ฮคฮฟ ฯ„ฮตฮปฮตฯ…ฯ„ฮฑฮฏฮฟ ฯƒฮทฮผฮตฮฏฮฟ ฮฑฯ…ฯ„ฮฟฯ Python ฮคฮฟ ฯƒฮตฮผฮนฮฝฮฌฯฮนฮฟ Pandas ฮฑฯ†ฮฟฯฮฌ ฯ„ฮฟฮฝ ฯ„ฯฯŒฯ€ฮฟ ฮบฮฟฯ€ฮฎฯ‚ ฮตฮฝฯŒฯ‚ ฯ€ฮปฮฑฮนฯƒฮฏฮฟฯ… ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ pandas.

ฮœฯ€ฮฟฯฮตฮฏฯ„ฮต ฮฝฮฑ ฯ‡ฯฮทฯƒฮนฮผฮฟฯ€ฮฟฮนฮฎฯƒฮตฯ„ฮต ฯ„ฮฟ ฯŒฮฝฮฟฮผฮฑ ฯ„ฮทฯ‚ ฯƒฯ„ฮฎฮปฮทฯ‚ ฮณฮนฮฑ ฮฝฮฑ ฮตฮพฮฑฮณฮฌฮณฮตฯ„ฮต ฮดฮตฮดฮฟฮผฮญฮฝฮฑ ฯƒฮต ฮผฮนฮฑ ฯƒฯ…ฮณฮบฮตฮบฯฮนฮผฮญฮฝฮท ฯƒฯ„ฮฎฮปฮท ฯŒฯ€ฯ‰ฯ‚ ฯ†ฮฑฮฏฮฝฮตฯ„ฮฑฮน ฯƒฯ„ฮฟ ฯ€ฮฑฯฮฑฮบฮฌฯ„ฯ‰ ฯ€ฮฑฯฮฌฮดฮตฮนฮณฮผฮฑ Panda:

## Slice
### Using name
df['A']

2030-01-31   -0.168655
2030-02-28    0.689585
2030-03-31    0.767534
2030-04-30    0.557299
2030-05-31   -1.547836
2030-06-30    0.511551
Freq: M, Name: A, dtype: float64

ฮ“ฮนฮฑ ฮฝฮฑ ฮตฯ€ฮนฮปฮญฮพฮตฯ„ฮต ฯ€ฮฟฮปฮปฮญฯ‚ ฯƒฯ„ฮฎฮปฮตฯ‚, ฯ€ฯฮญฯ€ฮตฮน ฮฝฮฑ ฯ‡ฯฮทฯƒฮนฮผฮฟฯ€ฮฟฮนฮฎฯƒฮตฯ„ฮต ฮดฯฮฟ ฯ†ฮฟฯฮญฯ‚ ฯ„ฮทฮฝ ฮฑฮณฮบฯฮปฮท, [[..,..]]

ฮคฮฟ ฯ€ฯฯŽฯ„ฮฟ ฮถฮตฯฮณฮฟฯ‚ ฮฑฮณฮบฯฮปฮทฯ‚ ฯƒฮทฮผฮฑฮฏฮฝฮตฮน ฯŒฯ„ฮน ฮธฮญฮปฮตฯ„ฮต ฮฝฮฑ ฮตฯ€ฮนฮปฮญฮพฮตฯ„ฮต ฯƒฯ„ฮฎฮปฮตฯ‚, ฯ„ฮฟ ฮดฮตฯฯ„ฮตฯฮฟ ฮถฮตฯ…ฮณฮฌฯฮนฮฑ ฮฑฮณฮบฯฮปฯ‰ฮฝ ฮปฮญฮตฮน ฯ€ฮฟฮนฮตฯ‚ ฯƒฯ„ฮฎฮปฮตฯ‚ ฮธฮญฮปฮตฯ„ฮต ฮฝฮฑ ฮตฯ€ฮนฯƒฯ„ฯฮญฯˆฮตฯ„ฮต.

df[['A', 'B']].
A B
2030-01-31 -0.168655 0.587590
2030-02-28 0.689585 0.998266
2030-03-31 0.767534 -0.940617
2030-04-30 0.557299 0.507350
2030-05-31 -1.547836 1.276558
2030-06-30 0.511551 1.572085

ฮœฯ€ฮฟฯฮตฮฏฯ„ฮต ฮฝฮฑ ฮบฯŒฯˆฮตฯ„ฮต ฯ„ฮนฯ‚ ฯƒฮตฮนฯฮญฯ‚ ฮผฮต:

ฮŸ ฯ€ฮฑฯฮฑฮบฮฌฯ„ฯ‰ ฮบฯŽฮดฮนฮบฮฑฯ‚ ฮตฯ€ฮนฯƒฯ„ฯฮญฯ†ฮตฮน ฯ„ฮนฯ‚ ฯ„ฯฮตฮนฯ‚ ฯ€ฯฯŽฯ„ฮตฯ‚ ฯƒฮตฮนฯฮญฯ‚

### using a slice for row
df[0:3]
A B C D
2030-01-31 -0.168655 0.587590 0.572301 -0.031827
2030-02-28 0.689585 0.998266 1.164690 0.475975
2030-03-31 0.767534 -0.940617 0.227255 -0.341532

ฮ— ฯƒฯ…ฮฝฮฌฯฯ„ฮทฯƒฮท loc ฯ‡ฯฮทฯƒฮนฮผฮฟฯ€ฮฟฮนฮตฮฏฯ„ฮฑฮน ฮณฮนฮฑ ฯ„ฮทฮฝ ฮตฯ€ฮนฮปฮฟฮณฮฎ ฯƒฯ„ฮทฮปฯŽฮฝ ฮผฮต ฮฟฮฝฯŒฮผฮฑฯ„ฮฑ. ฮฉฯ‚ ฯƒฯ…ฮฝฮฎฮธฯ‰ฯ‚, ฮฟฮน ฯ„ฮนฮผฮญฯ‚ ฯ€ฯฮนฮฝ ฮฑฯ€ฯŒ ฯ„ฮฟ ฮบฯŽฮผฮฑ ฮฑฮฝฯ„ฮนฯ€ฯฮฟฯƒฯ‰ฯ€ฮตฯฮฟฯ…ฮฝ ฯ„ฮนฯ‚ ฯƒฮตฮนฯฮญฯ‚ ฮบฮฑฮน ฮผฮตฯ„ฮฌ ฮฑฮฝฮฑฯ†ฮญฯฮฟฮฝฯ„ฮฑฮน ฯƒฯ„ฮท ฯƒฯ„ฮฎฮปฮท. ฮ ฯฮญฯ€ฮตฮน ฮฝฮฑ ฯ‡ฯฮทฯƒฮนฮผฮฟฯ€ฮฟฮนฮฎฯƒฮตฯ„ฮต ฯ„ฮนฯ‚ ฮฑฮณฮบฯฮปฮตฯ‚ ฮณฮนฮฑ ฮฝฮฑ ฮตฯ€ฮนฮปฮญฮพฮตฯ„ฮต ฯ€ฮตฯฮนฯƒฯƒฯŒฯ„ฮตฯฮตฯ‚ ฮฑฯ€ฯŒ ฮผฮฏฮฑ ฯƒฯ„ฮฎฮปฮตฯ‚.

## Multi col
df.loc[:,['A','B']]
A B
2030-01-31 -0.168655 0.587590
2030-02-28 0.689585 0.998266
2030-03-31 0.767534 -0.940617
2030-04-30 0.557299 0.507350
2030-05-31 -1.547836 1.276558
2030-06-30 0.511551 1.572085

ฮฅฯ€ฮฌฯฯ‡ฮตฮน ฮผฮนฮฑ ฮฌฮปฮปฮท ฮผฮญฮธฮฟฮดฮฟฯ‚ ฮณฮนฮฑ ฮฝฮฑ ฮตฯ€ฮนฮปฮญฮพฮตฯ„ฮต ฯ€ฮฟฮปฮปฮญฯ‚ ฯƒฮตฮนฯฮญฯ‚ ฮบฮฑฮน ฯƒฯ„ฮฎฮปฮตฯ‚ ฯƒฯ„ฮฑ Panda. ฮœฯ€ฮฟฯฮตฮฏฯ„ฮต ฮฝฮฑ ฯ‡ฯฮทฯƒฮนฮผฮฟฯ€ฮฟฮนฮฎฯƒฮตฯ„ฮต ฯ„ฮฟ iloc[]. ฮ‘ฯ…ฯ„ฮฎ ฮท ฮผฮญฮธฮฟฮดฮฟฯ‚ ฯ‡ฯฮทฯƒฮนฮผฮฟฯ€ฮฟฮนฮตฮฏ ฯ„ฮฟ ฮตฯ…ฯฮตฯ„ฮฎฯฮนฮฟ ฮฑฮฝฯ„ฮฏ ฮณฮนฮฑ ฯ„ฮฟ ฯŒฮฝฮฟฮผฮฑ ฯ„ฯ‰ฮฝ ฯƒฯ„ฮทฮปฯŽฮฝ. ฮŸ ฯ€ฮฑฯฮฑฮบฮฌฯ„ฯ‰ ฮบฯŽฮดฮนฮบฮฑฯ‚ ฮตฯ€ฮนฯƒฯ„ฯฮญฯ†ฮตฮน ฯ„ฮฟ ฮฏฮดฮนฮฟ ฯ€ฮปฮฑฮฏฯƒฮนฮฟ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ ฯŒฯ€ฯ‰ฯ‚ ฯ€ฮฑฯฮฑฯ€ฮฌฮฝฯ‰

df.iloc[:, :2]
A B
2030-01-31 -0.168655 0.587590
2030-02-28 0.689585 0.998266
2030-03-31 0.767534 -0.940617
2030-04-30 0.557299 0.507350
2030-05-31 -1.547836 1.276558
2030-06-30 0.511551 1.572085

ฮกฮฏฮพฯ„ฮต ฮผฮนฮฑ ฯƒฯ„ฮฎฮปฮท

ฮœฯ€ฮฟฯฮตฮฏฯ„ฮต ฮฝฮฑ ฮฑฯ€ฮฟฮธฮญฯƒฮตฯ„ฮต ฯƒฯ„ฮฎฮปฮตฯ‚ ฯ‡ฯฮทฯƒฮนฮผฮฟฯ€ฮฟฮนฯŽฮฝฯ„ฮฑฯ‚ ฯ„ฮฟ pd.drop()

df.drop(columns=['A', 'C'])
B D
2030-01-31 0.587590 -0.031827
2030-02-28 0.998266 0.475975
2030-03-31 -0.940617 -0.341532
2030-04-30 0.507350 -0.296035
2030-05-31 1.276558 0.523017
2030-06-30 1.572085 -0.594772

ฮ‘ฮปฮทฮปฮฟฯ…ฯ‡ฮฏฮฑ

ฮœฯ€ฮฟฯฮตฮฏฯ„ฮต ฮฝฮฑ ฯƒฯ…ฮฝฮดฮญฯƒฮตฯ„ฮต ฮดฯฮฟ DataFrame ฯƒฯ„ฮฑ Pandas. ฮœฯ€ฮฟฯฮตฮฏฯ„ฮต ฮฝฮฑ ฯ‡ฯฮทฯƒฮนฮผฮฟฯ€ฮฟฮนฮฎฯƒฮตฯ„ฮต ฯ„ฮฟ pd.concat()

ฮ ฯฯŽฯ„ฮฑ ฮฑฯ€ 'ฯŒฮปฮฑ, ฯ€ฯฮญฯ€ฮตฮน ฮฝฮฑ ฮดฮทฮผฮนฮฟฯ…ฯฮณฮฎฯƒฮตฯ„ฮต ฮดฯฮฟ DataFrames. ฮœฮญฯ‡ฯฮน ฯƒฯ„ฮนฮณฮผฮฎฯ‚ ฯŒฮปฮฑ ฮบฮฑฮปฮฌ, ฮตฮฏฯƒฯ„ฮต ฮฎฮดฮท ฮตฮพฮฟฮนฮบฮตฮนฯ‰ฮผฮญฮฝฮฟฮน ฮผฮต ฯ„ฮท ฮดฮทฮผฮนฮฟฯ…ฯฮณฮฏฮฑ ฯ€ฮปฮฑฮนฯƒฮฏฯ‰ฮฝ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ

import numpy as np
df1 = pd.DataFrame({'name': ['John', 'Smith','Paul'],
                     'Age': ['25', '30', '50']},
                    index=[0, 1, 2])
df2 = pd.DataFrame({'name': ['Adam', 'Smith' ],
                     'Age': ['26', '11']},
                    index=[3, 4])  

ฮคฮญฮปฮฟฯ‚, ฯƒฯ…ฮฝฮตฮฝฯŽฮฝฮตฯ„ฮต ฯ„ฮฑ ฮดฯฮฟ DataFrame

df_concat = pd.concat([df1,df2]) 
df_concat
ฮ—ฮปฮนฮบฮฏฮฑ ฯŒฮฝฮฟฮผฮฑ
0 25 ฮ“ฮนฮฌฮฝฮฝฮทฯ‚
1 30 ฮฃฮนฮดฮตฯฮฌฯ‚
2 50 ฮ ฮฑฯฮปฮฟฯ‚
3 26 ฮ‘ฮดฮฌฮผ
4 11 ฮฃฮนฮดฮตฯฮฌฯ‚

Drop_duplicates

ฮ•ฮฌฮฝ ฮญฮฝฮฑ ฯƒฯฮฝฮฟฮปฮฟ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ ฮผฯ€ฮฟฯฮตฮฏ ฮฝฮฑ ฯ€ฮตฯฮนฮญฯ‡ฮตฮน ฮดฮนฯ€ฮปฯŒฯ„ฯ…ฯ€ฮท ฯ‡ฯฮฎฯƒฮท ฯ€ฮปฮทฯฮฟฯ†ฮฟฯฮนฯŽฮฝ, ฯ„ฮฟ ยซdrop_duplicatesยป ฮตฮฏฮฝฮฑฮน ฮญฮฝฮฑฯ‚ ฮตฯฮบฮฟฮปฮฟฯ‚ ฮฑฯ€ฮฟฮบฮปฮตฮนฯƒฮผฯŒฯ‚ ฮดฮนฯ€ฮปฯŽฮฝ ฯƒฮตฮนฯฯŽฮฝ. ฮœฯ€ฮฟฯฮตฮฏฯ„ฮต ฮฝฮฑ ฮดฮตฮฏฯ„ฮต ฯŒฯ„ฮน ฯ„ฮฟ "df_concat" ฮญฯ‡ฮตฮน ฮผฮนฮฑ ฮดฮนฯ€ฮปฮฎ ฯ€ฮฑฯฮฑฯ„ฮฎฯฮทฯƒฮท, ฯ„ฮฟ "Smith" ฮตฮผฯ†ฮฑฮฝฮฏฮถฮตฯ„ฮฑฮน ฮดฯฮฟ ฯ†ฮฟฯฮญฯ‚ ฯƒฯ„ฮท ฯƒฯ„ฮฎฮปฮท "ฯŒฮฝฮฟฮผฮฑ".

df_concat.drop_duplicates('name')
ฮ—ฮปฮนฮบฮฏฮฑ ฯŒฮฝฮฟฮผฮฑ
0 25 ฮ“ฮนฮฌฮฝฮฝฮทฯ‚
1 30 ฮฃฮนฮดฮตฯฮฌฯ‚
2 50 ฮ ฮฑฯฮปฮฟฯ‚
3 26 ฮ‘ฮดฮฌฮผ

ฮคฮฑฮพฮนฮฝฯŒฮผฮทฯƒฮท ฯ„ฮนฮผฯŽฮฝ

ฮœฯ€ฮฟฯฮตฮฏฯ„ฮต ฮฝฮฑ ฯ„ฮฑฮพฮนฮฝฮฟฮผฮฎฯƒฮตฯ„ฮต ฯ„ฮทฮฝ ฯ„ฮนฮผฮฎ ฮผฮต sort_values

df_concat.sort_values('Age')
ฮ—ฮปฮนฮบฮฏฮฑ ฯŒฮฝฮฟฮผฮฑ
4 11 ฮฃฮนฮดฮตฯฮฌฯ‚
0 25 ฮ“ฮนฮฌฮฝฮฝฮทฯ‚
3 26 ฮ‘ฮดฮฌฮผ
1 30 ฮฃฮนฮดฮตฯฮฌฯ‚
2 50 ฮ ฮฑฯฮปฮฟฯ‚

ฮœฮตฯ„ฮฟฮฝฮฟฮผฮฑฯƒฮฏฮฑ: ฮฑฮปฮปฮฑฮณฮฎ ฮตฯ…ฯฮตฯ„ฮทฯฮฏฮฟฯ…

ฮœฯ€ฮฟฯฮตฮฏฯ„ฮต ฮฝฮฑ ฯ‡ฯฮทฯƒฮนฮผฮฟฯ€ฮฟฮนฮฎฯƒฮตฯ„ฮต ฯ„ฮท ฮผฮตฯ„ฮฟฮฝฮฟฮผฮฑฯƒฮฏฮฑ ฮณฮนฮฑ ฮฝฮฑ ฮผฮตฯ„ฮฟฮฝฮฟฮผฮฌฯƒฮตฯ„ฮต ฮผฮนฮฑ ฯƒฯ„ฮฎฮปฮท ฯƒฯ„ฮฟ Pandas. ฮ— ฯ€ฯฯŽฯ„ฮท ฯ„ฮนฮผฮฎ ฮตฮฏฮฝฮฑฮน ฯ„ฮฟ ฯŒฮฝฮฟฮผฮฑ ฯ„ฮทฯ‚ ฯ„ฯฮญฯ‡ฮฟฯ…ฯƒฮฑฯ‚ ฯƒฯ„ฮฎฮปฮทฯ‚ ฮบฮฑฮน ฮท ฮดฮตฯฯ„ฮตฯฮท ฯ„ฮนฮผฮฎ ฮตฮฏฮฝฮฑฮน ฯ„ฮฟ ฯŒฮฝฮฟฮผฮฑ ฯ„ฮทฯ‚ ฮฝฮญฮฑฯ‚ ฯƒฯ„ฮฎฮปฮทฯ‚.

df_concat.rename(columns={"name": "Surname", "Age": "Age_ppl"})
Age_ppl ฮ•ฯ€ฯŽฮฝฯ…ฮผฮฟ
0 25 ฮ“ฮนฮฌฮฝฮฝฮทฯ‚
1 30 ฮฃฮนฮดฮตฯฮฌฯ‚
2 50 ฮ ฮฑฯฮปฮฟฯ‚
3 26 ฮ‘ฮดฮฌฮผ
4 11 ฮฃฮนฮดฮตฯฮฌฯ‚

ฮ ฮตฯฮฏฮปฮทฯˆฮท

ฮ ฮฑฯฮฑฮบฮฌฯ„ฯ‰ ฮตฮฏฮฝฮฑฮน ฮผฮนฮฑ ฯƒฯฮฝฮฟฯˆฮท ฯ„ฮทฯ‚ ฯ€ฮนฮฟ ฯ‡ฯฮฎฯƒฮนฮผฮทฯ‚ ฮผฮตฮธฯŒฮดฮฟฯ… ฮณฮนฮฑ ฯ„ฮทฮฝ ฮตฯ€ฮนฯƒฯ„ฮฎฮผฮท ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ ฮผฮต ฯ„ฮฑ Panda

ฮตฮนฯƒฮฑฮณฯ‰ฮณฮฎ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ read_csv
ฮดฮทฮผฮนฮฟฯ…ฯฮณฮฏฮฑ ฯƒฮตฮนฯฯŽฮฝ ฮฃฮตฮนฯฮญฯ‚
ฮ”ฮทฮผฮนฮฟฯ…ฯฮณฮฏฮฑ Dataframe ฮ ฮปฮฑฮฏฯƒฮนฮฟ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ
ฮ”ฮทฮผฮนฮฟฯ…ฯฮณฮฏฮฑ ฮตฯฯฮฟฯ…ฯ‚ ฮทฮผฮตฯฮฟฮผฮทฮฝฮนฯŽฮฝ DATE_RANGE
ฮบฮตฯ†ฮฑฮปฮฎ ฮตฯ€ฮนฯƒฯ„ฯฮฟฯ†ฮฎฯ‚ ฮบฮตฯ†ฮฌฮปฮน
ฮฟฯ…ฯฮฌ ฮตฯ€ฮนฯƒฯ„ฯฮฟฯ†ฮฎฯ‚ ฮฟฯ…ฯฮฌ
ฮ ฮตฯฮนฮณฯฮฌฯ†ฯ‰ ฯ€ฮตฯฮนฮณฯฮฌฯ†ฮฟฯ…ฮฝ
ฯ†ฮญฯ„ฮฑ ฯ‡ฯฮทฯƒฮนฮผฮฟฯ€ฮฟฮนฯŽฮฝฯ„ฮฑฯ‚ ฯ„ฮฟ ฯŒฮฝฮฟฮผฮฑ ฯŒฮฝฮฟฮผฮฑ ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ['ฯŒฮฝฮฟฮผฮฑ ฯƒฯ„ฮฎฮปฮทฯ‚']
ฮšฯŒฯˆฯ„ฮต ฯƒฮต ฯ†ฮญฯ„ฮตฯ‚ ฯ‡ฯฮทฯƒฮนฮผฮฟฯ€ฮฟฮนฯŽฮฝฯ„ฮฑฯ‚ ฯƒฮตฮนฯฮญฯ‚ ฯŒฮฝฮฟฮผฮฑ_ฮดฮตฮดฮฟฮผฮญฮฝฯ‰ฮฝ[0:5]

ฮฃฯ…ฮฝฮฟฯˆฮฏฯƒฯ„ฮต ฮฑฯ…ฯ„ฮฎฮฝ ฯ„ฮทฮฝ ฮฑฮฝฮฌฯฯ„ฮทฯƒฮท ฮผฮต: