Библиотека Pandas

Pandas — это библиотека для анализа и манипулирования табличных данных, которая обеспечивает удобный и быстрый способ работы с данными, которые могут быть представлены в виде таблицы, такой как CSV-файлы, SQL-таблицы или данные, полученные из API.

Вот несколько основных команд в Pandas для аналитика данных:

  1. Загрузка данных:
import pandas as pd
df = pd.read_csv('file.csv')
  1. Просмотр первых нескольких строк:
df.head()
  1. Просмотр последних нескольких строк:
df.tail()
  1. Получение информации о данных:
df.info()
  1. Получение основных статистических характеристик данных:
df.describe()
  1. Выборка данных:
df.loc[row_indexer, column_indexer] # выборка по меткам
df.iloc[row_indexer, column_indexer] # выборка по позициям
  1. Фильтрация данных:
df[df['column'] > value]
  1. Группировка данных:
df.groupby('column').mean()
  1. Сортировка данных:
df.sort_values('column', ascending=False)
  1. Объединение данных:
pd.concat([df1, df2], axis=1)

Это только некоторые команды из многих, доступных в Pandas. Pandas обеспечивает мощный и гибкий способ манипулирования данными, который может быть адаптирован к различным сценариям анализа данных.

Теги: