Библиотека Pandas

Pandas — это библиотека для анализа и манипулирования табличных данных, которая обеспечивает удобный и быстрый способ работы с данными, которые могут быть представлены в виде таблицы, такой как CSV-файлы, SQL-таблицы или данные, полученные из API.

Вот несколько основных команд в Pandas для аналитика данных:

Загрузка данных:

import pandas as pd

df = pd.read_csv('file.csv')

Просмотр первых нескольких строк:

df.head()

Просмотр последних нескольких строк:

df.tail()

Получение информации о данных:

df.info()

Получение основных статистических характеристик данных:

df.describe()

Выборка данных:

df.loc[row_indexer, column_indexer] # выборка по меткам

df.iloc[row_indexer, column_indexer] # выборка по позициям

Фильтрация данных:

df[df['column'] > value]

Группировка данных:

df.groupby('column').mean()

Сортировка данных:

df.sort_values('column', ascending=False)

Объединение данных:

pd.concat([df1, df2], axis=1)

Это только некоторые команды из многих, доступных в Pandas. Pandas обеспечивает мощный и гибкий способ манипулирования данными, который может быть адаптирован к различным сценариям анализа данных.