Pandas — это библиотека для анализа и манипулирования табличных данных, которая обеспечивает удобный и быстрый способ работы с данными, которые могут быть представлены в виде таблицы, такой как CSV-файлы, SQL-таблицы или данные, полученные из API.
Вот несколько основных команд в Pandas для аналитика данных:
import pandas as pd
df = pd.read_csv('file.csv')
df.head()
df.tail()
df.info()
df.describe()
df.loc[row_indexer, column_indexer] # выборка по меткам
df.iloc[row_indexer, column_indexer] # выборка по позициям
df[df['column'] > value]
df.groupby('column').mean()
df.sort_values('column', ascending=False)
pd.concat([df1, df2], axis=1)
Это только некоторые команды из многих, доступных в Pandas. Pandas обеспечивает мощный и гибкий способ манипулирования данными, который может быть адаптирован к различным сценариям анализа данных.