Квартили в аналитике данных

В аналитике данных квартили используются для измерения разброса данных в наборе значений. Квартили делят распределение на четыре равные части, каждая из которых содержит определенную долю данных. Вот виды квартилей и примеры их использования в аналитике данных:

  1. Первый квартиль (Q1) или нижний квартиль: это значение, которое разделяет самые маленькие 25% значений от остальных 75%. Например, если у вас есть 20 чисел, Q1 будет значение, которое разделяет наименьшие 5 чисел от остальных 15.
  2. Второй квартиль (Q2) или медиана: это значение, которое разделяет распределение на две равные части, то есть 50% значений находятся ниже медианы, а 50% — выше. Например, если у вас есть 20 чисел, медиана будет средним значением двух средних чисел.
  3. Третий квартиль (Q3) или верхний квартиль: это значение, которое разделяет самые большие 25% значений от остальных 75%. Например, если у вас есть 20 чисел, Q3 будет значением, которое разделяет 5 наибольших чисел от остальных 15.

Квартили могут использоваться в аналитике данных для измерения разброса данных в наборе значений, а также для выявления выбросов и определения границ выборки для более детального анализа данных.


import numpy as np

# Создаем массив данных для примера
data = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])

# Вычисляем квартили
q1 = np.percentile(data, 25)
q2 = np.percentile(data, 50)
q3 = np.percentile(data, 75)

# Выводим результаты
print("Q1: ", q1)
print("Q2: ", q2)
print("Q3: ", q3)

Теги: