Гистограмма (Histogram) — это графическое представление распределения частоты значений числовой переменной. Она состоит из столбцов, расположенных на числовой оси, где каждый столбец представляет собой интервал значений, называемый интервалом классов, а высота столбца отображает количество значений переменной, попавших в этот интервал.
Гистограммы могут использоваться для визуализации различных статистических параметров распределения, таких как среднее значение, медиана, мода, дисперсия и стандартное отклонение. Они могут помочь исследователям понять форму распределения данных, такую как нормальное распределение, скошенное распределение, мультимодальное распределение и т.д.
Гистограммы также могут быть использованы для сравнения двух или более распределений. В этом случае каждое распределение может быть представлено разным цветом или шаблоном, чтобы облегчить сравнение. Например, гистограммы могут использоваться для сравнения распределения доходов мужчин и женщин в определенном регионе, чтобы выявить различия между этими распределениями.
import matplotlib.pyplot as plt
# Создание списка данных
data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5]
# Определение диапазона значений и количество интервалов
range_val = (min(data), max(data))
bins = 5
# Создание гистограммы
plt.hist(data, bins = bins, range = range_val, color = 'blue', edgecolor = 'black')
# Настройка осей
plt.xlabel('Значения')
plt.ylabel('Частота')
plt.title('Гистограмма данных')
# Отображение гистограммы
plt.show())
В этом примере мы создаем список данных, затем определяем диапазон значений и количество интервалов (bins) для гистограммы. Затем мы вызываем функцию hist из библиотеки matplotlib, чтобы создать гистограмму на основе этих данных, и настраиваем оси и заголовок. Наконец, мы отображаем гистограмму с помощью функции show.