Создаем гистограмму

Гистограмма (Histogram) — это графическое представление распределения частоты значений числовой переменной. Она состоит из столбцов, расположенных на числовой оси, где каждый столбец представляет собой интервал значений, называемый интервалом классов, а высота столбца отображает количество значений переменной, попавших в этот интервал.

Гистограммы могут использоваться для визуализации различных статистических параметров распределения, таких как среднее значение, медиана, мода, дисперсия и стандартное отклонение. Они могут помочь исследователям понять форму распределения данных, такую как нормальное распределение, скошенное распределение, мультимодальное распределение и т.д.

Гистограммы также могут быть использованы для сравнения двух или более распределений. В этом случае каждое распределение может быть представлено разным цветом или шаблоном, чтобы облегчить сравнение. Например, гистограммы могут использоваться для сравнения распределения доходов мужчин и женщин в определенном регионе, чтобы выявить различия между этими распределениями.

import matplotlib.pyplot as plt

# Создание списка данных
data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5]

# Определение диапазона значений и количество интервалов
range_val = (min(data), max(data))
bins = 5

# Создание гистограммы
plt.hist(data, bins = bins, range = range_val, color = 'blue', edgecolor = 'black')

# Настройка осей
plt.xlabel('Значения')
plt.ylabel('Частота')
plt.title('Гистограмма данных')

# Отображение гистограммы
plt.show())

В этом примере мы создаем список данных, затем определяем диапазон значений и количество интервалов (bins) для гистограммы. Затем мы вызываем функцию hist из библиотеки matplotlib, чтобы создать гистограмму на основе этих данных, и настраиваем оси и заголовок. Наконец, мы отображаем гистограмму с помощью функции show.

Теги: