Название | Частотный анализ числовых и текстовых данных. Учебное пособие |
---|---|
Автор произведения | Валентин Юльевич Арьков |
Жанр | |
Серия | |
Издательство | |
Год выпуска | 0 |
isbn | 9785005988416 |
2.3. Распределение
Рассчитаем теоретические значения плотности вероятности нормального распределения, см. рис.
Загружаем функцию нормального распределения norm из модуля stat библиотеки scipy.
Далее формируем одномерный массив (вектор) из 100 чисел в диапазоне от 60 до 140. В этих пределах расположена наша гистограмма. Для этого используем функцию linspace из библиотеки numpy.
Далее вычисляем значения плотности вероятности для нормального распределения с помощью функции norm. pdf. Название pdf в данном случае расшифровывается как probability density function – функция плотности вероятности. Задаем для этой функции те же параметры, что для генератора наших исходных данных:
– loc=mu – среднее значение (математическое ожидание);
– scale=sigma – стандартное отклонение («сигма»).
Здесь параметр loc означает location, то «расположение» среднего значения, то есть математического ожидания, которое обычно обозначается греческой буквой «мю».
Параметр scale определяет «размеры», или «размах» нашей кривой. Это среднее квадратическое отклонение, или С. К. О., или просто «сигма».
Строим график функции плотности с помощью функции plt.plot. Эта функция наносит на график точки и соединяет их прямыми отрезками. Поскольку точек и отрезков много, они сливаются и внешне выглядят как гладкая кривая.
Рассматриваем график и убеждаемся в правильности расчетов – обращаем внимание на среднее и разброс вокруг среднего (примерно три сигмы). В нашем примере это 100 плюс-минус 30, то есть от 70 до 130.
Рис. Плотность вероятности нормального распределения
Завершим оформление гистограммы – добавим теоретическую кривую и немного украсим изображение, см. рис.
При вызове функций plt. hist и plt.plot мы задаём параметр label. Это будет «метка» наших линий. Она нужна для оформления легенды, то есть вывода на график условных обозначений. Легенду мы выводим с помощью функции plt. legend () без параметров.
Для теоретического графика мы выбираем цвет с помощью параметра color. Линии разного цвета лучше воспринимаются, и эти цвета будут указаны в легенде.
Далее мы выводим заголовки по осям «икс» и «игрек»: plt. xlabel и plt. ylabel.
Наконец, на свободном месте графика выводим текст с помощью функции plt. text. Параметры этой функции следующие:
– x=130, y=0.033 – координаты левого нижнего угла текстового блока;
– s – строка текста для вывода на график (естественно, от английского слова string – строка).
Чтобы разобраться с этой строкой, придётся сосредоточиться. Итак, вначале указана буква f, что указывается на «форматированную строку», которая дана в кавычках. Далее мы выводим греческую букву «мю», для чего используем средства формул текстового редактора LaTeX: $\mu$. Формулы здесь вводятся в обрамлении символа «доллара». Затем мы выводим числовое значение переменной mu. Для этого используем фигурные скобки: {mu}. Затем используем символ перехода на новую строку \n – как и в стандартном формате вывода языка