Анализ распределения в Excel - страница 18

Шрифт
Интервал

стр.

Select Data — Horizontal (Category) Axis Labels — Edit

Выбрать данные — Подписи горизонтальной оси (категории) — Изменить


Выбор меток


Можно видеть, что такие текстовые метки больше подходят для украшения диаграммы. А вот использовать их в качестве масштаба будет гораздо труднее — по сравнению с не очень красивыми, но зато точными числами из предыдущего варианта.

Кумулята

Теперь построим кумуляту — график накопленных относительных частот. Расположим его под гистограммой.

Кумулята — это экспериментальная оценка формы графика функции распределения. Теоретическая кривая будет красивой и гладкой — мы познакомились с ней в начале работы, обсуждая свой вариант задания. Экспериментальная оценка — ломаная линия, да ещё и с погрешностями. Эти случайные ошибки вызваны ограниченным, не бесконечным объёмом выборки. В любом случае, эти графики начинаются в нуле и постепенно растут до 100%.

Напомним, что значения накопленных частот должны быть привязаны к верхним границам интервалов — в соответствии со стандартами и здравым смыслом. Идея в том, что накопленная частота накапливается именно к концу интервала, а не к середине.

Построим график в виде ломаной линии:

Insert — Charts — Insert Scatter (X, Y) or Bubble Chart

Вставка — Диаграммы — Вставить точечную (X, Y) или пузырьковую диаграмму


Вставка графика Y (X)


Выбираем тип графика

Scatter — Scatter with Straight Lines

Точечная — Точечная с прямыми отрезками

Это просто ломаная линия без маркеров точек.


Ломаная линия


Выбираем данные для графика:

Select Data — Select Data Source — Legend Entries (Series) — Add

Выбрать данные — Выбор источника данных — Элементы легенды (ряды) — Добавить

В окне

Edit Series

Изменение ряда

выбираем следующие данные.

Столбец «иксов» — верхние границы:

Series X Values

Значения Х

Столбец «игреков» — накопленные частоты:

Series Y Values

Значения Y

Убираем заголовок диаграммы:

Chart Elements — Chart Title

Элементы диаграммы — Название диаграммы

Настраиваем цвет линии на графике.

Format Data Series — Series options — Fill & Line — Line

Формат ряда данных —Параметры ряда — Заливка и границы — Линия


Line — Solid line

Линия — Сплошная линия


Color — Black

Цвет — Чёрный


Width = 0.5 pt

Ширина — 0,5 пт


Если отрезков много, то ломаная линия выглядит как гладкая кривая.


Кумулята


Настроим числовые метки на вертикальной оси, чтобы выводились целые числа:

Format Axis — Axis Options — Number — Decimal places — 0

Формат оси — Параметры оси — Число — Число десятичных знаков — 0


Целочисленные метки


Установим диапазоны значений по осям.

Вертикальная ось — метки в процентах, а границы диапазона — числа. Поэтому пределы изменения будут от 0 до 1:

Category — Percentage

Категория — Процентный


Axis Options — Bounds

Параметры оси — Границы


Minimum — 0

Минимум — 0


Maximum — 1

Максимум — 1


Горизонтальная ось — в соответствии с интервалами группировки — от 190 до 310.


Кумулята


Подгоняем размеры графика и размещаем его под гистограммой. Можно сделать это вручную.

Если захочется особой точности, поработаем через меню параметров графика (числа условные).

Format Chart Area — Chart Options — Size & Properties — Size

Формат области диаграммы — Параметры диаграммы — Размер и свойства — Размер


Height — 1.8 in

Высота — 7,62 см


Width — 5.3 in

Ширина — 12,7 см

В английской версии пакета размеры измеряются в дюймах. В русской версии — в сантиметрах. Можем установить точные значения размеров вручную.


Размер диаграммы


Окончательно совмещаем маштаб гистограммы и кумуляты: начало первого интервала 190, конец последнего интервала 310. Положения этих двух меток на обоих графиках должны совпадать.

Проблемы с масштабом решаем так. Значение 190 находится в начале интервала, обозначенного 193. Значение 310 находится в конце интервала, следующего за 303.


Гистограмма и кумулята

Группировка. Функция FREQUENCY

Следующий способ группировки — это подсчёт количества попаданий в интервалы с помощью формул и функций.

Создадим новый лист и скопируем сюда вспомогательную табличку с нижними и верхними границами интервалов группировки из предыдущего раздела.

Добавим в нашу таблицу новые столбцы:

— Середина интервала


стр.

Похожие книги