Гистограмма это диаграмма: Гистограммы. Что это? Как построить? Как представить данные? Как провести анализ? | Бережливые шесть сигм | Статьи | База знаний

Гистограмма это диаграмма: Гистограммы. Что это? Как построить? Как представить данные? Как провести анализ? | Бережливые шесть сигм | Статьи | База знаний

alexxlab 06.03.1970

Содержание

Представление данных в виде гистограммы

Чтобы создать гистограмму, сделайте следующее:

  1. Введите данные в электронную таблицу.

  2. Выделите данные.

  3. В зависимости от используемой версии Excel выполните одно из указанных ниже действий.

    • Excel 2016: на вкладке Вставка щелкните значок Вставить гистограмму или линейчатую диаграмму, а затем выберите нужный тип гистограммы.

    • Excel 2013: на вкладке Вставка щелкните значок Вставить гистограмму, а затем выберите нужный тип гистограммы.

    • Excel 2010 и Excel 2007: на вкладке Вставка щелкните значок Гистограмма, а затем выберите нужный тип гистограммы.

    Вы можете при необходимости отформатировать диаграмму. Ниже описаны некоторые варианты.

    Примечание: Перед применением форматирования нужно щелкнуть диаграмму.

    • Чтобы изменить макет диаграммы, щелкните Конструктор > Макет диаграммы и выберите макет.

    • Чтобы изменить стиль диаграммы, щелкните Конструктор > Стили диаграмм и выберите стиль.

    • Чтобы применить другой стиль фигуры, щелкните Формат > Стили фигур и выберите стиль.

      Примечание: Стили фигур отличаются от стилей диаграмм. Стиль фигуры — это форматирование, применяемое к границе диаграммы, а стиль диаграммы — это форматирование, которое применяется ко всей диаграмме.

    • Чтобы применить различные эффекты, выберите Формат > Эффекты фигуры и выберите нужный вариант, например Рельеф или Свечение, и его параметры.

    • Чтобы применить тему, щелкните Разметка страницы > Темы и выберите тему.

    • Чтобы изменить форматирование определенного компонента диаграммы (например, вертикальной оси (значений), горизонтальной оси (категорий) или области диаграммы), щелкните

      Формат, выберите компонент в раскрывающемся списке Элементы диаграммы, щелкните Формат выделенного фрагментаи внесите необходимые изменения. Повторите это действие для каждого компонента, который вы хотите изменить.

      Примечание: Если вы хорошо знакомы с диаграммами, вы также можете щелкнуть правой кнопкой мыши определенную область на диаграмме и выбрать параметр форматирования.

Чтобы создать гистограмму, сделайте следующее:

  1. В окне сообщения выберите Вставка > Диаграмма.

  2. В диалоговом окне Вставка диаграммы щелкните Гистограмма, выберите нужный тип гистограммы и нажмите кнопку ОК.

    В разделенном окне откроется лист Excel с примером данных.

  3. Замените их собственными данными.

    Примечание: Если на диаграмме не отображаются данные листа, перетащите вертикальные линии вниз до последней строки таблицы.

  4. При необходимости вы можете сохранить лист:

    1. Щелкните значок Измените данные Microsoft Excel на панели быстрого доступа.

      Лист откроется в Excel.

    2. Сохраните лист.

      Совет: Чтобы повторно открыть лист, щелкните Конструктор > Изменить данные и выберите нужный вариант.

    Вы можете при необходимости отформатировать диаграмму. Ниже описаны некоторые варианты.

    Примечание: Перед применением форматирования нужно щелкнуть диаграмму.

    • Чтобы изменить макет диаграммы, щелкните Конструктор > Макет диаграммы и выберите макет.

    • Чтобы изменить стиль диаграммы, щелкните Конструктор > Стили диаграмм и выберите стиль.

    • Чтобы применить другой стиль фигуры, щелкните

      Формат > Стили фигур и выберите стиль.

      Примечание: Стили фигур отличаются от стилей диаграмм. Стиль фигуры — это форматирование, применяемое к границе диаграммы, а стиль диаграммы — это форматирование, которое применяется ко всей диаграмме.

    • Чтобы применить различные эффекты, выберите Формат > Эффекты фигуры и выберите нужный вариант, например Рельеф или Свечение, и его параметры.

    • Чтобы изменить форматирование определенного компонента диаграммы (например, вертикальной оси (значений), горизонтальной оси (категорий) или области диаграммы), щелкните Формат, выберите компонент в раскрывающемся списке Элементы диаграммы, щелкните Формат выделенного фрагментаи внесите необходимые изменения. Повторите это действие для каждого компонента, который вы хотите изменить.

      Примечание: Если вы хорошо знакомы с диаграммами, вы также можете щелкнуть правой кнопкой мыши определенную область на диаграмме и выбрать параметр форматирования.

Гистограмма изображения—ArcGIS Pro | Документация

Гистограмма изображения визуально суммирует распределение непрерывной числовой переменной через измерение частоты, при которой определенные значения появляются в изображении. Ось x в гистограмме изображения представляет собой числовую линию, которая показывает диапазон значений пикселов изображения, который был разбит на несколько диапазонов или групп. Для каждой группы показывается столбец, толщина этого столбца представляет плотность числового диапазона в группе, а высота столбца представляет число пикселов, попавших в этот диапазон. Понимание распределения данных – это важный момент в процессе их изучения.

Переменная

Для гистограммы изображения нужна одна непрерывная Числовая переменная по оси x, состоящая из значений пикселов выбранного канала изображения.

Преобразование

Некоторые аналитические методы интерполяции требуют нормального распределения данных. Если данные сдвинуты (распределение несимметрично), то может понадобиться преобразовать данные к нормальному распределению. Гистограммы позволяют вам оценить эффект логарифмического преобразования и преобразования по методу квадратного корня на распределение данных. Для информации вы можете добавить график нормального распределения поверх вашей гистограммы, щелкнув отметку Показать нормальное распределение на панели Свойства диаграммы.

Логарифмическое преобразование

Логарифмическое преобразование часто используется, когда данные смещены в положительном направлении и присутствует мало очень больших значений. Если эти большие значения расположены в наборе данных, логарифмическое преобразование поможет сделать дисперсию более постоянной и привести данные к нормальному распределению.

Например, распределение со смещением в положительную сторону на диаграмме слева трансформировано в нормальное распределение с использованием логарифмического преобразования на диаграмме справа:

Логарифмическое преобразование можно применять только к значениям больше нуля.

Преобразование по методу квадратного корня

Преобразование по методу квадратного корня похоже на логарифмическое тем, что уменьшает правое смещение набора данных.. В отличие от логарифмических преобразований, преобразования по методу квадратного корня могут применяться к нулевым значениям.

Преобразование преобразование по методу квадратного корня можно применять только к значениям больше или равно нулю.

Количество бинов

Количество диапазонов по умолчанию соответствует квадратному корню из общего количества записей в наборе данных. Его можно выровнять, изменив значение Числа бинов на вкладке Данные на панели Диаграма. Изменение количества столбцов позволяют увидеть более или менее детальную структуру ваших данных.

Статистика

Некоторые основные статистические параметры также отображаются на гистограмме. Среднее и медиана отображаются каждое одной линией, по одному стандартному отклонению от среднего (выше и ниже) отображается двумя линиями. Вы можете щелкнуть эти элементы в таблице статистики или легенде диаграммы для включения или выключения их.

Таблица Статистика отображается на вкладке Данные на панели Свойства диаграммы и содержит следующую статистику для выбранных числовых полей:

  • Среднее
  • Медиана
  • Среднеквадратическое отклонение
  • Количество
  • Мин
  • Макс
  • Сумма
  • Значения NULL
  • Асимметрия
  • Эксцесс

Если на слое источнике диаграммы имеется выбранный набор, в таблице статистики будет отображаться один столбец со статистикой по всему набору данных, а другой — только со статистикой выбранного набора.

Если слой источник диаграммы является набором тематических или категорийных данных, а не с полями Переменная Число Value, число ячеек для Суммы вычисляться не будет. Используется по умолчанию. Если вы хотите, чтобы в диаграмме присутствовали вычисления Суммы для числа ячеек, щелкните Переменная и включите опцию Настроить число ячеек.

В таблице статистики имеются элементы управления для включения и выключения на гистограмме линий среднего, медианы и стандартного отклонения, а также для изменения их цвета.

Щелкните правой кнопкой мыши в таблице статистики и выберите Копировать таблицу, Копировать строку или Копировать значение, чтобы скопировать и вставить статистику из Свойств диаграммы в другие окна или приложения.

Оси

Границы по оси Y

Границы по оси Y устанавливаются в соответствии с диапазоном данных по оси Y. Эти значения можно настроить, введя нужные граничные значения по оси. Настройки границ оси можно использовать для сохранения масштаба согласованности диаграммы для сравнения. Щелчок на кнопке сброса вернет граничные значения оси к настройкам по умолчанию.

Числовой формат

Вы можете отформатировать способ отображения числовых значений оси, указав категорию форматирования или задав пользовательский формат. Например, $#,### можно использовать как строку пользовательского формата для отображения денежных значений.

Направляющие

Направляющие или диапазоны могут быть добавлены на диаграммы для ориентировки или как способ выделить важнейшие значения. Чтобы добавить направляющую, перейдите на вкладку Направляющие на панели Свойства диаграммы и нажмите Добавить направляющую. Чтобы нарисовать линию, введите значение, где вы хотите ее добавить. Чтобы задать диапазон, укажите начальное и конечное значения. Дополнительно можно добавить к направляющей текст, указав значение Надпись.

Оформление

Заголовки и описание

Диаграммам и осям присваиваются названия по умолчанию на основе имен переменных и типа диаграммы. Эти значения можно редактировать на вкладке Общие панели Свойства диаграммы. Также для диаграммы можно ввести Описание, которое представляет из себя текстовый блок, появляющийся в нижней части окна диаграммы.

Визуальное форматирование

В активном окне диаграммы становится доступной контекстная лента Формат диаграммы, которая позволяет выполнить визуальное форматирование диаграммы. К параметрам форматирования диаграмм относятся следующие:

  • Изменение размера, цвета и стиля шрифта, используемого для заголовков осей, надписей осей, текста описания и текста легенды
  • Изменение цвета, ширины и типа линий сетки и осей
  • Изменение цвета фона диаграммы

Более подробную информацию о том, как изменить внешний вид вашего графика гистограммы, см. в разделе Изменение внешнего вида диаграммы.


Отзыв по этому разделу?

Создание гистограмм, графиков и диаграмм с областями в PowerPoint :: think-cell

7.1
Гистограмма и гистограмма с накоплением
7.2
Диаграмма с группировкой
7.3
100%–диаграмма
7.4
График
7.5
Пределы погрешностей
7.6
Диаграмма с областями 100%-диаграмма с областями
7.7
Смешанная диаграмма

7.1 Гистограмма и гистограмма с накоплением

Значок в меню «Элементы»:

В think-cell нет отличия между простыми гистограммами и гистограммами с накоплением. Если вы хотите создать простую гистограмму, введите только один ряд (одну строку) данных в таблице. Чтобы быстро ознакомиться с гистограммами, изучите пример в главе Введение в создание диаграмм.

Линейчатые диаграммы в think-cell — это просто повернутые гистограммы, которые можно использовать точно так же. Кроме того, вы можете создавать диаграммы-бабочки, размещая две линейчатые диаграммы рядом друг с другом. Для это примените функции поворота (см. раздел Поворот и переворот элементов) и масштаба (см. раздел Такой же масштаб). Затем удалите метки категории для одной из диаграмм.

Инструкции по созданию диаграммы с накоплением и группировкой см. в разделе Диаграмма с группировкой.

Чтобы изменить ширину столбца, выберите сегмент и перетащите один из маркеров к половине высоты столбца.

В подсказке отображается полученный во время перетаскивания промежуток. Чем шире столбец, тем меньше промежуток и наоборот, так как ширина диаграммы не меняется при изменении ширины столбцов. Ширина промежутка отображается как процент от ширины столбца, то есть 50 % означает, что ширина каждого промежутка равна половине ширине столбца.

Изменение ширины одного столбца приведет к изменению ширины всех других столбцов. Ширина всех столбцов всегда одинакова. Сведения о диаграмме с различной шириной столбцов, которая зависит от данных, см. в разделе Диаграмма Mekko. Сведения о том, как сделать отдельные промежутки шире, см. в разделе Промежуток между категориями.

7.2 Диаграмма с группировкой

Значок в меню «Элементы»:

Диаграмма с группировкой — это вариант гистограммы с накоплением, в которой сегменты расположены рядом друг с другом.

Диаграмму с группировкой можно объединить с графиком, выбрав сегмент с рядом и выбрав параметр График в элементе управления типом диаграммы этого ряда.

Чтобы разместить группы сегментов рядом, можно создать диаграмму с накоплением и группировкой.

Чтобы создать диаграмму с накоплением и группировкой, выполните следующие действия.

  1. Вставьте диаграмму с накоплением.
  2. Выберите сегмент и перетащите маркер ширины столбца на половину высоты столбца, пока в подсказке не появится строка «Промежуток 0 %».
  3. Нажмите на базовую линию, где требуется вставить промежуток, и перетащите стрелку вправо, пока в подсказке не появится строка «Промежуток категории 1». Эти действия необходимо повторить для всех кластеров.

Если число столбиков в кластере четное, метку нельзя выровнять по центру для всего кластера. В этом случае используйте текстовое поле PowerPoint в качестве метки.

7.3 100%–диаграмма

Значок в меню «Элементы»:

100%-диаграмма — это вариант гистограммы с накоплением, в которой все столбцы обычно дополняются до одинаковой высоты (например, до 100 %). Метки 100%-диаграммы поддерживают свойство содержимого метки, которое позволяет выбрать, будут ли отображаться абсолютные значения, проценты или и то, и другое (Содержимое меток).

С помощью think-cell можно создавать 100%-диаграммы, значения столбцов которой необязательно равно 100 %. Если итоговое значение столбца не равно 100 %, он отображается соответствующим образом. Дополнительные сведения о заполнении таблицы см. в разделе Абсолютные и относительные значения.

7.4 График

Значок в меню «Элементы»:

График использует линии для соединения точек данных, которые относятся к одному ряду данных. Внешний вид графика определяют элементы управления схемой линий, типом линии и фигурой маркера на перемещаемой панели инструментов. Дополнительные сведения об этих элементах управления см. в разделе Форматирование и стили. Метки для точек данных по умолчанию не отображаются, но их можно включить с помощью кнопки  Добавить метку точки в контекстном меню графика.

Если значения категории графика — это строго увеличивающиеся числа или даты и их можно интерпретировать таким образом в соответствии с форматом числа метки оси, тогда ось X автоматически изменится на ось значений (см. раздел Ось значений). Если используются даты, формат даты можно изменить, выбрав все метки категорий (см. раздел Множественный выбор) и введя формат в элементе управления (см. раздел Коды форматов дат). Чтобы отобразить больше меток, чем помещается по горизонтали, можно использовать поворот меток (см. раздел Поворот метки).

Горизонтальная ось может переключиться с режима категории на режим значений, только если выполняются следующие условия.

  • Все ячейки категорий в таблице содержат числа, а в качестве формата ячеек Excel выбрано значение Общий или Число либо все ячейки категорий в таблице содержат даты, а в качестве формата ячеек Excel выбрано значение Дата.
  • Числа или даты в ячейках категорий строго увеличиваются слева направо.
  • Для оси Y не включен параметр Клетки между категориями (см. раздел Размещение оси значений). Если только это требование мешает перейти в режим оси значений, вы можете использовать параметр  Сделать осью значений в контекстном меню оси, чтобы включить параметр Клетки на категориях и тем самым включить режим оси значений.

На графике также может отображаться вторая вертикальная ось значений. Дополнительные сведения см. в разделе Вторая ось.

Если выбран параметр Использовать функцию «Заполнять сверху» Excel (см. раздел Цветовая схема), цвет заливки в параметрах форматирования Excel используется следующим образом.

  • Цвет заливки ячейки, содержащей имя ряда, определяет цвет линии.
  • Цвет заливки ячейки каждой точки данных определяет цвет этой точки данных.

7.4.1 Сглаженные линии

Если вы хотите, чтобы линии на графике были сглажены, включите этот параметр. Сначала нажмите правой кнопкой мыши на нужную линию, а затем нажмите кнопку  Преобразовать в гладкий график.

7.4.2 Интерполяция

На графиках, диаграммах с областями и 100%-диаграммах кнопку  Интерполировать можно использовать для отображения диаграммы с линейной интерполяцией всех отсутствующих в ряду данных значений. На графиках интерполяцию можно включить и отключить для отдельных рядов на диаграмме. На диаграммах с областями ее можно использовать только для всей диаграммы, так как ряды расположены друг над другом.

7.5 Пределы погрешностей

Пределы погрешностей можно использовать для обозначения отклонений на графиках и диаграммах с накоплением. С помощью пределов погрешностей можно создать следующую диаграмму.

  1. Создайте график с тремя рядами данных. Первый ряд обозначает верхнее отклонение, второй ряд — среднее отклонение, а третий ряд — нижнее отклонение.
  2. Щелкните правой кнопкой мыши центральную линию и выберите  Добавить пределы погрешностей в контекстном меню.
  3. Удалите метки для верхнего и нижнего ряда.

Выберите один из пределов погрешностей, чтобы изменить фигуру и цвет маркера для верхнего и нижнего отклонения, а также тип линии для всех пределов погрешностей. Вы также можете выбрать отдельный маркер предела погрешностей, чтобы изменить только его свойства.

При выборе предела погрешностей на каждом его конце появляется маркер. Их можно перетащить, чтобы выбрать, какие линии должны охватывать пределы погрешностей. Вы также можете отобразить интервалы вместо отклонений вокруг центрального значения, если предел погрешностей будет охватывать только две смежные линии.

7.6 Диаграмма с областями 100%-диаграмма с областями

7.6.1 Диаграмма с областями

Значок в меню «Элементы»:

Диаграмма с областями можно представить графиком с накоплением, в котором точки данных представляют сумму значений категорий, а не отдельные значения. Внешний вид диаграмм с областями настраивается с помощью элемента управления цветовой схемой. Метки для точек данных по умолчанию не отображаются, но их можно включить с помощью кнопки  Добавить метку точки в контекстном меню диаграммы с областями. Кнопку  Добавить итоги в контекстном меню диаграммы с областями можно использовать для отображения меток с итоговыми значениями. Вы можете включить линейную интерполяцию, нажав кнопку  Интерполировать (см. раздел Интерполяция).

Если выбран параметр Использовать функцию «Заполнять сверху» Excel (см. раздел Цветовая схема), цвет заливки Excel для ячейки метки ряда определяет цвет заливки области этого ряда.

7.6.2 100%-диаграмма с областями

Значок в меню «Элементы»:

100%-диаграмма с областями — это вариант диаграммы с областями, в которой сумма всех значений в категории обычно представляет 100 %. Если сумма значений в категории отличается от 100 %, то диаграмма будет отображаться соответствующим образом. Дополнительные сведения об указании значении данных см. в разделе Абсолютные и относительные значения. В метках 100%-диаграммы с областями могут отображаться абсолютные значения, проценты или и то, и другое (Содержимое меток). Вы можете включить линейную интерполяцию, нажав кнопку  Интерполировать (см. раздел Интерполяция).

7.7 Смешанная диаграмма

Значок в меню «Элементы»:

Смешанная диаграмма объединяет сегменты графика и гистограммы на одной диаграмме. В разделах График и Гистограмма и гистограмма с накоплением подробно описывается использование таких сегментов.

Чтобы преобразовать ряд сегментов, просто выделите линию и выберите параметр Сегменты стека в элементе управления типом диаграммы (см. раздел Тип диаграммы). Чтобы преобразовать сегменты в линию, просто выделите сегмент ряда и выберите параметр Линия в элементе управления типом диаграммы. У источников данных графиков, диаграмм с накоплением и смешанных диаграмм одинаковый формат.

Эту функцию можно использовать в гистограммах с накоплением и группировкой, а также в графиках.

Представляйте данные исследования с использованием блочных диаграмм и гистограмм

Гистограммы и блочные диаграммы часто используются для визуального представления данных исследований. Поэтому важно понимать разницу между ними. Использование блочной диаграммы или гистограммы зависит от характера данных и интерпретации, которую исследователь хотел бы предоставить.

Блочные диаграммы и как их читать

Блочная диаграмма используется для построения графика распределения данных. Блочные диаграммы также называются диаграммами размаха. Эти графики кодируют пять характеристик распределения данных, показывая читателю их положение и длину. Блок варьирует от Q1 (первый квартиль) распределения до Q3 (третий квартиль) распределения, а диапазон представлен IQR (межквартильный диапазон). Медиана обозначена линией поперек блока. Размахи на блочных диаграммах простираются от Q1 и Q3 до самых крайних точек данных. В свою очередь, каждое из этих выпадающих значений отмечено знаком. Как альтернатива, максимальные и минимальные значения могут быть использованы в качестве конечных точек размаха.

Чтение блочных диаграмм не так сложно, как может показаться. Медиана, представленная линией, проходящей через блок, является серединой набора данных. Это означает, что 50% данных больше медианы. Верхний размах представляет значения выше среднего. Выпадающие значения – это точки над верхним размахом. Аналогичная интерпретация применяется к нижнему размаху и выпадающим значениям. Блочные диаграммы также могут представлять ассиметричные распределения в наборе данных. Положение медианы на блоке показывает, насколько много данных находится над или под ней.

Благодарим за представление изображения: Натан Яу из Flowing Data

Гистограммы и как их читать

Гистограммы предназначены для представления категориальных переменных и подходят для подсчета. Гистограммы отображают и сравнивают частоту, число или другие показатели (например, среднее) для разных категорий данных. Однако непрерывные данные лабораторных исследований, исследований на людях и исследований на животных часто представлены в виде гистограмм. Гистограммы – это часто используемые графики, потому что их легко интерпретировать и просто создавать. Они полезны для отображения номинальных или порядковых категорий. Порядковые категории – это данные, которые ранжируются (например, от очень хорошего до очень плохого), в то время как номинальные данные представляют качественные или описательные данные (например, страна рождения, предмет, изучаемый в университете). Существуют различные типы гистограмм, такие как горизонтальные гистограммы, сгруппированные гистограммы и гистограммы с накоплением. Исследователи должны создавать свои графики, соблюдая несколько правил, чтобы представить свои работы в четкой и эффективной форме.

Интерпретация гистограмм начинается с наблюдения высоты гистограммы относительно соответствующего значения на оси Y. Различия в высотах столбцов можно определить, обратившись к оси Y. Второй шаг – сравнить группировки столбцов. Некоторые гистограммы могут иметь столбцы, сгруппированные в кластеры. В этом случае сравните столбцы внутри кластеров, чтобы понять, как каждый набор данных в подкатегории сравнивается с другими наборами данных. Кроме того, вы также можете проверить диапазон, вычитая самое низкое значение (обозначенное самым коротким столбцом) из наибольшего значения (обозначенного самым длинным столбцом).

Какой из этих графиков следует использовать?

Какой тип данных вы будете представлять? Как вы хотите представить свои данные? Вам нужно ответить на такие вопросы, прежде чем выбирать между этими двумя типами.

Некоторые авторы утверждают, что гистограммы не должны использоваться, в то время как другие утверждают, что должны появиться новые форматы для представления данных. Сгруппированные гистограммы полезны, например, для отображения бюджетов для двух домохозяйств. Одно из распространенных применений гистограмм – показать соотношение одного значения к другому.

С другой стороны, блочные диаграммы полезны для построения различных наборов данных из независимых источников. Пример включает в себя сравнение результатов тестов между различными университетами, изменение данных (до и после) в результате процесса или данные с разных машин, производящих один и тот же продукт. Блочные диаграммы – это хороший способ представить распределение ваших данных, особенно если вы стремитесь показать другие значения помимо среднего.

Связывание данных ваших исследований

Это просто, если вы решите, какой тип графика лучше всего подходит для ваших данных. Например, если ваши данные ассиметричны, можно использовать блочную диаграмму. Ваш читатель сможет определить, смещены ли данные влево или вправо, в зависимости от блока полосы выше и ниже средней линии. Данные из ANOVA также могут быть показаны с помощью блочной диаграммы. Если ваши данные, в основном, носят описательный характер, и вы хотите показать пропорции, то гистограмма – ваш лучший выбор.

Какой бы путь вы ни выбрали, важно понимать полезность этих графиков. Ваш анализ данных исследования является основной частью отчета об исследовании – делайте это эффективно! Дайте нам знать, что вы думаете об использовании блочной диаграммы и гистограммы при представлении результатов!

Гистограмма. Статистическая диаграмма . Анализ распределения в Excel

Самый простой способ построить гистограмму — использовать вставку готовой статистической диаграммы.

Выделяем столбец случайных чисел. Для этого щёлкаем по первой ячейке столбца данных (ячейка B3) и нажимаем комбинацию клавиш Shift + Ctrl + ?. Клавиша Shift при перемещении курсора позволяет выделять ячейки. Комбинация Ctrl + ? перемещает курсор в самую нижнюю заполненную ячейку столбца.

Вставляем график:

Insert — Charts — Insert Statistic Chart — Histogram

Вставка — Диаграммы — Вставить статистическую диаграмму — Гистограмма

Вставка гистограммы

В середине экрана появляется график. Теперь его предстоит правильно расположить и настроить.

Автоматические настройки

Перенесём график на новый лист. Щёлкаем правой кнопкой по графику и вырезаем его (переносим в буфер обмена), выбрав пункт

Cut:

Вырезать

Создаём новый лист, нажав кнопку (+)

New Sheet

Новый лист

в нижней части окна. Вставляем график, нажав правую кнопку мыши и выбрав пункт

Paste

Вставка

В списке

Paste Options

Параметры вставки

Выбираем вариант вставки из буфера

Use Destination Theme

Использовать конечную тему

Вставка графика

Можно поступить проще: вырезать комбинацией клавиш Ctrl + C, вставить комбинацией Ctrl + V.

Итак, мы вставили график на новый лист. Кроме нас, никто не знает, что это такое и откуда оно взялось. Поэтому делаем заголовок.

Гистограмма на новом листе

Теперь настроим оформление и параметры графика.

Щёлкаем левой кнопкой мыши по графику и справа обнаруживаем кнопку [+]

Chart Elements

Элементы диаграммы

Управление элементами графика

Нажимаем на эту кнопку и выбираем нужные элементы оформления. В нашем случае потребуются следующие элементы:

масштаб по осям координат

Axes

Оси

заголовки по осям координат

Axis Titles

Названия осей

общий заголовок графика

Chart Title

Название диаграммы

линии масштабной сетки на поле графика

Gridlines

Сетка

Выбор элементов графика

Отредактируем заголовки по осям: x и n. Установим наклонный жирный шрифт высотой 12 пунктов. Настройки шрифта по-прежнему находятся в разделе

Home — Font

Главная — Шрифт

Настройка заголовков по осям

Настроим количество столбцов в гистограмме. Для этого правой клавишей мыши нажмём на горизонтальную ось графика и выберем

Format Axis

Формат оси

Второй вариант — двойной щелчок по горизонтальной оси.

В правой части окна появится окно настройки оси

Format Axis

Формат оси

По умолчанию используется автоматический выбор параметров группировки данных:

Axis Options — Bins — Automatic

Параметры оси — Интервалы — Авто

Параметры группировки

Английское слово Bin буквально означает «корзина». Переводят его по-разному: «карманы», «корзины», «интервалы». Имеется в виду интервал значений, диапазон значений случайной величины для группировки данных. При построении гистограммы подсчитывается количество попаданий в этот интервал.

Гистограмма — это грубая, экспериментальная оценка формы графика плотности вероятности по реальным данным. Поэтому при настройке гистограммы самое главное — правильно выбрать количество интервалов.

Как подобрать количество интервалов — с этим подходом лучше всего познакомиться на практике. Выбираем вариант

Number of bins

Количество интервалов

Вручную вводим числа. Подбираем подходящее, оптимальное количество. Как влияет выбор количества интервалов на форму гистограммы, показано на следующих трёх рисунках.

Если выбрать слишком мало интервалов, пропадут подробности на графике.

Слишком мало интервалов

Если взять слишком много интервалов, то станут заметными случайные погрешности, и на их фоне потеряется полезная информация.

Слишком много интервалов

Нам нужно найти компромисс: не слишком много и не слишком мало интервалов.

Оптимальное количество интервалов

Настроим оформление графика. В соответствии с отечественными и международными стандартами, столбики на гистограмме должны соприкасаться сторонами, прилегать друг к другу. Это объясняется тем, что при группировке данных интервалы группирования тоже соприкасаются своими границами. На гистограмме границы интервалов превращаются в границы столбиков.

Чтобы установить правильную ширину столбиков, щёлкаем левой кнопкой по столбикам гистограммы и устанавливаем нулевой зазор между столбиками:

Format Data Series — Series Options — Gap Width — 0%

Формат ряда данных — Параметры ряда — Боковой зазор — 0%

Зазор между столбиками

Теперь настроим изображение столбиков. Слишком много закрашенных столбиков на графике отвлекает внимание от графика. Убираем заливку столбиков:

Format Data Series — Series Options — Fill & Line — Fill — No fill

Формат ряда данных — Параметры ряда — Заливка и границы — Заливка — Нет заливки

Очертания столбиков должны изображаться сплошной линией:

Border — Solid Line

Граница — Сплошная линия

Линии должны быть чёрного цвета:

Border — Color — Black

Граница — Цвет — Черный

Установим толщину линий 0,5 пункта:

Border — Width — 0.5 pt

Граница — Ширина — 0,5 пт

Только линии

Наконец, настроим масштаб по горизонтальной оси. Щёлкаем по горихонтальной оси. Выбираем вкладку

Axis Options

Параметры оси

Устанавливаем формат вывода числовых меток на оси:

Format Axis — Axis Options — Number — Category — Number

Decimal places = 0

Формат оси — Параметры оси — Число — Категория — Числовой

Число десятичных знаков = 2

Масштаб

Рассмотрим полученный график. При большой объёме выборки отдельные редкие значения появляются очень далеко от среднего значения — гораздо дальше, чем три сигмы. Чтобы собрать редкие удалённые значения в крайние интервалы, используем дополнительные настройки оси:

Format Axis — Axis Options — Underflow bin / Overflow bin

Формат оси — Параметры оси — Выход за нижнюю / верхнюю границу интервала

Выход за границы

После группировки крайних значений получаем два крайних интервала: «меньше 189» и «больше 311». При необходимости корректируем общее число интервалов.

Следующая особенность нашего графика — это форма скобок: круглая скобка для нижней границы и квадратная скобка для верхней границы интервала:

(250, 254]

Это означает, что нижняя граница не входит в интервал значений, то есть не учитывается при подсчёте количества попаданий случайных чисел в данный интервал. Аналогично работают остальные функции Excel, которые выполняют группировку данных. Отметим, что такой подсчёт частот полностью соответствует основным положениям теории вероятностей.

И последнее, что можно отметить в полученной гистограмме: высота столбиков соответствует количеству попаданий в интервал, что в статистике называется термином ЧАСТОТА или АБСОЛЮТНАЯ ЧАСТОТА. Для анализа гистограммы более информативным будет ОТНОСИТЕЛЬНАЯ ЧАСТОТА (в процентах). И такая возможность отсутствует в текущей версии встроенной статистической диаграммы.

Самое главное — графический интерфейс позволяет ознакомиться с инструментом и в диалоге, на ходу выбрать количество интервалов группировки. Эту настройку мы будем использовать при построении гистограммы с помощью других инструментов пакета.

Повторите все описанные выше шаги для выборки с равномерным распределением. Здесь и далее мы проводим свой анализ для обоих наборов исходных данных — с нормальным и с равномерным распределением.

ТЕСТ №2 «Диаграммы и графики в электронных таблицах» — Тесты по информатике и ИКТ — Архив тестов — Каталог статей

ТЕСТ №2 «Диаграммы и графики  в электронных таблицах»

 

1. Деловая графика представляет собой:

 

1. совокупность графиков функций;

2. графические иллюстрации;

3. график совещания;

4. совокупность программных средств, позволяющих представить в графическом виде закономерности изменения числовых данных.

 

  1. График функции можно создать в Excel при помощи:

1. Строки формул;

2. Мастера Функций;

3. Мастера Шаблонов;

4. Мастера Диаграмм.

 

  1. Гистограмма наиболее пригодна для:

 

1. отображения распределений;

2. отображения динамики изменения данных;

3. сравнения различных членов группы;

4. отображения удельных соотношений различных признаков.

 

  1. Диаграмма это:

 

1. карта местности;

2. форма графического представления  числовых значений, которая позволяет облегчить интерпретацию  числовых данных;

3. красиво оформленная таблица;

4. обычный график.

 

  1. Диаграмма в электронных таблицах – это:

 

 1. качественно оформленная числовая таблица;

      2. график, отображающий зависимость между всеми числами таблицы;

      3. средство наглядного графического изображения информации, предназначенное для сравнения нескольких величин или нескольких значений одной величины, слежения за изменением их значений и т. п.

4. зависимость между числовыми значениями.

 

  1. Круговая диаграмма – это диаграмма:

 

  1. представленная в виде круга, разбитого на секторы, в которой допускается только один ряд данных;
  2. в которой  отдельные ряды данных представлены в виде закрашенных разными цветами областей;
  3. в которой используется система координат с тремя координатными осями, что позволяет получить эффект пространственного представления рядов данных;
  4. в которой отдельные значения представлены точками в декартовой состеме координат.

 

  1. В каком разделе меню табличного процессора Excel находится Мастер Диаграмм:

1. Правка;

2. Вставка;

3. Сервис;

4. Данные.

 

  1. Форма графического представления числовых значений, позволяющая облегчить восприятие и интерпретацию числовых данных, называется:

1. чертежом;

2. картой;

3. блок-схемой;

4. диаграммой.

 

9. Гистограмма – это диаграмма, в которой:

1. отдельные значения представлены полосами различной длины, расположенными горизонтально вдоль оси ОХ

2. отдельные значения представлены вертикальными столбцами различной высоты;

3. используется система координат с тремя координатными осями, что позволяет получить эффект пространственного представления рядов данных;

4. для представления отдельных значений используются параллелепипеды, размещенные вдоль оси ОХ.

 

10. Диаграмма,  в которой отдельные значения представлены точками в декартовой системе координат, называется:

1. линейчатой;

2. точечной;

3. круговой;

4. гистограммой.

 

11. Линейчатая диаграмма – это диаграмма:

1. в которой отдельные значения представлены вертикальными столбиками различной высоты;

2. в которой отдельные значения представлены точками в декартовой системе координат;

3. в которой отдельные значения представлены полосами различной длины, расположенными горизонтально вдоль оси ОХ

4. представленная в виде круга, разбитого на секторы, и в которой допускается только один ряд данных.

 

 

12. Чтобы отформатировать какой-либо элемент диаграммы, необходимо:

1. дважды щелкнуть по нему курсором мыши;

2. выполнить команды Диаграмма, Исходные данные;

3. выполнить команды Диаграмма, Добавить данные;

4. все вышеперечисленные ответы верны.

 

13. На основе чего строится любая диаграмма?

а. книги Excel

б. графического файла

в. текстового файла

г. данных таблицы

 

 

14. Для сравнения нескольких величин в одной точке обычно используется:

1. линейчатая диаграмма;

2. гистограмма;

3. точечная диаграмма;

4. круговая диаграмма.

как правильно выбрать диаграмму или график для годового отчета

Целевая аудитория вашей презентации либо отчета — инвесторы, руководство и просто люди — ожидают получить не ворох цифр, а уже сформулированные выводы либо понятно расставленные акценты. Возникает необходимость обратить внимание аудитории на факторы и обстоятельства, показать планы и стратегию.

Графическое отображение информации помогает донести нужную мысль, подкрепить сформулированный вывод либо подчеркнуть акцент

Но есть одна проблема — восприятие положительных и отрицательных результатов. При этом разные аудитории по-разному относятся даже к положительным. Например, журналисты могут скептически комментировать достижения. Акционеры склонны болезненно реагировать на убытки. И здесь необходим тонкий продуманный подход.

О неудачах и негативе можно рассказать очень скучно и нудно, а интересный и бодрый рассказ об успехах — подкрепить наглядной демонстрацией, включающей в себя презентацию с впечатляющими графиками. При этом правильно выбранная диаграмма может в корне изменить восприятие информации: если вы просто покажете, как рос доход компании в течение года, это будет не так впечатляюще, как если рядом будет показана динамика проседания вашего конкурента.

Одна из трудностей, которая существенно замедляет составление отчетов и аналитическую работу, заключается в подборе правильного типа диаграммы. Неверный ее выбор может вызвать путаницу в голове у зрителей или привести к ошибочной интерпретации данных.

Давайте посмотрим на инфографику о мировом производстве масла.

Инфографика Top Lead для компании Baker Tilly. Посмотреть в полном размере.

Здесь все — и объемы производства, экспорт, прогнозы, спрос, потребители и еще тонны информации. Эта инфографика вмещает в себя по сути огромный объем данных по целой отрасли. Тем не менее она проста в восприятии, и на графике четко видны определенные тенденции.

Чтобы создать диаграмму, которая объясняет и демонстрирует точную аналитику, сначала нужно понять причины, по которым вообще она может понадобиться. В этой статье мы рассмотрим пять вопросов, возникающих при выборе типа диаграммы. Затем мы дадим обзор 13 различных видов диаграмм, из которых можно выбрать самую подходящую.

5 вопросов, которые нужно задать себе при выборе диаграммы

1. Вам нужно сравнивать величины?

Графики идеально подходят для сравнения одного или нескольких наборов величин, и они могут легко отображать самые низкие и высокие показатели.

Для создания сравнительной диаграммы используйте следующие типы: гистограмма, круговая диаграмма, точечная диаграмма, шкала со значениями.

2. Вы хотите показать структуру чего-либо?

Например, вы хотите рассказать о типах мобильных устройств, которые используют посетители сайта или общий объем продаж, разбитый на сегменты.

Чтобы показать структуру, используйте следующие диаграммы: круговая диаграмма, гистограмма с накоплением, вертикальный стек, областная диаграмма, диаграмма-водопад.

3. Вы хотите понять, как распределяются данные?

Таблицы с распределением помогают понять основные тенденции и отметить, что выходит за рамки.

Используйте эти диаграммы: точечная диаграмма, линейная диаграмма, гистограмма.

4. Вы заинтересованы в анализе тенденций в определенном наборе данных?

Если вы хотите узнать больше о том, как цифры ведут себя в течение конкретного временного периода, есть типы диаграмм, которые очень хорошо это отображают.

Вам пригодятся: линейная диаграмма, двойная ось (столбец и линия), гистограмма.

5. Хотите лучше понять взаимосвязь между установленными значениями?

Взаимосвязанные графики подходят для того, чтобы показать, как одна переменная относится к другой или нескольким различным переменным. Это можно использовать, чтобы показать положительное, отрицательное или нулевое влияние на другую цифру.

Используйте для этого следующие диаграммы: точечная диаграмма, пузырьковая диаграмма, линейная диаграмма.

13 различных типов диаграмм для анализа и представления данных

Чтобы лучше понять каждый график и возможности его применения, рассмотрим все типы диаграмм.

Гистограмма

Гистограмма используется, чтобы показать сравнение между различными элементами, также она может сравнить элементы за определенный промежуток времени. Этот формат можно использовать для отслеживания динамики переходов на лендинг или количества клиентов за определенный период.

Инфографика Top Lead для юридической компании AEQUO

Рекомендации по дизайну для столбчатых диаграмм

1. Подбирайте единую цветовую гамму и акцентируйте цветом места, которые хотите выделить как значимые моменты перелома или изменения с течением времени.

2. Используйте горизонтальные метки, чтобы улучшить читаемость.

3. Начните ось y с 0, чтобы правильно отразить значения на графике.

Горизонтальная гистограмма

Гистограмму — в основном горизонтальную столбчатую — следует использовать, чтобы избежать путаницы, когда одна полоска данных слишком длинная или в случае сравнения более 10 элементов. Этот вариант также может использоваться для визуализации отрицательных значений.

Инфографика Top Lead для интернет-издания Aggeek. Посмотреть в полном размере.

Рекомендации по дизайну для гистограмм

1. Подбирайте единую цветовую гамму и акцентируйте цветом места, которые хотите выделить как значимые точки перелома или изменения с течением времени.

2. Используйте горизонтальные метки, чтобы улучшить читаемость.

3. Начните ось Y с 0, чтобы правильно отразить значения на графике.

Линейная диаграмма

Линейная диаграмма отображает тенденции или прогресс и может использоваться для визуализации самых разных категорий данных. Ее следует использовать, когда вы создаете график, основанный на длительном сборе данных.

Инфографика Top Lead. Линейная диаграмма — снизу.

Рекомендации по дизайну для линейных диаграмм

1. Используйте сплошные линии.

2. Не рисуйте больше четырех линий, чтобы избежать появления визуальных отвлекающих факторов.

3. Используйте правильную высоту, чтобы линии занимали примерно 2/3 высоты оси Y.

Диаграмма с двойной осью

Двухосевая диаграмма позволяет выстраивать данные с использованием двух осей — Х и Y. Используется несколько наборов данных, один из которых, например, — данные за период, а другой — лучше подходит для группировки по категориям. Таким образом можно продемонстрировать корреляцию или ее отсутствие между разными показателями.

Инфографика Top Lead для Growth Up. Диграмма с двойной осью — вверху.

Рекомендации по дизайну для диаграмм с двумя осями

1. Используйте левую ось Y для основной переменной, потому что для людей естественно сначала смотреть влево.

2. Используйте разные стили графиков, чтобы проиллюстрировать два набора данных.

3. Выберите контрастные цвета для сравниваемых наборов данных.

Областная диаграмма

Областная диаграмма в целом выглядит как линейная диаграмма, но пространство между осью Х и линией графика заполняется цветом или рисунком. Такой вариант подойдет для демонстрации отношений между частями одного целого, например, вклада отдельных торговых представителей в общий объем продаж за год. Это поможет проанализировать как всю картину в целом, так и информацию о тенденциях на отдельных участках.

Инфографика Top Lead для компании Baker Tilly. Сверху вниз: круговая диаграмма, две обласных диаграммы, круговые диаграммы.

Рекомендации по дизайну для диаграмм областей

1. Используйте полупрозрачные цвета.

2. Используйте не более четырех категорий, чтобы избежать путаницы.

3. Организовывайте данные с высокой частотой изменчивости в верхней части диаграммы, чтобы было легче воспринимать динамические изменения.

Штабельная диаграмма

Ее можно использовать для сравнения большого количества различных составляющих. Например, частоту посещения нескольких сайтов и каждой страницы в отдельности.

Инфографика и верстка — Top Lead. Для «Нафтогаз України». Штабельная диаграмма — внизу слева. Посмотреть в полном размере.

Рекомендации по дизайну для штабельных диаграмм

1. Лучше всего использовать ее для иллюстрации отношений «часть-целое». Для большей наглядности выбирайте контрастные цвета.

2. Сделайте масштаб диаграммы достаточно большим, чтобы видеть размеры групп по отношению друг к другу.

Круговая диаграмма

Круговая диаграмма отображает статическое число и то, как части складываются в целое — состав чего-либо. Круговая диаграмма показывает числа в процентах, и общая сумма всех сегментов должна равняться 100%.

Инфографика и верстка — Top Lead. Для «Нафтогаз України». Посмотреть в полном размере.

Рекомендации по дизайну для круговых диаграмм

1. Не добавляйте слишком много категорий, чтобы разница между срезами была хорошо заметна.

2. Убедитесь, что общая сумма всех частей составляет 100%.

3. Необходимо упорядочить части в соответствии с их размером.

Инфографика Top Lead для компании Baker Tilly. Посмотреть в полном размере.

Диаграмма-водопад

Диаграмма-водопад используется для демонстрации того, как промежуточные значения — положительные и отрицательные — влияют на изначальное значение и приводят к окончательному результату. Примером может служить визуализация того, как общий доход компании зависит от различных отделов и превращается в конкретный объем прибыли.

Инфографика и верстка — Top Lead. Годовой отчет «Нафтогаз України». Диаграмма-водопад в верхней половине верстки. Посмотреть в полном размере. 

Рекомендации по дизайну для водопадных диаграмм

1. Используйте контрастные цвета, чтобы выделить различия в наборах данных.

2. Выбирайте теплые цвета, чтобы показать рост, и холодные цвета — для падения.

Воронкообразная диаграмма

Диаграмма-воронка отображает последовательность этапов и скорость завершения каждого из них. Ее можно использовать для отслеживания процесса продаж или взаимодействия пользователей с сайтом.

Инфографика Top Lead.

Рекомендации по дизайну для воронкообразных диаграмм

1. Масштабируйте размер каждой секции, чтобы точно отобразить объем набора данных.

2. Используйте контрастные цвета или оттенки одного цвета от самого темного до самого светлого по мере сужения воронки.

Есть еще несколько видов графиков — они используются не так часто, но тоже могут пригодиться для визуализации болььших объемов данных. Среди них:

Точечная диаграмма

Точечная диаграмма показывает взаимосвязь между двумя различными переменными или демонстрирует распределяющие тенденции. Она подходит, если у вас много разных точечных данных, и вы хотите найти общее в наборе данных. Такая визуализация хорошо работает в поиске исключений или закономерности распределения данных.

Рекомендации по дизайну для точечных диаграмм

1. Включите больше переменных, таких как разные размеры, чтобы объединить больше данных.

2. Начните ось Y с 0 для точного распределения данных.

3. Если вы используете линии тенденций, необходимо ограничиться максимум двумя, чтобы график был понятен.

Пузырьковая диаграмма

Пузырьковая диаграмма похожа на точечный график. Но только в том смысле, что она может показывает распределение и взаимосвязь. Существует третий набор данных, который обозначается размером круга.

Рекомендации по дизайну для пузырьковых диаграмм

1. Проводите градацию пузырьков по занимаемой ими площади, а не по диаметру.

2. Убедитесь, что метки четкие и хорошо видны.

3. Используйте только круги.

Шкала со значениями

Такой график показывает прогресс в достижении цели, сравнивает его по разным критериям и отображает результат как рейтинг или производительность.

Рекомендации по разработке дизайна для шкалы со значениями

1. Используйте контрастные цвета, чтобы показать динамику.

2. Используйте один цвет в разных оттенках для оценки прогресса.

Тепловая карта

Тепловая карта показывает взаимосвязь между двумя элементами и предоставляет рейтинговую информацию. Информация о рейтинге отображается с использованием различных цветов или разной насыщенности.

Рекомендации по разработке дизайна для тепловой карты

1. Используйте базовый и четкий план карты, чтобы не отвлекать зрителей от данных.

2. Используйте разные оттенки одного цвета, чтобы показать изменения.

3. Избегайте использования нескольких шаблонов.

 

Вариантов дизайна может быть огромное количество.

Чтобы узнать больше о подготовке нефинансовых отчетов и послушать кейсы таких компаний как Coca-Cola, Kernel, Нова Пошта, 1+1 Media, Infopulse и других, регистрируйтесь на нашу онлайн-конференцию Corporate Reporting Conference 2020. Жмите на баннер, чтобы узнать подробности, а  билеты покупайте прямо в Фейсбуке:

Что такое гистограммы? Анализ и распределение частот


Ищете более качественные инструменты?

Попробуйте «Планируй-Выполняй-Учеба-Действуй» (PDSA) Plus QTools ™ Training:

Глоссарий качества Определение: гистограмма

Частотное распределение показывает, как часто встречается каждое отдельное значение в наборе данных. Гистограмма — это наиболее часто используемый график для отображения частотного распределения. Это очень похоже на гистограмму, но между ними есть важные различия.Этот полезный инструмент для сбора и анализа данных считается одним из семи основных инструментов качества.

Когда использовать гистограмму

Используйте гистограмму, когда:

  • Данные числовые
  • Вы хотите увидеть форму распределения данных, особенно при определении того, примерно нормально ли распределяются выходные данные процесса.
  • Анализ соответствия процесса требованиям заказчика
  • Анализируя, как выглядит результат процесса поставщика
  • Проверка того, произошло ли изменение процесса с одного периода времени на другой
  • Определение того, являются ли выходные данные двух или более процессов разными
  • Вы хотите быстро и легко сообщать другим о распределении данных

Пример гистограммы

Как создать гистограмму

  1. Соберите не менее 50 последовательных точек данных из процесса.
  2. Используйте рабочий лист гистограммы , чтобы настроить гистограмму. Это поможет вам определить количество полосок, диапазон чисел, которые входят в каждую полосу, и метки для краев полос. Вычислив Вт и на шаге 2 рабочего листа, используйте свое суждение, чтобы отрегулировать его до удобного числа. Например, вы можете округлить 0,9 до 1,0. Значение W не должно иметь больше десятичных знаков, чем числа, которые вы будете отображать на графике.
  3. Нарисуйте оси X и Y на миллиметровой бумаге.Отметьте и подпишите ось Y для подсчета значений данных. Отметьте и пометьте ось x значениями L из рабочего листа. Пробелы между этими числами будут столбиками гистограммы. Не допускайте промежутков между стержнями.
  4. Для каждой точки данных отметьте один отсчет над соответствующей полосой знаком X или заштриховав эту часть полосы.

Анализ гистограммы

  • Прежде чем делать какие-либо выводы из вашей гистограммы, убедитесь, что процесс работал нормально в течение исследуемого периода времени.Если какие-либо необычные события повлияли на процесс в течение периода времени гистограммы, ваш анализ формы гистограммы, вероятно, не может быть обобщен на все периоды времени.
  • Проанализируйте значение формы вашей гистограммы. Ниже описаны типичные формы гистограмм и их значение.

Инструменты и шаблоны гистограмм

Шаблон гистограммы (Excel) Анализируйте частотное распределение до 200 точек данных, используя этот простой, но мощный инструмент для создания гистограмм.

Шаблон контрольного листа (Excel) Анализируйте количество дефектов на каждый день недели. Начните с отслеживания дефектов на контрольном листе. Инструмент создаст гистограмму, используя введенные вами данные.

Нормальное распределение

Распространенным паттерном является колоколообразная кривая, известная как «нормальное распределение». При нормальном или «типичном» распределении точки могут встречаться как на одной стороне среднего, так и на другой. Обратите внимание, что другие распределения похожи на нормальное распределение.Для доказательства нормального распределения необходимо использовать статистические расчеты.

Важно отметить, что «нормальный» относится к типичному дистрибутиву для конкретного процесса. Например, у многих процессов есть естественный предел с одной стороны, и они будут давать искаженные распределения. Это нормально — то есть типично — для этих процессов, даже если распределение не считается «нормальным».

Асимметричное распределение

Асимметричное распределение асимметрично, потому что естественный предел предотвращает результаты с одной стороны.Пик распределения смещен от центра к пределу, а хвост тянется от него. Например, распределение анализов очень чистого продукта будет искажено, потому что продукт не может быть чистым более чем на 100 процентов. Другими примерами естественных ограничений являются отверстия, которые не могут быть меньше диаметра бурового долота, или время обработки вызовов, которое не может быть меньше нуля. Эти распределения называются скошенными вправо или влево в зависимости от направления хвоста.

Двухпиковый или бимодальный

Бимодальное распределение похоже на спину двугорбого верблюда.Результаты двух процессов с разными распределениями объединяются в один набор данных. Например, распределение производственных данных при работе в две смены может быть двухрежимным, если каждая смена дает различное распределение результатов. Стратификация часто выявляет эту проблему.

Плато или мультимодальное распределение

Плато можно назвать «мультимодальным распределением». Объединены несколько процессов с нормальным распределением. Поскольку имеется много пиков, расположенных близко друг к другу, вершина распределения напоминает плато.

Распределение пиков по краю

Распределение краевых пиков похоже на нормальное распределение, за исключением того, что у него есть большой пик на одном конце. Обычно это вызвано ошибочным построением гистограммы, когда данные сгруппированы в группу с пометкой «больше чем».

Распределение гребней

При гребенчатом распределении стержни бывают попеременно высокими и короткими. Такое распределение часто является результатом округленных данных и / или неправильно построенной гистограммы.Например, данные о температуре, округленные до ближайших 0,2 градуса, покажут форму гребня, если ширина полосы для гистограммы составляет 0,1 градуса.

Усеченное распределение или распределение по центру

Усеченное распределение выглядит как нормальное распределение с обрезанными хвостами. Поставщик может производить нормальное распределение материала, а затем полагаться на инспекцию, чтобы отделить то, что находится в пределах спецификации, от того, что не соответствует спецификации. В результате поставки клиенту изнутри спецификации — это сердце.

Раздача кормов для собак

В раздаче корма для собак чего-то не хватает — результаты близки к средним. Если покупатель получает такое распределение, то кому-то другому достается сердце, а покупателю остается «собачий корм» — мелочи, оставшиеся после трапезы хозяина. Несмотря на то, что то, что получает заказчик, находится в пределах спецификаций, продукт распадается на два кластера: один находится рядом с верхним пределом спецификации, а другой — рядом с нижним пределом спецификации.Этот вариант часто вызывает проблемы в работе клиента.

Адаптировано из The Quality Toolbox, Second Edition , ASQ Quality Press.

Определение гистограммы

Что такое гистограмма?

Гистограмма — это графическое представление, которое упорядочивает группу точек данных в определенные пользователем диапазоны. По внешнему виду похожая на гистограмму, гистограмма уплотняет ряд данных в легко интерпретируемый визуальный элемент, беря множество точек данных и группируя их в логические диапазоны или интервалы.

Ключевые выводы

  • Гистограмма — это представление данных в виде гистограммы, которое объединяет диапазон результатов в столбцы по оси x.
  • Ось Y представляет количество или процент вхождений в данные для каждого столбца и может использоваться для визуализации распределения данных.
  • В торговле гистограмма MACD используется техническими аналитиками для обозначения изменений импульса.

Как работают гистограммы

Гистограммы обычно используются в статистике, чтобы продемонстрировать, сколько переменных определенного типа встречается в определенном диапазоне.Например, перепись населения, ориентированная на демографию страны, может использовать гистограмму, чтобы показать, сколько людей находится в возрасте от 0 до 10, от 11 до 20, 21-30, 31-40, 41-50 и т. Д. Эта гистограмма будет выглядеть аналогично приведенному ниже примеру.

Аналитик может настраивать гистограммы несколькими способами. Первый — изменить интервал между ведрами. В приведенном выше примере есть 5 сегментов с интервалом в десять. Это можно было бы изменить, например, на 10 сегментов с интервалом 5.

Другое соображение — как определить ось y. Самая простая метка — использовать частоту встречаемости, наблюдаемую в данных, но вместо этого можно также использовать процент от общего количества или плотность.

Изображение Джули Банг © Investopedia 2019

Гистограммы и гистограммы

И гистограммы, и гистограммы обеспечивают визуальное отображение с использованием столбцов, и люди часто используют эти термины как синонимы. С технической точки зрения гистограмма представляет собой частотное распределение переменных в наборе данных.С другой стороны, гистограмма обычно представляет собой графическое сравнение дискретных или категориальных переменных.

Пример: гистограмма MACD

Технические трейдеры могут быть знакомы с гистограммой расхождения конвергенции скользящих средних (MACD), популярным техническим индикатором, который показывает разницу между линией MACD и сигнальной линией.

Например, если разница между двумя линиями составляет 5 долларов, гистограмма MACD графически представляет эту разницу.Гистограмма MACD нанесена на график, чтобы трейдеру было легко определить импульс конкретной ценной бумаги.

Полоса гистограммы является положительной, когда линия MACD находится выше сигнальной линии, и отрицательной, когда линия MACD находится ниже сигнальной линии. Возрастающая гистограмма MACD указывает на увеличение восходящего импульса, в то время как убывающая гистограмма используется для обозначения нисходящего импульса.

Торговля с гистограммой MACD

Трейдеры часто упускают из виду гистограмму MACD при использовании этого индикатора для принятия торговых решений.Слабость использования индикатора MACD в его традиционном понимании, когда линия MACD пересекает сигнальную линию, заключается в том, что торговый сигнал отстает от цены. Поскольку две линии являются скользящими средними, они не пересекаются до тех пор, пока не произойдет движение цены. Это означает, что трейдеры отказываются от части этого начального движения.

Гистограмма MACD помогает решить эту проблему, генерируя более ранние сигналы входа. Трейдеры могут отслеживать длину столбцов гистограммы по мере их удаления от нулевой линии.Индикатор генерирует торговый сигнал, когда полоса гистограммы короче предыдущей. Как только меньшая полоса гистограммы завершается, трейдеры открывают позицию в направлении снижения гистограммы.

Другие технические индикаторы следует использовать вместе с гистограммой MACD, чтобы повысить надежность сигнала. Более того, трейдеры должны разместить стоп-лосс, чтобы закрыть сделку, если цена ценной бумаги не изменится, как ожидалось.

Гистограмм

Гистограмма : графическое отображение данных с использованием полос разной высоты.

Это похоже на гистограмму, но гистограмма группирует числа в диапазонов .

Высота каждой полосы показывает, сколько человек попадает в каждый диапазон.

А какие диапазоны использовать — решать вам!

Пример: высота апельсиновых деревьев

Вы измеряете высоту каждого дерева в саду в сантиметрах (см)

Высота от 100 см до 340 см

Вы решаете разделить результаты на группы по 50 см:

  • От 100 до чуть менее 150 см Диапазон ,
  • Модель от 150 до чуть менее 200 см Диапазон ,
  • и др…

Итак, дерево высотой 260 см добавляется к диапазону «250-300».

А вот результат:

Вы можете видеть (например), что существует 30 деревьев от 150 см до чуть менее 200 см высотой

(PS: вы можете создавать подобные графики, используя Make your own Histogram)

Обратите внимание, что горизонтальная ось непрерывна, как числовая линия:

Пример: Сколько растет этот щенок?

Каждый месяц вы измеряете, сколько веса набрал ваш щенок, и получаете следующие результаты:

0.5, 0,5, 0,3, -0,2, 1,6, 0, 0,1, 0,1, 0,6, 0,4

Они варьируются от -0,2 (щенок похудел в этом месяце) до 1,6

Упорядочить от наименьшего к наибольшему приросту веса:

−0,2, 0, 0,1, 0,1, 0,3, 0,4, 0,5, 0,5, 0,6, 1,6

Вы решаете разделить результаты на группы по 0,5:

  • Диапазон от −0,5 до чуть ниже 0 ,
  • Диапазон от 0 до чуть ниже 0,5 ,
  • и др…

А вот результат:

(Нет значений от 1 до чуть ниже 1,5, но мы все равно показываем пространство.)

Диапазон каждого столбца также называется интервалом класса

В приведенном выше примере интервал каждого класса равен 0,5

Гистограммы

— отличный способ показать результаты непрерывных данных, например:

  • вес
  • высота
  • сколько времени
  • и др.

Но когда данные находятся в категориях (таких как Страна или Любимый фильм), мы должны использовать гистограмму.

Частотная гистограмма

Гистограмма частот — это специальный график, который использует вертикальные столбцы для отображения частот (сколько раз встречается каждая оценка):

Здесь я сложил, как часто встречается 1 (2 раза),
, как часто встречается 2 (5 раз) и т. Д.,
и показал их в виде гистограммы.

гистограмм — понимание свойств гистограмм, что они показывают, а также когда и как их использовать

гистограммы — понимание свойств гистограмм, что они показывают, а также когда и как их использовать | Статистика Лаэрд

Что такое гистограмма?

Гистограмма — это график, который позволяет обнаружить и показать основное частотное распределение (форму) набора непрерывных данных.Это позволяет проверять данные на предмет их основного распределения (например, нормального распределения), выбросов, асимметрии и т. Д. Пример гистограммы и необработанных данных, из которых она была построена, показаны ниже:

36 25 38 46 55 68 72 55 36 38
67 45 22 48 91 46 52 61 58 55

Как построить гистограмму из непрерывной переменной?

Чтобы построить гистограмму из непрерывной переменной, сначала необходимо разбить данные на интервалы, называемые бинами .В приведенном выше примере возраст был разделен на интервалы, причем каждый интервал представляет собой 10-летний период, начинающийся с 20 лет. Каждая ячейка содержит количество вхождений оценок в наборе данных, содержащихся в этой ячейке. Для указанного выше набора данных частоты в каждом интервале сведены в таблицу вместе с оценками, которые способствовали увеличению частоты в каждом интервале (см. Ниже):

Бункер Частота Баллы включены в корзину
20-30 2 25,22
30-40 4 36,38,36,38
40-50 4 46,45,48,46
50-60 5 55,55,52,58,55
60-70 3 68,67,61
70-80 1 72
80-90 0
90-100 1 91

Обратите внимание, что, в отличие от гистограммы, между столбцами нет «промежутков» (хотя некоторые столбцы могут «отсутствовать», не отражая частот).Это связано с тем, что гистограмма представляет собой непрерывный набор данных, и поэтому в данных нет пробелов (хотя вам придется решить, округлять ли вы оценки в большую или меньшую сторону на границах бинов).

Выбор правильной ширины бункера

Нет правильного или неправильного ответа на вопрос, какой ширины должна быть корзина, но есть практические правила. Вы должны следить за тем, чтобы мусорные ведра не были слишком маленькими или слишком большими. Рассмотрим гистограмму, которую мы создали ранее (см. Выше): следующие гистограммы используют те же данные, но имеют либо гораздо меньшие, либо большие интервалы, как показано ниже:

Из гистограммы слева видно, что ширина бина слишком мала, потому что она показывает слишком много отдельных данных и не позволяет легко увидеть базовый шаблон (частотное распределение) данных.На другом конце шкалы находится диаграмма справа, где интервалы слишком велики, и мы снова не можем найти основную тенденцию в данных.

Гистограммы основаны на площади, а не на высоте столбцов

На гистограмме это область полосы, которая указывает частоту появления для каждого интервала. Это означает, что высота полосы не обязательно указывает, сколько вхождений оценок было в каждой отдельной ячейке. Это произведение высоты, умноженное на ширину интервала, которое указывает частоту появления в этом интервале.Одна из причин того, что высота полосок часто неправильно оценивается как показывающая частоту, а не площадь полосы, связана с тем, что многие гистограммы часто имеют одинаково расположенные полосы (интервалы), и в этих обстоятельствах высота бина отражает частоту.

В чем разница между столбчатой ​​диаграммой и гистограммой?

Основное отличие состоит в том, что гистограмма используется только для отображения частоты появления оценок в непрерывном наборе данных, который был разделен на классы, называемые ячейками.С другой стороны, гистограммы могут использоваться для множества других типов переменных, включая порядковые и номинальные наборы данных.

Главная О нас Связаться с нами Положения и условия Конфиденциальность и файлы cookie © Lund Research Ltd, 2018

Примеры, типы и способы построения гистограмм

Что такое гистограмма?

Гистограмма используется для суммирования дискретных или непрерывных данных. Другими словами, он обеспечивает визуальную интерпретацию данных. Представление данных аналитикам необходимо для эффективной передачи результатов финансового анализа руководству, инвесторам и деловым партнерам.числовых данных, показывая количество точек данных, попадающих в указанный диапазон значений (называемых «ячейками»). Он похож на вертикальную гистограмму. Однако гистограмма, в отличие от вертикальной гистограммы, не показывает промежутков между столбцами.

Части гистограммы

  1. Заголовок: Заголовок описывает информацию, содержащуюся в гистограмме.
  2. Ось X: Ось X — это интервалы, показывающие шкалу значений, под которую попадают измерения.
  3. Ось Y: Ось Y показывает, сколько раз значения встречались в пределах интервалов, установленных осью X.
  4. Полосы: Высота полосы показывает, сколько раз значения встречались в пределах интервала, а ширина полосы показывает покрытый интервал. Для гистограммы с одинаковыми ячейками ширина должна быть одинаковой для всех столбцов.

Важность гистограммы

Создание гистограммы обеспечивает визуальное представление распределения данных.Гистограммы могут отображать большой объем данных и функцию частоты. Функция частоты. Функция частоты относится к категории статистических функций Excel. Функция рассчитает и вернет частотное распределение. Мы можем использовать его, чтобы получить частоту значений в наборе данных. значений данных. Функция medianMEDIAN Функция MEDIAN относится к категории статистических функций Excel. Функция вычислит среднее значение заданного набора чисел. Медиана может быть определена как среднее число группы чисел.То есть половина чисел возвращает значения, которые больше медианы, и распределение данных можно определить с помощью гистограммы. Кроме того, он может отображать любые выбросы или пробелы в данных.

Распределения гистограммы

Нормальное распределение: В нормальном распределении точки на одной стороне от среднего Функция AVERAGE Вычислить среднее значение в Excel. Функция СРЕДНИЙ относится к Статистическим функциям. Он вернет среднее значение аргументов.Он используется для вычисления среднего арифметического заданного набора аргументов. Финансовому аналитику эта функция полезна для определения среднего числа. с такой же вероятностью, как и на другой стороне среднего.

Бимодальное распределение: В бимодальном распределении есть два пика. При бимодальном распределении данные следует разделять и анализировать как отдельные нормальные распределения.

Распределение со смещением вправо: Распределение со смещением вправо также называется положительно наклонным распределением.В распределении со смещением вправо большое количество значений данных находится слева, а меньшее количество значений данных — справа. Распределение с перекосом вправо обычно возникает, когда данные имеют границу диапазона в левой части гистограммы. Например, граница 0.

Скошенное влево распределение: Скошенное влево распределение также называется отрицательно скошенным распределением. В распределении со смещением влево большое количество значений данных находится справа, а меньшее количество значений данных — слева.Распределение с перекосом вправо обычно возникает, когда данные имеют границу диапазона в правой части гистограммы. Например, граница, такая как 100.

Случайное распределение: Случайное распределение не имеет видимой закономерности и имеет несколько пиков. В гистограмме случайного распределения может быть случай, когда были объединены разные свойства данных. Поэтому данные следует разделять и анализировать отдельно.

Пример гистограммы

Джефф — менеджер филиала в местном банке. Недавно Джефф получил отзывы клиентов, в которых говорилось, что время ожидания обслуживания клиента представителем службы поддержки слишком велико. Джефф решает наблюдать и записывать время, потраченное каждым клиентом на ожидание. Вот его результаты наблюдения и записи времени ожидания, потраченного 20 клиентами:

Соответствующая гистограмма с 5-секундными ячейками (5-секундные интервалы) будет выглядеть следующим образом:

Мы видим, что:

  • Есть 3 клиента ожидают между 1 и 35 секунд
  • Есть 5 клиентов ожидают между 1 и 40 секундами
  • Есть 5 клиентов ожидающих между 1 и 45 секунд
  • Есть 5 клиентов ждут между 1 и 50 секунд
  • Есть 2 клиента ждут между 1 и 55 секундами

Джефф может сделать вывод, что большинство клиентов ждут между 35.1 и 50 секунд.

Как создать гистограмму

Давайте создадим нашу собственную гистограмму. Загрузите соответствующий файл шаблона Excel для этого примера.

Шаг 1: Откройте окно анализа данных. Это можно найти на вкладке Data как Data Analysis :

Шаг 2: Выбрать Гистограмма :

Введите соответствующий шаг диапазон ввода и диапазон бункера.В этом примере диапазоны должны быть:

  • Диапазон ввода: $ C $ 10: $ D $ 19
  • Диапазон ячеек: $ F $ 9: $ F $ 24

Убедитесь, что «Вывод диаграммы» установлен и нажмите «ОК».

Загрузите пример шаблона, чтобы создать его самостоятельно!

Ссылки по теме

CFI является официальным поставщиком услуг глобального финансового моделирования и оценки (FMVA) ™. Стать сертифицированным аналитиком финансового моделирования и оценки (FMVA) ® Сертификация CFI по финансовому моделированию и оценке (FMVA) ® поможет вы обретете необходимую уверенность в своей финансовой карьере.Запишитесь сегодня! программа сертификации, призванная помочь любому стать финансовым аналитиком мирового уровня. Чтобы продолжить продвижение по карьерной лестнице, вам будут полезны следующие дополнительные ресурсы CFI:

  • Типы графиков в ExcelТипы графиковСверху 10 типов графиков для представления данных, которые вы должны использовать — примеры, советы, форматирование, способы их использования для эффективного общения и в презентациях.
  • Создание информационной панели в ExcelВ
  • Ярлыки Excel Ярлыки ПК и MacExcel Ярлыки MacExcel ПК — Список наиболее важных и распространенных ярлыков MS Excel для пользователей ПК и Mac, специалистов в области финансов и бухгалтерского учета. Сочетания клавиш ускоряют ваши навыки моделирования и экономят время. Изучите редактирование, форматирование, навигацию, ленту, специальную вставку, манипулирование данными, редактирование формул и ячеек и другие краткие сведения.
  • Список функций Excel ФункцииСписок наиболее важных функций Excel для финансовых аналитиков.Эта шпаргалка охватывает 100 функций, которые критически важно знать аналитику Excel

Полное руководство по гистограммам

Что такое гистограмма?

Гистограмма — это диаграмма, на которой показано распределение значений числовой переменной в виде серии столбцов. Каждая полоса обычно охватывает диапазон числовых значений, называемых ячейкой или классом; высота столбца указывает частоту точек данных со значением в соответствующем интервале.

Гистограмма выше показывает частотное распределение времени до ответа на билеты, отправленные в вымышленную систему поддержки.Каждая полоса охватывает один час времени, а высота указывает количество билетов в каждом временном диапазоне. Мы видим, что наибольшая частота ответов была в диапазоне 2-3 часов, с более длинным хвостом справа, чем слева. Также есть холм поменьше, пик (режим) которого находится в диапазоне 13-14 часов. Если бы мы смотрели только на числовую статистику, такую ​​как среднее значение и стандартное отклонение, мы могли бы упустить тот факт, что эти два пика способствовали общей статистике.

Когда следует использовать гистограмму

Гистограммы хорошо показывают общие особенности распределения переменных набора данных.Вы можете примерно увидеть, где находятся пики распределения, является ли распределение асимметричным или асимметричным, и есть ли какие-либо выбросы.

Чтобы использовать гистограмму, нам просто нужна переменная, которая принимает непрерывные числовые значения. Это означает, что различия между значениями постоянны независимо от их абсолютных значений. Например, даже если оценка за тест может принимать только целые значения от 0 до 100, пробел того же размера имеет одинаковое значение независимо от того, где мы находимся на шкале: разница между 60 и 65 — это те же 5 баллов. размер как разница между 90 и 95.

Информация о количестве бинов и их границах для подсчета точек данных не присуща самим данным. Вместо этого настройка интервалов — это отдельное решение, которое мы должны принять при построении гистограммы. Как будет показано ниже, способ, которым мы укажем интервалы, будет иметь большое влияние на то, как можно интерпретировать гистограмму.

Когда значение находится на границе ячейки, оно будет последовательно назначаться ячейке справа или слева (или конечным ячейкам, если оно находится в конечных точках).Какая сторона будет выбрана, зависит от инструмента визуализации; у некоторых инструментов есть возможность переопределить их настройки по умолчанию. В этой статье предполагается, что значения на границе ячейки будут присвоены ячейке справа.

Пример структуры данных

Одним из способов работы инструментов визуализации с данными, которые должны быть визуализированы в виде гистограммы, является обобщенная форма, подобная приведенной выше. Здесь первый столбец указывает границы интервала, а второй — количество наблюдений в каждом интервале.В качестве альтернативы некоторые инструменты могут просто работать с исходным неагрегированным столбцом данных, а затем применять к данным указанные параметры разделения при создании гистограммы.

Лучшие практики использования гистограммы

Используйте нулевой базовый показатель

Важным аспектом гистограмм является то, что они должны быть построены с нулевым значением базовой линии. Поскольку частота данных в каждой ячейке подразумевается высотой каждой полосы, изменение базовой линии или введение разрыва в шкале исказит восприятие распределения данных.

Если отсечь 80 баллов от вертикальной оси, распределение оценок производительности будет выглядеть намного лучше, чем есть на самом деле.
Выберите подходящее количество ячеек

Хотя инструменты, которые могут генерировать гистограммы, обычно имеют некоторые алгоритмы по умолчанию для выбора границ интервалов, вы, вероятно, захотите поиграть с параметрами интервалов, чтобы выбрать что-то, что является репрезентативным для ваших данных. В Википедии есть обширный раздел, посвященный практическим правилам выбора подходящего количества ящиков и их размеров, но в конечном итоге стоит использовать знания предметной области, а также изрядно поиграть с различными вариантами, чтобы узнать, что лучше всего подойдет для ваших целей.

Выбор размера ящика имеет обратную зависимость от количества ячеек. Чем больше размер ячеек, тем меньше ячеек будет для охвата всего диапазона данных. Чем меньше размер ящика, тем больше ящиков потребуется. Стоит потратить некоторое время на то, чтобы протестировать различные размеры бункеров, чтобы увидеть, как распределение выглядит в каждом из них, а затем выбрать график, который лучше всего представляет данные. Если у вас слишком много бинов, тогда распределение данных будет выглядеть грубым, и будет сложно отличить сигнал от шума.С другой стороны, при слишком малом количестве интервалов гистограмме будет не хватать деталей, необходимых для различения любого полезного паттерна из данных.

Бункеры на левой панели слишком малы, что подразумевает множество ложных пиков и впадин. Ячейки на правой панели слишком велики, что скрывает любые признаки второго пика.
Выбрать интерпретируемые границы ячеек

Деления и метки обычно должны попадать на границы ячейки, чтобы лучше информировать, где находятся пределы каждой полосы. Ярлыки не нужно устанавливать для каждой полосы, но их размещение между каждыми несколькими полосами помогает читателю отслеживать ценность.Кроме того, полезно, если метки представляют собой значения с небольшим количеством значащих цифр, чтобы их было удобно читать.

Это говорит о том, что ячейки размером 1, 2, 2,5, 4 или 5 (которые делят 5, 10 и 20 поровну) или их степень десяти являются хорошими размерами ячеек для начала, как правило. Это также означает, что ячейки размером 3, 7 или 9, вероятно, будут труднее читать, и их не следует использовать, если контекст не имеет для них смысла.

Вверху: небрежное разделение данных на десять ячеек от минимального до максимального может закончиться очень странным разделением ячеек.Внизу: требуется меньше делений, если размер бункера легко проследить.

Небольшое предостережение: убедитесь, что вы учитываете типы значений, которые принимает интересующая вас переменная. В случае дробного размера ячейки, например 2,5, это может быть проблемой, если ваша переменная принимает только целые значения. Бункер от 0 до 2,5 имеет возможность собирать три разных значения (0, 1, 2), но следующий интервал от 2,5 до 5 может собирать только два разных значения (3, 4-5 попадут в следующий интервал).Это означает, что ваша гистограмма может выглядеть неестественно «неровной» просто из-за количества значений, которые каждая ячейка может принимать.

На рисунке выше показано распределение результатов при суммировании результата пяти бросков кубика, повторенных 20 000 раз. Ожидаемая форма колокольчика выглядит остроконечной или однобокой, когда выбираются размеры бункера, которые отражают разное количество целочисленных результатов.

Распространенные ошибки

Измеряемая переменная не является непрерывной числовой

Как отмечалось в начальных разделах, гистограмма предназначена для изображения частотного распределения непрерывной числовой переменной.Когда интересующая нас переменная не соответствует этому свойству, нам нужно вместо этого использовать другой тип диаграммы: гистограмму. Переменная, которая принимает категориальные значения, такие как тип пользователя (например, гость, пользователь) или местоположение, явно не являются числовыми, и поэтому следует использовать гистограмму. Однако есть определенные типы переменных, которые может быть сложнее классифицировать: те, которые принимают дискретные числовые значения, и те, которые принимают значения, основанные на времени.

Переменные, которые принимают дискретные числовые значения (например, целые числа 1, 2, 3 и т. Д.) могут быть построены с помощью гистограммы или гистограммы, в зависимости от контекста. Использование гистограммы будет более вероятно, когда есть много разных значений для построения. Когда диапазон числовых значений велик, дискретность значений обычно не имеет значения, и хорошей идеей будет непрерывное группирование.

Одна важная вещь, о которой следует помнить, — это то, что числа являются репрезентативными для реальной стоимости. Если числа на самом деле являются кодами для категориальной или слабо упорядоченной переменной, то это признак того, что следует использовать гистограмму.Например, если у вас есть ответы на опрос по шкале от 1 до 5, значения кодирования от «полностью не согласен» до «полностью согласен», то частотное распределение должно быть визуализировано в виде гистограммы. Причина в том, что различия между отдельными ценностями могут быть непоследовательными: мы действительно не знаем, что значимая разница между 1 и 2 («категорически не согласен» — «не согласен») такая же, как разница между 2 и 3. («Не согласен» — «ни согласен, ни не согласен»).

Более сложный случай — это когда интересующая нас переменная зависит от времени.Когда значения соответствуют относительным периодам времени (например, 30 секунд, 20 минут), тогда имеет смысл разбиение по периодам времени для гистограммы. Однако, когда значения соответствуют абсолютному времени (например, 10 января, 12:15), различие становится нечетким. Когда записываются новые точки данных, значения обычно попадают во вновь созданные ячейки, а не в существующий диапазон ячеек. Кроме того, некоторые варианты естественной группировки, например, по месяцам или кварталам, приводят к несколько неравным размерам ячеек. По этим причинам нет ничего необычного в использовании другого типа диаграммы, например гистограммы или линейной диаграммы.

Использование бункеров разного размера

Хотя до сих пор во всех примерах гистограммы были показаны с использованием интервалов одинакового размера, на самом деле это не является техническим требованием. Когда данных мало, например, когда есть длинный хвост данных, может прийти в голову идея использовать бункеры большей ширины, чтобы покрыть это пространство. Однако создание гистограммы с ячейками неравного размера не является ошибкой, но для этого требуются некоторые серьезные изменения в том, как создается гистограмма, и это может вызвать множество трудностей при интерпретации.

Техническая особенность гистограмм заключается в том, что общая площадь полосок представляет собой целое, а площадь, занимаемая каждой полосой, представляет собой долю целого, содержащегося в каждой ячейке. Когда размеры бункера совпадают, это делает измерение площади стержня и высоты эквивалентным. Однако в гистограмме с переменными размерами ячеек высота больше не может соответствовать общей частоте появления. Это исказит представление о том, сколько точек находится в каждой ячейке, поскольку увеличение размера ячейки только увеличивает ее размер.На центральном графике рисунка ниже интервалы 5-6, 6-7 и 7-10 выглядят так, как будто они содержат больше точек, чем на самом деле.

Слева: гистограмма с ячейками одинакового размера; В центре: гистограмма с неравными интервалами, но неправильными единицами измерения по вертикальной оси; Справа: гистограмма с неравными ячейками с высотой плотности

Вместо этого по вертикальной оси необходимо кодировать частоту , плотность на единицу размера ячейки. Например, на правой панели рисунка выше корзина 2–2,5 имеет высоту около 0.32. Умножьте на ширину бина 0,5, и мы сможем оценить около 16% данных в этом бункере. Высота более широких интервалов была уменьшена по сравнению с центральной панелью: обратите внимание, как общая форма выглядит похожей на исходную гистограмму с одинаковыми размерами интервалов. Плотность — непростая концепция для понимания, и такой сюжет, представленный другим, незнакомым с концепцией, будет трудно интерпретировать его.

Из-за всего этого лучший совет — попробовать и просто придерживаться абсолютно одинаковых размеров бункеров.Наличие пустых интервалов и некоторого повышенного шума в диапазонах с разреженными данными обычно стоит повышения интерпретируемости вашей гистограммы. С другой стороны, если есть неотъемлемые аспекты переменной, которые должны быть нанесены на график, которые предполагают неравномерные размеры ячеек, тогда вместо использования гистограммы с неравномерными ячейками вам может быть лучше использовать гистограмму.

Общие параметры гистограммы

Абсолютная частота в зависимости от относительной частоты

В зависимости от целей вашей визуализации вы можете изменить единицы на вертикальной оси графика как абсолютную или относительную частоту.Абсолютная частота — это просто естественное количество появлений в каждом интервале, а относительная частота — это пропорция появлений в каждом интервале. Выбор единиц оси будет зависеть от того, какие виды сравнений вы хотите выделить при распределении данных.

Преобразуя первый пример в относительную частоту, гораздо проще сложить первые пять полосок и обнаружить, что примерно на половину заявок отвечает в течение пяти часов.
Отображение неизвестных или отсутствующих данных

На самом деле это , а не , особенно распространенный вариант, но его стоит рассмотреть, когда дело доходит до настройки ваших графиков.Если в строке данных отсутствует значение интересующей переменной, оно часто пропускается в подсчете для каждой ячейки. Если важно показать количество пропущенных или неизвестных значений, вы можете объединить гистограмму с дополнительной полосой, которая отображает частоту этих неизвестных. При построении этого столбца рекомендуется разместить его на оси, параллельной основной гистограмме, и другим нейтральным цветом, чтобы точки, собранные на этом столбце, не были перепутаны с числовым значением.

Смежные участки

Гистограмма

Как отмечалось выше, если интересующая нас переменная не является непрерывной и числовой, а дискретна или категориальна, то вместо этого нам понадобится столбиковая диаграмма. В отличие от гистограммы, столбцы на гистограмме обычно имеют небольшой промежуток между собой: это подчеркивает дискретный характер отображаемой переменной.

Линейный график

Если у вас есть групповые числовые данные, но вы хотите, чтобы вертикальная ось вашего графика передавала что-то, кроме частотной информации, вам следует обратить внимание на использование линейной диаграммы.Вертикальное положение точек на линейной диаграмме может отображать значения или статистические сводки второй переменной. Когда линейная диаграмма используется для изображения частотных распределений, таких как гистограмма, это называется частотным многоугольником .

Кривая плотности

Кривая плотности или оценка плотности ядра (KDE) — это альтернатива гистограмме, которая дает каждой точке данных непрерывный вклад в распределение. На гистограмме вы можете представить себе каждую точку данных как переливание жидкости из ее значения в ряд цилиндров ниже (бункеры).В KDE каждая точка данных добавляет небольшой кусок объема вокруг своего истинного значения, который складывается по точкам данных для создания окончательной кривой. Форма объема — это «ядро», и существует безграничный выбор. Из-за огромного количества опций при выборе ядра и его параметров кривые плотности обычно являются областью программных средств визуализации.

Толстыми черными штрихами обозначены точки данных, которые влияют на гистограмму (слева) и кривую плотности (справа).Обратите внимание на то, как каждая точка вносит свой вклад в общую форму маленькой колоколообразной кривой.
Коробчатый сюжет и скрипичный сюжет

Гистограммы хорошо показывают распределение одной переменной, но довольно сложно провести сравнение между гистограммами, если мы хотим сравнить эту переменную между разными группами. Одним из возможных решений для двух групп является построение гистограмм двух групп подряд. Специфической версией этого типа графика является пирамида населения , которая отображает возрастное распределение страны или другого региона для мужчин и женщин в виде вертикальных гистограмм.

Однако, если у нас есть три или более групп, последовательное решение не сработает. Одним из решений может быть создание фасетных гистограмм, построение по одной для каждой группы в строке или столбце. Другой альтернативой является использование другого типа сюжета, такого как коробчатый сюжет или сюжет для скрипки. Оба этих типа графиков обычно используются, когда мы хотим сравнить распределение числовой переменной по уровням категориальной переменной. По сравнению с фасетными гистограммами эти графики торгуют точным отображением абсолютной частоты для более компактного относительного сравнения распределений.

Как довольно распространенный тип визуализации, большинство инструментов, способных создавать визуализации, имеют гистограмму в качестве опции. Если гистограмма недоступна, гистограмма должна быть доступна в качестве близкого заменителя. Создание гистограммы может потребовать немного больше работы, чем другие базовые типы диаграмм, из-за необходимости тестирования различных вариантов разбиения, чтобы найти лучший вариант. Однако эти усилия часто того стоят, поскольку хорошая гистограмма может быть очень быстрым способом точной передачи общей формы и распределения переменной данных.

Гистограмма — это один из множества различных типов диаграмм, которые можно использовать для визуализации данных. Узнайте больше из наших статей об основных типах диаграмм, о том, как выбрать тип визуализации данных, или просмотрев полную коллекцию статей в категории диаграмм.

Гистограмма

: построение диаграммы за простые шаги


Состав:

См. Также: Гистограмма Excel

Посмотрите видео, чтобы узнать, как построить гистограмму вручную:


Не можете посмотреть видео? Кликните сюда.

Гистограммы похожи на гистограммы; они позволяют отображать количество данных. Гистограмма показывает фактическое количество по категориям; Высота полосы указывает количество элементов в этой категории. Гистограмма отображает те же категориальные переменные в «ячейках».

Бункер показывает, сколько точек данных находится в пределах диапазона (интервала). Обычно вы выбираете диапазон, который лучше всего соответствует вашим данным. не существует установленных правил о том, сколько ящиков вы можете иметь, но эмпирическое правило — 5-20 ячеек.Если больше 20 ячеек, ваш график будет трудно читать. Менее 5 ячеек, и ваш график будет иметь мало значения (если вообще будет). Большинство графиков, которые вы создадите в элементарной статистике, будут иметь от 5 до 7 ячеек.

График с 5 ячейками


Слишком много ячеек.

Еще одно практическое правило для ячеек состоит в том, что если значение попадает в две ячейки, поместите ее в верхнюю ячейку. Например, если вы составляете гистограмму возрастов и ваши ячейки включают 40-42 и 42-44, участник 42 лет должен быть помещен в ячейку 42-44.


Что означает высота столбца на гистограмме?

В отличие от гистограммы, область столбца гистограммы представляет частоту, а не высоту. Частота вычисляется путем умножения ширины ячейки на высоту. Высота полосы на гистограмме указывает частоту (количество) , только если ширина интервалов равномерно распределена. Например, если вы наносите на график магнитуды землетрясений, а ваши интервалы составляют 3-5, 5-7 и 7-9, каждый интервал располагается на расстоянии двух чисел друг от друга, поэтому высота столбца будет равна частоте.Однако не всегда гистограммы содержат четные интервалы. Когда гистограмма имеет неровные ячейки, высота не равна частоте.

Гистограмма с неравномерными ячейками (высота НЕ указывает частоту).


Вернуться к началу

Изображение: Справочник EDA


Бигистограмма — это график, составленный из двух гистограмм («bi» = два) в противоположных направлениях. Одна гистограмма находится над осью, а другая — под ней. Гистограммы могут быть расположены друг за другом на противоположных сторонах оси y или оси x.Каждая половина представляет собой отдельную категорию.

Бигистограмма представляет собой визуальную альтернативу t-критерию независимых выборок. Он может быть более полезным, чем t-тест, потому что на одном графике видны многие функции, в том числе:

Создание бигистограммы

Бигистограмма редко используется по сравнению с другими статистическими методами, поэтому большинство популярных программ не могут ее создать. Две программы, у которых есть опции, — это R и Dataplot. SPSS также предоставляет средства для размещения гистограмм рядом, что по сути дает вам то же самое.

Бигистограмма в R

В R нет простой функции для создания бигистограмм, но StrictlyStat предлагает наложить две гистограммы друг на друга для того же эффекта. Код, использующий ggplot или базовую графику, можно найти в этой статье на сайте R-Bloggers. Вы также можете найти онлайн-калькулятор (который использует модуль R) здесь, на Wessa.net. Я попробовал онлайн-калькулятор; наберитесь терпения, так как отображение графика может занять несколько минут.

Карта данных

Команда в Dataplot — БИГИСТОГРАММА

Гистограмма — это способ графического отображения групп чисел в зависимости от того, как часто они появляются. В этой статье вы узнаете, как сделать его вручную, но вам гораздо лучше, если использовать технологии, такие как создание гистограммы Excel. Выбор бункеров в статистике обычно является делом обоснованного предположения. Когда вы составляете гистограмму вручную, вы застряли с исходными настройками корзины. С помощью Excel (или другого программного обеспечения) вы можете изменить интервалы после того, как вы создали гистограмму, что дает вам возможность поиграть с размерами интервалов, пока вы не получите диаграмму, которая вам понравится.Хорошо, хватит лекций о технологиях. Иногда у вас может быть и , чтобы построить гистограмму вручную, особенно если вы строите гистограмму относительной частоты; Такие технологии, как TI-83, будут создавать только регулярные частотные гистограммы. Если у вас и для создания гистограммы вручную, вот простой способ.

Постройте гистограмму: шаги

Пример вопроса: Создайте гистограмму для следующих результатов тестов: 99, 97, 94, 88, 84, 81, 80, 77, 71, 25.

Шаг 1: Нарисуйте и обозначьте оси x и y .В этом примере ось X будет помечена как «оценка», а ось Y будет помечена как «относительная частота%».

Шаг 2: Выберите количество ячеек (как выбирать размеры ячеек в статистике) и пометьте свой график. В этом примере, вопрос, группы по 10 (значения по оси X — это ячейки) — хороший выбор (похоже, у вас будет 5 полосок с одним или двумя элементами в группе).

Шаг 3: Разделите 100 на количество точек данных , чтобы получить представление о том, где разместить «отметки» для вашей частоты.У нас есть 10 элементов в нашем наборе данных, поэтому имеет смысл считать по 100/10 = 10% (один элемент будет равен 10% от общего количества).

Шаг 4: Подсчитайте, сколько элементов находится в каждой корзине, а затем нарисуйте прямоугольник на графике , который соответствует проценту от общей суммы, которую заполняет эта корзина. В этом примере набора данных первая ячейка (20-30) содержит 1 элемент, а 70-80 — два элемента. Если элемент попадает на границу ячейки (например, 80), поместите его в ячейку , следующую вверх (80 попадет в ячейку 80-90).

Вот и все!

подсказки

Совет 1: Если вы не знаете, сколько ячеек выбрать , подумайте о том, чтобы сделать приблизительную онлайн-диаграмму с помощью этого Shodor.org инструмент. Поиграйте с ячейками (измените размер интервала), пока не получите диаграмму, которая вам нравится.
Совет 2 : Выбор места для установки частотных меток также является своего рода вызовом для суждения и редко является точной наукой. Например, если у вас есть 21 элемент, вы можете поставить отметку 5%, хотя каждый элемент будет немного меньше 5%. Имейте это в виду, когда вы рисуете график.

Предупреждение: При выборе оптимальных размеров бункера очень комплекс с больших наборов данных (см. Эту статью для примера уродливой математики).Чем больше ваш набор данных, тем лучше вы используете технологии.
В начало


Minitab — это программный пакет, похожий на Excel или другие программы для работы с электронными таблицами.

Посмотрите это короткое видео о том, как построить гистограмму в Minitab:


Не можете посмотреть видео? Кликните сюда.

Как сделать гистограмму в Minitab: шаги

Шаг 1: Введите данные в столбцы в Minitab. В большинстве случаев гистограммы содержат два набора переменных в двух столбцах.

Шаг 2: Щелкните «График» , а затем щелкните «Гистограмма».

Шаг 3: Выберите тип гистограммы , которую вы хотите построить. В большинстве случаев для элементарной статистики лучше всего подходит «Простая» гистограмма.

Шаг 4: Нажмите «ОК».

Шаг 5: Выберите имя переменной , для которой вы хотите построить гистограмму, а затем нажмите кнопку «Выбрать», чтобы переместить это имя переменной в поле Graph Variables.

Шаг 6: Нажмите «ОК» , чтобы создать гистограмму в Minitab.

Шаг 7: (Необязательно) Измените количество ячеек (ширину категорий), щелкнув один из заголовков ячеек (числа) у основания полосы. Откроется окно редактирования масштаба. Щелкните «Группирование», а затем установите переключатель «Число интервалов». Измените количество ящиков и нажмите «ОК».

Совет: При вводе данных в Minitab убедитесь, что в первой строке (заголовке столбца) указаны значащие имена переменных. Это упрощает выбор переменной, которую вы хотите построить на шаге 5.

Допустим, у вас есть список высот самых высоких зданий Нью-Йорка. Вот как вставить его в TI 83 и в мгновение ока превратить в гистограмму.

Посмотрите видео по шагам:


Не можете посмотреть видео? Кликните сюда.

Гистограмма TI-83: ​​шаги

Пример задачи : Постройте гистограмму, отображающую 20 самых высоких зданий в Нью-Йорке. Высота 20 лучших зданий (в футах): 1250, 1200, 1046, 1046, 952, 927, 915, 861, 850, 814, 813, 809, 808, 806, 792, 778, 757, 755, 752. , и 750.

Шаг 1: Введите данные в список. Нажмите кнопку STAT, а затем нажмите ENTER, чтобы перейти к опции «Редактировать». Введите первое число (1250) и нажмите ENTER. Продолжайте вводить числа, нажимая кнопку ENTER после каждого ввода.

Шаг 2: Нажмите «2nd», затем «Y =», чтобы выбрать «Stat Plot».

Шаг 3: ENTER, чтобы выбрать график «1».

Шаг 4: Снова нажмите ENTER. Будет выбрано «Вкл.».

Шаг 5: Нажмите клавишу со стрелкой вниз (клавиши со стрелками находятся вверху справа), затем дважды нажмите клавишу со стрелкой вправо.Ваш курсор должен мигать над параметром гистограммы, который находится в правом верхнем углу списка.

Шаг 6: Стрелка вниз до XList и введите имя списка, который вы ввели свои данные на шаге 1. Если вы создаете список впервые, вы, скорее всего, ввели данные в «L1», который является список по умолчанию. Если «L1» не отображается, нажмите «2nd», затем «1», чтобы выбрать «L1».

Шаг 7: Стрелка вниз и введите «1» для «Freq.»

Шаг 8: Нажмите кнопку «График».На экране появится график гистограммы. Нажмите «Zoom», а затем «Zoomstat», чтобы просмотреть гистограмму.

подсказки

Совет № 1 : Нажмите кнопку TRACE и стрелку назад и вперед слева направо. Это отобразит количество элементов в каждой категории (n =), а также верхний и нижний пределы класса.

Совет № 2 : Чтобы изменить ширину класса, нажмите WINDOW и измените Xscl. Например, если вам нужна ширина класса 100 (вероятно, наиболее подходящая для приведенных выше данных), измените «Xscl» на «100.”

Вот как создать гистограмму на TI-83!

Пример 2

Нарисуйте гистограмму для следующих результатов последних тестов в классе статистики: 45, 67, 68, 69, 74, 76, 75, 77, 79, 84, 86, 90.

Шаг 1: Нажмите STAT, затем ENTER, чтобы отредактировать L1.

Шаг 2: Введите данные о проблеме в список. Нажимайте ENTER после каждой записи. Например, для первых двух записей вы должны ввести:
4 5 ENTER
6 7 ENTER

Шаг 3: Нажмите 2-ю, а затем Y = для доступа к меню Stat Plot .

Шаг 4: Дважды нажмите ENTER, чтобы включить Plot1 .

Шаг 5: Стрелка вниз до Введите , справа от которого есть 6 значков. Выделите верхний правый значок, который выглядит как гистограмма, и нажмите ENTER, чтобы выбрать его.

Шаг 6: Убедитесь, что в записи XList написано «L 1 ». Если этого не произошло, нажмите на него стрелку вниз, нажмите «Очистить», затем «2-я», «1.

».

Шаг 7: Press Graph. Вы должны увидеть свою гистограмму.

подсказки

Совет : Если при нажатии на «График» вы видите сообщение «Err: Stat» или просто не видите гистограмму, как вы ожидали, затем нажмите «Окно» и попробуйте другие настройки. Особенно попробуйте изменить значение Xscl (X Scale) на большее значение.

Вот и все!
В начало

После того, как вы введете данные для гистограммы TI 89 и построите их график, TI-89 даже посчитает, сколько элементов находится в каждой полосе (или классе).

TI 89 Гистограмма: шаги

Посмотрите видео с шагами:


Не можете посмотреть видео? Кликните сюда.

Пример задачи: Создайте гистограмму для следующих новых затрат на автомобиль: 12 500; 22 400; 14 300; 32 200; 21 500; 19,980; 15,001; 22 001; 32 036; 35,124; 29 001; 25,006; 27 001; и 18 500.

Шаг 1: Нажмите ПРИЛОЖЕНИЯ и прокрутите до Редактора статистики / списка. Нажмите Ввод.

Шаг 2: Нажмите F1, затем 8, чтобы очистить редактор списка данных.

Шаг 3: Введите «cars» в качестве имени списка, нажав 2-ю АЛЬФА) = 23 ENTER.

Шаг 4: Введите свои данные:
12500 ENTER
22400 ENTER
14300 ENTER
32200 ENTER
21500 ENTER
19980 ENTER
15001 ENTER
22001 ENTER
32036 ENTER
35124 ENTER
29001 ENTER
25006 ENTER
2700 18500 ВВОД

Шаг 5: Нажмите F2 ENTER и F1, чтобы перейти к настройке графика (Определить график).

Шаг 6: Нажмите стрелку вправо, чтобы открыть меню «Тип графика». Нажмите 4, чтобы получить Гистограмма .

Шаг 7: Прокрутите вниз до « x ». Нажмите 2-ю — (клавишу «минус»), чтобы открыть Var-Link . Прокрутите вниз до «cars» и нажмите ENTER.

Шаг 8: Прокрутите вниз до Hist. Ширина ковша и введите 5000 ENTER. Это ширина вашего класса.

Шаг 9: Нажмите ENTER F5. Примечание : Если вы нажмете ENTER слишком много раз и окажетесь на главном экране, просто нажмите ромбовидную клавишу, а затем F3 (для графика).

Шаг 10: Нажмите 3 для функции трассировки. Используйте левую и правую клавиши прокрутки для перехода от одной полосы к другой. (Это покажет вам, сколько элементов находится в каждом классе (n = x)).

подсказки

Совет № 1 : Если ваша гистограмма TI 89 не отображается (или отображается только часть графика), возможно, вам придется изменить окно. Нажмите ромбовидную клавишу , , затем F2, чтобы проверить настройки окна. Для приведенного выше графика ваши настройки должны быть примерно 10000

Совет № 2 : Убедитесь, что альфа-блокировка включена, проверив маленький черный прямоугольник с буквой «а» в нижнем левом углу экрана.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *