Компания
67,45
рейтинг
14 октября 2014 в 14:28

Разработка → Зачем и как использовать визуализацию данных?



Медицинские исследователи установили, что если в инструкции к лекарству находится только текст, человек усваивает из нее лишь 70% информации. Если же в инструкцию добавить картинки, человек усвоит уже 95%.

В нашей компании уже много лет занимаются разработкой и поддержкой инструментов для визуализации данных, охватывая большой диапазон платформ и технологий. И в этом есть смысл, ведь визуализационные инструменты всегда были и остаются востребованными на рынке разработки. И мы знаем, в чем причина такой популярности.

Что такое визуализация данных?


Прежде всего, нужно знать, что же такое визуализация данных и какие ее методы используются, в том числе и в повседневной жизни.

Самые простые, а потому и самые распространенные методы визуализации — это графики

Визуализация данных — это наглядное представление массивов различной информации. Существует несколько типов визуализации:
  • Обычное визуальное представление количественной информации в схематической форме. К этой группе можно отнести всем известные круговые и линейные диаграммы, гистограммы и спектрограммы, таблицы и различные точечные графики.
  • Данные при визуализации могут быть преобразованы в форму, усиливающую восприятие и анализ этой информации. Например, карта и полярный график, временная линия и график с параллельными осями, диаграмма Эйлера.
  • Концептуальная визуализация позволяет разрабатывать сложные концепции, идеи и планы с помощью концептуальных карт, диаграмм Ганта, графов с минимальным путем и других подобных видов диаграмм.
  • Стратегическая визуализация переводит в визуальную форму различные данные об аспектах работы организаций. Это всевозможные диаграммы производительности, жизненного цикла и графики структур организаций.
  • Графически организовать структурную информацию с помощью пирамид, деревьев и карт данных поможет метафорическая визуализация, ярким примером которой является карта метро.
  • Комбинированная визуализация позволяет объединить несколько сложных графиков в одну схему, как в карте с прогнозом погоды.

Зачем использовать визуализацию данных?


Визуальная информация лучше воспринимается и позволяет быстро и эффективно донести до зрителя собственные мысли и идеи. Физиологически, восприятие визуальной информации является основной для человека. Есть многочисленные исследования, подтверждающие, что:
  • 90% информации человек воспринимает через зрение
  • 70% сенсорных рецепторов находятся в глазах
  • около половины нейронов головного мозга человека задействованы в обработке визуальной информации
  • на 19% меньше при работе с визуальными данными используется когнитивная функция мозга, отвечающая за обработку и анализ информации
  • на 17% выше производительность человека, работающего с визуальной информацией
  • на 4,5% лучше воспоминаются подробные детали визуальной информации


Если попросить читателя вспомнить названия материков, в голове возникнет именно эта картинка

  • в 60000 раз быстрее воспринимается визуальная информация по сравнению с текстовой


На графике читатель быстрее найдет минимальное и максимальное значения

  • 10% человек запоминает из услышанного, 20% — из прочитанного, и 80% — из увиденного и сделанного
  • на 323% лучше человек выполняет инструкцию, если она содержит иллюстрации


Инструкцию снизу намного легче и быстрее понять и выполнить

Подробнее о фактах и исследованиях можно посмотреть в интересной инфографике здесь.

Очевидно, что человек предрасположен обрабатывать именно визуальную информацию. Помимо прекрасной обработки нашим мозгом, визуализация данных имеет несколько преимуществ:
  • Акцентирование внимания на разных аспектах данных


С помощью графиков можно легко обратить внимание читателя на красные показатели

  • Анализ большого набора данных со сложной структурой
  • Уменьшение информационной перегрузки человека и удерживание его внимания
  • Однозначность и ясность выводимых данных
  • Выделение взаимосвязей и отношений, содержащихся в информации


На графике легко можно заметить важные данные

  • Эстетическая привлекательность


Эстетически привлекательные графики делают подачу данных эффектной и запоминающейся

Эдвард Тафти, автор одних из лучших книг по визуализации, описывает ее как инструмент для показа данных; побуждения зрителя задуматься о сути, а не методологии; избежания искажения того, что должны сказать данные; отображения многих чисел на небольшом пространстве; показа большого набора данных связным и единым целым; побуждения зрителя сравнивать фрагменты данных; служения достаточно четким целям: описанию, исследованию, упорядочиванию или украшению (“The Visual Display of Quantitative Information”, Edward Tufte).

Как правильно использовать визуализацию данных?


Успех визуализации напрямую зависит от правильности ее применения, а именно от выбора типа графика, его верного использования и оформления.

60% успеха визуализации зависит от выбора типа графика, 30% — от его правильного использования и 10% — от его верного оформления

Правильный тип графика


График позволяет выразить идею, которую несут данные, наиболее полно и точно, поэтому очень важно выбрать подходящий тип диаграммы. Выбор можно осуществить по алгоритму:


Цели визуализации — это реализация основной идеи информации, это то, ради чего нужно показать выбранные данные, какого эффекта нужно добиться — выявления отношений в информации, показа распределения данных, композиции или сравнения данных.

В первом ряду показаны графики с целями показа отношений на данных и распределения данных, а во втором ряду целями являются показ композиции и сравнения данных

Отношения в данных — это то, как они зависят друг от друга, связь между ними. С помощью отношений можно выявить наличие или отсутствие зависимостей между переменными. Если основная идея информации содержит фразы “относится к”, “снижается/повышается при”, то нужно стремиться показать именно отношения в данных.
Распределение данных — то, как они располагаются относительно чего-либо, сколько объектов попадает в определенные последовательные области числовых значений. Основная идея при этом будет содержать фразы “в диапазоне от x до y”, “концентрация”, “частотность”, “распределение”.
Композиция данных — объединение данных с целью анализа общей картины в целом, сравнения компонентов, составляющих процент от некоего целого. Ключевыми фразами для композиции являются “составило x%”, “доля”, “процент от целого”.
Сравнение данных — объединение данных, с целью сравнения некоторых показателей, выявление того, как объекты соотносятся друг с другом. Также это сравнение компонентов, изменяющихся с течением времени. Ключевые фразы для идеи при сравнении — “больше/меньше чем”, “равно”, “изменяется”, “повышается/понижается”.

После определения цели визуализации требуется определить тип данных. Они могут по своему типу и структуре быть очень разнородными, но в самом простом случае выделяют непрерывные числовые и временные данные, дискретные данные, географические и логические данные. Непрерывные числовые данные содержат в себе информацию зависимости одной числовой величины от другой, например графики функций, такой как y=2x. Непрерывные временные содержат в себе данные о событиях, происходящих на каком-либо промежутке времени, как график температуры, измеряемой каждый день. Дискретные данные могут содержать в себе зависимости категорийных величин, например график количества продаж товаров в разных магазинах. Географические данные содержат в себе различную информацию, связанную с местоположением, геологией и другими географическими показателями, яркий пример — это обычная географическая карта. Логические данные показывают логическое расположение компонентов относительно друг друга, например генеалогическое древо семьи.

Графики непрерывных числовых и временных данных, дискретных данных, географических и логических данных

В зависимости от цели и данных можно выбрать наиболее подходящий им график. Лучше всего избегать разнообразия ради разнообразия и выбирать по принципу “чем проще, тем лучше”. Только для специфичных данных использовать специфичные типы диаграмм, в остальных же случаях хорошо подойдут самые распространенные графики:
  • линейный (line)
  • с областями (area)
  • колонки и гистограммы (bar)
  • круговая диаграмма (pie, doughnut)
  • полярный график (radar)
  • точечный график (scatter, bubble)
  • карты (map)
  • деревья (tree, mental map, tree map)
  • временные диаграммы (time line, gantt, waterfall).

Линейные диаграммы, графики с областями и гистограммы могут содержать в одном аргументе для одной категории несколько значений, которые могут быть как абсолютными (тогда к таким видам графикам прибавляется приставка stacked), так и относительными (full stacked).

График со stacked значениями и с full stacked

При выборе подходящего графика можно руководствоваться следующей таблицей, составленной на основе этой диаграммы и книги “Говори на языке диаграмм” Джина Желязны:



Правильное использование графика


Важно не только верно выбрать тип графика, но и правильно его использовать:
  • Не нужно нагружать график большим количеством информации. Оптимальное количество разных типов данных, категорий — это не более 4-5, иначе же целесообразнее разделить такую диаграмму на несколько штук.


Такой график можно сравнить со спагетти и лучше разделить на несколько диаграмм

  • Верно выбрать шкалу и ее масштаб для графика. Для гистограмм и графиков с областями предпочтительнее начинать шкалу значений с нуля. Постараться не использовать инвертированные шкалы — это очень часто вводит зрителя в заблуждение относительно данных.


Неверная шкала отрицательно влияет на восприятие данных. В первом случае некорректно выбран масштаб, во втором шкала инвертирована

  • Для круговых диаграмм и графиков, где показан процент от общей доли, сумма значений всегда должна составлять 100%.
  • Для лучшего восприятия данных информацию на оси лучше упорядочить — либо по значениям, либо по алфавиту, либо по логическому смыслу

Правильное оформление графика


Ничто так не радует глаз, как правильно оформленные графики, и ничто так не портит диаграммы, как наличие графического “мусора”. Основные принципы оформления:
  • использовать палитры похожих, не ярких цветов, и постараться ограничиться набором из шести штук
  • вспомогательные и второстепенные линии должны быть простыми и не бросающимися в глаза


Вспомогательные линии на графике не должны отвлекать внимание от основной идеи данных

  • там, где возможно, использовать только горизонтальные надписи на осях
  • для графиков с областями предпочтительнее использовать цвет с прозрачностью
  • для каждой категории на графике использовать свой цвет

Выводы


Визуализация — мощный инструмент донесения мыслей и идей до конечного потребителя, помощник для восприятия и анализа данных. Но как и все инструменты, ее нужно применять в свое время и в своем месте. В противном случае информация может восприниматься медленно, а то и некорректно.

На графиках изображены одни и те же данные, слева показаны основные ошибки визуализации, а справа они исправлены

При умелом применении визуализация данных позволяет сделать материал впечатляющим, нескучным и запоминающимся.

P.S. Графики для статьи были сделаны с помощью DevExtreme.
Автор: @tatyana_ryzh

Комментарии (27)

  • +3
    «добавить картинки, человек усвоит уже 95%. » — значит ли это, что любые(! например с котиками!) картинки повышают усвоение информации из области биохимии/молекулярной биологии на 25%?
    • +9
      Само собой, все зависит от верного применения визуализации данных. Но если бы котики преподавали молекулярную биологию — это был бы мой любимый предмет=)
      • +1
        То есть, читать следует «Если добавить ПРАВИЛЬНЫЕ картинки»… И далее по тексту иметь ввиду именно эту фразу: хорошая визуализация помогает, плохая — нет.
        • +2
          Излишняя педантичность может навредить.
          www.ted.com/talks/tyler_dewitt_hey_science_teachers_make_it_fun — любопытный доклад, на сайте есть как субтитры, так и транскрипты на большом количестве языков, в том числе и на русском.
          You know, I keep talking about this idea of telling a story, and it's like science communication has taken on this idea of what I call the tyranny of precision, where you can't just tell a story. It's like science has become that horrible storyteller that we all know, who gives us all the details nobody cares about <...> Or even worse, science education is becoming like that guy who always says, «Actually.» Right? You want to be like, «Oh, dude, we had to get up in the middle of the night and drive a hundred miles in total darkness.» And that guy's like, «Actually, it was 87.3 miles.» And you're like, «Actually, shut up! I'm just trying to tell a story.»
          <...>
          If a young learner thinks that all viruses have DNA, that's not going to ruin their chances of success in science. But if a young learner can't understand anything in science and learns to hate it because it all sounds like this, that will ruin their chances of success.
        • +1
          Ага, и не забывать, что речь в исследовании идёт исключительно про инструкции к лекарствам, а не про всё подряд.
    • +4
      … любые(! например с котиками!) картинки повышают усвоение информации из области биохимии/молекулярной биологии

      Из биологии — запросто :)
      картинка с котиком
      Котик
      • +2
        А потом мощность в метрах меряют… Но для понимания устройства кота на верхнем уровне — вполне :-D
        • +2
          Сегодня актуально время в километрах мерить
          • 0
            Больная мозоль: мощность в метрах, время в километрах, чтение подробных инструкций — за гранью возможности среднего человека… Печально!
    • 0
      Да, я так всегда курсовые и дипломы писал.
  • +6
    Всегда питал слабость к разным видам визуализации данных. Главное уметь правильно преподнести информацию, как правильно замечено в статье, ибо «некрасивой» визуализацией можно и навредить.
  • +1
    Использовать в самом начале в разделе «Как правильно использовать визуализацию данных?» круговую диаграмму (pie chart), да ещё и всего для трёх цифр — это так символично. При том, что круговая диаграмма считается наиболее нерепрезентативным типом графика, а график для трёх цифр — вообще чрезмерным.

    С другими картинками тоже есть косяки (хотя бы размерность величин, в попугаях измерения ведёте?). Можно было бы считать это придирками, если бы не хаб «Визуализация данных». А слова вроде бы правильные пишете и структурировано всё неплохо, жаль только, что нюансам всевозможным так мало уделили внимания.

    По классификации графиков есть вот такой замечательный ресурс: datavizcatalogue.com, а ещё можно погуглить постер «The Graphic Continuum».
    • +1
      Ресурс интересный, жаль, что еще не до конца заполнен. Постер тоже познавательный, мне на глаза не попадался, спасибо)

      По поводу графика для трех цифр — вынуждена не согласиться, даже для одной переменной визуализация во многих случаях выглядит лучше, чем ничего. Хороший пример графика для малого количества переменных — вот. Наиболее нерепрезентативным типом графика круговая диаграмма возможно и считается, но по прежнему остается и наиболее популярным, и на то есть свои, веские причины:)

      По поводу размерности — да, каюсь, не подозревала, что в рамках этого материала размерность будет нужна. Я посчитала ее лишней информацией, отвлекающей внимание от самой сути статьи.

      А в целом, спасибо за комментарии, обязательно учту при последующем написании статей)
      • 0
        По поводу графика для трех цифр — вынуждена не согласиться, даже для одной переменной визуализация во многих случаях выглядит лучше, чем ничего.

        Термин переменная тут не совсем корректно применять, это во-первых. Во-вторых, вы уж решите что вам важнее, выглядит лучше или работает лучше? А то вы путаетесь в показаниях.

        Наиболее нерепрезентативным типом графика круговая диаграмма возможно и считается, но по прежнему остается и наиболее популярным, и на то есть свои, веские причины:)

        Использование круговых диаграмм, на эту тему уже столько бумаги исписано, что только совсем новичок может быть не в теме. А люди продолжают их использовать, потому что привыкли (спасибо Excel и PowerPoint) и не в курсе их недостатков.
  • –3
    Лозунги ни о чём, вперемешку с банальностями. Для кого статья? Кто понаставил плюсов?.. Не понимаю.
    • +2
      Отвечаю — статья о применении визуализации, без открытия Америки, но информативная и структурирующая большой объем данных по визуализации. Что является банальным для одного человека, не так очевидно для другого, и эта статья призвана ввести такого человека в курс дела. А для тех «кто в теме» — рассказать, как я надеюсь, о некоторых интересных вещах в визуализации.

      Более содержательный комментарий возможно помог бы мне учесть некоторые недостатки и проработать их в будущем.
  • +3
    Статья хорошая. Еще бы библиографию типа:
    Few, Stephen
    Information Dashboard Design: The Effective Visual Communication of Data. Sabastopol, California: O’Reilly Media. 2006.
    Show Me the Numbers: Designing Tables and Graphs to Enlighten. Oakland, California: Analytics Press. 2004.
    Tufte, Edward R.
    Visual Display of Quantitative Information, Second Edition. Cheshire, Connecticut: Graphics Press. 2001.
    Envisioning Information
    Visual ExplanationsBeautiful Evidence (Features Sparklines)
    Ware, Colin
    Visual Thinking for Design. Morgan Kaufmann, 2008
    Norman, Donald A.
    Design of Everyday Things, The. New York: Basic Books. 2002. (reprinted from the original, entitled, The Psychology of Everyday Things.)
    Emotional Design: Why we Love (or Hate) Everyday Things. New York: Basic Books. 2004.
    Желязны, Джин [Zelazny, Gene]
    Говори на языке диаграмм: пособие по визуальным коммуникациям [Say it With Chart]

    • +1
      Спасибо, да, согласна, вероятно стоило добавить такой раздел в конце, и плюс скинуть ссылку на вот этот ресурс
  • –4
    Странно говорить о визуализации данных при искаженной карте.
    Начните с варианта без искажений.

    image
  • +2
    Не удержался вдогонку на:
    На графиках изображены одни и те же данные, слева показаны основные ошибки визуализации, а справа они исправлены
    Вы уверены что это ошибки, а не сознательный выбор автора диаграммы, нацеленный на достижение очевидного для него результата?

    Чего бы еще хотелось увидеть в статье:
    * о выборе цветов и тем. Типа: на проекторе плохо смотрятся гистограммы с тенями, хотя отлично выглядят на экране или бумаге. Для презентаций лучше использовать чистые контрастные цвета (либо наоборот блеклые, чтобы продемонстрировать необходимость покупки свежего DLP проектора.)
    * о преемственности цветов. Если мы использовали коричневый цвет для Австралии, то ожидаем что этот цвет будет отображать именно ее показатели (если, конечно, у нас есть такая задача: ).
    * о выборе шрифтов
    * о единицах измерений
    * чек лист: соответствует ли построенная диаграмма моим целям?
    • 0
      Да, уверена, ведь главное получить очевидный не для создателя результат, а для конечного потребителя.

      Насчет более подробного рассмотрения дизайна — это очень интересная тема, и она настолько объемная, что тянет на отдельную статью) Много плюшек и хорошей информации на эту тему можно найти в этой замечательной книге. А так спасибо за ценный комментарий)
      • +1
        Вы роли создателя/заказчика и конечного потребителя не путаете? Создатель решает, какой вывод должен сделать потребитель на основе представленных диаграмм. Вы же так и написали: цели->тип данных->график. Использовать определения «правильно», «лучше» можно только исходя из определенных (а не подразумеваемых) целей.

  • 0
    Спасибо за труд, но мне статья не очень понравилась. Слишком много текста, который в такой статье можно было бы визуализировать. Слишком много поясняющих картинок для текста, который надо было визуализировать.
    • 0
      Спасибо за честный комментарий) В плане визуализации надо держать себя в руках, ее тоже бывает слишком много. Постаралась все же соблюсти баланс между комиксом и текстовым материалом.
  • +3
    Если бы еще и инструмент посоветовали, в котором можно выстроить все эти графики в виде некого дашборда.

    Знаю, инструментов много, но чем больше пытаюсь подобрать\найти, тем больше завишу от экселя.
    • +4
      У нас есть отдельный продукт, позволяющий создавать дашборды — вот ссылка на демку , а вот на сам продукт. Плюс, конечно же, есть возможность использовать наши графики (ссылка на демку и в целом на чарты) отдельно.

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.

Самое читаемое Разработка