35,2
рейтинг
30 марта 2014 в 21:01

Разработка → Как правильно лгать с помощью статистики


Существуют три вида лжи: ложь, наглая ложь и статистика (источник)

Есть такой замечательный жанр — "вредные советы", в котором детям дают советы, а дети, как известно, всё делают наоборот и получается всё как раз правильно. Может быть и со всем остальным так получится?

Статистика, инфографика, big data, анализ данных и data science — этим сейчас кто только не занят. Все знают как правильно всем этим заниматься, осталось только кому-то написать как НЕ нужно этого делать. В данной статье мы именно этим и займемся.


Hazen Robert "Curve fitting". 1978, Science.

Структура статьи:
  1. Введение
  2. Предвзятая выборка (Sampling bias)
  3. Правильно выбираем среднее (Well-chosen average)
  4. И еще 10 неудачных экспериментов, про которые мы не написали
  5. Играем со шкалой
  6. Выбираем 100%
  7. Скрываем нужные числа
  8. Визуальная метафора
  9. Пример качественной визуализации
  10. Заключение и дальнейшее чтение



Предвзятая выборка (Sampling bias)


В 1948 году во время президентской гонки в США в ночь на оглашение результатов выборов Труман (демократы) против Дьюи (республиканцы) газета Chicago Tribune опубликовала свой, пожалуй, самый знаменитый заголовок DEWEY DEFEATS TRUMAN (см. фото). Сразу после закрытия участков газета провела опрос, обзвонив огромное (достаточное для выборки) число избирателей, и всё предвещало оглушительную победу Дьюи. На фото мы видим смеющегося Трумана, победителя выборов 48го года. Что же пошло не так?



Людей обзванивали действительно случайно и в достаточном количестве, но в 48-ом году телефон был доступен только людям определенного достатка и редко встречался у людей с небольшим заработком. Таким образом, сам метод опроса вносит поправку в распределение голосов. Выборка не учитывала достаточно широкий пласт избирателей Трумана (как правило демократы имеют большую долю голосов среди бедного населения), которым телефон в свою очередь был недоступен. Такая выборка и называется предвзятой (sampling bias).

Народное творчество о данном феномене:
По данным интернет-голосования 100% людей пользуются интернетом.


Зарплата выпускников

Никого не удивляло, что когда мы слышим о зарплатах выпускников ВУЗов, то почему-то всегда это неправдоподобно высокие цифры? В США сейчас доходит дело даже до судов, где выпускники утверждают, что данные по зарплатам искусственно завышены.


(картинка из How to Lie with Statistics)

Это довольно старая проблема, согласно Darrell Huff, подобный вопрос возникал у выпускников Yale 24-го года. И на самом деле все говорят правду, да только не всю. Сбор статистики происходил в виде опросов (а в те годы с помощью бумажной почты). Отправляют ответ далеко не все, а только небольшая часть всех выпускников; активнее других отвечают те, у кого дела идут хорошо (что часто выражается в неплохой зарплате), поэтому мы видим только «хорошую» часть картины. Это-то и создаёт предвзятость выборки и делает результаты подобных опросов абсолютно бесполезными.

Правильно выбираем среднее (Well-chosen average)


Представим себе компанию, в которой руководитель получает 25 тысяч, его заместитель 7,6 тысяч, топ-менеджеры по 5,5 тысяч, менеджеры среднего звена по 3,5 тысячи, младшие менеджеры по 2,5 тысячи, а обычные работники по 1,4 тысячи (абстрактных фунтиков) в месяц.

И наша задача представить информацию о компании в положительном свете. Мы можем написать средняя заработная плата в компании составляет X, но что означает среднее? Рассмотрим возможные варианты (см. схему ниже):


(картинка из How to Lie with Statistics)

Арифметическое среднее некоторого конечного множества X={xi} — это такое число m равное mean(X) из уравнения:



Это самая бесполезная информация с точки зрения работника — 3,472 средняя зарплата, но за счет чего получается такая высокая цифра? За счет высоких зарплат руководства, что создает иллюзию, что работник будет получать столько же. С точки зрения работника данная величина не является особо информативной.

Конечно же народное творчество не обошло стороной эту особенность «средней величины» в виде средне арифметического
Чиновники едят мясо, я — капусту. В среднем мы едим голубцы.

Медиана некоторого распределения P(X) (X={xi}), это такая величина m, что она удовлетворяет следующему уравнению:



Проще говоря, половина работников получает больше данной величины, а половина меньше — ровно середина распределения! Данная статистика достаточно информативна для работников компании, так как она позволяет определить как зарплата сотрудника соотносится с большинством сотрудников.

Мода конечного множества X={xi}, это число m, которое встречается в X чаще всего. В данном случае, мода может быть наиболее информативна для человека, который собирается начать работать в данной компании.

Таким образом в зависимости от ситуации под средним значением может пониматься любая из указанных выше величин (в принципе и не только из них). Поэтому принципиально важно понять, как же рассчитывается это среднее значение.


И еще 10 неудачных экспериментов, про которые мы не написали


Опустим обычную газету в серную кислоту, а журнал ТВ Парк — в дистиллированную воду! Почувствовали разницу? С журналом ничего не произошло — бумага как новая! (Весь ролик тут.)



Наши исследования сообщают, что зубная паста Doake's на 23% процента эффектнее конкурентов, и всё это благодаря Dr Cornish's Tooth Powder! (Который наверняка содержал β-каротин и секретную формулу леса — прим. автора.) Вы наверное удивитесь, но исследование действительно провели и даже выпустили технический отчет. И эксперимент действительно показал, что зубная паста на 23% процента эффективнее конкурентов (чтобы это не значило). Но только вся ли это история?

В действительности выборка для эксперимента составляла всего лишь дюжину человек (согласно Darrell Huff и уже упомянутой книге). Это именно та выборка, которая нужна, чтобы получить любые результаты! Представим, что мы подбрасываем монетку пять раз. Какова вероятность, что все пять раз выпадет орел? (1/2)5 = 1/32. Всего лишь одна тридцать вторая, это не может быть просто совпадением, если выпадут все пять орлов, ведь так? А теперь представим, что мы повторяем этот эксперимент 50 раз. Хоть одна из этих попыток увенчается успехом. О ней-то мы и напишем в отчете, а все другие эксперименты никуда не пойдут. Таким образом мы получим исключительно случайные данные, которые отлично вписываются в нашу задачу.

Играем со шкалой


Предположим, завтра нужно показать на совещании, что мы догнали конкурентов, но числа немного не сходятся, что же делать? Давайте немного подвигаем шкалой! Даже известный своей качественной работой с данными New York Times выпустил подобный совершенно сбивающий с толку график (обратите внимание на скачок с 800к до 1,5м в центре шкалы).



(пример из How to Display Data Badly Howard Wainer. The American Statistician, 1984.)

Выбираем 100%


Представим, что в прошлом году молоко стоило 10 копеек за литр и хлеб был 10 копеек за буханку. В этом году молоко упало в цене на 5 копеек, а хлеб вырос на 20. Внимание вопрос, что мы хотим доказать?

Представим, что прошлый год — это 100%, основание для расчетов. Тогда молоко упало в цене на 50% процентов, а хлеб вырос на 200%, среднее 125%, а значит в целом цены выросли на 25%.


Давайте попробуем еще разок, пусть текущий год — 100%, значит цены на молоко составляли 200% в прошлом году, а хлеб 50%. А значит, в прошлом году цены в среднем были на 25% выше!


(графики и пример из главы «How to Statisticulate» How to Lie with Statistics)


Скрываем нужные числа


Лучший способ что-то скрыть — это отвлечь внимание. Например, рассмотрим зависимость количества частных и публичных школ (в тысячах штук) по годам. Из графика видно, что число публичных школ сокращается, а число частных существенно не изменяется.



На самом деле рост числа частных школ скрыт на фоне числа публичных школ. Так как они отличаются на порядок, то фактически любые изменения будут не заметны на шкале с достаточно большим шагом. Перерисуем число частных школ отдельно; теперь мы отчетливо видим существенный рост числа частных школ, который был «скрыт» на предыдущем графике.


(пример и графики из How to Display Data Badly, Howard Wainer. The American Statistician, 1984.)


Визуальная метафора


Если сравнивать не с чем, а запутать очень хочется, то самое время для непонятных визуальных метафор. Например, если мы изобразим вместо длины площадь на графике, то любой рост будет казаться гораздо более значительным.

Рассмотрим потребление количества пива в США за 1970-1978 годы в миллионах баррелей и долю рынка компании Schlitz (см. график ниже). Неплохо выглядит, внушительно. Не правда ли?



А теперь давайте избавимся от ненужного «мусора» на данном графике и перерисуем его в нормальном виде. Уже как-то не так внушительно и серьезно выходит.


(графики и примеры из John P. Boyd, lecture notes How to Graph Badly or What. NOT to Do)

Первая картинка не врет, все числа в ней верные, только она неявно преподносит данные в совершенно ином свете.


(картинка из How to Lie with Statistics).


Пример качественной визуализации


Качественная визуализация прежде всего преподносит результаты, избегая неоднозначности, и передает достаточное количество информации в сжатом объеме. Про работу Шарль-Жозефа Минара хорошо сказано тут:

Тут прекрасно совершенно все, зрителя не держат за идиота, и не тратят его время на втыкание в censored. Широкая бежевая полоса показывает размер армии в каждой точке похода. В правом верхнем углу — Москва, куда приходит французская армия и откуда начинается отступление, показанное черной полосой. К маршруту отступления для дополнительного интереса привязан график времени и температуры.

Вывод в итоге: изумленный зритель сравнивает размер армии на старте с тем, что вернулось домой. Зритель весь в чувствах, он узнал новое, он ощутил масштаб, он заворожен, он понял, что в школе ничего не узнал.



(Charles Joseph Minard: Napoleon's Retreat From Moscow (The Russian Campaign 1812-1813), 1869.)


Заключение и дальнейшее чтение


76% всей статистики взято из головы

Данная подборка покрывает далеко не полный список приемов, которые осознанно, а также не осознанно искажают данные. Данная статья прежде всего демонстрирует, что мы должны очень внимательно следить за предоставленными нам статистическими данными и выводами сделанными на их основе.

Короткий список к дальнейшему чтению:
How to Lie with Statistics — замечательная небольшая книга, невероятно интересно и хорошо написанная, читается на одном дыхании. Демонстрирует основные «ошибки», которые допускают СМИ (и не только они) при работе с данными.
How to Display Data Badly. Howard Wainer. The American Statistician (1984) — сборник типичных ошибок и общих «вредных» правил, чаще всего встречающихся в работах с визуализацией данных.

Сергей Парамонов @varagian
карма
257,2
рейтинг 35,2
Data Scientist
Реклама помогает поддерживать и развивать наши сервисы

Подробнее
Реклама

Самое читаемое Разработка

Комментарии (74)

  • 0
    А есть эти книги в переводе? Хочу дать на почитать паре людей…
    • +33
      Поясню для автора статьи: «Один мой знакомый» не знает английский, можете ли вы погуглить для меня переводы этих книг?
      • 0
        Нет, вопрос именно — есть или нету. Найти я могу и сам.
        Просто автор ссылается на них — но всюду на англ.версии.
        Варинты: русской нет, либо просто англ удобнее автору.
        Лично мне пофиг (я уже скачал англ себе).

        p.s.: беглый вопрос по «имя книги + перевод» результата не дало.
        • +1
          Не так давно вышел перевод. https://bookmate.com/books/FhAUBcm9
          • +1
            Огромное спасибо! Расшарил с «одним моим знакомым» (3шт).
  • +22
    Отличный пример буквально на днях попадался

    image

    Сначала смутило то, что статуя свободы изображена больше Волгоградской Родины, но и остальными статуями на картинке расклад тоже такой же

    Для тех, кто не в курсе, статуя свободы без пьедестала (как изображено на картинке) всего 45 метров, а Родина Мать без пьедестала — 52.
    • +9
      И это тоже ложь — цифры с пьедесталом, статуи без.
      • +14
        В своё время нам твердили, что Останкинская башня — самая-самая!
        Полез на днях в Вики: добрёл до высотных сооружений…
        Ну и листаю по мере роста от Эйфевелевой и по годам…
        Дохожу до 2000-х с арабской мегапостройкой — Останкинской нету!
        Начинаю поиск от Останкинской — выясняется, что как чисто высотка она в свои годы не дотягивала до рекордсменов!!!
        НО!
        Если учитывать только телевизионные, только бетонные и только без внешних распорок… То да, она была таки на первом месте!
        Тоже статистика, однака…
    • +35
      Статистика такая статистика :)
      Статистика голосования
      • +62
        А у нас тут, как видите, добыча газа неуклонно растет.
        image
      • +48
        Такая практика используется и в айтишных кругах:
        image
      • 0
        «Статистика и стилистика»…
      • +2
        image
        • 0
          Для тех кто не понял — сумма 146.47%
    • +12
      Для тех, кто не в курсе, статуя свободы без пьедестала (как изображено на картинке) всего 45 метров, а Родина Мать без пьедестала — 52.

      Для тех, кто не в курсе. Высота пьедестала статуи «Родина Мать» в Волгограде — около 2 метров. 52 метра — это высота самой фигуры без пьедестала. 85 метров — высота фигуры без пьедестала до конца меча. Высота Статуи Свободы без пьедестала до конца факела 45-46 метров (по разным данным).

      А вы дезинформируете народ, давая высоту Статуи Свободы по факел, а Родины Матери по макушку ;)
      • 0
        Ух. Интересно, сколько таких статуй на просторах СНГ?
        а то оказалось, чтол статуя «Родина-Мать» внезапно есть не только в Киеве, а и в Волгограде…
      • 0
        В википедии есть наглядная картинка:
        image
  • +12
    Очень важная статья для любого менеджера проекта, я считаю!
  • –4
    «Всего лишь одна тридцать вторая, это не может быть просто совпадением, если выпадут все пять орлов, ведь так? А теперь представим, что мы повторяем этот эксперимент 50 раз. Хоть одна из этих попыток увенчается успехом. „

    >>> (31/32.0)**50
    0.20444936956763513

    Ну-ну :)
    • +18
      20% — это вероятность того, что пять орлов не выпадут ни разу за 50 подходов. Значит, искомая вероятность — 80%. Это, конечно, не есть абсолютная уверенность в успехе, но всё-таки немало. Но не суть. Автор исходного текста имел в виду «мы будем повторять опыт, пока он не даст нужные нам результаты».
      • +2
        Спасибо, я имел ввиду вероятность фейла этого утверждения.

        Ну это тогда ещё отличный абзац в статью.
        «Хоть одна из этих попыток увенчается успехом.» != «Скорее всего, одна из этих попыток увенчается успехом».

        20% это много почти всегда.
    • +3
      Немного не так

      >>> 1-(31/32.0)**50
      0.7955506304323648
  • +2
    Хорошая статья, спасибо. Теперь будет на что ссылку давать тем, «кто знает как правильно всем этим заниматься», прежде чем отсылать почитать Тафти и учебник по статистике.

    По поводу восприятия людьми различных стимулов — известный Закон Стивенса.
    Ресурс, именно по типичным ошибкам в статистике: Statistics Done Wrong.
    Ну и масса блогов по визуализации данных.
  • +4
    А ещё гуглите «Манипулятивная диаграммология».
    Она же вот эта статья с загуглённой презентацией «Как не дать диаграммам себя обмануть».
  • 0
    Спасибо за статтю.

    Напомнило:
    Если взять число и отнять от него 20%, потом добавить 20% от того что плучилось, то получится число, на 4% меншее за исходное.
    • +12
      Неужели это кого-то удивляет? Отнять 20% от числа — это то же самое, что умножить его на 0.8. Добавить 20% к числу — это то же самое, что умножить его на 1.2. Собственно, (N * 0.8) * 1.2 = N * (0.8 * 1.2) = N * 0.96. То есть ровно 96% от исходного.
    • 0
      А если взять число и отнять от него 99%, а потом добавить 9999%, то удивительно, проиграем всего 1%!
      • +2
        Не стоит доверять вам деньги. В вашем примере мы выигрываем 0.99%.
        • +7
          Приятно знать, что тут пересчитывают любые выкладки в комментариях :)
          • +2
            Лол) Тогда не деньги, а вам самому доверять не стоит :-) Шутка конечно же.
  • 0
    del
  • +7
    Спасибо за перевод. Было интересно почитать.
    Есть ошибочка. Причём в оригинале. Хотя ситуацию принципиально она не меняет, но
    Давайте попробуем еще разок, пусть текущий год — 100%, значит цены на молоко составляли 200% в прошлом году, а хлеб 50%.

    10 копеек от 30 копеек, будет 33,(3)%, а не 50%.
    • 0
      Судя по всему, в статье должно быть не «а хлеб вырос на 20», а «а хлеб вырос до 20».
  • 0
    Так и не понял, график чего изобразили New York Post.
    • +4
      Падение продаж Daily News и рост продаж их газеты.
    • +1
      Что конечные точки на графиках как бы рядом, хотя там идёт огромный скачок на шкале от 800к до 1.5кк)
  • +57
    Ещё один частый подлог — корреляция преподносится как причинно-следственная связь.

    image
    • +2
      Абсцисса на этом графике просто великолепна.
  • +1
    Меня всегда раздражают душераздирающие графики ужасающего падения величины почти до нуля, при том, что внизу шкала Y начинается с лишь немного меньшего значения, чем максимум на графике. В итоге, падение на полпроцента создаёт панику в головах людей.
    • +1
      О дааа :)
      Помню, лет 7–8 назад, когда был одним из ответственных за доступность сети банкоматов, негодовал, почему большие начальники докладывают самым большим начальникам уровень доступности в масштабе по оси ординат что-то типа от 95 до 97 процентов. Естественно, при таком раскладе падение на полпроцента выглядело феерическим провалом и влекло за собой необходимость долго объясняться. Один раз мои начальники со мной согласились и доложили в масштабе от 0 до 100. На это получили выговор: «не видно изменений, переделайте».
      • +4
        Ну, падение с 99% до 97% может означать, что доля конкурента выросла в три раза с 1% до 3%, а это уже вполне может быть поводом для беспокойства.
      • 0
        Ну так «уровень доступности» стоило бы измерять в процентах недоступности ибо пользователя не волнует сколько раз он успешно воспользовался банкоматом, но его бесит каждый случай когда он воспользоваться им не смог :)
        Было бы от 0% (идеал) до, скажем, 7% (ужас). Полпроцента в таком масштабе вполне себе ощущаются.

        А 95-97% сделали, надо полагать, потому что «95% доступности» звучит лучше чем «5% недоступности».
        Но вот начало шкалы-то как раз выбрали правильно, на графиках для адекватного отражения ситуации все равно следовало бы отразить примерно тот же диапазон, просто в цифрах доступности — т.е. те самые 90-100% или 93-100%.
    • +2
      image
  • 0
    На мой вкус — статья несколько… biased («предвзята»).

    Все-таки, за такого рода ляпами чаще стоит неграмотность, чем злой умысел. Сколь-нибудь квалифицированные статистики редко делают такие ошибки 00 слишком они «дидактичны». Такие цифры чаще производят на свет менеджеры по продажам и пр.

    В пору доступности «Big Data» нужно быть особо осторожным на предмет «False Positive Discoveries» — «Ложные открытия»
    (картинка подо катом)
    (картинка подо катом)
    • +9
      Вы недооцениваете человеческую тупость.

      Я видел подобные фокусы (в частности, совершенно по-идиотски сконструированные выборки и откровенную подмену причинно-следственной связи корреляцией) в исследованиях, причем не в каких-то несчастных местечковых самопалках и студенческих работах, а «типа как серьезных» публикациях оплаченных вполне ощутимыми грантами (собственно, очень многие из поддерживаемых Институтом Гувера исследований в т.н. social sciences грешат подобными «фокусами»).
      «Деньги взад» у таких учоных, насколько я знаю, еще ни разу никто не попросил.
  • +13
    Хотел бы ещё добавить, что у Мартина Гарднера в книге «А ну-ка, догадайся!», посвящённой парадоксам в широком смысле слова, пятая (кажется) глава посвящена статистике и типичным ошибкам интерпретации.

    Например, по статистике, смертность от рака (относительная, доля от всех причин смерти) в мире с каждым годом всё выше. Казалось бы, из этого напрашивается вывод, что медицина плоха и всё хуже справляется с раком. Ну или что экология стала хуже. Или ещё что-то в этом роде.
    На самом же деле это прямое следствие увеличения средней продолжительности жизни и уровня её качества — подавляющее большинство случаев рака бывает у пожилых людей, а раньше просто до рака, так сказать, не успевали дожить.

    Есть в переводе на русский, читается легко, всем советую.
    • +2
      На самом деле, и ваш вывод после слов «На самом же деле» далеко не бесспорен. :)
      • 0
        Не могу спорить :)
  • +5
    Мои «5 копеек» из 2009-го года:
    habrahabr.ru/post/58344/
  • –1
    У нас в лаборатории большинство экспериментов проводилось на допотопном оборудовании. Прибор чертил на бумаге пером кривую, по наклону которой (методом прикладывания линейки к воображаемой средней линии) определялись различные параметры.

    Когда определяли например графики активности ферментов, дабы не смущать научрука большим отклонением от его ранее полученных данных, один край линейки чуть сдвигался вверх или вниз (буквально на 0.5-1.0 мм) в зависимости от допущенной ошибки. Заметить такой финт — невозможно из-за «шумности» прибора.
  • –5
    Обожаю математику и тервер!
    В инсте просто прикола ради рассчитал вероятность того, что пол-аудитории задохнётся: вероятность того, что атом воздуха находится в передней или задней части аудитории — 0.5: тупо или там или там.
    Размер аудитории известен, число атомов на кубометр — известно. Надо посчитать вероятность того, что ВСЕ атомы воздуха окажутся с одной стороны…
    Число вышло исчезающе малым, но таки ВЕРОЯТНЫМ!
    Долго одногрупников пугал, а потом объяснил, что рассчёт яйца выеденного не стоит, т.к. не учитывает давления и т.д.: если в какой-то стороне газа больше, то лишних тупо выпнут в другую часть…
    • 0
      Да тут сегодня день удивлений :))
    • 0
      Ваши одногрупники очень пугливы. Там и без давления вероятность настолько мала, что у меня рука отвалилась бы нули писать.
      • 0
        Пишите 10-100500
    • 0
      «вероятность того, что ВСЕ атомы воздуха окажутся с одной стороны…»

      50% же — окажутся или не окажутся :)
  • 0
    Сразу вспоминаются все эти ТВ ролики с высказываниями вида «Номер 1 в России/Европе/Мире*».
  • +1
    Даже известный своей качественной работой с данными New York Times выпустил подобный совершенно сбивающий с толку график (обратите внимание на скачок с 800к до 1,5м в центре шкалы).

    А в графике New York Post, тоже очевидно «известный» своей качественной работой с данными
  • +6
    Есть ещё вот такое:
    image
  • 0
    Фрагмент из книги «Сначала нарушьте все правила».
    image

    Главное — что вывод взят не с потолка!
    • +3
      Это рассчитано на тех, кто читает очень быстро. При большой скорости чтения, например 500 слов в минуту на критическую оценку текста времени нет, и читатель впитывает всё, что ему написал автор.
      Тут есть люди, которые читают по паре-тройке книг в неделю. Они не отдают себе отчёта в том, что не обдумывают прочитанное — они просто поглощают.
      Я некоторые книги по полгода читаю, а некоторые вовсе не осилил, при этом часть книг я не читаю, а изучаю с карандашом в руках. В среднем на книгу уходит месяц, иногда больше. То, что можно читать по пути на работу, в метро повиснув между пассажирами, я книгами не считаю.
      • 0
        Книг 5-6 в месяц читаю, конечно это художественная литература, на техническую уходит больше времени, как раз в транспорте. Если точнее, то фиксирую момент когда книга прочитана, промежуток времени, затраченный на чтение может быть и больше, и меньше, т.к.читаю параллельно несколько. Запоминать художку имхо смысла нет, понравившиеся идеи, мысли — в цитатник.
    • 0
      Поясните пожлуйста, а что именно здесь не так? Нет, я понимаю, что написана ерунда, но что именно вас возмутило?) Подобные книги можно целыми параграфами в качестве цитат приводить…
  • +9
    Вспоминается советский анекдот:
    Хрушёв и Кеннеди решили устроить шуточный забег глав государств. Кеннеди, как более молодой, выиграл.

    В Американских газетах:
    В забеге глав крупнейших государств наш президент первый, а советский генсек пришёл самым последним.

    В Советских:
    В забеге глав крупнейших государств Никита Сергеевич Хрушёв занял почётное второе место. Американский президент лишь на предпоследнем.
  • +3
    Десять путинских лет
    image

    • +1
      Прикольно. Совершенно хрестоматийный обман.
      • 0
        Что-то не вижу явного обмана (если, конечно, указанные цифры соответствуют действительности), скорее вижу грубую небрежность в построении графиков (проще говоря, графики построены в разных масштабах, чтобы казалось, что они пересекаются гораздо раньше, чем на самом деле) и полное отсутствие пояснений по промежуточным значениям (и при этом зачем-то внизу сделана линейка), да и вообще, непонятна цена деления (делений 22, а годов — 10).
        • +2
          А Вам не кажется немного странным, что тезис — про «рождаемость» а на первом графике (где столбики и человечки) «численность жителей»?

          Ежели я в Екатеринбург перееду, то численность там вырастет на 1 :)

          Второй график чуть менее «палевный» (хотя надо бы проверить цифры), но всем нормальным специалистам известно что в РФ имеется периодическое колебание рождаемости, которое надо учитывать при оценке ценности заявлений относительно того что «Политик Х увеличил рождаемость....»

          Так что очень, очень хрестоматийный пример.
          • 0
            Если цифры рождаемости и смертности не взяты с потолка, то это — скорее уже не явный обман, а всего лишь демагогия. То есть, «мы сказали всю правду, а то, что вы их неправильно поняли, это ваши проблемы».
            • +1
              Я сказал «хрестоматийный», то есть достойный помещения в некий (смею надеяться, воображаемый) дидактический материал, содержащий систематически подобранные материалы о том, как «правильно» обманывать.
          • 0
            Согласен с тем, что первый график удобно притянут за уши. А вот второй мне понравился. По моим прикидкам разница рождаемость-смертность принесла "-50000" :) Так что «понаехало» прилично.
            При этом сам график не врёт в плане «позитива» — рождаемость привысила сметность, динамика тоже положительная, выборка за 10 лет тоже добавляет оптимизма. А вот правдо ли это — другой вопрос.
            • 0
              Так я и говорю: демагогия. Даны три утверждения:
              1) с 2000 по 2010 правил Путин;
              2) за это время рождаемость повышалась, смертность уменьшалась, так что в какой-то момент рождаемость превысила смертность впервые со времён перестройки;
              3) за этот период население города увеличилось.
              Допустим эти утверждения верные. О причинно-следственных связях между ними ничего не сказано, но невнимательный читатель решит, что они выстроены именно так: Путин правил хорошо, поэтому рождаемость увеличилась настолько, что стала причиной роста населения, на что собственно и рассчитано. А вот разные масштабы графиков — это уже грубый просчёт, надо было хотя бы разместить их отдельно, если хотелось, чтобы их не сравнивали.

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.