Pull to refresh
17
0
Дмитрий Кирьянов @polybook

Пользователь

Send message
1. Из предположения, что массы конфет — это независимые одинаково (неважно, как именно, но давайте считать — непрерывно) распределенные случайные величины с одинаковым средним и дисперсией.

Из этого условия логически следует (ЦПТ), что распределение массы коробки близко к нормальному -> 2 и т.д.

Термин «максимально допустимое отклонение», действительно, не очень хорош (так формулировал исходную задачу сам кондитер в 1й статье), но вполне допустим, на мой взгляд. Я его понимаю так: «какое отклонение конфеты от среднего можно допустить, чтобы положить конфету в коробку, а не выбросить в переплавку?».
Я вовсе не настаиваю на своей правоте. Может, стоило бы более строго формулировать задачу. Но я отталкивался от формулировки первого автора (которую по ходу сначала он сам, а потом и я сам слегка поправил).

Из своего опыта, как раз такая нечеткая формулировка типична: «Что мне делать, чтобы 90% коробок конфет соответствовали M=310±7?». А потом уже математик с заказчиком уточняют детали. Работая в консалтинге, я время от времени такие задачки решаю. Действительно, ТЗ на НИР стараюсь не подписывать, но в рамках техподдержки или обучения решаю (и с удовольствием).
Формальная задача не некорректна. (Некорректной я назвал задачу восстановления распределения конфет по известному распределению массы коробки).

Задача хороша тем, что она из реальной жизни. Именно так математику и ставят обычно задачу технологи.
Найти максимально допустимое отклонение массы конфеты при ее производстве, чтобы нетто коробки, состоящей из n=12 штук их, не выходило за пределы M=310±7 грамм в 90% случаев.


В задаче нет ничего про распределение. Технолог не знает статистики. Он хочет соблюсти ТУ. А как мы, математики, решили эту задачу?
1. Показали, что распределение массы коробки — гауссово (ЦПТ), независимо от распределения конфет (мы ее не знаем, но понимаем, что оно непрерывное).
2. Считаем дисперсию коробки, при которой 95% квантиль нормального распределения равен 7 г.
3. Пересчитываем (ЦПТ) найденную дисперсию коробки в дисперсию конфеты (делим на корень из 12).
4. Предлагаем технологу практическую реализацию: выкидывать слишком большие и слишком маленькие конфеты (2-я статья).

На мой взгляд, логика безупречна.
Еще можно и экономику посчитать — сколько фабрика сэкономит на том, что не будет перерасхода шоколада и штрафов за несоответствие ТУ.
Ну, мы же решаем конкретную практическую задачу. Ваш пример хорош, как математическая умозрительная иллюстрация. Но понятно, что в реальной жизни распределение конфет по массам непрерывное.
Конечно, берущийся, только Вы в аналитическом вычислении интеграла синус с косинусом перепутали. Он и нарисован (только посчитан численно). Чтобы убедиться, нарисовал на графике:



Ваша аналитика совпадает с моим численным методом.

— желтое — разность синусов (аналитика)
— красные точки — реальная часть разности экспонент (аналитика)
— зеленый пунктир — численное интегрирование (то же самое, что на всех моих графиках выше, они все правильные)
Именно это я хотел тут донести. Числовое решение, фактически, было получено в двух предыдущих статьях.
Слово «можно» — это мостик между строгой теорией (n=бесконечность) и практикой (n=12).

Думаю, что не только 12 непрерывных решений, а бесконечное число. Это типичная некорректная обратная задача. По самой постановке, х.ф. g задана с погрешностью (мы же изучаем выборки, где ошибки принципиально присутствуют). Поэтому для восстановления f нужны какие-то регуляризирующие идеи (в частности, гипотезы о нормальности или равномерности распределения конфет).
Потому, что ЦПТ нам дает обоснование нормального закона распределения массы коробки. Поэтому (еще раз Вас процитирую)
достаточно взять дисперсию, при которой 95% квантиль нормального распределения равен 7, поделить ее на число конфет и получить допустимую дисперсию массы конфеты.

Требовать нормальности распределения конфет нет необходимости в силу ЦПТ (конечно с оговорками на погрешность из-за того, что 12 меньше бесконечности, из-за несовершенности датчика случайных чисел и т.д.)
Речь зашла о характеристических функциях. Давайте посмотрим, как они выглядят. Конфеты считаем распределенными равномерно (отсортированные, как показано во всех трех статьях). Тогда х.ф. для равномерного распределения конфет и нормального распределения коробок:


Вот так выглядят графики действительной и мнимой части х.ф. конфет:


Структура х.ф. — фрактальная (график зависит от масштаба):


Звездочки — это х.ф. нормального распределения коробок.

Последний график — модуль х.ф. распределения 1-й конфеты (синяя огибающая), суммы 12 конфет (12-я степень х.ф. конфеты — пунктир) и коробки (звездочки):



Ради примера показана 4-я степень х.ф. конфеты (как бы коробка из 4 конфет).

Было бы любопытно услышать комментарии от специалистов в теорвере (я не знал про фрактальные осцилляции х.ф. — не ошибся ли я?) — вопрос к всемирному разуму.
Вы оба сейчас ошибаетесь. ЦПТ говорит о том, что при достаточно большом числе слагаемых сумму с.в. с (почти) любым распределением можно считать распределенной нормально. Ровно про это моя статья (можно поиграться в Маткаде).

Почему рассуждения про х.ф. неверны — с ходу не скажу. Возможно потому, что вы решаете уравнение 12-й степени, и корень из х.ф. массы коробки — это только одно из возможных решений (не забывайте о том, что х.ф. комплексная).
Прозевал Вашу прекрасную статью! Если я правильно понял, Вы доказали, что, если выкидывать конфеты, отличающиеся от 310/12 больше, чем на σ0*sqrt(3)=2.12 г, то 90% коробок будет в пределах 310±7. Независимо от распределения конфет.

Не врубился с ходу в Вашу математику, но похоже, Вы совершенно правы. Я когда брал равномерное распределение конфет, то выходило (по Монте-Карло), что, если оставлять только конфеты 310/12±2.13 г, то СКО конфет будет ровно σ0)=1.23 г. Соответственно, это дает нужную дисперсию коробки.

Я проверял только на равномерном и нормальном распределении конфет (две картинки в моей статье и два кейса в файле с расчетами). А что будет, если еще какое-нибудь распределение попробовать? По-Вашему, надо обрезать по тому же уровню 2.12*σ0?
В реальной жизни, может, и не бывает, но, как модель, его очень широко используют.
Я тоже согласен, что формулировка некорректная. Но автор первой статьи честно сказал — задача из реальной жизни. А в ней такое сплошь и рядом. Практический смысл задачи прозрачный: как технологу обеспечить попадание 90% продукции в диапазон 310±7 г. Да и механизм управления этим вполне ясен — отбраковывать слишком большие и слишком маленькие конфеты.
Нормально распределена масса коробки из 12 конфет. Неважно, как распределены по массе сами конфеты — в силу ЦПТ масса коробки будет иметь гауссово распределение.
1. Вы правы — много факторов влияют на численный эксперимент, и интересно проследить — как именно (для того я и выкладываю расчеты в Маткаде, чтобы любой, кто интересуется, мог идти дальше.

2. Именно! Вы дали, как мне представляется, лаконичное решение, поиску которого посвящены обе статьи:
сумма независимых распределений заведомо распределена нормально, так что, если масса конфеты распределена нормально — достаточно взять дисперсию, при которой 95% квантиль нормального распределения равен 7, поделить ее на число конфет и получить допустимую дисперсию массы конфеты.
Но посмотрите на комменты к первой статье (а ее автор сначала выложил саму задачу без решения, чтобы читатели могли ее сами решить).

3. Тоже согласен, изначально сформулировано неоднозначно. Но смысл интуитивно понятен: что надо делать, чтобы 90% коробок было в пределах M=310±7 г.

Я ничего не доказываю, а просто решаю задачу. И логика такова:
— независимо от статистики конфет, ЦПТ дает право полагать, что статистика суммы — Гауссова.
— автор задачи нашел S — искомую дисперсию массы для коробки. И отсюда — оценку для искомой дисперсии конфеты S/12.
Да нет, все правильно. Если взять Ваше пороговое СКО конфеты=0.64 г (СКО коробки=2.214), то Монте-Карло дает около 0.1...0.2% плохих коробок т.е. Р=0.001.

А неравенство Чебышева, конечно, выполнено, т.к. 0.001 <= s^2 / a ^2=0.1
М=100 интервалов, это М+1=101 узлов.

Про занудность — в корне не соглашусь (моя миссия — как раз показать, что это не так). По мне, математика, как таковая (с формулами и доказательствами) — как раз скучна. А вот вычислительная математика — нет! Потому что я сразу чувствую связь с физикой и реальной жизнью. А, играя параметрами, могу проникнуть и в суть физических явлений, и в особенности вычислительных методов (как с устойчивостью схемы).

И конечно, в некоторых задачах допустимо считать «плюс-минус-лапоть», а в некоторых — нет. Для долговременных расчетов тех же координат ИСЗ (где обыкновенные диф.уры, но решения быстро осциллирующие, и точность критична) есть специальные алгоритмы.
Для рассматриваемой разностной схемы феномен Рунге ни при чем, т.к. и по t, и по x интерполяция линейная.
Ваша первая ссылка ровно на явную схему бегущего счета, которая — один-в-один и рассмотрена в статье:

image

И о тесте про 4 знака после запятой там ничего нет.

Вообще-то моя статья — не про выбор хорошего алгоритма для решения диф.уравнения (явная схема Эйлера как раз плохая, а хороша она тем, что простая и часто работает). А про то, как быстро «на коленке» можно посчитать разностную схему в Маткаде, не требующем никаких навыков программирования (причем, в бесплатной версии).

Information

Rating
Does not participate
Location
Россия
Registered
Activity