<?xml version="1.0" encoding="utf-8"?> 
<rss version="2.0"
  xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd"
  xmlns:atom="http://www.w3.org/2005/Atom">

<channel>

<title>Математика и кофе: заметки с тегом примеры из жизни</title>
<link>https://mathandcoffee.ru/tags/primery-iz-zhizni/</link>
<description>Отделы продаж, коллцентры, аналитика, цифры и данные, воронки продаж, матстатистика..</description>
<author>Иван Балдин</author>
<language>ru</language>
<generator>E2 (v3565; Aegea)</generator>

<itunes:owner>
<itunes:name>Иван Балдин</itunes:name>
<itunes:email></itunes:email>
</itunes:owner>
<itunes:subtitle>Отделы продаж, коллцентры, аналитика, цифры и данные, воронки продаж, матстатистика..</itunes:subtitle>
<itunes:image href="" />
<itunes:explicit></itunes:explicit>

<item>
<title>4 смски «за», 4 смски «против»</title>
<guid isPermaLink="false">31</guid>
<link>https://mathandcoffee.ru/all/4-smski-za-4-smski-protiv/</link>
<pubDate>Mon, 16 Sep 2019 20:03:11 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/4-smski-za-4-smski-protiv/</comments>
<description>
&lt;p&gt;Недавно слушал «Вести ФМ», где обсуждались итоги &lt;a href="https://ru.wikipedia.org/wiki/%D0%95%D0%B4%D0%B8%D0%BD%D1%8B%D0%B9_%D0%B4%D0%B5%D0%BD%D1%8C_%D0%B3%D0%BE%D0%BB%D0%BE%D1%81%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F_8_%D1%81%D0%B5%D0%BD%D1%82%D1%8F%D0%B1%D1%80%D1%8F_2019_%D0%B3%D0%BE%D0%B4%D0%B0"&gt;единого дня голосования 8 сентября&lt;/a&gt;.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/4smski05.JPG" width="1230" height="601" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Меня заинтересовала следующая реплика ведущего, &lt;a href="https://youtu.be/tOUSxbWdSuY?t=6305"&gt;с 01:45:05&lt;/a&gt;:&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;&lt;i&gt;Кстати, вот, слушатели из того же Хабаровского края пишут и, примерно, по количеству смсок делятся «50 на 50». 50% считают, что они позитивный выбор совершили, а 50% считают, что стало хуже, и это был негативный выбор. Это, понятно, не социологическое исследование. Ну, вот, просто я вижу десяток, восемь, где-то, смсок, и они примерно пополам делятся. Тоже любопытно.&lt;/i&gt;&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;К чести ведущего, абсолютно корректное замечание-«дисклеймер», что это не «социологическое исследование». И все же, что можно сказать о том, как, &lt;i&gt;в реальности,&lt;/i&gt; делятся голоса, если у вас в наличии только 4 смски «за» и 4 смски «против»? Насколько соотношение «50 на 50», полученное на выборке в 8 смсок, подтверждает ровно то же самое распределение голосов &lt;i&gt;в генеральной совокупности?&lt;/i&gt;&lt;/p&gt;
&lt;h2&gt;Считаем в Гугл Таблицах&lt;/h2&gt;
&lt;p&gt;Быстро воспроизводим эксперимент в Гугл Таблицах:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/4smski00.PNG" width="381" height="191" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Итак, в тот день 4 человека прислали смски «за», 4 человека прислали смски «против». Логично предположить, что день на день не приходится, и сегодня это были одни слушатели, завтра смски будут присылать другие слушатели, и соотношение сил может быть «3 к 5», «5 к 3», «2 к 6» или «7 к 1» — любое сочетание теоретически возможно. Однако, если мы предполагаем, что взгляды аудитории делятся поровну, то чуть более вероятны сценарии «4 к 4», «3 к 5» или «5 к 3», а сценарии «8 к 0» или «1 к 7», например, менее вероятны.&lt;/p&gt;
&lt;p&gt;Технически, мы имеем дело с &lt;i&gt;биномиальным распределением&lt;/i&gt; — из 8 смсок мы &lt;i&gt;ожидаем&lt;/i&gt; получить 4 смски «за», но не знаем наверняка, сколько их будет. Вероятность получить смску «за» равна 50% (допустим, что ровно 50% аудитории — «за»), в этом случае &lt;b&gt;&lt;i&gt;стандартная ошибка (SD,&lt;/i&gt;&lt;/b&gt; или &lt;b&gt;&lt;i&gt;&amp;sigma;)&lt;/i&gt;&lt;/b&gt; биномиального распределения рассчитывалась бы по формуле:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/CodeCogsEqn.png" width="201" height="77" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;где &lt;b&gt;&lt;i&gt;p&lt;/i&gt;&lt;/b&gt; = 50%, а &lt;b&gt;&lt;i&gt;n&lt;/i&gt;&lt;/b&gt; = 8.&lt;/p&gt;
&lt;p&gt;Считаем:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/4smski01.PNG" width="384" height="231" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Получается, если вероятность получить смску «за» равняется 50%, то стандартное отклонение при выборке в 8 смсок &lt;b&gt;равняется 17,68%!&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Что же это означает на практике?&lt;/p&gt;
&lt;p&gt;Это означает, что, поскольку имеющаяся выборка (8 смсок) крайне мала, доля случайности в нашем результате «4 „за“, 4 „против“», наоборот, крайне велика, и мы не можем уверенно говорить о строгом распределении голосов «50 на 50» среди всей аудитории «Вести ФМ». Единственное, что мы можем утверждать более-менее точно, это то,  что истинная доля голосов «за» лежит &lt;b&gt;&lt;i&gt;в некотором интервале&lt;/i&gt;&lt;/b&gt; вокруг 50%. И величина этого интервала будет тем шире, чем больше мы захотим быть уверены в его надежности.&lt;/p&gt;
&lt;p&gt;Предположим, мы хотим быть уверены в нашем доверительном интервале на 90%. (Оставляем себе право на ошибку в 10% случаев, другими словами). Согласно законам &lt;i&gt;нормального распределения&lt;/i&gt; (а биномиальное распределение — это частный случай нормального), данный интервал &lt;b&gt;определяется как 50%&amp;plusmn;1,645SD.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Такое несложно рассчитать в Гугл Таблицах:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/4smski03.PNG" width="379" height="246" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Получается, что истинная доля голосов «за» лежит в интервале 50%&amp;plusmn;29,08%, &lt;b&gt;т. е. от 20,92% до 79,08%.&lt;/b&gt; Примерно вот так это выглядит:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/4smski02.PNG" width="789" height="368" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Значит, мы и близко не можем говорить о том, что «слушатели ... примерно ... делятся 50 на 50»! В лучшем случае (даже оставляя 10% на то, что мы ошибемся), &lt;b&gt;мы можем говорить лишь об интервале от 21% до 79%.&lt;/b&gt;&lt;/p&gt;
&lt;h2&gt;Уточнение расчетов&lt;/h2&gt;
&lt;p&gt;Однако, интервал &lt;b&gt;&lt;i&gt;p&lt;/i&gt;&amp;plusmn;1,645&lt;i&gt;SD&lt;/i&gt;&lt;/b&gt; тоже является достаточно грубой оценкой. Существуют более сложные, и немного более точные, способы оценить границы интервалов.&lt;/p&gt;
&lt;p&gt;Воспользовавшись &lt;a href="https://www.wolframalpha.com/input/?i=binomial+distribution+confidence+interval"&gt;калькулятором Wolfram Alpha&lt;/a&gt;, можно получить следующие границы интервала:&lt;/p&gt;
&lt;div class="e2-text-table"&gt;
&lt;table cellpadding="0" cellspacing="0" border="0"&gt;
&lt;tr&gt;
&lt;td style="text-align: left"&gt;Clopper-Pearson confidence interval for a binomial parameter&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,1929&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,8071&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: left"&gt;Wilson score confidence interval for a binomial parameter with continuity correction&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,2034&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,7966&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: left"&gt;standard confidence interval for a binomial parameter&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,2092&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,7908&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: left"&gt;Jeffreys confidence interval for a binomial parameter&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,2393&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,7607&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: left"&gt;Wilson score confidence interval for a binomial parameter&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,2486&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,7514&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: left"&gt;Agresti-Coull confidence interval for a binomial parameter&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,2486&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,7514&lt;/td&gt;
&lt;/tr&gt;
&lt;/table&gt;
&lt;/div&gt;
&lt;h2&gt;Ну а если хотим, хотя бы, 45-55% получить?&lt;/h2&gt;
&lt;p&gt;Вот еще интересно: на какого размера выборке, если голоса в ней по-прежнему делятся строго «50 на 50», мы сможем говорить о доверительном интервале, суженном хотя бы до 45-55%?&lt;/p&gt;
&lt;p&gt;Рассчитать такое несложно. Если речь идет об интервале 50%&amp;plusmn;5%, (и мы продолжаем придерживаться уровня уверенности в результате, равном нашим любимым 90%), то 5% должны составлять 1,645 стандартных отклонений (SD). Отсюда, SD = 3,04%. По формуле стандартного отклонения:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/4smski04.png" width="270" height="58" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;откуда несложно найти n = 270,6. Получается, нужно 270-272 смски с распределением голосов строго пополам, чтобы говорить об интервале от 45% до 55% с уровнем уверенности 90%.&lt;/p&gt;
&lt;h2&gt;См. также&lt;/h2&gt;
&lt;p&gt;&lt;a href="https://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval"&gt;https://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval&lt;/a&gt;&lt;br /&gt;
&lt;a href="https://www.wolframalpha.com/input/?i=binomial+distribution+confidence+interval&amp;assumption=%22FSelect%22+-%3E+%7B%7B%22BinomialInterval%22%7D%7D&amp;assumption=%7B%22F%22%2C+%22BinomialInterval%22%2C+%22phat%22%7D+-%3E%220.5%22&amp;assumption=%7B%22F%22%2C+%22BinomialInterval%22%2C+%22c%22%7D+-%3E%220.9%22&amp;assumption=%7B%22F%22%2C+%22BinomialInterval%22%2C+%22n%22%7D+-%3E%228%22"&gt;Калькулятор на WolframAlpha.com&lt;/a&gt;&lt;br /&gt;
&lt;a href="https://cyberleninka.ru/article/n/doveritelnye-intervaly-dlya-chastot-i-doley.pdf"&gt;https://cyberleninka.ru/article/n/doveritelnye-intervaly-dlya-chastot-i-doley.pdf&lt;/a&gt;&lt;br /&gt;
&lt;a href="http://italylov.ru/blog/all/ctatisticheskaya-dostovernost-koltrekinga/"&gt;Cтатистическая достоверность для застройщиков&lt;/a&gt;&lt;/p&gt;
</description>
</item>


</channel>
</rss>