{
    "version": "https:\/\/jsonfeed.org\/version\/1",
    "title": "Математика и кофе: заметки с тегом примеры из жизни",
    "_rss_description": "Отделы продаж, коллцентры, аналитика, цифры и данные, воронки продаж, матстатистика..",
    "_rss_language": "ru",
    "_itunes_email": "",
    "_itunes_categories_xml": "",
    "_itunes_image": "",
    "_itunes_explicit": "",
    "home_page_url": "https:\/\/mathandcoffee.ru\/tags\/primery-iz-zhizni\/",
    "feed_url": "https:\/\/mathandcoffee.ru\/tags\/primery-iz-zhizni\/json\/",
    "icon": "https:\/\/mathandcoffee.ru\/user\/userpic@2x.jpg?1559386410",
    "author": {
        "name": "Иван Балдин",
        "url": "https:\/\/mathandcoffee.ru\/",
        "avatar": "https:\/\/mathandcoffee.ru\/user\/userpic@2x.jpg?1559386410"
    },
    "items": [
        {
            "id": "31",
            "url": "https:\/\/mathandcoffee.ru\/all\/4-smski-za-4-smski-protiv\/",
            "title": "4 смски «за», 4 смски «против»",
            "content_html": "<p>Недавно слушал «Вести ФМ», где обсуждались итоги <a href=\"https:\/\/ru.wikipedia.org\/wiki\/%D0%95%D0%B4%D0%B8%D0%BD%D1%8B%D0%B9_%D0%B4%D0%B5%D0%BD%D1%8C_%D0%B3%D0%BE%D0%BB%D0%BE%D1%81%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F_8_%D1%81%D0%B5%D0%BD%D1%82%D1%8F%D0%B1%D1%80%D1%8F_2019_%D0%B3%D0%BE%D0%B4%D0%B0\">единого дня голосования 8 сентября<\/a>.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/4smski05.JPG\" width=\"1230\" height=\"601\" alt=\"\" \/>\n<\/div>\n<p>Меня заинтересовала следующая реплика ведущего, <a href=\"https:\/\/youtu.be\/tOUSxbWdSuY?t=6305\">с 01:45:05<\/a>:<\/p>\n<blockquote>\n<p><i>Кстати, вот, слушатели из того же Хабаровского края пишут и, примерно, по количеству смсок делятся «50 на 50». 50% считают, что они позитивный выбор совершили, а 50% считают, что стало хуже, и это был негативный выбор. Это, понятно, не социологическое исследование. Ну, вот, просто я вижу десяток, восемь, где-то, смсок, и они примерно пополам делятся. Тоже любопытно.<\/i><\/p>\n<\/blockquote>\n<p>К чести ведущего, абсолютно корректное замечание-«дисклеймер», что это не «социологическое исследование». И все же, что можно сказать о том, как, <i>в реальности,<\/i> делятся голоса, если у вас в наличии только 4 смски «за» и 4 смски «против»? Насколько соотношение «50 на 50», полученное на выборке в 8 смсок, подтверждает ровно то же самое распределение голосов <i>в генеральной совокупности?<\/i><\/p>\n<h2>Считаем в Гугл Таблицах<\/h2>\n<p>Быстро воспроизводим эксперимент в Гугл Таблицах:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/4smski00.PNG\" width=\"381\" height=\"191\" alt=\"\" \/>\n<\/div>\n<p>Итак, в тот день 4 человека прислали смски «за», 4 человека прислали смски «против». Логично предположить, что день на день не приходится, и сегодня это были одни слушатели, завтра смски будут присылать другие слушатели, и соотношение сил может быть «3 к 5», «5 к 3», «2 к 6» или «7 к 1» — любое сочетание теоретически возможно. Однако, если мы предполагаем, что взгляды аудитории делятся поровну, то чуть более вероятны сценарии «4 к 4», «3 к 5» или «5 к 3», а сценарии «8 к 0» или «1 к 7», например, менее вероятны.<\/p>\n<p>Технически, мы имеем дело с <i>биномиальным распределением<\/i> — из 8 смсок мы <i>ожидаем<\/i> получить 4 смски «за», но не знаем наверняка, сколько их будет. Вероятность получить смску «за» равна 50% (допустим, что ровно 50% аудитории — «за»), в этом случае <b><i>стандартная ошибка (SD,<\/i><\/b> или <b><i>&sigma;)<\/i><\/b> биномиального распределения рассчитывалась бы по формуле:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/CodeCogsEqn.png\" width=\"201\" height=\"77\" alt=\"\" \/>\n<\/div>\n<p>где <b><i>p<\/i><\/b> = 50%, а <b><i>n<\/i><\/b> = 8.<\/p>\n<p>Считаем:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/4smski01.PNG\" width=\"384\" height=\"231\" alt=\"\" \/>\n<\/div>\n<p>Получается, если вероятность получить смску «за» равняется 50%, то стандартное отклонение при выборке в 8 смсок <b>равняется 17,68%!<\/b><\/p>\n<p>Что же это означает на практике?<\/p>\n<p>Это означает, что, поскольку имеющаяся выборка (8 смсок) крайне мала, доля случайности в нашем результате «4 „за“, 4 „против“», наоборот, крайне велика, и мы не можем уверенно говорить о строгом распределении голосов «50 на 50» среди всей аудитории «Вести ФМ». Единственное, что мы можем утверждать более-менее точно, это то,  что истинная доля голосов «за» лежит <b><i>в некотором интервале<\/i><\/b> вокруг 50%. И величина этого интервала будет тем шире, чем больше мы захотим быть уверены в его надежности.<\/p>\n<p>Предположим, мы хотим быть уверены в нашем доверительном интервале на 90%. (Оставляем себе право на ошибку в 10% случаев, другими словами). Согласно законам <i>нормального распределения<\/i> (а биномиальное распределение — это частный случай нормального), данный интервал <b>определяется как 50%&plusmn;1,645SD.<\/b><\/p>\n<p>Такое несложно рассчитать в Гугл Таблицах:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/4smski03.PNG\" width=\"379\" height=\"246\" alt=\"\" \/>\n<\/div>\n<p>Получается, что истинная доля голосов «за» лежит в интервале 50%&plusmn;29,08%, <b>т. е. от 20,92% до 79,08%.<\/b> Примерно вот так это выглядит:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/4smski02.PNG\" width=\"789\" height=\"368\" alt=\"\" \/>\n<\/div>\n<p>Значит, мы и близко не можем говорить о том, что «слушатели ... примерно ... делятся 50 на 50»! В лучшем случае (даже оставляя 10% на то, что мы ошибемся), <b>мы можем говорить лишь об интервале от 21% до 79%.<\/b><\/p>\n<h2>Уточнение расчетов<\/h2>\n<p>Однако, интервал <b><i>p<\/i>&plusmn;1,645<i>SD<\/i><\/b> тоже является достаточно грубой оценкой. Существуют более сложные, и немного более точные, способы оценить границы интервалов.<\/p>\n<p>Воспользовавшись <a href=\"https:\/\/www.wolframalpha.com\/input\/?i=binomial+distribution+confidence+interval\">калькулятором Wolfram Alpha<\/a>, можно получить следующие границы интервала:<\/p>\n<div class=\"e2-text-table\">\n<table cellpadding=\"0\" cellspacing=\"0\" border=\"0\">\n<tr>\n<td style=\"text-align: left\">Clopper-Pearson confidence interval for a binomial parameter<\/td>\n<td style=\"text-align: right\">0,1929<\/td>\n<td style=\"text-align: right\">0,8071<\/td>\n<\/tr>\n<tr>\n<td style=\"text-align: left\">Wilson score confidence interval for a binomial parameter with continuity correction<\/td>\n<td style=\"text-align: right\">0,2034<\/td>\n<td style=\"text-align: right\">0,7966<\/td>\n<\/tr>\n<tr>\n<td style=\"text-align: left\">standard confidence interval for a binomial parameter<\/td>\n<td style=\"text-align: right\">0,2092<\/td>\n<td style=\"text-align: right\">0,7908<\/td>\n<\/tr>\n<tr>\n<td style=\"text-align: left\">Jeffreys confidence interval for a binomial parameter<\/td>\n<td style=\"text-align: right\">0,2393<\/td>\n<td style=\"text-align: right\">0,7607<\/td>\n<\/tr>\n<tr>\n<td style=\"text-align: left\">Wilson score confidence interval for a binomial parameter<\/td>\n<td style=\"text-align: right\">0,2486<\/td>\n<td style=\"text-align: right\">0,7514<\/td>\n<\/tr>\n<tr>\n<td style=\"text-align: left\">Agresti-Coull confidence interval for a binomial parameter<\/td>\n<td style=\"text-align: right\">0,2486<\/td>\n<td style=\"text-align: right\">0,7514<\/td>\n<\/tr>\n<\/table>\n<\/div>\n<h2>Ну а если хотим, хотя бы, 45-55% получить?<\/h2>\n<p>Вот еще интересно: на какого размера выборке, если голоса в ней по-прежнему делятся строго «50 на 50», мы сможем говорить о доверительном интервале, суженном хотя бы до 45-55%?<\/p>\n<p>Рассчитать такое несложно. Если речь идет об интервале 50%&plusmn;5%, (и мы продолжаем придерживаться уровня уверенности в результате, равном нашим любимым 90%), то 5% должны составлять 1,645 стандартных отклонений (SD). Отсюда, SD = 3,04%. По формуле стандартного отклонения:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/4smski04.png\" width=\"270\" height=\"58\" alt=\"\" \/>\n<\/div>\n<p>откуда несложно найти n = 270,6. Получается, нужно 270-272 смски с распределением голосов строго пополам, чтобы говорить об интервале от 45% до 55% с уровнем уверенности 90%.<\/p>\n<h2>См. также<\/h2>\n<p><a href=\"https:\/\/en.wikipedia.org\/wiki\/Binomial_proportion_confidence_interval\">https:\/\/en.wikipedia.org\/wiki\/Binomial_proportion_confidence_interval<\/a><br \/>\n<a href=\"https:\/\/www.wolframalpha.com\/input\/?i=binomial+distribution+confidence+interval&assumption=%22FSelect%22+-%3E+%7B%7B%22BinomialInterval%22%7D%7D&assumption=%7B%22F%22%2C+%22BinomialInterval%22%2C+%22phat%22%7D+-%3E%220.5%22&assumption=%7B%22F%22%2C+%22BinomialInterval%22%2C+%22c%22%7D+-%3E%220.9%22&assumption=%7B%22F%22%2C+%22BinomialInterval%22%2C+%22n%22%7D+-%3E%228%22\">Калькулятор на WolframAlpha.com<\/a><br \/>\n<a href=\"https:\/\/cyberleninka.ru\/article\/n\/doveritelnye-intervaly-dlya-chastot-i-doley.pdf\">https:\/\/cyberleninka.ru\/article\/n\/doveritelnye-intervaly-dlya-chastot-i-doley.pdf<\/a><br \/>\n<a href=\"http:\/\/italylov.ru\/blog\/all\/ctatisticheskaya-dostovernost-koltrekinga\/\">Cтатистическая достоверность для застройщиков<\/a><\/p>\n",
            "date_published": "2019-09-16T20:03:11+03:00",
            "date_modified": "2019-09-16T20:37:32+03:00",
            "image": "https:\/\/mathandcoffee.ru\/pictures\/4smski05.JPG",
            "_date_published_rfc2822": "Mon, 16 Sep 2019 20:03:11 +0300",
            "_rss_guid_is_permalink": "false",
            "_rss_guid": "31",
            "_e2_data": {
                "is_favourite": false,
                "links_required": [],
                "og_images": [
                    "https:\/\/mathandcoffee.ru\/pictures\/4smski05.JPG",
                    "https:\/\/mathandcoffee.ru\/pictures\/4smski00.PNG",
                    "https:\/\/mathandcoffee.ru\/pictures\/CodeCogsEqn.png",
                    "https:\/\/mathandcoffee.ru\/pictures\/4smski01.PNG",
                    "https:\/\/mathandcoffee.ru\/pictures\/4smski03.PNG",
                    "https:\/\/mathandcoffee.ru\/pictures\/4smski02.PNG",
                    "https:\/\/mathandcoffee.ru\/pictures\/4smski04.png"
                ]
            }
        }
    ],
    "_e2_version": 3565,
    "_e2_ua_string": "E2 (v3565; Aegea)"
}