<?xml version="1.0" encoding="utf-8"?> 
<rss version="2.0"
  xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd"
  xmlns:atom="http://www.w3.org/2005/Atom">

<channel>

<title>Математика и кофе: заметки с тегом Google Таблицы</title>
<link>https://mathandcoffee.ru/tags/google-tablicy/</link>
<description>Отделы продаж, коллцентры, аналитика, цифры и данные, воронки продаж, матстатистика..</description>
<author>Иван Балдин</author>
<language>ru</language>
<generator>E2 (v3565; Aegea)</generator>

<itunes:owner>
<itunes:name>Иван Балдин</itunes:name>
<itunes:email></itunes:email>
</itunes:owner>
<itunes:subtitle>Отделы продаж, коллцентры, аналитика, цифры и данные, воронки продаж, матстатистика..</itunes:subtitle>
<itunes:image href="" />
<itunes:explicit></itunes:explicit>

<item>
<title>Нормальное распределение</title>
<guid isPermaLink="false">41</guid>
<link>https://mathandcoffee.ru/all/normalnoe-raspredelenie/</link>
<pubDate>Sun, 05 Apr 2020 15:06:07 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/normalnoe-raspredelenie/</comments>
<description>
&lt;h2&gt;Нормальное распределение&lt;/h2&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/normal00.png" width="958" height="392" alt="" /&gt;
&lt;/div&gt;
&lt;div class="e2-text-table"&gt;
&lt;table cellpadding="0" cellspacing="0" border="0"&gt;
&lt;tr&gt;
&lt;td&gt;&lt;b&gt;Количество SD&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;-3,000&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;-2,576&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;-2,000&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;-1,960&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;-1,645&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;-1,282&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;1,282&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;1,645&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;1,960&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;2,000&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;2,576&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;3,000&lt;/b&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;b&gt;Вероятность накопленным итогом&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,0013&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,0050&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,0228&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,0250&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,0500&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,1000&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,9000&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,9500&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,9750&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,9772&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,9950&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,9987&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;b&gt;Вероятность в границах +/- стольких SD&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;-0,9973&lt;/td&gt;
&lt;td style="text-align: right"&gt;-0,9900&lt;/td&gt;
&lt;td style="text-align: right"&gt;-0,9545&lt;/td&gt;
&lt;td style="text-align: right"&gt;-0,9500&lt;/td&gt;
&lt;td style="text-align: right"&gt;-0,9000&lt;/td&gt;
&lt;td style="text-align: right"&gt;-0,8000&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,8000&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,9000&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,9500&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,9545&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,9900&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,9973&lt;/td&gt;
&lt;/tr&gt;
&lt;/table&gt;
&lt;/div&gt;
&lt;p&gt;&lt;a href="https://docs.google.com/spreadsheets/d/1NyGMqQtVnRRNK06Wh2vR6R6e2M09Ao7LG5-2e3maLAk/edit?usp=sharing"&gt;График и данные&lt;/a&gt; в Google Таблицах&lt;/p&gt;
</description>
</item>

<item>
<title>Продвинутый способ расчета рейтингов</title>
<guid isPermaLink="false">16</guid>
<link>https://mathandcoffee.ru/all/prodvinuty-sposob-rascheta-reytingov/</link>
<pubDate>Sat, 21 Sep 2019 15:59:00 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/prodvinuty-sposob-rascheta-reytingov/</comments>
<description>
&lt;p&gt;Крайне любопытная статья на сайте EvanMiller.org, &lt;a href="https://www.evanmiller.org/ranking-items-with-star-ratings.html" class="nu"&gt;«&lt;u&gt;Ranking Items With Star Ratings&lt;/u&gt;»&lt;/a&gt;, предлагает &lt;b&gt;продвинутый способ расчета рейтингов,&lt;/b&gt; например, по пятибалльной шкале.&lt;/p&gt;
&lt;p&gt;(Вообще, судя по интонации автора, история с рейтингами и методиками их расчета не так проста, как может показаться, и он &lt;a href="https://www.evanmiller.org/how-not-to-sort-by-average-rating.html"&gt;неоднократно к ней возвращается&lt;/a&gt;.)&lt;/p&gt;
&lt;p&gt;Из того, что удалось понять: во-первых, расчет &lt;b&gt;среднего рейтинга&lt;/b&gt; не всегда позволяет однозначно определить место объекта относительно остальных объектов — например, средние рейтинги могут, банально, совпадать. Во-вторых, средний рейтинг не учитывает количество голосов, ведь по идее, чем больше голосов участвует в расчете рейтинга, тем надежнее этот рейтинг.&lt;/p&gt;
&lt;p&gt;Простой пример — оценки двух сотрудников:&lt;/p&gt;
&lt;p&gt;Осипов — 5, 5, 5, 5, 5, 2, 2, 2, 2, 2. &lt;b&gt;Среднее = 3,50.&lt;/b&gt;&lt;br /&gt;
Сухонцев — 4, 4, 3, 3. &lt;b&gt;Среднее = 3,50.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Неразрешимая, на первый взгляд, ситуация решается методами &lt;a href="https://ru.wikipedia.org/wiki/%D0%91%D0%B0%D0%B9%D0%B5%D1%81%D0%BE%D0%B2%D1%81%D0%BA%D0%B0%D1%8F_%D1%81%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0"&gt;байесовской статистики&lt;/a&gt; (что бы конкретно это здесь ни значило), вуаля:&lt;/p&gt;
&lt;p&gt;Осипов — &lt;b&gt;2,72.&lt;/b&gt;&lt;br /&gt;
Сухонцев — &lt;b&gt;2,63.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Чудесным образом то ли меньшее среднеквадратичное отклонение (0,58 против 1,58), то ли меньшее количество оценок (4 против 10), то ли все они вместе &lt;b&gt;уточнили&lt;/b&gt; средний рейтинг Сухонцева, отдав ему предпочтение в несколько сотых.&lt;/p&gt;
&lt;h2&gt;Формула продвинутого расчета среднего рейтинга&lt;/h2&gt;
&lt;p&gt;Приготовьтесь, будет немного больно.&lt;/p&gt;
&lt;p&gt;Итак, &lt;a href="https://www.evanmiller.org/ranking-items-with-star-ratings.html#setup"&gt;предполагается&lt;/a&gt;, что у нас есть &lt;i&gt;&lt;b&gt;K&lt;/b&gt;&lt;/i&gt; возможных оценок, считаемых по &lt;i&gt;&lt;b&gt;k,&lt;/b&gt;&lt;/i&gt; каждая оценка стоит &lt;i&gt;&lt;b&gt;s&lt;sub&gt;k&lt;/sub&gt;&lt;/b&gt;&lt;/i&gt; баллов («1» — это 1 балл, «2» — это 2 балла и т. д.). Имея &lt;i&gt;&lt;b&gt;N&lt;/b&gt;&lt;/i&gt; полученных оценок для каждого объекта, по &lt;i&gt;&lt;b&gt;n&lt;sub&gt;k&lt;/sub&gt;&lt;/b&gt;&lt;/i&gt; оценок для каждого &lt;i&gt;&lt;b&gt;k,&lt;/b&gt;&lt;/i&gt; можно посчитать рейтинг каждого объекта по формуле:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/ratings00.PNG" width="835" height="229" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Где &lt;i&gt;&lt;b&gt;z&lt;sub&gt;α/2&lt;/sub&gt;&lt;/b&gt;&lt;/i&gt; это &lt;i&gt;&lt;b&gt;1−α/2&lt;/b&gt;&lt;/i&gt; квантиль нормального распределения. Посчитанный рейтинг является нижней границей нормальной аппроксимации байесова доверительного интервала для среднего рейтинга. Принимая, например, α=0,10 (z=1,65), рассчитанный рейтинг &lt;i&gt;&lt;b&gt;S&lt;/b&gt;&lt;/i&gt; будет означать, что в 95% случаев средний рейтинг объекта будет выше &lt;i&gt;&lt;b&gt;S&lt;/b&gt;&lt;/i&gt;.&lt;/p&gt;
&lt;p&gt;Упрощая, «продвинутый» расчет среднего рейтинга позволяет дать прогноз возможной средней оценки, рассчитываемой традиционным путем. Ну и, следовательно, как показано выше, ранжировать объекты даже при формально одинаковой средней оценке.&lt;/p&gt;
&lt;h2&gt;Пример расчета продвинутого среднего рейтинга&lt;/h2&gt;
&lt;p&gt;Вооружившись 2000 оценок по пятибалльной шкале условных территориальных офисов продаж, я посчитал средний рейтинг каждого офиса обычным и «продвинутым» способом.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;div class="fotorama" data-width="455" data-ratio="1.0859188544153"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/ratings01.PNG" width="455" height="419" alt="" /&gt;
&lt;img src="https://mathandcoffee.ru/pictures/ratings02.PNG" width="455" height="419" alt="" /&gt;
&lt;/div&gt;
&lt;div class="e2-text-caption"&gt;Среднее 1.0 — средний рейтинг обычный, Среднее 2.0 — средний рейтинг продвинутый.&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;«Таганский» упал со 2-го на 4-е место по всей видимости, из-за того, что выборка в 66 оценок не дает достаточной уверенности в том, что его средний рейтинг действительно настолько высок, и в 90% случаев его рейтинг прогнозируется выше всего лишь 4,55, что примерно соответствует 4-му месту.&lt;/p&gt;
&lt;p&gt;«Академический» формально был на 13-м месте, но, благодаря надежным 249 оценкам, для него прогнозируется, в 90% случаев, средний рейтинг не ниже 4,4, что поднимает его до 10-го места.&lt;/p&gt;
&lt;p&gt;У меня сложилось ощущение, что формула более убедительно работает для коротких шкал оценок, как «от 1 до 5» в приведенном примере.&lt;/p&gt;
&lt;p&gt;В любом случае, делюсь &lt;a href="https://docs.google.com/spreadsheets/d/1Uh5ndL3rFjd9orZ5NCZFInuWN218LDO6N-D90Ih0THo/edit?usp=sharing"&gt;файлом в Google Таблицах&lt;/a&gt; — по идее, он считает рейтинги для всех шкал «длиной» до 100 оценок включительно, позволяет импортировать до 10 000 строк с оценками и корректировать уровень достоверности (90% в нашем примере).&lt;/p&gt;
&lt;h2&gt;Cм. также&lt;/h2&gt;
&lt;p&gt;&lt;a href="https://www.evanmiller.org/ranking-items-with-star-ratings.html"&gt;https://www.evanmiller.org/ranking-items-with-star-ratings.html&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;&lt;a href="https://docs.google.com/spreadsheets/d/1Uh5ndL3rFjd9orZ5NCZFInuWN218LDO6N-D90Ih0THo/edit?usp=sharing"&gt;Продвинутый способ расчета рейтинга&lt;/a&gt; в Google Таблицах&lt;/p&gt;
</description>
</item>

<item>
<title>4 смски «за», 4 смски «против»</title>
<guid isPermaLink="false">31</guid>
<link>https://mathandcoffee.ru/all/4-smski-za-4-smski-protiv/</link>
<pubDate>Mon, 16 Sep 2019 20:03:11 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/4-smski-za-4-smski-protiv/</comments>
<description>
&lt;p&gt;Недавно слушал «Вести ФМ», где обсуждались итоги &lt;a href="https://ru.wikipedia.org/wiki/%D0%95%D0%B4%D0%B8%D0%BD%D1%8B%D0%B9_%D0%B4%D0%B5%D0%BD%D1%8C_%D0%B3%D0%BE%D0%BB%D0%BE%D1%81%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F_8_%D1%81%D0%B5%D0%BD%D1%82%D1%8F%D0%B1%D1%80%D1%8F_2019_%D0%B3%D0%BE%D0%B4%D0%B0"&gt;единого дня голосования 8 сентября&lt;/a&gt;.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/4smski05.JPG" width="1230" height="601" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Меня заинтересовала следующая реплика ведущего, &lt;a href="https://youtu.be/tOUSxbWdSuY?t=6305"&gt;с 01:45:05&lt;/a&gt;:&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;&lt;i&gt;Кстати, вот, слушатели из того же Хабаровского края пишут и, примерно, по количеству смсок делятся «50 на 50». 50% считают, что они позитивный выбор совершили, а 50% считают, что стало хуже, и это был негативный выбор. Это, понятно, не социологическое исследование. Ну, вот, просто я вижу десяток, восемь, где-то, смсок, и они примерно пополам делятся. Тоже любопытно.&lt;/i&gt;&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;К чести ведущего, абсолютно корректное замечание-«дисклеймер», что это не «социологическое исследование». И все же, что можно сказать о том, как, &lt;i&gt;в реальности,&lt;/i&gt; делятся голоса, если у вас в наличии только 4 смски «за» и 4 смски «против»? Насколько соотношение «50 на 50», полученное на выборке в 8 смсок, подтверждает ровно то же самое распределение голосов &lt;i&gt;в генеральной совокупности?&lt;/i&gt;&lt;/p&gt;
&lt;h2&gt;Считаем в Гугл Таблицах&lt;/h2&gt;
&lt;p&gt;Быстро воспроизводим эксперимент в Гугл Таблицах:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/4smski00.PNG" width="381" height="191" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Итак, в тот день 4 человека прислали смски «за», 4 человека прислали смски «против». Логично предположить, что день на день не приходится, и сегодня это были одни слушатели, завтра смски будут присылать другие слушатели, и соотношение сил может быть «3 к 5», «5 к 3», «2 к 6» или «7 к 1» — любое сочетание теоретически возможно. Однако, если мы предполагаем, что взгляды аудитории делятся поровну, то чуть более вероятны сценарии «4 к 4», «3 к 5» или «5 к 3», а сценарии «8 к 0» или «1 к 7», например, менее вероятны.&lt;/p&gt;
&lt;p&gt;Технически, мы имеем дело с &lt;i&gt;биномиальным распределением&lt;/i&gt; — из 8 смсок мы &lt;i&gt;ожидаем&lt;/i&gt; получить 4 смски «за», но не знаем наверняка, сколько их будет. Вероятность получить смску «за» равна 50% (допустим, что ровно 50% аудитории — «за»), в этом случае &lt;b&gt;&lt;i&gt;стандартная ошибка (SD,&lt;/i&gt;&lt;/b&gt; или &lt;b&gt;&lt;i&gt;&amp;sigma;)&lt;/i&gt;&lt;/b&gt; биномиального распределения рассчитывалась бы по формуле:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/CodeCogsEqn.png" width="201" height="77" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;где &lt;b&gt;&lt;i&gt;p&lt;/i&gt;&lt;/b&gt; = 50%, а &lt;b&gt;&lt;i&gt;n&lt;/i&gt;&lt;/b&gt; = 8.&lt;/p&gt;
&lt;p&gt;Считаем:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/4smski01.PNG" width="384" height="231" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Получается, если вероятность получить смску «за» равняется 50%, то стандартное отклонение при выборке в 8 смсок &lt;b&gt;равняется 17,68%!&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Что же это означает на практике?&lt;/p&gt;
&lt;p&gt;Это означает, что, поскольку имеющаяся выборка (8 смсок) крайне мала, доля случайности в нашем результате «4 „за“, 4 „против“», наоборот, крайне велика, и мы не можем уверенно говорить о строгом распределении голосов «50 на 50» среди всей аудитории «Вести ФМ». Единственное, что мы можем утверждать более-менее точно, это то,  что истинная доля голосов «за» лежит &lt;b&gt;&lt;i&gt;в некотором интервале&lt;/i&gt;&lt;/b&gt; вокруг 50%. И величина этого интервала будет тем шире, чем больше мы захотим быть уверены в его надежности.&lt;/p&gt;
&lt;p&gt;Предположим, мы хотим быть уверены в нашем доверительном интервале на 90%. (Оставляем себе право на ошибку в 10% случаев, другими словами). Согласно законам &lt;i&gt;нормального распределения&lt;/i&gt; (а биномиальное распределение — это частный случай нормального), данный интервал &lt;b&gt;определяется как 50%&amp;plusmn;1,645SD.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Такое несложно рассчитать в Гугл Таблицах:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/4smski03.PNG" width="379" height="246" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Получается, что истинная доля голосов «за» лежит в интервале 50%&amp;plusmn;29,08%, &lt;b&gt;т. е. от 20,92% до 79,08%.&lt;/b&gt; Примерно вот так это выглядит:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/4smski02.PNG" width="789" height="368" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Значит, мы и близко не можем говорить о том, что «слушатели ... примерно ... делятся 50 на 50»! В лучшем случае (даже оставляя 10% на то, что мы ошибемся), &lt;b&gt;мы можем говорить лишь об интервале от 21% до 79%.&lt;/b&gt;&lt;/p&gt;
&lt;h2&gt;Уточнение расчетов&lt;/h2&gt;
&lt;p&gt;Однако, интервал &lt;b&gt;&lt;i&gt;p&lt;/i&gt;&amp;plusmn;1,645&lt;i&gt;SD&lt;/i&gt;&lt;/b&gt; тоже является достаточно грубой оценкой. Существуют более сложные, и немного более точные, способы оценить границы интервалов.&lt;/p&gt;
&lt;p&gt;Воспользовавшись &lt;a href="https://www.wolframalpha.com/input/?i=binomial+distribution+confidence+interval"&gt;калькулятором Wolfram Alpha&lt;/a&gt;, можно получить следующие границы интервала:&lt;/p&gt;
&lt;div class="e2-text-table"&gt;
&lt;table cellpadding="0" cellspacing="0" border="0"&gt;
&lt;tr&gt;
&lt;td style="text-align: left"&gt;Clopper-Pearson confidence interval for a binomial parameter&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,1929&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,8071&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: left"&gt;Wilson score confidence interval for a binomial parameter with continuity correction&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,2034&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,7966&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: left"&gt;standard confidence interval for a binomial parameter&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,2092&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,7908&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: left"&gt;Jeffreys confidence interval for a binomial parameter&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,2393&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,7607&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: left"&gt;Wilson score confidence interval for a binomial parameter&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,2486&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,7514&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: left"&gt;Agresti-Coull confidence interval for a binomial parameter&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,2486&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,7514&lt;/td&gt;
&lt;/tr&gt;
&lt;/table&gt;
&lt;/div&gt;
&lt;h2&gt;Ну а если хотим, хотя бы, 45-55% получить?&lt;/h2&gt;
&lt;p&gt;Вот еще интересно: на какого размера выборке, если голоса в ней по-прежнему делятся строго «50 на 50», мы сможем говорить о доверительном интервале, суженном хотя бы до 45-55%?&lt;/p&gt;
&lt;p&gt;Рассчитать такое несложно. Если речь идет об интервале 50%&amp;plusmn;5%, (и мы продолжаем придерживаться уровня уверенности в результате, равном нашим любимым 90%), то 5% должны составлять 1,645 стандартных отклонений (SD). Отсюда, SD = 3,04%. По формуле стандартного отклонения:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/4smski04.png" width="270" height="58" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;откуда несложно найти n = 270,6. Получается, нужно 270-272 смски с распределением голосов строго пополам, чтобы говорить об интервале от 45% до 55% с уровнем уверенности 90%.&lt;/p&gt;
&lt;h2&gt;См. также&lt;/h2&gt;
&lt;p&gt;&lt;a href="https://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval"&gt;https://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval&lt;/a&gt;&lt;br /&gt;
&lt;a href="https://www.wolframalpha.com/input/?i=binomial+distribution+confidence+interval&amp;assumption=%22FSelect%22+-%3E+%7B%7B%22BinomialInterval%22%7D%7D&amp;assumption=%7B%22F%22%2C+%22BinomialInterval%22%2C+%22phat%22%7D+-%3E%220.5%22&amp;assumption=%7B%22F%22%2C+%22BinomialInterval%22%2C+%22c%22%7D+-%3E%220.9%22&amp;assumption=%7B%22F%22%2C+%22BinomialInterval%22%2C+%22n%22%7D+-%3E%228%22"&gt;Калькулятор на WolframAlpha.com&lt;/a&gt;&lt;br /&gt;
&lt;a href="https://cyberleninka.ru/article/n/doveritelnye-intervaly-dlya-chastot-i-doley.pdf"&gt;https://cyberleninka.ru/article/n/doveritelnye-intervaly-dlya-chastot-i-doley.pdf&lt;/a&gt;&lt;br /&gt;
&lt;a href="http://italylov.ru/blog/all/ctatisticheskaya-dostovernost-koltrekinga/"&gt;Cтатистическая достоверность для застройщиков&lt;/a&gt;&lt;/p&gt;
</description>
</item>

<item>
<title>«В каждом пятом» звонке проблемы, проверяем</title>
<guid isPermaLink="false">21</guid>
<link>https://mathandcoffee.ru/all/v-kazhdom-pyatom-zvonke-problemy-proveryaem/</link>
<pubDate>Sun, 09 Jun 2019 16:45:58 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/v-kazhdom-pyatom-zvonke-problemy-proveryaem/</comments>
<description>
&lt;p&gt;На днях пришел в голову такой пример: предположим, подрядчик жалуется &lt;b&gt;на плохую связь «в каждом пятом» звонке.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Наша задача проверить, &lt;b&gt;справедлива ли гипотеза, что 20% звонков имеют проблемы со связью.&lt;/b&gt; Причем, как всегда, мы не просто сделаем 100 тестовых звонков (на это у нас нет ресурсов), а сформулируем нулевую гипотезу, альтернативную гипотезу, и проверим ее с заданным уровнем достоверности.&lt;/p&gt;
&lt;h2&gt;Выдвигаем гипотезу и определяем уровень достоверности&lt;/h2&gt;
&lt;p&gt;&lt;b&gt;Нулевой гипотезой &lt;i&gt;(H&lt;sub&gt;0&lt;/sub&gt;)&lt;/i&gt;&lt;/b&gt; пусть будет предположение, что со связью все в порядке, или, по крайней мере, проблемы встречаются реже, чем в 20% звонков.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Альтернативной гипотезой &lt;i&gt;(H&lt;sub&gt;1&lt;/sub&gt;),&lt;/i&gt;&lt;/b&gt; которую мы будем проверять, пусть будет предположение подрядчика, что в каждом пятом звонке наблюдаются помехи. То есть, по крайней мере, в 20% звонков есть проблемы со связью.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Уровень достоверности&lt;/b&gt; — это наша уверенность в результатах эксперимента. Чем он выше, тем больше придется сделать проверочных звонков, поэтому мы заложим 1% на возможную ошибку, и выберем уровень достоверности в 99% (1%, что, если даже эксперимент не подтвердит проблем со связью, они, в действительности, могут быть).&lt;/p&gt;
&lt;h2&gt;Cобираем формулу для расчета выборки&lt;/h2&gt;
&lt;p&gt;Предположим, цель эксперимента — &lt;i&gt;опровергнуть&lt;/i&gt; альтернативную гипотезу H&lt;sub&gt;1&lt;/sub&gt; («есть проблемы»), подтвердив нулевую гипотезу H&lt;sub&gt;0&lt;/sub&gt; («все в порядке»). Чтобы сделать это, нам будет достаточно продемонстрировать N подряд успешных звонков без признаков проблем со связью, при этом допуская вероятность, равную или меньше 1%, что нам просто повезет, и, при наличии, в действительности, проблем с оборудованием, они случайно не проявят себя ни в одном из N звонков.&lt;/p&gt;
&lt;p&gt;Из предположения подрядчика вытекает, что 80% звонков не имеют проблем. Вероятность отсутствия сбоев в N звонках подряд равна 0,80&lt;sup&gt;N&lt;/sup&gt;. Нам нужно подобрать минимальное N, при котором вероятность упадет до 1%: 0,80&lt;sup&gt;N&lt;/sup&gt; = 1%&lt;/p&gt;
&lt;p&gt;Получается, нам нужно вычислить логарифм 1% по основанию 80%!&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/every5th01.PNG" width="223" height="36" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Загружаем в Гугл Таблицы:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/every5th00.PNG" width="366" height="320" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Формула для ячейки C5 будет выглядеть как&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=LOG(1-C2;1-C3)&lt;/code&gt;&lt;/pre&gt;&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/every5th02.PNG" width="373" height="262" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Нужно сделать 20,64 звонка. (Проверяем: 0,80&lt;sup&gt;20,64&lt;/sup&gt; = 0,9995%, идеально.)&lt;/p&gt;
&lt;p&gt;Остается только добавить округление:&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=ОКРУГЛВВЕРХ(C5)&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;или сразу&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=ОКРУГЛВВЕРХ(LOG(1-C2;1-C3))&lt;/code&gt;&lt;/pre&gt;&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/every5th03.PNG" width="366" height="266" alt="" /&gt;
&lt;/div&gt;
&lt;h2&gt;Проверяем гипотезу&lt;/h2&gt;
&lt;p&gt;Если альтернативная гипотеза &lt;i&gt;H&lt;sub&gt;1&lt;/sub&gt;&lt;/i&gt; нашего подрядчика верна, и мы испытываем проблемы со связью в каждом пятом звонке, то, вероятность не заметить проблем в 21 тестовом звонке подряд составляет порядка 1%. Иными словами, либо это крайне редкое совпадение (1%), либо альтернативная гипотеза о проблемах в 20% звонков неверна (99%), и мы оставляем нулевую гипозеу &lt;i&gt;H&lt;sub&gt;0&lt;/sub&gt;&lt;/i&gt;. &lt;b&gt;С вероятностью 99% мы уверены, что проблем со связью не наблюдается.&lt;/b&gt;&lt;/p&gt;
</description>
</item>

<item>
<title>Качество звонков: сколько нужно прослушать</title>
<guid isPermaLink="false">12</guid>
<link>https://mathandcoffee.ru/all/kachestvo-zvonkov-skolko-proslushat/</link>
<pubDate>Sun, 26 May 2019 16:46:00 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/kachestvo-zvonkov-skolko-proslushat/</comments>
<description>
&lt;p&gt;Распространенным инструментом оценки качества работы менеджеров отдела продаж является &lt;b&gt;аудит качества телефонных звонков,&lt;/b&gt; «прослушка».&lt;/p&gt;
&lt;p&gt;Предположим, вы задались целью не просто &lt;b&gt;замерить&lt;/b&gt; качество телефонных звонков, но &lt;b&gt;зафиксировать &lt;i&gt;рост&lt;/i&gt; этого качества.&lt;/b&gt; Например, провели обучение (тренинг) менеджеров, либо предложили новую мотивацию за соблюдение стандартов качества, либо что-то еще.&lt;/p&gt;
&lt;p&gt;Логично предположить, что рост качества в первом попавшемся, после тренинга, звонке, не будет однозначно свидетельствовать о росте качества в остальных звонках. Скорее всего, и второй удачный звонок тоже однозначно не подтвердит гипотезу, что качество выросло.&lt;/p&gt;
&lt;p&gt;Таким образом, речь будет идти о том, что вам придется прослушать если не все, то, по крайней мере, достаточное число звонков после введенных вами изменений, и число звонков, которые необходимо будет прослушать, на самом деле, &lt;b&gt;можно однозначно рассчитать.&lt;/b&gt;&lt;/p&gt;
&lt;h2&gt;Считаем размер выборки&lt;/h2&gt;
&lt;p&gt;На 15-й странице работы «&lt;a href="https://people.ucsc.edu/~dgbonett/docs/wrkshp/LectureNotes.pdf"&gt;Планирование размеров выборки для исследований в бихевиоризме&lt;/a&gt;» мне попался подходящий пример 2.4 и формула для расчета таких выборок:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/samplesize00.PNG" width="858" height="506" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;В данном примере рассматривается изменение оценки &lt;a href="https://ru.wikipedia.org/wiki/ACT"&gt;ACT&lt;/a&gt;-теста по математике с 24,5 (дисперсия 8,2) до 26,0 баллов при &amp;alpha; = 0,05 и мощности = 0,90.&lt;/p&gt;
&lt;p&gt;Для удобства работы, я собрал приведенную формулу в Гугл-таблицах:&lt;br /&gt;
&lt;a href="https://docs.google.com/spreadsheets/d/1c1J88P0i0gmDFpOtfDIkPt-C0HKJOWACbSWVZTx2kL8/edit?usp=sharing"&gt;Калькулятор размера выборки&lt;/a&gt;&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/samplesize01.PNG" width="865" height="346" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Вам остается скопировать файл, и можете подставлять нужные вам значения. Достоверность разумно выбирать от 80% до 95%, значение мощности — от 60% до 80%. Указываете средний балл оценки звонков до изменений, стандартное отклонение (SD) оценки звонков «до», и ожидаемый средний балл оценки звонков после изменений.&lt;/p&gt;
&lt;h2&gt;Верификация полученных результатов&lt;/h2&gt;
&lt;p&gt;Важно понимать, что, даже прослушав требуемое количество звонков «после», все равно необходимо проверять наличие статистически значимых различий через &lt;a href="http://n4d-d.xyz/all/a-b-test-maksimalno-prosto/"&gt;калькулятор А/Б-тестов&lt;/a&gt;.&lt;/p&gt;
&lt;h2&gt;См. также:&lt;/h2&gt;
&lt;p&gt;&lt;a href="https://habr.com/ru/post/339798/"&gt;https://habr.com/ru/post/339798/&lt;/a&gt;&lt;br /&gt;
&lt;a href="https://people.ucsc.edu/~dgbonett/docs/wrkshp/LectureNotes.pdf"&gt;https://people.ucsc.edu/~dgbonett/docs/wrkshp/LectureNotes.pdf&lt;/a&gt;&lt;/p&gt;
</description>
</item>

<item>
<title>t-Критерий Стьюдента</title>
<guid isPermaLink="false">5</guid>
<link>https://mathandcoffee.ru/all/t-kriteriy-styudenta/</link>
<pubDate>Mon, 15 Apr 2019 11:44:02 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/t-kriteriy-styudenta/</comments>
<description>
&lt;p&gt;Если однажды перед вами оказывались два набора похожих данных, вам, вероятно, приходило в голову задаться вопросом: насколько эти данные различаются между собой? Или, что еще более важно, наблюдаются ли &lt;i&gt;статистически значимые&lt;/i&gt; различия между этими выборками?&lt;/p&gt;
&lt;p&gt;Поясню, о чем идет речь.&lt;/p&gt;
&lt;p&gt;Допустим, вы проанализировали звонки за прошедший год и обратили внимание, что &lt;b&gt;среднее время звонка в первой половине дня — 2 мин 45 сек, а во второй половине дня — 2 мин 57 сек.&lt;/b&gt; Следует ли из этого, что звонки после обеда в среднем длятся дольше? Или это простое совпадение, и, возьми вы звонки за год до этого, вы бы увидели другую картину?&lt;/p&gt;
&lt;p&gt;Или, например, вы замеряли уровень гемоглобина у контрольной группы до начала исследований нового лекарства, и после. Предположим, &lt;b&gt;средний уровень вырос с 142,5 г/л до 147,1 г/л.&lt;/b&gt; Достаточно ли опираться на увеличение среднего, чтобы сделать заключение об эффективности лекарства? Или, возможно, исследование нужно повторить? Увеличив размер контрольной группы, например?&lt;/p&gt;
&lt;p&gt;Уже из постановки вопроса очевидно, что &lt;b&gt;одной разницы между средними в двух выборках недостаточно, чтобы научно подтвердить их различие.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Вот почему мы обратимся к &lt;b&gt;формуле расчета&lt;/b&gt; и &lt;b&gt;таблице значений t-критериев Стьюдента,&lt;/b&gt; чтобы научиться делать &lt;i&gt;математически корректные&lt;/i&gt; выводы о &lt;i&gt;статистически значимых&lt;/i&gt; различиях между двумя выборками. Или, другими словами, научиться видеть разницу, когда она не заметна, или игнорировать ее, даже если кажется, что она есть.&lt;/p&gt;
&lt;p&gt;Рассмотрим вопрос на примере.&lt;/p&gt;
&lt;h2&gt;Анализ длительности звонков Асланян и Евтушенко&lt;/h2&gt;
&lt;p&gt;В вашем отделе продаж работают 2 менеджера — Ольга Асланян и Кирилл Евтушенко. Вы получили данные по длительности их разговоров с покупателями и хотите проверить гипотезу, что разговоры Асланян в среднем длятся дольше разговоров Евтушенко.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/student01.PNG" width="694" height="474" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Посчитаем среднюю длительность звонка, стандартное отклонение и число звонков, которые попали в выборке.&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=СРЗНАЧ(B2:B999)&lt;/code&gt;&lt;/pre&gt;&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=СТАНДОТКЛОН(B2:B999)&lt;/code&gt;&lt;/pre&gt;&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=СЧЁТ(B2:B999)&lt;/code&gt;&lt;/pre&gt;&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/student02.PNG" width="696" height="403" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;В среднем, звонки Асланян длятся на 34,5 сек дольше звонков Евтушенко. (Кроме того, разброс длительности ее звонков больше, т. к. больше стандартное отклонение. Грубо говоря, короткие и длинные звонки у Асланян найти проще, чем у Евтушенко).&lt;/p&gt;
&lt;p&gt;Достаточно ли полученных данных, чтобы сделать вывод о правильности гипотезы, что Асланян в среднем дольше общается с клиентами, чем Евтушенко? На самом деле, нет. Всегда существует вероятность, что в выборку Асланян случайно попали более длинные звонки, а в выборку Евтушенко — более короткие. Чем больше звонков доступно для анализа (а нам достались 242 и 209 звонков, что не так уж и мало), тем более надежен результат, но он никогда не надежен на 100%.&lt;/p&gt;
&lt;p&gt;Впрочем, надежность 100% нам и не нужна. Не ракету к Марсу запускаем. Даже если нам удастся проверить нашу гипотезу с вероятностью 90-95%, этого будет вполне достаточно для большинства случаев. Пускай мы оставим себе шанс ошибиться в 5-10% случаев, зато нам не нужно будет ждать несколько лет, чтобы накопить достаточно данных для анализа, и управленческие решения (разбор звонков с менеджером, анализ продаж, корректировки скриптов) мы сможем принять уже сейчас.&lt;/p&gt;
&lt;p&gt;Рассмотрим два способа, как нам проверить, случайность ли, что звонки Асланян в среднем длиннее звонков Евтушенко.&lt;/p&gt;
&lt;h2&gt;Проверка гипотезы о равенстве среднего. Простой способ&lt;/h2&gt;
&lt;p&gt;И в Google Таблицах, и в Microsoft Excel, есть &lt;b&gt;функция ТТЕСТ.&lt;/b&gt; Воспользуемся ей для анализа наших выборок.&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=ТТЕСТ(B2:B999;C2:C999;2;3)&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;У функции 4 атрибута, идущие через точку с запятой.&lt;/p&gt;
&lt;ol start="1"&gt;
&lt;li&gt;Диапазон ячеек, содержащих первую выборку.&lt;/li&gt;
&lt;li&gt;Диапазон ячеек, содержащих вторую выборку.&lt;/li&gt;
&lt;li&gt;Количество хвостов распределения. Выбираем «2», чтобы проверить наличие различий вообще, и «1», чтобы проверить, звонки Асланян длиннее, а не наоборот.&lt;/li&gt;
&lt;li&gt;Тип применения t-критерия. По умолчанию выбираем «3». («2» выбираем если стандартные отклонения очень близки, «1» — если, например, вы сравниваете средний балл &lt;i&gt;одних и тех же учеников&lt;/i&gt; на начало и конец года попарно.)&lt;/li&gt;
&lt;/ol&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/student03.PNG" width="694" height="429" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Итак, Т-тест дал вероятность 0,04595, или, округленно, 4,6%.&lt;/p&gt;
&lt;p&gt;Что же это за вероятность? В нашем примере это вероятность того, &lt;b&gt;что статистически значимые различия между звонками Асланян и Евтушенко отсутствуют.&lt;/b&gt; Технически, это вероятность, что наша «нулевая гипотеза» («нет разницы между выборками») была верна, а «альтернативная» («Асланян общается с покупателями дольше Евтушенко») — неверна.&lt;/p&gt;
&lt;p&gt;Оставшиеся 95,4% составляют вероятность того, что между выборками есть статистические различия, и «альтернативная гипотеза» о различиях между выборками верна.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Вывод: с вероятностью 95,4% Асланян, действительно, в среднем общается с клиентами дольше Евтушенко. (С вероятностью 4,6% статистически значих различий между их звонками нет).&lt;/b&gt;&lt;/p&gt;
&lt;h2&gt;Проверка гипотезы о равенстве среднего. Сложный способ&lt;/h2&gt;
&lt;p&gt;Сложный способ будет состоит из двух этапов: расчет t-критерия Стьюдента и сравнение полученного значения t-критерия с контрольным.&lt;/p&gt;
&lt;p&gt;На первом этапе рассчитаем t-критерий Стьюдента по следующей формуле:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/kriteriy_styudenta.jpg" width="247" height="157" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;X&lt;sub&gt;1&lt;/sub&gt; и X&lt;sub&gt;2&lt;/sub&gt; — средняя длина звонков в первой и второй выборке (238,6 сек и 204,1 сек)&lt;br /&gt;
s&lt;sub&gt;1&lt;/sub&gt; и s&lt;sub&gt;2&lt;/sub&gt; — стандартные отклонения первой и второй выборок в квадрате (их дисперсии, другими словами) (201,2&lt;sup&gt;2&lt;/sup&gt; и 164,7&lt;sup&gt;2&lt;/sup&gt; для наших выборок)&lt;br /&gt;
n&lt;sub&gt;1&lt;/sub&gt; и n&lt;sub&gt;2&lt;/sub&gt; — число звонков в первой и второй выборках (242 и 209 звонков)&lt;/p&gt;
&lt;p&gt;Воспользуемся листочком бумаги и калькулятором, или же посчитаем все прямо в Google Таблицах:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/student04.PNG" width="751" height="372" alt="" /&gt;
&lt;/div&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=(F2-G2)/КОРЕНЬ(F3^2/F4+G3^2/G4)&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;t-Критерий равен 2,0014.&lt;/p&gt;
&lt;p&gt;Осталось разобраться, что делать с вычисленным значением нашего t-критерия.&lt;/p&gt;
&lt;p&gt;Но перед этим посчитаем число степеней свободы по формуле n&lt;sub&gt;1&lt;/sub&gt;+n&lt;sub&gt;2&lt;/sub&gt;-2:&lt;/p&gt;
&lt;p&gt;242 + 209 — 2 = 449 степеней свободы&lt;/p&gt;
&lt;p&gt;Воспользуемся теперь &lt;a href="https://ru.wikipedia.org/wiki/%D0%9A%D0%B2%D0%B0%D0%BD%D1%82%D0%B8%D0%BB%D0%B8_%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D1%8F_%D0%A1%D1%82%D1%8C%D1%8E%D0%B4%D0%B5%D0%BD%D1%82%D0%B0"&gt;таблицей коэффициентов Стьюдента&lt;/a&gt; из Википедии, найдя строку, соответствующую нашим 449 степеням свободы.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/student05.PNG" width="1302" height="88" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;В нашем случае, строки именно для числа 449 нет, зато несложно заметить, что значения для 100 и 1000 — ближайших подходящих строк — отличаются на сотые доли, поэтому для большого числа степеней свободны подойдет любая строка.&lt;/p&gt;
&lt;p&gt;Наше значение 2,0014 находится между 1,9623 и 2,3301: 1,9623 &lt; 2,0014 &lt; 2,3301&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/student05.PNG" width="1302" height="88" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;В шапке таблицы это соответствует 95%-му и 98%-му квантилю распределения Стьюдента, т. е. мы захватили 95%-й квантиль, но не захватили 98%-й:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/student06.PNG" width="1303" height="90" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;b&gt;Если расчетное значение t-критерия Стьюдента больше контрольного, значит, «альтернативная гипотеза» верна с соответствующей вероятностью (95%), и выборки статистически различаются.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Если бы мы получили значение t-критерия больше, чем 2,3301 (98%), мы бы могли говорить по правильности «альтернативной гипотезы» уже с 98%-й вероятностью. Аналогично, если бы мы получили значение t-критерия меньше, чем 1,9623 (95%), но больше 1,6464 (90%), мы бы говорили о правильности гипотезы на 90%.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Вывод: расчетное значение t-критерия Стьюдента 2,0014 соответствует, по меньшей мере, 95% уверенности в том, что между выборками есть статистически значимые различия, и звонки Асланян, действительно, в среднем длиннее звонков Евтушенко.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Наша «альтернативная гипотеза» получила 95%-ое подтверждение, мы можем быть уверены в результате и принимать решение о дальнейшей работе с полученный информацией.&lt;/p&gt;
&lt;h2&gt;Полезные ссылки&lt;/h2&gt;
&lt;p&gt;&lt;a href="http://www.evanmiller.org/ab-testing/t-test.html"&gt;http://www.evanmiller.org/ab-testing/t-test.html&lt;/a&gt;&lt;/p&gt;
</description>
</item>


</channel>
</rss>