<?xml version="1.0" encoding="utf-8"?> 
<rss version="2.0"
  xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd"
  xmlns:atom="http://www.w3.org/2005/Atom">

<channel>

<title>Математика и кофе</title>
<link>https://mathandcoffee.ru/</link>
<description>Отделы продаж, коллцентры, аналитика, цифры и данные, воронки продаж, матстатистика..</description>
<author>Иван Балдин</author>
<language>ru</language>
<generator>E2 (v3565; Aegea)</generator>

<itunes:owner>
<itunes:name>Иван Балдин</itunes:name>
<itunes:email></itunes:email>
</itunes:owner>
<itunes:subtitle>Отделы продаж, коллцентры, аналитика, цифры и данные, воронки продаж, матстатистика..</itunes:subtitle>
<itunes:image href="" />
<itunes:explicit></itunes:explicit>

<item>
<title>График конверсии с доверительным интервалом</title>
<guid isPermaLink="false">45</guid>
<link>https://mathandcoffee.ru/all/grafik-konversii-s-doveritelnym-intervalom/</link>
<pubDate>Tue, 25 May 2021 01:13:50 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/grafik-konversii-s-doveritelnym-intervalom/</comments>
<description>
&lt;p&gt;Некоторое время с удовольствием использую более свежую визуализацию конверсии, добавляя к своим диаграммам &lt;b&gt;границы доверительного интервала.&lt;/b&gt;&lt;/p&gt;
&lt;h2&gt;Конверсия офисов продаж&lt;/h2&gt;
&lt;p&gt;Итак, например, мы оцениваем эффективность работы территориальных офисов продаж. Под &lt;b&gt;&lt;i&gt;эффективностью&lt;/i&gt;&lt;/b&gt; понимаем отношение числа совершенных продаж к числу заявок (конверсию заявок в продажи, или просто &lt;b&gt;&lt;i&gt;«конверсию»).&lt;/i&gt;&lt;/b&gt; То есть, если в офисе «Сокольники» за квартал было 19 продаж на 33 заявки, их эффективность будем считать равной 19/33 = 57,6%.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/candles-sd-00.png" width="642" height="382" alt="" /&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/candles-sd-01.png" width="455" height="454" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Очевидно, что одни офисы работают эффективнее других: конверсия по офисам меняется от 57,6% до 17,6%. Заметно также, что и число заявок в офисах различно: от 33 заявок в «Сокольниках» до 706 заявок в «Лианозово».&lt;/p&gt;
&lt;p&gt;Обычно на этом этапе многие останавливаются, но есть несложный способ воспользоваться понятием «доверительного интервала» или «стандартного отклонения (SD)», чтобы показать то, что, на первый взгляд, не так заметно.&lt;/p&gt;
&lt;h2&gt;Оцениваем размер выборки и величину SD&lt;/h2&gt;
&lt;p&gt;Как нетрудно заметить, из-за неравного числа заявок по разным офисам («Сокольники» отличаются в этом смысле от «Лианозово» почти в 22 раза), уверенность в надежности рассчитанной конверсии будет не одинакова. Так, для «Лианозово» результат в 36,1% достигнут на выборке из 706 заявок и может считаться вполне надежным; в «Сокольниках» мы получили результат 57,6% на небольшой выборке в 33 заявки, из-за чего нет уверенности, что, получи со временем последние свои 706 заявок, они бы удержали результат на том же уровне.&lt;/p&gt;
&lt;p&gt;Разумеется, необходимо прикинуть размер доверительного интервала для каждого офиса продаж, исходя из числа заявок, то есть, размера выборки.&lt;/p&gt;
&lt;p&gt;Уже знакомая нам формула стандартного отклонения (SD), или &lt;i&gt;&amp;sigma;&lt;/i&gt;:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/CodeCogsEqn.png" width="201" height="77" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;где &lt;i&gt;p&lt;/i&gt; — величина конверсии, &lt;i&gt;n&lt;/i&gt; — число заявок.&lt;/p&gt;
&lt;p&gt;Считаем в колонке E:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/candles-sd-02.png" width="637" height="380" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Полученная величина стандартного отклонения (SD) показывает погрешность при расчете конверсии, и, очевидно, оказалась выше там, где была меньше выборка. Чем меньше данных, тем менее надежен рассчитанный результат, и тем меньше мы уверены в нашей оценке эффективности соответствующего офиса продаж.&lt;/p&gt;
&lt;h2&gt;Считаем границы 90%-го доверительного интервала&lt;/h2&gt;
&lt;p&gt;Дополним нашу таблицу рассчитанными нижней и верхней границей 90%-го доверительного интервала. Другими словами, оценим разброс конверсий по каждому из офисов продаж, так, что с вероятностью 90% мы будем уверены, что &lt;i&gt;истинная&lt;/i&gt; конверсия лежит в пределах этого диапазона.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/candles-sd-03.png" width="653" height="381" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Зная о том, что границы 90%-го доверительного интервала лежат в пределах &amp;plusmn;1,645SD, вычитаем и прибавляем 1,645SD для нижней и верхней границ, соответственно. Для «Лианозово» получаем, что их &lt;i&gt;истинная&lt;/i&gt; конверсия лежит в пределах от 33,1% до 39,1%. (По-прежнему, в 1 случае из 10 она выходит за границы нашего интервала, но зато в 9 случаях из 10 мы не ошиблись).&lt;/p&gt;
&lt;h2&gt;Дополняем график, рисуя «свечи»&lt;/h2&gt;
&lt;p&gt;В Excel 2013 воспользуемся &lt;b&gt;«биржевой диаграммой»,&lt;/b&gt; указав вместо &lt;b&gt;&lt;i&gt;самого высокого&lt;/i&gt;&lt;/b&gt; и &lt;b&gt;&lt;i&gt;самого низкого курсов&lt;/i&gt;&lt;/b&gt; верхнюю и нижнюю границу наших доверительных интервалов, а вместо &lt;b&gt;&lt;i&gt;курса закрытия&lt;/i&gt;&lt;/b&gt; — рассчитанную вначале конверсию:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/candles-sd-04.png" width="634" height="600" alt="" /&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/candles-sd-05.png" width="454" height="454" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Доработанная подобным образом диаграмма не меняет выводов, полученных в самом начале. Однако, для наблюдательного руководителя она ненавязчиво напоминает, что полученные значения конверсий офисов продаж &lt;b&gt;не конечны,&lt;/b&gt; и особенно «не конечны» там, где оказались шире границы разброса конверсии.&lt;/p&gt;
&lt;p&gt;«Сокольники», предварительно, обогнали «Беговой», однако, если хороший результат «Бегового» надежен за счет узкого интервала, то результат «Сокольников» очень приблизителен, поэтому уверенные выводы возможно делать лишь о части офисов продаж, для остальных — нужно больше данных, а до тех пор их позиции в рейтинге можно считать лишь предварительными, или, как было сказано выше, не конечными.&lt;/p&gt;
&lt;h2&gt;См. также:&lt;/h2&gt;
&lt;p&gt;&lt;a href="http://italylov.ru/blog/all/ctatisticheskaya-dostovernost-koltrekinga/"&gt;http://italylov.ru/blog/all/ctatisticheskaya-dostovernost-koltrekinga/&lt;/a&gt;&lt;/p&gt;
</description>
</item>

<item>
<title>Нормальное распределение</title>
<guid isPermaLink="false">41</guid>
<link>https://mathandcoffee.ru/all/normalnoe-raspredelenie/</link>
<pubDate>Sun, 05 Apr 2020 15:06:07 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/normalnoe-raspredelenie/</comments>
<description>
&lt;h2&gt;Нормальное распределение&lt;/h2&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/normal00.png" width="958" height="392" alt="" /&gt;
&lt;/div&gt;
&lt;div class="e2-text-table"&gt;
&lt;table cellpadding="0" cellspacing="0" border="0"&gt;
&lt;tr&gt;
&lt;td&gt;&lt;b&gt;Количество SD&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;-3,000&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;-2,576&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;-2,000&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;-1,960&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;-1,645&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;-1,282&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;1,282&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;1,645&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;1,960&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;2,000&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;2,576&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;3,000&lt;/b&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;b&gt;Вероятность накопленным итогом&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,0013&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,0050&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,0228&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,0250&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,0500&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,1000&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,9000&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,9500&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,9750&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,9772&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,9950&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,9987&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;b&gt;Вероятность в границах +/- стольких SD&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;-0,9973&lt;/td&gt;
&lt;td style="text-align: right"&gt;-0,9900&lt;/td&gt;
&lt;td style="text-align: right"&gt;-0,9545&lt;/td&gt;
&lt;td style="text-align: right"&gt;-0,9500&lt;/td&gt;
&lt;td style="text-align: right"&gt;-0,9000&lt;/td&gt;
&lt;td style="text-align: right"&gt;-0,8000&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,8000&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,9000&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,9500&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,9545&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,9900&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,9973&lt;/td&gt;
&lt;/tr&gt;
&lt;/table&gt;
&lt;/div&gt;
&lt;p&gt;&lt;a href="https://docs.google.com/spreadsheets/d/1NyGMqQtVnRRNK06Wh2vR6R6e2M09Ao7LG5-2e3maLAk/edit?usp=sharing"&gt;График и данные&lt;/a&gt; в Google Таблицах&lt;/p&gt;
</description>
</item>

<item>
<title>Доверительный интервал биномиального распределения по методу Уилсона</title>
<guid isPermaLink="false">40</guid>
<link>https://mathandcoffee.ru/all/doveritelny-interval-binomialnogo-raspredeleniya-po-metodu-uilso/</link>
<pubDate>Wed, 01 Apr 2020 16:54:50 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/doveritelny-interval-binomialnogo-raspredeleniya-po-metodu-uilso/</comments>
<description>
&lt;p&gt;В процессе изучения биномиального распределения, обратил внимание, что стандартный способ определения доверительного интервала через &lt;i&gt;&amp;plusmn;1,645SD&lt;/i&gt; не всегда точен. Грубо говоря, если «решка» выпала меньше, чем в 10 бросках, то, скорее всего, либо вы сделали мало бросков, либо у вас вероятность выпадения «решки» в «заколдованной монетке» сильно невелика; если &lt;i&gt;np&lt;/i&gt; &amp;lt; 10, лучше воспользоваться более сложными формулами, дающими более точные оценки при маленьких &lt;i&gt;p&lt;/i&gt; или &lt;i&gt;n:&lt;/i&gt;&lt;/p&gt;
&lt;p&gt;&lt;i&gt;По мнению многих статистиков, наиболее оптимальную оценку доверительных интервалов для частот осуществляет &lt;b&gt;метод Уилсона (Wilson),&lt;/b&gt; предложенный еще в 1927 году &amp;lt;...&amp;gt;. Данный метод не только позволяет оценить доверительные интервалы для очень малых и очень больших частот, но и применим для малого числа наблюдений.&lt;/i&gt;&lt;/p&gt;
&lt;p&gt;Звучит заманчиво. Попробуем разобраться.&lt;/p&gt;
&lt;h2&gt;Метод Уилсона&lt;/h2&gt;
&lt;p&gt;Нижняя и верхняя граница доверительного интервала &lt;i&gt;p = 1—&amp;alpha;/2&lt;/i&gt; вычисляются следующими формулами:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;div class="fotorama" data-width="392" data-ratio="2.6666666666667"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/wilson01.PNG" width="392" height="147" alt="" /&gt;
&lt;img src="https://mathandcoffee.ru/pictures/wilson02.PNG" width="393" height="132" alt="" /&gt;
&lt;/div&gt;
&lt;div class="e2-text-caption"&gt;Формула расчета нижней и верхней границ, соответственно.&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;где &lt;i&gt;&lt;b&gt;p&lt;/b&gt;&lt;/i&gt; — наблюдаемая вероятность «выпадения решки», &lt;i&gt;&lt;b&gt;N&lt;/b&gt;&lt;/i&gt; — число измерений («бросков»), &lt;i&gt;&lt;b&gt;z&lt;/b&gt;&lt;/i&gt; — &lt;i&gt;z-&lt;/i&gt;оценка (например, 1,960 для 95%-го доверительного интервала, или 1,645 для 90%-го).&lt;/p&gt;
&lt;h2&gt;Пример и калькулятор для расчета&lt;/h2&gt;
&lt;p&gt;Предположим, нам удалось прослушать 10 рандомных звонков колл-центра, и в 4 из них оператор забыл или поленился уточнить у клиента источник рекламы. Скорее всего, исходя из данной информации, операторы не уточняют источники рекламы в 40% звонков.&lt;/p&gt;
&lt;p&gt;Однако, это очень смелое утверждение, ведь наша выборка (10 звонков) откровенно мала: для получения более точной оценки качества работы коллцентра, хорошо бы прослушать больше рандомных звонков (прослушать все звонки, очевидно, невозможно).&lt;/p&gt;
&lt;p&gt;Но даже для выборки из 10 звонков, можно рассчитать SD биномиального распределения:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/CodeCogsEqn.png" width="201" height="77" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Имеем, SD = 15,49%. С вероятностью 90%, точная оценка качества работы коллцентра (доля звонков, где не выявлен источник рекламы) лежит в диапазоне 40%&amp;plusmn;1,645SD, или от 14,52% до 65,48%.&lt;/p&gt;
&lt;p&gt;Применяя же формулу Уилсона (что уместно, так как &lt;i&gt;np&lt;/i&gt; = 4 &amp;lt; 10), границы доверительного интервала уточняются: с вероятностью 90%, истинная доля звонков, где не выявляется источник рекламы, лежит в границах от 19,42% до 64,84%. SD, получается, равно 13,80%.&lt;/p&gt;
&lt;p&gt;&lt;a href="https://docs.google.com/spreadsheets/d/1QSvQF7SHUF8QIM8dzxWFT0itI5rP2VOn-tWJ4tHX5qI/edit?usp=sharing"&gt;&lt;b&gt;Калькулятор&lt;/b&gt;&lt;/a&gt; в Google Таблицах (меню «Файл» — «Создать копию»).&lt;/p&gt;
&lt;h2&gt;См. также:&lt;/h2&gt;
&lt;p&gt;«&lt;a href="https://cyberleninka.ru/article/n/doveritelnye-intervaly-dlya-chastot-i-doley/viewer"&gt;Доверительные интервалы для частот и долей&lt;/a&gt;», А.М. Гржибовский, 2008 (стр. 58-59)&lt;br /&gt;
&lt;a href="http://vassarstats.net/prop1.html"&gt;Онлайн-калькулятор&lt;/a&gt; для 95%-го доверительного интервала&lt;br /&gt;
&lt;a href="https://www.wolframalpha.com/input/?i=binomial+distribution+confidence+interval&amp;assumption=%22FSelect%22+-%3E+%7B%7B%22WilsonScoreInterval%22%7D%7D&amp;assumption=%7B%22F%22%2C+%22WilsonScoreInterval%22%2C+%22k%22%7D+-%3E%224%22&amp;assumption=%7B%22F%22%2C+%22WilsonScoreInterval%22%2C+%22c%22%7D+-%3E%220.90%22&amp;assumption=%7B%22F%22%2C+%22WilsonScoreInterval%22%2C+%22n%22%7D+-%3E%2210%22"&gt;Калькулятор&lt;/a&gt; на WolframAlpha.com&lt;br /&gt;
&lt;a href="https://www.ucl.ac.uk/english-usage/staff/sean/resources/binomialpoisson.pdf"&gt;Binomial confidence intervals and contingency tests&lt;/a&gt; (стр.4-5)&lt;br /&gt;
&lt;a href="https://influentialpoints.com/Training/confidence_intervals_of_proportions.htm#wils"&gt;https://influentialpoints.com/Training/confidence_intervals_of_proportions.htm#wils&lt;/a&gt;&lt;br /&gt;
&lt;a href="https://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval#Wilson_score_interval"&gt;Wilson score interval&lt;/a&gt; на Википедии&lt;/p&gt;
</description>
</item>

<item>
<title>Три уровня понимания выборки</title>
<guid isPermaLink="false">36</guid>
<link>https://mathandcoffee.ru/all/tri-urovnya-ponimaniya-vyborki/</link>
<pubDate>Sun, 26 Jan 2020 12:54:32 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/tri-urovnya-ponimaniya-vyborki/</comments>
<description>
&lt;p&gt;В последнее время много размышлял о том, как, с точки зрения статистики, можно кратко оценить или описать любую совокупность или выборку. Пришел к выводу, что, глобально, &lt;b&gt;существует 3 уровня понимания выборки.&lt;/b&gt;&lt;/p&gt;
&lt;h2&gt;Пруд с золотыми рыбками&lt;/h2&gt;
&lt;p&gt;Для примера, возьмем мой любимый пруд с золотыми рыбками. Вот такой:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/100_fish.png" width="1200" height="675" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;100 золотых рыбок. (На самом деле, рыбок-клоунов, но не важно.)&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Предположим, мы знаем вес каждой рыбки в граммах (или длину в миллиметрах, не имеет значения в данном случае):&lt;/p&gt;
&lt;div class="e2-text-table"&gt;
&lt;table cellpadding="0" cellspacing="0" border="0"&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;96,83&lt;/td&gt;
&lt;td style="text-align: right"&gt;100,84&lt;/td&gt;
&lt;td style="text-align: right"&gt;97,59&lt;/td&gt;
&lt;td style="text-align: right"&gt;135,46&lt;/td&gt;
&lt;td style="text-align: right"&gt;89,32&lt;/td&gt;
&lt;td style="text-align: right"&gt;25,72&lt;/td&gt;
&lt;td style="text-align: right"&gt;71,5&lt;/td&gt;
&lt;td style="text-align: right"&gt;28,7&lt;/td&gt;
&lt;td style="text-align: right"&gt;100,47&lt;/td&gt;
&lt;td style="text-align: right"&gt;96,08&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;75,74&lt;/td&gt;
&lt;td style="text-align: right"&gt;90,22&lt;/td&gt;
&lt;td style="text-align: right"&gt;64,58&lt;/td&gt;
&lt;td style="text-align: right"&gt;101,55&lt;/td&gt;
&lt;td style="text-align: right"&gt;43,38&lt;/td&gt;
&lt;td style="text-align: right"&gt;109,91&lt;/td&gt;
&lt;td style="text-align: right"&gt;83,22&lt;/td&gt;
&lt;td style="text-align: right"&gt;115,43&lt;/td&gt;
&lt;td style="text-align: right"&gt;118,84&lt;/td&gt;
&lt;td style="text-align: right"&gt;56,39&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;99,43&lt;/td&gt;
&lt;td style="text-align: right"&gt;67,46&lt;/td&gt;
&lt;td style="text-align: right"&gt;99,19&lt;/td&gt;
&lt;td style="text-align: right"&gt;86,85&lt;/td&gt;
&lt;td style="text-align: right"&gt;53,01&lt;/td&gt;
&lt;td style="text-align: right"&gt;123,29&lt;/td&gt;
&lt;td style="text-align: right"&gt;95,37&lt;/td&gt;
&lt;td style="text-align: right"&gt;67,57&lt;/td&gt;
&lt;td style="text-align: right"&gt;123,89&lt;/td&gt;
&lt;td style="text-align: right"&gt;98,91&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;101,96&lt;/td&gt;
&lt;td style="text-align: right"&gt;157,56&lt;/td&gt;
&lt;td style="text-align: right"&gt;139,5&lt;/td&gt;
&lt;td style="text-align: right"&gt;89,64&lt;/td&gt;
&lt;td style="text-align: right"&gt;92,31&lt;/td&gt;
&lt;td style="text-align: right"&gt;175,05&lt;/td&gt;
&lt;td style="text-align: right"&gt;92,29&lt;/td&gt;
&lt;td style="text-align: right"&gt;124,63&lt;/td&gt;
&lt;td style="text-align: right"&gt;81,35&lt;/td&gt;
&lt;td style="text-align: right"&gt;107,43&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;86,47&lt;/td&gt;
&lt;td style="text-align: right"&gt;110,03&lt;/td&gt;
&lt;td style="text-align: right"&gt;144,89&lt;/td&gt;
&lt;td style="text-align: right"&gt;105,25&lt;/td&gt;
&lt;td style="text-align: right"&gt;137,14&lt;/td&gt;
&lt;td style="text-align: right"&gt;76,28&lt;/td&gt;
&lt;td style="text-align: right"&gt;102,96&lt;/td&gt;
&lt;td style="text-align: right"&gt;101,95&lt;/td&gt;
&lt;td style="text-align: right"&gt;90,88&lt;/td&gt;
&lt;td style="text-align: right"&gt;69,02&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;96,76&lt;/td&gt;
&lt;td style="text-align: right"&gt;110,17&lt;/td&gt;
&lt;td style="text-align: right"&gt;118,66&lt;/td&gt;
&lt;td style="text-align: right"&gt;100,5&lt;/td&gt;
&lt;td style="text-align: right"&gt;109,23&lt;/td&gt;
&lt;td style="text-align: right"&gt;40,66&lt;/td&gt;
&lt;td style="text-align: right"&gt;104,43&lt;/td&gt;
&lt;td style="text-align: right"&gt;113,17&lt;/td&gt;
&lt;td style="text-align: right"&gt;101,9&lt;/td&gt;
&lt;td style="text-align: right"&gt;66,76&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;107,59&lt;/td&gt;
&lt;td style="text-align: right"&gt;141,11&lt;/td&gt;
&lt;td style="text-align: right"&gt;71,43&lt;/td&gt;
&lt;td style="text-align: right"&gt;95,73&lt;/td&gt;
&lt;td style="text-align: right"&gt;52,26&lt;/td&gt;
&lt;td style="text-align: right"&gt;70,67&lt;/td&gt;
&lt;td style="text-align: right"&gt;70,97&lt;/td&gt;
&lt;td style="text-align: right"&gt;103,66&lt;/td&gt;
&lt;td style="text-align: right"&gt;135,65&lt;/td&gt;
&lt;td style="text-align: right"&gt;144,62&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;150,26&lt;/td&gt;
&lt;td style="text-align: right"&gt;130,69&lt;/td&gt;
&lt;td style="text-align: right"&gt;81,31&lt;/td&gt;
&lt;td style="text-align: right"&gt;163,39&lt;/td&gt;
&lt;td style="text-align: right"&gt;74,22&lt;/td&gt;
&lt;td style="text-align: right"&gt;83,43&lt;/td&gt;
&lt;td style="text-align: right"&gt;122,14&lt;/td&gt;
&lt;td style="text-align: right"&gt;122,61&lt;/td&gt;
&lt;td style="text-align: right"&gt;137,46&lt;/td&gt;
&lt;td style="text-align: right"&gt;53,94&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;29,25&lt;/td&gt;
&lt;td style="text-align: right"&gt;90,83&lt;/td&gt;
&lt;td style="text-align: right"&gt;119,56&lt;/td&gt;
&lt;td style="text-align: right"&gt;99,3&lt;/td&gt;
&lt;td style="text-align: right"&gt;34,53&lt;/td&gt;
&lt;td style="text-align: right"&gt;74,02&lt;/td&gt;
&lt;td style="text-align: right"&gt;120,04&lt;/td&gt;
&lt;td style="text-align: right"&gt;129,32&lt;/td&gt;
&lt;td style="text-align: right"&gt;124,2&lt;/td&gt;
&lt;td style="text-align: right"&gt;83,37&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;109,94&lt;/td&gt;
&lt;td style="text-align: right"&gt;70,41&lt;/td&gt;
&lt;td style="text-align: right"&gt;107,63&lt;/td&gt;
&lt;td style="text-align: right"&gt;107,79&lt;/td&gt;
&lt;td style="text-align: right"&gt;52,74&lt;/td&gt;
&lt;td style="text-align: right"&gt;79,36&lt;/td&gt;
&lt;td style="text-align: right"&gt;80,28&lt;/td&gt;
&lt;td style="text-align: right"&gt;72,16&lt;/td&gt;
&lt;td style="text-align: right"&gt;142,41&lt;/td&gt;
&lt;td style="text-align: right"&gt;64,53&lt;/td&gt;
&lt;/tr&gt;
&lt;/table&gt;
&lt;/div&gt;
&lt;p&gt;&lt;b&gt;Имея такую выборку, что мы можем сказать о наших рыбках в общем? Как кратко описать множество этих рыбок так, чтобы стало немного понятнее, с чем мы имеем дело с точки зрения статистки?&lt;/b&gt;&lt;/p&gt;
&lt;h2&gt;1-й уровень понимания. Среднее значение.&lt;/h2&gt;
&lt;p&gt;Проще всего было бы рассчитать &lt;b&gt;&lt;i&gt;среднее значение&lt;/i&gt;&lt;/b&gt; веса рыбок — в нашем случае получилось бы 96,70 г. Тогда, на первом, самом базовом уровне понимания, мы бы сказали:&lt;/p&gt;
&lt;p&gt;&lt;b&gt;&lt;i&gt;— В нашем пруду водятся золотые рыбки. Их средний вес равен 96,70 г.&lt;/i&gt;&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Верное ли утверждение? Верное. Действительно, несмотря на то, что попадаются и рыбки весом 26 г, и рыбки весом 175 г, средний вес рыбок равен 96,7 г.&lt;/p&gt;
&lt;p&gt;Достаточно ли данной информации? Как минимум, ее достаточно, чтобы представить множество из ста рыбок по 96,7 г каждая, и, приблизительно, это дает понимание о качестве рыбок в нашем пруду. Вооружившись удочкой, мы бы шли ловить таких рыбок.&lt;/p&gt;
&lt;p&gt;Однако, этого будет недостаточно, чтобы понять, например, как сильно рыбки различаются между собой. Потому что случайно выловленная рыбка может весить гораздо меньше, чем 96,7 г. И тут мы подошли бы к следующему, более углубленному, уровню понимания.&lt;/p&gt;
&lt;h2&gt;2-й уровень понимания. Стандартное отклонение.&lt;/h2&gt;
&lt;p&gt;Чуть более образованный человек не удовлетворился бы информацией о том, что средний вес рыбок равен 96,7 г. Он обязательно пошутил бы про «среднюю температуру по больнице» и уточнил бы, а &lt;b&gt;как сильно различаются рыбки по размеру между собой?&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Такое различие называлось бы &lt;b&gt;&lt;i&gt;стандартным отклонением&lt;/i&gt;&lt;/b&gt; (или дисперсией). Оно описывало бы величину отклонения веса случайной рыбки от среднего веса всех рыбок.&lt;/p&gt;
&lt;p&gt;Проведя несложные вычисления, мы бы узнали, что, в среднем, вес случайной рыбки отклоняется от веса средней рыбки на 30,4 г. Стандартное отклонение (SD) равно 30,4 г.&lt;/p&gt;
&lt;p&gt;И здесь, мы бы уточнили свое первоначальное утверждение:&lt;/p&gt;
&lt;p&gt;&lt;b&gt;&lt;i&gt;— В нашем пруду водятся золотые рыбки. Их средний размер (вес) равен 96,70 г, SD=30,4 г.&lt;/i&gt;&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Теперь случайный рыбак не просто идет ловить рыбок весом 96,7 г, а отдает себе отчет в том, что, в среднем, вес выловленных рыбок будет на 30,4 г больше или меньше среднего веса. Наш рыбак теперь морально готов к тому, что ему может попасться как маленькая, так и большая рыбка.&lt;/p&gt;
&lt;p&gt;А, если наш рыбак еще и математик, то он прикинет, что, предполагая, что вес рыбок подчиняется закону нормального распределения (а огромное число вещей и явлений в природе и мире распределены &lt;i&gt;нормально&lt;/i&gt;), он будет ожидать, что 68% выловленных рыбок будет иметь вес плюс-минус 30,4 г от среднего 96,7 г, или от 66,3 г до 127,1 г.&lt;/p&gt;
&lt;p&gt;И, если наш рыбак-математик с первой попытки поймает рыбку весом, например, 146,7 г (что будет отличаться от среднего веса на 50,0 г, или 1,645SD), он будет знать, что так везет лишь одному рыбаку из двадцати, потому что лишь 5% рыбок в пруду имеют вес более 146,7 г, согласно закону нормального распределения.&lt;/p&gt;
&lt;p&gt;Единственная проблема заключается в том, что далеко не все в жизни сводится к примеру с рыбками, или к нормальному распределению. Так как речь может идти о генеральных совокупностях, распределенных не &lt;i&gt;нормально,&lt;/i&gt; а как-то иначе.&lt;/p&gt;
&lt;p&gt;И тут нам придется нырнуть, вслед за рыбками, к третьему, самому глубокому, уровню понимания.&lt;/p&gt;
&lt;h2&gt;3-й уровень понимания. Гистограмма распределения.&lt;/h2&gt;
&lt;p&gt;Чтобы понять, как распределена совокупность наших рыбок, лучше всего было бы «увидеть» всю картину в виде &lt;i&gt;&lt;b&gt;гистограммы распределения.&lt;/b&gt;&lt;/i&gt; Поскольку далеко не всегда мы будем иметь дело с нормальным распределением, одно лишь знание о размере стандартного отклонения и степени разброса значений в нашей выборке не даст нам полного понимания и осознания нашей совокупности.&lt;/p&gt;
&lt;p&gt;Распределив имеющиеся 100 значений веса рыбок по диапазонам от 20 до 180 г с шагом в 20 г, мы бы увидели следующую картину:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/3_levels_fish_02.png" width="852" height="530" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Только теперь мы получили полную картину того, какие рыбки плавают в нашем пруду. Мы словно разом прочувстовали, с чем имеем дело, увидели, насколько маловероятно выловить рыбку весом, например, больше 160 г, убедились, что вероятности встретить больших или маленьких рыбок одинаковы, а узнаваемая колоколообразная форма графика однозначно подсказала, что вес рыбок подчиняется нормальному распределению.&lt;/p&gt;
&lt;h2&gt;How much is the fish?&lt;/h2&gt;
&lt;p&gt;Мы идем на рыбалку, вооружившись полной картиной того, с чем имеем дело.&lt;/p&gt;
&lt;p&gt;На первом уровне, уточнили средний вес рыбок.&lt;br /&gt;
На втором уровне, уточнили средний вес и его стандартное отклонение.&lt;br /&gt;
На третьем уровне, нарисовали гистограмму веса рыбок, чтобы разом увидеть портрет всех рыбок в пруду.&lt;/p&gt;
</description>
</item>

<item>
<title>Продвинутый способ расчета рейтингов</title>
<guid isPermaLink="false">16</guid>
<link>https://mathandcoffee.ru/all/prodvinuty-sposob-rascheta-reytingov/</link>
<pubDate>Sat, 21 Sep 2019 15:59:00 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/prodvinuty-sposob-rascheta-reytingov/</comments>
<description>
&lt;p&gt;Крайне любопытная статья на сайте EvanMiller.org, &lt;a href="https://www.evanmiller.org/ranking-items-with-star-ratings.html" class="nu"&gt;«&lt;u&gt;Ranking Items With Star Ratings&lt;/u&gt;»&lt;/a&gt;, предлагает &lt;b&gt;продвинутый способ расчета рейтингов,&lt;/b&gt; например, по пятибалльной шкале.&lt;/p&gt;
&lt;p&gt;(Вообще, судя по интонации автора, история с рейтингами и методиками их расчета не так проста, как может показаться, и он &lt;a href="https://www.evanmiller.org/how-not-to-sort-by-average-rating.html"&gt;неоднократно к ней возвращается&lt;/a&gt;.)&lt;/p&gt;
&lt;p&gt;Из того, что удалось понять: во-первых, расчет &lt;b&gt;среднего рейтинга&lt;/b&gt; не всегда позволяет однозначно определить место объекта относительно остальных объектов — например, средние рейтинги могут, банально, совпадать. Во-вторых, средний рейтинг не учитывает количество голосов, ведь по идее, чем больше голосов участвует в расчете рейтинга, тем надежнее этот рейтинг.&lt;/p&gt;
&lt;p&gt;Простой пример — оценки двух сотрудников:&lt;/p&gt;
&lt;p&gt;Осипов — 5, 5, 5, 5, 5, 2, 2, 2, 2, 2. &lt;b&gt;Среднее = 3,50.&lt;/b&gt;&lt;br /&gt;
Сухонцев — 4, 4, 3, 3. &lt;b&gt;Среднее = 3,50.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Неразрешимая, на первый взгляд, ситуация решается методами &lt;a href="https://ru.wikipedia.org/wiki/%D0%91%D0%B0%D0%B9%D0%B5%D1%81%D0%BE%D0%B2%D1%81%D0%BA%D0%B0%D1%8F_%D1%81%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0"&gt;байесовской статистики&lt;/a&gt; (что бы конкретно это здесь ни значило), вуаля:&lt;/p&gt;
&lt;p&gt;Осипов — &lt;b&gt;2,72.&lt;/b&gt;&lt;br /&gt;
Сухонцев — &lt;b&gt;2,63.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Чудесным образом то ли меньшее среднеквадратичное отклонение (0,58 против 1,58), то ли меньшее количество оценок (4 против 10), то ли все они вместе &lt;b&gt;уточнили&lt;/b&gt; средний рейтинг Сухонцева, отдав ему предпочтение в несколько сотых.&lt;/p&gt;
&lt;h2&gt;Формула продвинутого расчета среднего рейтинга&lt;/h2&gt;
&lt;p&gt;Приготовьтесь, будет немного больно.&lt;/p&gt;
&lt;p&gt;Итак, &lt;a href="https://www.evanmiller.org/ranking-items-with-star-ratings.html#setup"&gt;предполагается&lt;/a&gt;, что у нас есть &lt;i&gt;&lt;b&gt;K&lt;/b&gt;&lt;/i&gt; возможных оценок, считаемых по &lt;i&gt;&lt;b&gt;k,&lt;/b&gt;&lt;/i&gt; каждая оценка стоит &lt;i&gt;&lt;b&gt;s&lt;sub&gt;k&lt;/sub&gt;&lt;/b&gt;&lt;/i&gt; баллов («1» — это 1 балл, «2» — это 2 балла и т. д.). Имея &lt;i&gt;&lt;b&gt;N&lt;/b&gt;&lt;/i&gt; полученных оценок для каждого объекта, по &lt;i&gt;&lt;b&gt;n&lt;sub&gt;k&lt;/sub&gt;&lt;/b&gt;&lt;/i&gt; оценок для каждого &lt;i&gt;&lt;b&gt;k,&lt;/b&gt;&lt;/i&gt; можно посчитать рейтинг каждого объекта по формуле:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/ratings00.PNG" width="835" height="229" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Где &lt;i&gt;&lt;b&gt;z&lt;sub&gt;α/2&lt;/sub&gt;&lt;/b&gt;&lt;/i&gt; это &lt;i&gt;&lt;b&gt;1−α/2&lt;/b&gt;&lt;/i&gt; квантиль нормального распределения. Посчитанный рейтинг является нижней границей нормальной аппроксимации байесова доверительного интервала для среднего рейтинга. Принимая, например, α=0,10 (z=1,65), рассчитанный рейтинг &lt;i&gt;&lt;b&gt;S&lt;/b&gt;&lt;/i&gt; будет означать, что в 95% случаев средний рейтинг объекта будет выше &lt;i&gt;&lt;b&gt;S&lt;/b&gt;&lt;/i&gt;.&lt;/p&gt;
&lt;p&gt;Упрощая, «продвинутый» расчет среднего рейтинга позволяет дать прогноз возможной средней оценки, рассчитываемой традиционным путем. Ну и, следовательно, как показано выше, ранжировать объекты даже при формально одинаковой средней оценке.&lt;/p&gt;
&lt;h2&gt;Пример расчета продвинутого среднего рейтинга&lt;/h2&gt;
&lt;p&gt;Вооружившись 2000 оценок по пятибалльной шкале условных территориальных офисов продаж, я посчитал средний рейтинг каждого офиса обычным и «продвинутым» способом.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;div class="fotorama" data-width="455" data-ratio="1.0859188544153"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/ratings01.PNG" width="455" height="419" alt="" /&gt;
&lt;img src="https://mathandcoffee.ru/pictures/ratings02.PNG" width="455" height="419" alt="" /&gt;
&lt;/div&gt;
&lt;div class="e2-text-caption"&gt;Среднее 1.0 — средний рейтинг обычный, Среднее 2.0 — средний рейтинг продвинутый.&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;«Таганский» упал со 2-го на 4-е место по всей видимости, из-за того, что выборка в 66 оценок не дает достаточной уверенности в том, что его средний рейтинг действительно настолько высок, и в 90% случаев его рейтинг прогнозируется выше всего лишь 4,55, что примерно соответствует 4-му месту.&lt;/p&gt;
&lt;p&gt;«Академический» формально был на 13-м месте, но, благодаря надежным 249 оценкам, для него прогнозируется, в 90% случаев, средний рейтинг не ниже 4,4, что поднимает его до 10-го места.&lt;/p&gt;
&lt;p&gt;У меня сложилось ощущение, что формула более убедительно работает для коротких шкал оценок, как «от 1 до 5» в приведенном примере.&lt;/p&gt;
&lt;p&gt;В любом случае, делюсь &lt;a href="https://docs.google.com/spreadsheets/d/1Uh5ndL3rFjd9orZ5NCZFInuWN218LDO6N-D90Ih0THo/edit?usp=sharing"&gt;файлом в Google Таблицах&lt;/a&gt; — по идее, он считает рейтинги для всех шкал «длиной» до 100 оценок включительно, позволяет импортировать до 10 000 строк с оценками и корректировать уровень достоверности (90% в нашем примере).&lt;/p&gt;
&lt;h2&gt;Cм. также&lt;/h2&gt;
&lt;p&gt;&lt;a href="https://www.evanmiller.org/ranking-items-with-star-ratings.html"&gt;https://www.evanmiller.org/ranking-items-with-star-ratings.html&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;&lt;a href="https://docs.google.com/spreadsheets/d/1Uh5ndL3rFjd9orZ5NCZFInuWN218LDO6N-D90Ih0THo/edit?usp=sharing"&gt;Продвинутый способ расчета рейтинга&lt;/a&gt; в Google Таблицах&lt;/p&gt;
</description>
</item>

<item>
<title>4 смски «за», 4 смски «против»</title>
<guid isPermaLink="false">31</guid>
<link>https://mathandcoffee.ru/all/4-smski-za-4-smski-protiv/</link>
<pubDate>Mon, 16 Sep 2019 20:03:11 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/4-smski-za-4-smski-protiv/</comments>
<description>
&lt;p&gt;Недавно слушал «Вести ФМ», где обсуждались итоги &lt;a href="https://ru.wikipedia.org/wiki/%D0%95%D0%B4%D0%B8%D0%BD%D1%8B%D0%B9_%D0%B4%D0%B5%D0%BD%D1%8C_%D0%B3%D0%BE%D0%BB%D0%BE%D1%81%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F_8_%D1%81%D0%B5%D0%BD%D1%82%D1%8F%D0%B1%D1%80%D1%8F_2019_%D0%B3%D0%BE%D0%B4%D0%B0"&gt;единого дня голосования 8 сентября&lt;/a&gt;.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/4smski05.JPG" width="1230" height="601" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Меня заинтересовала следующая реплика ведущего, &lt;a href="https://youtu.be/tOUSxbWdSuY?t=6305"&gt;с 01:45:05&lt;/a&gt;:&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;&lt;i&gt;Кстати, вот, слушатели из того же Хабаровского края пишут и, примерно, по количеству смсок делятся «50 на 50». 50% считают, что они позитивный выбор совершили, а 50% считают, что стало хуже, и это был негативный выбор. Это, понятно, не социологическое исследование. Ну, вот, просто я вижу десяток, восемь, где-то, смсок, и они примерно пополам делятся. Тоже любопытно.&lt;/i&gt;&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;К чести ведущего, абсолютно корректное замечание-«дисклеймер», что это не «социологическое исследование». И все же, что можно сказать о том, как, &lt;i&gt;в реальности,&lt;/i&gt; делятся голоса, если у вас в наличии только 4 смски «за» и 4 смски «против»? Насколько соотношение «50 на 50», полученное на выборке в 8 смсок, подтверждает ровно то же самое распределение голосов &lt;i&gt;в генеральной совокупности?&lt;/i&gt;&lt;/p&gt;
&lt;h2&gt;Считаем в Гугл Таблицах&lt;/h2&gt;
&lt;p&gt;Быстро воспроизводим эксперимент в Гугл Таблицах:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/4smski00.PNG" width="381" height="191" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Итак, в тот день 4 человека прислали смски «за», 4 человека прислали смски «против». Логично предположить, что день на день не приходится, и сегодня это были одни слушатели, завтра смски будут присылать другие слушатели, и соотношение сил может быть «3 к 5», «5 к 3», «2 к 6» или «7 к 1» — любое сочетание теоретически возможно. Однако, если мы предполагаем, что взгляды аудитории делятся поровну, то чуть более вероятны сценарии «4 к 4», «3 к 5» или «5 к 3», а сценарии «8 к 0» или «1 к 7», например, менее вероятны.&lt;/p&gt;
&lt;p&gt;Технически, мы имеем дело с &lt;i&gt;биномиальным распределением&lt;/i&gt; — из 8 смсок мы &lt;i&gt;ожидаем&lt;/i&gt; получить 4 смски «за», но не знаем наверняка, сколько их будет. Вероятность получить смску «за» равна 50% (допустим, что ровно 50% аудитории — «за»), в этом случае &lt;b&gt;&lt;i&gt;стандартная ошибка (SD,&lt;/i&gt;&lt;/b&gt; или &lt;b&gt;&lt;i&gt;&amp;sigma;)&lt;/i&gt;&lt;/b&gt; биномиального распределения рассчитывалась бы по формуле:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/CodeCogsEqn.png" width="201" height="77" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;где &lt;b&gt;&lt;i&gt;p&lt;/i&gt;&lt;/b&gt; = 50%, а &lt;b&gt;&lt;i&gt;n&lt;/i&gt;&lt;/b&gt; = 8.&lt;/p&gt;
&lt;p&gt;Считаем:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/4smski01.PNG" width="384" height="231" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Получается, если вероятность получить смску «за» равняется 50%, то стандартное отклонение при выборке в 8 смсок &lt;b&gt;равняется 17,68%!&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Что же это означает на практике?&lt;/p&gt;
&lt;p&gt;Это означает, что, поскольку имеющаяся выборка (8 смсок) крайне мала, доля случайности в нашем результате «4 „за“, 4 „против“», наоборот, крайне велика, и мы не можем уверенно говорить о строгом распределении голосов «50 на 50» среди всей аудитории «Вести ФМ». Единственное, что мы можем утверждать более-менее точно, это то,  что истинная доля голосов «за» лежит &lt;b&gt;&lt;i&gt;в некотором интервале&lt;/i&gt;&lt;/b&gt; вокруг 50%. И величина этого интервала будет тем шире, чем больше мы захотим быть уверены в его надежности.&lt;/p&gt;
&lt;p&gt;Предположим, мы хотим быть уверены в нашем доверительном интервале на 90%. (Оставляем себе право на ошибку в 10% случаев, другими словами). Согласно законам &lt;i&gt;нормального распределения&lt;/i&gt; (а биномиальное распределение — это частный случай нормального), данный интервал &lt;b&gt;определяется как 50%&amp;plusmn;1,645SD.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Такое несложно рассчитать в Гугл Таблицах:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/4smski03.PNG" width="379" height="246" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Получается, что истинная доля голосов «за» лежит в интервале 50%&amp;plusmn;29,08%, &lt;b&gt;т. е. от 20,92% до 79,08%.&lt;/b&gt; Примерно вот так это выглядит:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/4smski02.PNG" width="789" height="368" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Значит, мы и близко не можем говорить о том, что «слушатели ... примерно ... делятся 50 на 50»! В лучшем случае (даже оставляя 10% на то, что мы ошибемся), &lt;b&gt;мы можем говорить лишь об интервале от 21% до 79%.&lt;/b&gt;&lt;/p&gt;
&lt;h2&gt;Уточнение расчетов&lt;/h2&gt;
&lt;p&gt;Однако, интервал &lt;b&gt;&lt;i&gt;p&lt;/i&gt;&amp;plusmn;1,645&lt;i&gt;SD&lt;/i&gt;&lt;/b&gt; тоже является достаточно грубой оценкой. Существуют более сложные, и немного более точные, способы оценить границы интервалов.&lt;/p&gt;
&lt;p&gt;Воспользовавшись &lt;a href="https://www.wolframalpha.com/input/?i=binomial+distribution+confidence+interval"&gt;калькулятором Wolfram Alpha&lt;/a&gt;, можно получить следующие границы интервала:&lt;/p&gt;
&lt;div class="e2-text-table"&gt;
&lt;table cellpadding="0" cellspacing="0" border="0"&gt;
&lt;tr&gt;
&lt;td style="text-align: left"&gt;Clopper-Pearson confidence interval for a binomial parameter&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,1929&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,8071&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: left"&gt;Wilson score confidence interval for a binomial parameter with continuity correction&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,2034&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,7966&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: left"&gt;standard confidence interval for a binomial parameter&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,2092&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,7908&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: left"&gt;Jeffreys confidence interval for a binomial parameter&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,2393&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,7607&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: left"&gt;Wilson score confidence interval for a binomial parameter&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,2486&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,7514&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: left"&gt;Agresti-Coull confidence interval for a binomial parameter&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,2486&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,7514&lt;/td&gt;
&lt;/tr&gt;
&lt;/table&gt;
&lt;/div&gt;
&lt;h2&gt;Ну а если хотим, хотя бы, 45-55% получить?&lt;/h2&gt;
&lt;p&gt;Вот еще интересно: на какого размера выборке, если голоса в ней по-прежнему делятся строго «50 на 50», мы сможем говорить о доверительном интервале, суженном хотя бы до 45-55%?&lt;/p&gt;
&lt;p&gt;Рассчитать такое несложно. Если речь идет об интервале 50%&amp;plusmn;5%, (и мы продолжаем придерживаться уровня уверенности в результате, равном нашим любимым 90%), то 5% должны составлять 1,645 стандартных отклонений (SD). Отсюда, SD = 3,04%. По формуле стандартного отклонения:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/4smski04.png" width="270" height="58" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;откуда несложно найти n = 270,6. Получается, нужно 270-272 смски с распределением голосов строго пополам, чтобы говорить об интервале от 45% до 55% с уровнем уверенности 90%.&lt;/p&gt;
&lt;h2&gt;См. также&lt;/h2&gt;
&lt;p&gt;&lt;a href="https://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval"&gt;https://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval&lt;/a&gt;&lt;br /&gt;
&lt;a href="https://www.wolframalpha.com/input/?i=binomial+distribution+confidence+interval&amp;assumption=%22FSelect%22+-%3E+%7B%7B%22BinomialInterval%22%7D%7D&amp;assumption=%7B%22F%22%2C+%22BinomialInterval%22%2C+%22phat%22%7D+-%3E%220.5%22&amp;assumption=%7B%22F%22%2C+%22BinomialInterval%22%2C+%22c%22%7D+-%3E%220.9%22&amp;assumption=%7B%22F%22%2C+%22BinomialInterval%22%2C+%22n%22%7D+-%3E%228%22"&gt;Калькулятор на WolframAlpha.com&lt;/a&gt;&lt;br /&gt;
&lt;a href="https://cyberleninka.ru/article/n/doveritelnye-intervaly-dlya-chastot-i-doley.pdf"&gt;https://cyberleninka.ru/article/n/doveritelnye-intervaly-dlya-chastot-i-doley.pdf&lt;/a&gt;&lt;br /&gt;
&lt;a href="http://italylov.ru/blog/all/ctatisticheskaya-dostovernost-koltrekinga/"&gt;Cтатистическая достоверность для застройщиков&lt;/a&gt;&lt;/p&gt;
</description>
</item>

<item>
<title>Ищем «аномалии», включаем красные и зеленые «лампочки»</title>
<guid isPermaLink="false">30</guid>
<link>https://mathandcoffee.ru/all/ischem-anomalii/</link>
<pubDate>Thu, 12 Sep 2019 15:27:33 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/ischem-anomalii/</comments>
<description>
&lt;p&gt;Переписываясь на днях с коллегой в Телеграме, в очередной раз увидел примерно вот такой отчет (сейчас просто нарисовал похожий) — сверху недели, сбоку, допустим, территориальные офисы продаж (там были месяцы и продажи по типам продукта, но для целей этой заметки это совершенно не имеет значения):&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/anomalii00.PNG" width="1163" height="434" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Воспользовавшись «Условным форматированием» в Экселе, замечаем, что на 6-й неделе в офисе «Академический»  было 503 продажи. В общем, до этого момента ничего необычного, и так выжали 90% из данных, можно работать с отчетом и анализировать, что душе угодно.&lt;/p&gt;
&lt;p&gt;Однако, есть несложная доработка, позволяющая выжать из данных еще лишние 5%.&lt;/p&gt;
&lt;h2&gt;Что, собственно, ищем&lt;/h2&gt;
&lt;p&gt;На картинке особо не видно, но чем ниже по списку, тем меньше в среднем продаж в каждом следующем офисе. То есть, будем считать, что офисы продаж все очень разные, и некорректно сравнивать «Академический» с «Якиманкой» — нехитрым вычислением получается, что «Академический» в среднем делал 242 продажи в неделю, а «Якиманка» — всего 13. Предположим, что тому есть объективные причины, и никто и не требовал от всех офисов показывать одинаковые результаты.&lt;/p&gt;
&lt;p&gt;И тогда можно задать себе вопрос: достаточно ли просто анализировать абсолютные показатели по нашим офисам? И не будет ли правильнее копнуть вглубь, и &lt;b&gt;попробовать найти такие показатели, которые выбиваются из общей картины?&lt;/b&gt; Такие недели, которые были &lt;b&gt;&lt;i&gt;аномальными&lt;/i&gt;&lt;/b&gt; для данного офиса продаж.&lt;/p&gt;
&lt;p&gt;Здесь и далее под &lt;i&gt;«аномалией»&lt;/i&gt; я буду понимать такое значение продаж, которое &lt;b&gt;слишком отличается от среднего по данном офису.&lt;/b&gt; Как в большую (и надо разобраться, как повторить этот результат) или в меньшую (проанализировать, как избежать неудачи в будущем) сторону.&lt;/p&gt;
&lt;h2&gt;Распределяем результаты офиса «Академический»&lt;/h2&gt;
&lt;p&gt;Изучив результаты продаж офиса «Академический» за прошедшие 43 недели, мы рассчитали, что в среднем они делают 241,5 продаж в неделю, при этом стандартное отклонение (SD) равно 86,3.&lt;/p&gt;
&lt;p&gt;Напомню формулы:&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=СРЗНАЧ(B2:AR2)&lt;/code&gt;&lt;/pre&gt;&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=СТАНДОТКЛОН.В(B2:AR2)&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;Можно, гипотетически, представить, что мы имеем возможность наблюдать за результатами офиса «Академический» 200 (sic!) лет, при условии, что все это время среднее и стандартное отклонение не меняются, т. е., грубо говоря, они работают, как работали. В этом случае, мы увидели бы распределение результатов продаж, близкое к &lt;i&gt;нормальному:&lt;/i&gt;&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/anomalii01.PNG" width="663" height="379" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Давайте даже еще раз перерисуем картинку. 2 290 недель из 10 000 они бы делали от 200 до 249 продаж в неделю:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/anomalii02.PNG" width="663" height="379" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Понимаете, к чему я клоню?&lt;/p&gt;
&lt;p&gt;Если только допустить, что результаты продаж подчиняются законам &lt;i&gt;нормального распределения&lt;/i&gt; (грубо говоря, равновероятно продать как чуть больше, так и чуть меньше среднего), существует некоторое разумное отклонение от среднего, в пределах которого было бы глупо всерьез говорить о «спаде продаж» или «невероятном успехе». Иными словами, бессмысленно считать «аномалией» то, что лежит в пределах разумного отклонения от среднего.&lt;/p&gt;
&lt;p&gt;Остается сформулировать критерии «разумности» и научить отчет сигнализировать об «аномалиях».&lt;/p&gt;
&lt;h2&gt;Вспоминаем теорию&lt;/h2&gt;
&lt;p&gt;Если вкратце, то, допустив на минутку, что мы имеем дело с &lt;i&gt;нормальным распределением,&lt;/i&gt; вычислив &lt;i&gt;среднее значение&lt;/i&gt; и &lt;i&gt;стандартное отклонение (SD),&lt;/i&gt; мы можем уверенно говорить о том, &lt;b&gt;что 90% данных в отчете не будут выходить за границы &amp;plusmn;1,645SD от среднего.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Применительно к офису «Академический» речь идет о том, что для 90% времени результаты их продаж будут лежать в диапазоне от 100 до 383, или 241,5&amp;plusmn;142,0.  Поэтому до тех пор, пока цифры не вышли за пределы этих границ, мы не наблюдаем ничего необычного.&lt;/p&gt;
&lt;p&gt;Сразу оговоримся: конечно, степень «необычности», или «аномалии», каждый определяет для себя сам. Для одних, подозрение могут вызывать показатели, выбивающиеся за рамки 80%-ной вероятности (&amp;plusmn;1,28SD), для других — терпимым будет отклонение в &amp;plusmn;1,96SD, что соответствует 95%-й вероятности. Тогда, первые будут бить искать причины «аномалии» в 20% случаев, вторые — в 5%. Каждую пятую неделю но отчете у коммерческого директора первые будут объяснять, что произошло, и почему, тогда как вторые будут делать это раз в 4-5 месяцев.&lt;/p&gt;
&lt;p&gt;Допущение о том, что продажи в территориальных офисах, число посетителей на сайте, количество рекламных звонков, клики по баннеру распределяются по закону нормального распределения, дало нам потрясающую возможность оценивать вероятность наступления «аномалии» — слишком сильного отклонения от среднего значения. Обратно, оно учит нас не бить тревогу там, где отклонение, хотя и есть, не является достаточно сильным, и делает, отчасти, бессмысленным анализ и разбор ситуаций, когда показатель отклоняется в пределах разумного.&lt;/p&gt;
&lt;h2&gt;Перекрашиваем отчет, включаем зеленые и красные «лампочки»&lt;/h2&gt;
&lt;p&gt;Теперь мы хотим переделать отчет о продажах в территориальных офисах таким образом, чтобы напротив подозрительно больших или подозрительно маленьких значений загорались бы зеленые и красные «лампочки».&lt;/p&gt;
&lt;p&gt;Нам необходимо научить отчет «включать» наши «лампочки», если значение в ячейке становится больше или меньше границ 90%-го диапазона, т. е. в примерно 90% случаев ни одна из «лампочек» «загораться» не будет, в примерно 5% случаев будет «загораться» красная «лампочка», и еще в примерно 5% — зеленая.&lt;/p&gt;
&lt;p&gt;Применительно к «Академическому», мы хотим выделять красным значения, меньшие чем 241,5-1,645*86,3, т. е., меньшие, чем 100, и мы ходим выделять зеленым значения, большие, чем 241,5+1,645*86,3, т. е., большие, чем 383.&lt;/p&gt;
&lt;p&gt;Нам остается рассчитать границы включения «лампочек» по каждому из офисов продаж, рассчитав последовательно: среднее значение продаж, стандартное отклонение (SD), нижнюю границу 90%-го диапазона, верхнюю границу 90%-го диапазона.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/anomalii03.PNG" width="542" height="308" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Используемые формулы:&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=СРЗНАЧ(B2:AR2)&lt;/code&gt;&lt;/pre&gt;&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=СТАНДОТКЛОН.В(B2:AR2)&lt;/code&gt;&lt;/pre&gt;&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=B2-1,645*C2&lt;/code&gt;&lt;/pre&gt;&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=B2+1,645*C2&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;У нас получилась следующая таблица, содержащая расчеты по нижним и верхним границам того, что мы далее будем считать «аномалией»:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/anomalii04.PNG" width="471" height="439" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Теперь, используя инструмент «Условное форматирование» — «Правило выделения ячеек» — «Меньше...»/«Больше...», последовательно для каждого из 17-ти офисов продаж настраиваем правила подсветки ячеек красным и зеленым, в зависимости от того, будет ли значение ниже нижней границы 90%-го диапазона, или выше верхней границы:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;div class="fotorama" data-width="614" data-ratio="1.9068322981366"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/anomalii05.PNG" width="614" height="322" alt="" /&gt;
&lt;img src="https://mathandcoffee.ru/pictures/anomalii06.PNG" width="600" height="315" alt="" /&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Дополнительно выставляем светло-серый цвет текста, чтобы подсвеченные «аномалии» были еще более заметны. Добавляем градиент от белого к светло-серому, чтобы сохранить первоначальную идею выделять большие значения более темной заливкой. Законченная таблица приобретает следующий вид:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/anomalii07.PNG" width="1162" height="438" alt="" /&gt;
&lt;/div&gt;
&lt;h2&gt;Выводы&lt;/h2&gt;
&lt;p&gt;Используя идею о разбросе значений вокруг среднего в нормальном распределении, нам удалось доработать наш отчет о территориальных офисах таким образом, что мы не просто видим результаты, но и теперь отдельно включаем красные и зеленые «лампочки» для тех результатов, которые представляют интерес, как «аномалии» — маловероятно маленькие или маловероятно большие значения, определив уровень «аномалии» как все, что выходит за пределы 90% вероятности.&lt;/p&gt;
</description>
</item>

<item>
<title>Голосовой робот KupiVIP, угадываем размер выборки</title>
<guid isPermaLink="false">27</guid>
<link>https://mathandcoffee.ru/all/golosovoy-robot-kupivip-ugadyvaem-razmer-vyborki/</link>
<pubDate>Sat, 20 Jul 2019 13:18:48 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/golosovoy-robot-kupivip-ugadyvaem-razmer-vyborki/</comments>
<description>
&lt;p&gt;В статье «&lt;a href="https://vc.ru/marketing/54315-keys-zamenili-na-black-friday-koll-centr-kupivip-robotom-i-tolko-5-chelovek-iz-5000-ponyali-chto-obshchayutsya-s-neyrosetyu"&gt;Кейс: заменили на Black Friday колл-центр KupiVIP роботом, и только 5 человек из 5000 поняли, что общаются с нейросетью&lt;/a&gt;» на vc.ru меня, среди прочего, не могла не заинтересовать фраза, где автор рассказывает о росте конверсии с 6% до 8%:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/kupivip_robot_00.PNG" width="690" height="276" alt="&amp;quot;количество активаций промокода у голосового робота доходило до 8% против 6% у реальных сотрудников колл-центра.&amp;quot;" /&gt;
&lt;/div&gt;
&lt;p&gt;Естественно, я задумался, на каком же объеме звонков был зафиксирован данный рост конверсии, и достаточен ли был этот объем, чтобы можно было достоверно утверждать, что голосовой робот эффективнее живых операторов колл-центра.&lt;/p&gt;
&lt;p&gt;Точно вопрос можно было бы сформулировать, например, следующим образом: &lt;b&gt;какой минимальный объем звонков требуется сделать, чтобы с уровнем достоверности, например, 95% зафиксировать рост конверсии с 6% до 8%?&lt;/b&gt;&lt;/p&gt;
&lt;h2&gt;Строим эксперимент в Excel&lt;/h2&gt;
&lt;p&gt;Попробуем выписать имеющиеся данные в Excel. Для дальнейших расчетов нам понадобится параметр &lt;i&gt;«число звонков»&lt;/i&gt; — предположим пока, что и робот, и операторы сделали по 1000 звонков, прежде чем были получены конверсии 6% и 8%:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/kupivip_robot_01.PNG" width="366" height="215" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Вообще, налицо обычный А/Б сплит-тест, и далее нам нужно будет пройтись по его алгоритму для получения &lt;i&gt;Z-оценки&lt;/i&gt; и расчета &lt;i&gt;p-значения&lt;/i&gt;.&lt;/p&gt;
&lt;p&gt;Рассчитаем стандартные ошибки (SD, или &amp;sigma;) для обеих конверсий и стандартную ошибку разницы этих конверсий. Формула для расчета стандартной ошибки конверсии:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/CodeCogsEqn.png" width="201" height="77" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;где &lt;i&gt;p&lt;/i&gt; — конверсия (6%, например), &lt;i&gt;n&lt;/i&gt; — размер выборки (1000 звонков). Считаем в Excel:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/kupivip_robot_02.PNG" width="573" height="217" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Стандартная ошибка разницы конверсий — считаем по формуле:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/CodeCogsEqn02.png" width="230" height="58" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;где &amp;sigma; — это стандартная ошибка каждой из конверсий A и B (оператор и робот). В Excel посчитаем ее чуть ниже:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/kupivip_robot_03.PNG" width="556" height="250" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Насколько разница между конверсиями A и B больше, чем стандартная ошибка этой разницы? Это соотношение называется &lt;i&gt;&lt;b&gt;Z-оценкой.&lt;/b&gt;&lt;/i&gt; В Excel считается совсем просто:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/kupivip_robot_04.PNG" width="506" height="271" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Итак, Z-оценка = 1,7541. На графике нормального распределения это соответствует 96%-му персентилю, то есть, вероятность, что Z-оценка случайно окажется выше 1,7541 составляет порядка 4% (иными словами, 96% площади под колоколом нормального распределения не выходят за пределы +1,7541 стандартных отклонений):&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/kupivip_robot_05.PNG" width="706" height="304" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Откуда мы взяли именно 96%? Точное значение вероятности, &lt;i&gt;p-значение,&lt;/i&gt; вычисляем по формуле:&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=НОРМ.РАСП(1,7541;0;1;ИСТИНА)&lt;/code&gt;&lt;/pre&gt;&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/kupivip_robot_06.PNG" width="571" height="94" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;P-значение = 96,03%.&lt;/p&gt;
&lt;p&gt;Итак, промежуточный вывод: &lt;b&gt;если на выборке в 1000 звонков в каждом из двух случаев мы обнаружили конверсии (активации промокода) в 6% и 8% звонков, то мы на 96% уверены, что эта разница не случайна.&lt;/b&gt; (Остается 4% вероятности, что обнаруженная разница — случайность. Тогда, возможно, конверсия вообще одинакова и равна, например, 7%. Сделай мы больше звонков, разница вскоре сошла бы на нет).&lt;/p&gt;
&lt;h2&gt;Эксперимент минимального размера&lt;/h2&gt;
&lt;p&gt;Однако, вернемся к первоначальной задаче.&lt;/p&gt;
&lt;p&gt;Мы не хотели убедиться, что 8% больше, чем 6%, да и цифра 1000 звонков для робота и операторов была выбрана наугад. Мы хотели рассчитать &lt;b&gt;минимальное количество звонков, чтобы с уровнем уверенности 95% зафиксировать статистическую значимость разницы между 8% и 6%.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;1000 звонков нам оказалось точно достаточно. Теперь нам остается уменьшать это число до той поры, пока p-значение не пересечет границу 95%. (По формуле нормального распределения, кстати, это будет соответствовать Z-оценке, равной 1,6449 — попробуйте проверить.)&lt;/p&gt;
&lt;p&gt;В теории, наверное, можно было бы вывести большую формулу для расчета такого &lt;i&gt;n,&lt;/i&gt; при котором p-значение будет равно 0,95. На практике, быстрее окажется вручную подобрать минимальное n. Или, еще лучше, воспользоваться в Excel инструментом &lt;b&gt;Данные — Анализ «что, если» — Подбор параметра:&lt;/b&gt;&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/kupivip_robot_07.PNG" width="797" height="186" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;(Убедитесь только, что число звонков робота ровно то же самое, что и число звонков оператора, т. е. вы указали =C6 в ячейке C7).&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/kupivip_robot_08.PNG" width="817" height="185" alt="" /&gt;
&lt;/div&gt;
&lt;h2&gt;Выводы&lt;/h2&gt;
&lt;p&gt;Итак, мы вычислили минимальные условия эксперимента для оценки эффективности голосового робота для KupiVIP.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Нужно не менее 878 звонков в каждой из двух групп, чтобы с уровнем достоверности 95% подтвердить наличие разницы между 6% активаций промокодов в контрольной группе (реальные сотрудники) и 8% в тестовой группе (голосовой робот).&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;(Единственное, ни 6%, ни 8% не дают целого числа активаций на выборке из 878 звонков, и, в реальности, конечно, цифры будут другие, причем число звонков в двух группах вообще может быть различным. Но, на самом деле, это не имеет большого значения, т. к., наверняка, в статье были приведены округленные значения конверсий).&lt;/p&gt;
&lt;h2&gt;См. также:&lt;/h2&gt;
&lt;p&gt;&lt;a href="https://abtestguide.com/calc/?ua=1000&amp;ub=1000&amp;ca=60&amp;cb=80"&gt;https://abtestguide.com/calc/?ua=1000&amp;ub=1000&amp;ca=60&amp;cb=80&lt;/a&gt;&lt;/p&gt;
</description>
</item>

<item>
<title>«В каждом пятом» звонке проблемы, проверяем</title>
<guid isPermaLink="false">21</guid>
<link>https://mathandcoffee.ru/all/v-kazhdom-pyatom-zvonke-problemy-proveryaem/</link>
<pubDate>Sun, 09 Jun 2019 16:45:58 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/v-kazhdom-pyatom-zvonke-problemy-proveryaem/</comments>
<description>
&lt;p&gt;На днях пришел в голову такой пример: предположим, подрядчик жалуется &lt;b&gt;на плохую связь «в каждом пятом» звонке.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Наша задача проверить, &lt;b&gt;справедлива ли гипотеза, что 20% звонков имеют проблемы со связью.&lt;/b&gt; Причем, как всегда, мы не просто сделаем 100 тестовых звонков (на это у нас нет ресурсов), а сформулируем нулевую гипотезу, альтернативную гипотезу, и проверим ее с заданным уровнем достоверности.&lt;/p&gt;
&lt;h2&gt;Выдвигаем гипотезу и определяем уровень достоверности&lt;/h2&gt;
&lt;p&gt;&lt;b&gt;Нулевой гипотезой &lt;i&gt;(H&lt;sub&gt;0&lt;/sub&gt;)&lt;/i&gt;&lt;/b&gt; пусть будет предположение, что со связью все в порядке, или, по крайней мере, проблемы встречаются реже, чем в 20% звонков.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Альтернативной гипотезой &lt;i&gt;(H&lt;sub&gt;1&lt;/sub&gt;),&lt;/i&gt;&lt;/b&gt; которую мы будем проверять, пусть будет предположение подрядчика, что в каждом пятом звонке наблюдаются помехи. То есть, по крайней мере, в 20% звонков есть проблемы со связью.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Уровень достоверности&lt;/b&gt; — это наша уверенность в результатах эксперимента. Чем он выше, тем больше придется сделать проверочных звонков, поэтому мы заложим 1% на возможную ошибку, и выберем уровень достоверности в 99% (1%, что, если даже эксперимент не подтвердит проблем со связью, они, в действительности, могут быть).&lt;/p&gt;
&lt;h2&gt;Cобираем формулу для расчета выборки&lt;/h2&gt;
&lt;p&gt;Предположим, цель эксперимента — &lt;i&gt;опровергнуть&lt;/i&gt; альтернативную гипотезу H&lt;sub&gt;1&lt;/sub&gt; («есть проблемы»), подтвердив нулевую гипотезу H&lt;sub&gt;0&lt;/sub&gt; («все в порядке»). Чтобы сделать это, нам будет достаточно продемонстрировать N подряд успешных звонков без признаков проблем со связью, при этом допуская вероятность, равную или меньше 1%, что нам просто повезет, и, при наличии, в действительности, проблем с оборудованием, они случайно не проявят себя ни в одном из N звонков.&lt;/p&gt;
&lt;p&gt;Из предположения подрядчика вытекает, что 80% звонков не имеют проблем. Вероятность отсутствия сбоев в N звонках подряд равна 0,80&lt;sup&gt;N&lt;/sup&gt;. Нам нужно подобрать минимальное N, при котором вероятность упадет до 1%: 0,80&lt;sup&gt;N&lt;/sup&gt; = 1%&lt;/p&gt;
&lt;p&gt;Получается, нам нужно вычислить логарифм 1% по основанию 80%!&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/every5th01.PNG" width="223" height="36" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Загружаем в Гугл Таблицы:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/every5th00.PNG" width="366" height="320" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Формула для ячейки C5 будет выглядеть как&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=LOG(1-C2;1-C3)&lt;/code&gt;&lt;/pre&gt;&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/every5th02.PNG" width="373" height="262" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Нужно сделать 20,64 звонка. (Проверяем: 0,80&lt;sup&gt;20,64&lt;/sup&gt; = 0,9995%, идеально.)&lt;/p&gt;
&lt;p&gt;Остается только добавить округление:&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=ОКРУГЛВВЕРХ(C5)&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;или сразу&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=ОКРУГЛВВЕРХ(LOG(1-C2;1-C3))&lt;/code&gt;&lt;/pre&gt;&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/every5th03.PNG" width="366" height="266" alt="" /&gt;
&lt;/div&gt;
&lt;h2&gt;Проверяем гипотезу&lt;/h2&gt;
&lt;p&gt;Если альтернативная гипотеза &lt;i&gt;H&lt;sub&gt;1&lt;/sub&gt;&lt;/i&gt; нашего подрядчика верна, и мы испытываем проблемы со связью в каждом пятом звонке, то, вероятность не заметить проблем в 21 тестовом звонке подряд составляет порядка 1%. Иными словами, либо это крайне редкое совпадение (1%), либо альтернативная гипотеза о проблемах в 20% звонков неверна (99%), и мы оставляем нулевую гипозеу &lt;i&gt;H&lt;sub&gt;0&lt;/sub&gt;&lt;/i&gt;. &lt;b&gt;С вероятностью 99% мы уверены, что проблем со связью не наблюдается.&lt;/b&gt;&lt;/p&gt;
</description>
</item>

<item>
<title>Сколько минут возможно просидеть без звонков</title>
<guid isPermaLink="false">22</guid>
<link>https://mathandcoffee.ru/all/skolko-minut-mozhno-sidet-bez-zvonkov/</link>
<pubDate>Sun, 09 Jun 2019 12:10:35 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/skolko-minut-mozhno-sidet-bez-zvonkov/</comments>
<description>
&lt;p&gt;Или вот еще был случай: разгар рабочего дня в отделе продаж, телефон молчит уже полчаса.&lt;/p&gt;
&lt;p&gt;Варианта два: либо технический сбой, либо это просто случайно подзатянувшаяся пауза, и вот-вот поступит очередной звонок от клиента.&lt;/p&gt;
&lt;p&gt;Попробуем разобраться, сколько минут можно просидеть в тишине, прежде чем надо начинать беспокоиться.&lt;/p&gt;
&lt;h2&gt;Неочевидный параметр телефонного звонка&lt;/h2&gt;
&lt;p&gt;Какими вообще параметрами обладает телефонный звонок в отделе продаж или в коллцентре? &lt;i&gt;Дата и время, скорость ответа, длительность, день недели, номер линии, номер клиента&lt;/i&gt; — вот самые очевидные характеристики, по которым можно анализировать поступающие звонки.&lt;/p&gt;
&lt;p&gt;Где-то в тени прячется еще один параметр — а именно, &lt;b&gt;длительность паузы&lt;/b&gt; (промежутка без звонков), &lt;b&gt;предшествующей очередному звонку.&lt;/b&gt; Например, звонок поступил в 14:07 13 февраля и продлился 3 мин 52 сек. Это то, что видно в выгрузке, в логах АТС или в CRM. Не менее любопытно, что, если предыдущий звонок был зарегистрирован в 14:01, то пауза в 6 минут является тем самым неочевидным параметром, который тоже можно было бы проанализировать.&lt;/p&gt;
&lt;p&gt;Допустим, возьмем звонки в коллцентр в будние дни с 10 до 19 часов. Посчитаем разность в минутах между двумя соседними звонками — «0», если прошло меньше минуты, «1» — от одной до двух минут (от 01:00 до 01:59), и так далее. Проанализировав тысячи звонков, получаем примерно такую таблицу:&lt;/p&gt;
&lt;div class="e2-text-table"&gt;
&lt;table cellpadding="0" cellspacing="0" border="0"&gt;
&lt;tr&gt;
&lt;td&gt;&lt;b&gt;Пауза перед звонком, минут&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;Число звонков&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;Доля звонков&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;Доля звонков накопленным итогом&lt;/b&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;0&lt;/td&gt;
&lt;td style="text-align: right"&gt;19 641&lt;/td&gt;
&lt;td style="text-align: right"&gt;21,3%&lt;/td&gt;
&lt;td style="text-align: right"&gt;21,3%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;1&lt;/td&gt;
&lt;td style="text-align: right"&gt;16 299&lt;/td&gt;
&lt;td style="text-align: right"&gt;17,7%&lt;/td&gt;
&lt;td style="text-align: right"&gt;39,0%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;2&lt;/td&gt;
&lt;td style="text-align: right"&gt;12 137&lt;/td&gt;
&lt;td style="text-align: right"&gt;13,2%&lt;/td&gt;
&lt;td style="text-align: right"&gt;52,2%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;3&lt;/td&gt;
&lt;td style="text-align: right"&gt;9 251&lt;/td&gt;
&lt;td style="text-align: right"&gt;10,0%&lt;/td&gt;
&lt;td style="text-align: right"&gt;62,1%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;4&lt;/td&gt;
&lt;td style="text-align: right"&gt;7 276&lt;/td&gt;
&lt;td style="text-align: right"&gt;7,9%&lt;/td&gt;
&lt;td style="text-align: right"&gt;70,1%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;...&lt;/td&gt;
&lt;td style="text-align: right"&gt;...&lt;/td&gt;
&lt;td style="text-align: right"&gt;...&lt;/td&gt;
&lt;td style="text-align: right"&gt;...&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;23&lt;/td&gt;
&lt;td style="text-align: right"&gt;139&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,2%&lt;/td&gt;
&lt;td style="text-align: right"&gt;99,4%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;...&lt;/td&gt;
&lt;td style="text-align: right"&gt;...&lt;/td&gt;
&lt;td style="text-align: right"&gt;...&lt;/td&gt;
&lt;td style="text-align: right"&gt;...&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;40&lt;/td&gt;
&lt;td style="text-align: right"&gt;10&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,0%&lt;/td&gt;
&lt;td style="text-align: right"&gt;100,0%&lt;/td&gt;
&lt;/tr&gt;
&lt;/table&gt;
&lt;/div&gt;
&lt;p&gt;(Строго говоря, паузы более 40 минут тоже присутствуют, но их доля ничтожно мала, поэтому, округляя до десятых, мы достигаем 100% уже на 40 минутах.)&lt;/p&gt;
&lt;h2&gt;Простая идея «аномальных» пауз&lt;/h2&gt;
&lt;p&gt;Итого, мы имеем удивительно красивую гистограмму распределения длительности пауз между звонками. Что примечательно, длительности пауз убывают по экспоненте:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/poisson00.png" width="786" height="494" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Вернемся к тому, что мы вообще хотели посчитать в самом начале.&lt;/p&gt;
&lt;p&gt;У нас родилась идея, что рано или поздно, &lt;b&gt;перерыв между звонками в середине рабочего дня становится таким длительным, что это начинает вызывать тревогу у менеджеров.&lt;/b&gt; Логично предположить, что в каждом отделе продаж или коллцентре тревогу вызывать будут затянувшиеся паузы разной длительности — для больших коллцентров перерыв в 5 минут это уже очень маловероятно, для других — 5 минут это стандартный промежуток между звонками, а вот 55 минут — уже очень подозрительно.&lt;/p&gt;
&lt;p&gt;А что если попробовать сформулировать идею «аномально» затянувшейся паузы между звонками таким образом: это такая пауза, которая встречается чрезвычайно редко, например, раз в неделю, или раз в месяц, или раз в полгода. Определим для себя уровень «аномалии», кажущийся нам разумным, и посчитаем, &lt;b&gt;паузы какой длительности встречаются примерно так редко, как мы определили нашу «аномалию».&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Например, пусть аномальной будет считаться пауза, &lt;b&gt;которая, в среднем, встречается раз в неделю.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Если в нашу таблицу длительностей пауз между звонками попали звонки за прошедший год, логично, что количество «аномальных» («раз в неделю») пауз там будет порядка 52 штук (по числу недель).&lt;/p&gt;
&lt;p&gt;Итак, нам нужно отсчитать &lt;b&gt;52 звонка с самыми длительными паузами перед ними.&lt;/b&gt; В моей таблице нашлось 47 звонков с паузами 38+ минут, затем идут 57 звонков с паузами 37+ и более минут.&lt;/p&gt;
&lt;p&gt;Таким образом, можно сделать вывод, что &lt;b&gt;пауза в 37-38 минут между звонками в будний день должна настораживать: либо перед нами еженедельная «аномалия», наблюдаемся порядка 52 раз в год, либо речь идет о том, что мог произойти технический сбой, и звонки перестали поступать.&lt;/b&gt;&lt;/p&gt;
</description>
</item>

<item>
<title>Качество звонков: сколько нужно прослушать</title>
<guid isPermaLink="false">12</guid>
<link>https://mathandcoffee.ru/all/kachestvo-zvonkov-skolko-proslushat/</link>
<pubDate>Sun, 26 May 2019 16:46:00 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/kachestvo-zvonkov-skolko-proslushat/</comments>
<description>
&lt;p&gt;Распространенным инструментом оценки качества работы менеджеров отдела продаж является &lt;b&gt;аудит качества телефонных звонков,&lt;/b&gt; «прослушка».&lt;/p&gt;
&lt;p&gt;Предположим, вы задались целью не просто &lt;b&gt;замерить&lt;/b&gt; качество телефонных звонков, но &lt;b&gt;зафиксировать &lt;i&gt;рост&lt;/i&gt; этого качества.&lt;/b&gt; Например, провели обучение (тренинг) менеджеров, либо предложили новую мотивацию за соблюдение стандартов качества, либо что-то еще.&lt;/p&gt;
&lt;p&gt;Логично предположить, что рост качества в первом попавшемся, после тренинга, звонке, не будет однозначно свидетельствовать о росте качества в остальных звонках. Скорее всего, и второй удачный звонок тоже однозначно не подтвердит гипотезу, что качество выросло.&lt;/p&gt;
&lt;p&gt;Таким образом, речь будет идти о том, что вам придется прослушать если не все, то, по крайней мере, достаточное число звонков после введенных вами изменений, и число звонков, которые необходимо будет прослушать, на самом деле, &lt;b&gt;можно однозначно рассчитать.&lt;/b&gt;&lt;/p&gt;
&lt;h2&gt;Считаем размер выборки&lt;/h2&gt;
&lt;p&gt;На 15-й странице работы «&lt;a href="https://people.ucsc.edu/~dgbonett/docs/wrkshp/LectureNotes.pdf"&gt;Планирование размеров выборки для исследований в бихевиоризме&lt;/a&gt;» мне попался подходящий пример 2.4 и формула для расчета таких выборок:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/samplesize00.PNG" width="858" height="506" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;В данном примере рассматривается изменение оценки &lt;a href="https://ru.wikipedia.org/wiki/ACT"&gt;ACT&lt;/a&gt;-теста по математике с 24,5 (дисперсия 8,2) до 26,0 баллов при &amp;alpha; = 0,05 и мощности = 0,90.&lt;/p&gt;
&lt;p&gt;Для удобства работы, я собрал приведенную формулу в Гугл-таблицах:&lt;br /&gt;
&lt;a href="https://docs.google.com/spreadsheets/d/1c1J88P0i0gmDFpOtfDIkPt-C0HKJOWACbSWVZTx2kL8/edit?usp=sharing"&gt;Калькулятор размера выборки&lt;/a&gt;&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/samplesize01.PNG" width="865" height="346" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Вам остается скопировать файл, и можете подставлять нужные вам значения. Достоверность разумно выбирать от 80% до 95%, значение мощности — от 60% до 80%. Указываете средний балл оценки звонков до изменений, стандартное отклонение (SD) оценки звонков «до», и ожидаемый средний балл оценки звонков после изменений.&lt;/p&gt;
&lt;h2&gt;Верификация полученных результатов&lt;/h2&gt;
&lt;p&gt;Важно понимать, что, даже прослушав требуемое количество звонков «после», все равно необходимо проверять наличие статистически значимых различий через &lt;a href="http://n4d-d.xyz/all/a-b-test-maksimalno-prosto/"&gt;калькулятор А/Б-тестов&lt;/a&gt;.&lt;/p&gt;
&lt;h2&gt;См. также:&lt;/h2&gt;
&lt;p&gt;&lt;a href="https://habr.com/ru/post/339798/"&gt;https://habr.com/ru/post/339798/&lt;/a&gt;&lt;br /&gt;
&lt;a href="https://people.ucsc.edu/~dgbonett/docs/wrkshp/LectureNotes.pdf"&gt;https://people.ucsc.edu/~dgbonett/docs/wrkshp/LectureNotes.pdf&lt;/a&gt;&lt;/p&gt;
</description>
</item>

<item>
<title>Скользящее среднее, или как сгладить график</title>
<guid isPermaLink="false">2</guid>
<link>https://mathandcoffee.ru/all/skolzyaschee-srednee-ili-kak-sgladit-grafik/</link>
<pubDate>Sun, 26 May 2019 11:23:27 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/skolzyaschee-srednee-ili-kak-sgladit-grafik/</comments>
<description>
&lt;p&gt;Честно говоря, не знаю, как правильно называется эта штука, но пусть у нее будет рабочее название &lt;b&gt;«скользящее среднее».&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Очень часто бывает так, что у нас есть &lt;b&gt;данные с разбивкой по дням.&lt;/b&gt; Например, заходы на сайт или звонки в отдел продаж. И, в попытке проанализировать &lt;b&gt;динамику&lt;/b&gt; происходящего, мы строим график, получая примерно следующее:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/mvng_avrg_03.png" width="985" height="750" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Что здесь не так?&lt;/p&gt;
&lt;p&gt;Достаточно очевидно, что, во-первых, график постоянно прыгает вверх-вниз, а, во-вторых, имеет некрасивые &lt;i&gt;экстремумы&lt;/i&gt; вроде 16 заявок в октябре или 122 заявок в августе. День на день не приходится, и данные слишком сильно колеблются вокруг среднего значения (кстати, среднее тут равно 63).&lt;/p&gt;
&lt;p&gt;А там, где что-то так некрасиво прыгает, часто можно что-то сгладить, используя понятие &lt;a href="https://www.google.ru/search?q=moving+average&amp;newwindow=1&amp;tbm=isch"&gt;&lt;b&gt;&lt;i&gt;скользящего среднего&lt;/i&gt;&lt;/b&gt;&lt;/a&gt;.&lt;/p&gt;
&lt;h2&gt;Скользящее среднее. Простой способ.&lt;/h2&gt;
&lt;p&gt;Попробуем «сгладить» наш прыгающий график путем расчета &lt;b&gt;&lt;i&gt;среднего числа заявок на дату,&lt;/i&gt;&lt;/b&gt; исходя из предыдущих 6 дней (7-й — текущий день, итого ровно неделя).&lt;/p&gt;
&lt;p&gt;Напротив 07.01.2018 напишем формулу&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=СРЗНАЧ(B2:B8)&lt;/code&gt;&lt;/pre&gt;&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/mvng_avrg_05.png" width="985" height="750" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Протянув формулу по всему году до самой последней строки, получим &lt;i&gt;среднее число заявок на каждую дату за предыдущую неделю&lt;/i&gt;. Как будто рамку, шириной в одну неделю, мы двигали по году вдоль с шагом в один день.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/mvng_avrg_06.png" width="985" height="750" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Визуально ничего не изменилось. Разве что, раньше были целые значения, а теперь, из-за усреднения, вылезли знаки после запятой — 79,9, 84,1. Обновим наш график:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/mvng_avrg_07.png" width="985" height="750" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;На месте прежнего, «прыгающего», графика, теперь более гладкая линия. Исчезли аномальные дни с 16 и 122 звонками в октябре и в августе, зато теперь, на «недельном» масштабе, стал заметнее провал на майские праздники.&lt;/p&gt;
&lt;h2&gt;Скользящее среднее. Сложный способ.&lt;/h2&gt;
&lt;p&gt;Некоторое время попрактиковавшись с вычислением скользящего среднего, вы обратите внимание, что, чем шире вы будете брать «окно» для расчета среднего на дату, тем сильнее будет сглаживаться ваш график. Теоретически, вы можете взять окно шириной в 365 дней... и получится практически ровная линия. А при окне шириной в 1 день — график не сглаживается вообще.&lt;/p&gt;
&lt;p&gt;В этот момент становится понятно, что «7 дней» из первого примера — это просто случайное число, а на самом деле, оно может быть абсолютно любым — все зависит лишь от ваших предпочтений и представлений о том, что вы хотите увидеть и проанализировать.&lt;/p&gt;
&lt;p&gt;Попробуем не задавать жестко ширину нашего «окна», а сделать его &lt;i&gt;параметром&lt;/i&gt; нашего графика. Пусть «окно» в 7 дней, используемое для сглаживания графика, будет зависеть от цифры «7», помещенной в ячейку C1. И пусть, если мы меняем «7» на «5» или «30», Эксель перестраивает наш график.&lt;/p&gt;
&lt;p&gt;Итак, настало время для красивой формулы в ячейке C8:&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=СРЗНАЧЕСЛИМН(B$2:B$365;A$2:A$365;&amp;quot;&amp;lt;=&amp;quot;&amp;amp;A8;A$2:A$365;&amp;quot;&amp;gt;=&amp;quot;&amp;amp;(A8-$C$1+1))&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;Функция&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=СРЗНАЧЕСЛИМН()&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;берет и считает среднее значение для тех дат, для которых будут выполняться оба условия:&lt;/p&gt;
&lt;ol start="1"&gt;
&lt;li&gt;Дата, которая участвует в расчете среднего, должна быть больше или равна дате, отстоящей от даты, для которой мы рассчитываем среднее, назад на N-1 дней (где N — ширина нашего «окна»).&lt;/li&gt;
&lt;li&gt;Дата, которая участвует в расчете среднего, должна быть меньше или равна дате, для которой мы это среднее рассчитываем.&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;Проще говоря, для расчета среднего числа заявок на 18 апреля при N=7 дней, мы возьмем среднее от числа заявок с 12 по 18 апреля (больше или равно 12 апреля и меньше или равно 18 апреля). Для расчета среднего числа заявок на 19 апреля — среднее от числа заявок с 13 по 19 апреля, и так далее.&lt;/p&gt;
&lt;p&gt;Выделим ячейку C1 под наш параметр N, тогда формула для 07.01.2018 выглядит так:&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=СРЗНАЧЕСЛИМН(B$2:B$365;A$2:A$365;&amp;quot;&amp;lt;=&amp;quot;&amp;amp;A8;A$2:A$365;&amp;quot;&amp;gt;=&amp;quot;&amp;amp;(A8-$C$1+1))&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;Итого, теперь мы имеем уже знакомый нам «сглаженный» 7-дневный график, но ширину «окна» задали не строго, а привязали ее к параметру, записанному в ячейке C1:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/mvng_avrg_08.png" width="985" height="750" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Меняя значение параметра в ячейке C1, получаем все более и более ровную линию. Вот, для сравнения, наложенные друг на друга графики при N=1, N=5, N=30:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/mvng_avrg_09.png" width="985" height="750" alt="" /&gt;
&lt;/div&gt;
</description>
</item>

<item>
<title>Когнитивная ошибка конверсии</title>
<guid isPermaLink="false">19</guid>
<link>https://mathandcoffee.ru/all/oshibka-konversii/</link>
<pubDate>Tue, 07 May 2019 12:39:07 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/oshibka-konversii/</comments>
<description>
&lt;p&gt;Любопытная особенность работы с понятием &lt;i&gt;конверсия&lt;/i&gt; заключается в том, что, строго говоря, &lt;b&gt;конверсия практически никогда не бывает определена точно.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Вот эти вот «конверсия звонка в продажу 18,4%», «CTR 3,1%», «конверсия в сделки 30%» — это всегда немного упрощенный подход, будто конверсия надежно измерена и, если и изменится, то мы это объясним объективными факторами, не допуская мысли, что изначально никаких «18,4%» и не было, а были только 38 договоров, которые мы сделали на 206 звонках, и это вовсе не значит, что их не могло бы быть больше или меньше.&lt;/p&gt;
&lt;p&gt;Примерно, как местоположение электрона вокруг ядра атома не задается точными координатами, а лишь описывается некоторой областью, в которой он, наиболее вероятно, находится, наша конверсия — это тоже не конкретное число, а, в действительности, &lt;b&gt;интервал, в котором она находится.&lt;/b&gt;&lt;/p&gt;
&lt;h2&gt;Расчет конверсии и когнитивное искажение&lt;/h2&gt;
&lt;p&gt;Рассмотрим вымышленный отдел продаж, в котором с этого года начали продавать новый продукт. Допустим, ммм, &lt;b&gt;лимузины.&lt;/b&gt; Продукт не пользуется большим спросом, поэтому, пока что, данных для анализа не так много, или, лучше сказать, совсем мало:&lt;/p&gt;
&lt;div class="e2-text-table"&gt;
&lt;table cellpadding="0" cellspacing="0" border="0"&gt;
&lt;tr&gt;
&lt;td&gt;&lt;b&gt;месяц&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;Заявки&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;Продажи&lt;/b&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;август&lt;/td&gt;
&lt;td style="text-align: right"&gt;48&lt;/td&gt;
&lt;td style="text-align: right"&gt;1&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;сентябрь&lt;/td&gt;
&lt;td style="text-align: right"&gt;35&lt;/td&gt;
&lt;td style="text-align: right"&gt;1&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;октябрь&lt;/td&gt;
&lt;td style="text-align: right"&gt;24&lt;/td&gt;
&lt;td style="text-align: right"&gt;0&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;ноябрь&lt;/td&gt;
&lt;td style="text-align: right"&gt;61&lt;/td&gt;
&lt;td style="text-align: right"&gt;2&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;декабрь&lt;/td&gt;
&lt;td style="text-align: right"&gt;32&lt;/td&gt;
&lt;td style="text-align: right"&gt;0&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;b&gt;ИТОГО:&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;200&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;4&lt;/b&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/table&gt;
&lt;/div&gt;
&lt;p&gt;Как видно из данных наших продаж, по итогам нескольких месяцев, мы имеем 4 сделки на 200 лидов (заявок), т. е. наша конверсия равна 4 / 200 = 2,0%&lt;/p&gt;
&lt;p&gt;(Дополнительно, исходя из цифр пяти месяцев работы, мы можем примерно спрогнозировать 480 лидов на следующий год и, соответствнно, 480 * 0,02 = 9,6 сделок.)&lt;/p&gt;
&lt;p&gt;В целом, на таких скудных данных ошибиться невозможно, поэтому, безусловно, такой прогноз не будет ошибочным. Однако, он содержит важное когнитивное искажение: 2,0% это не точное значение, а &lt;i&gt;наиболее пока вероятное&lt;/i&gt; значение конверсии заявок в продажи наших лимузинов.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;В действительности, конверсия не может быть определена точно. Она лежит в доверительном интервале от 0,4% до 3,6%.&lt;/b&gt; И в будущем году нужно прогнозировать не 9,6 сделок, а от 5 до 15 проданных лимузинов. К сожалению, определить этот диапазон точнее будет довольно самонадеянным.&lt;/p&gt;
&lt;h2&gt;Колокол конверсии&lt;/h2&gt;
&lt;p&gt;Исходя из предположения, что наша &lt;i&gt;истинная&lt;/i&gt; конверсия стабильна, и &lt;i&gt;точно&lt;/i&gt; равна 2,0%, мы можем прикинуть возможные варианты числа сделок на 480 лидов, ожидаемых в будущем году. Поскольку мы можем отвечать только за стабильность &lt;i&gt;своей&lt;/i&gt; работы, но не можем учесть фактор случайности (настроение клиентов, форс мажор, случайная продажа другу гендиректора), всегда существует вероятность, что число сделок будет немного отличаться от прогнозируемых 480 * 0,02 = 9,6 сделок подобно тому, как число решек на 480 бросков монеты может немного отличаться от 240, и быть 235, 248, или, возможно, даже 223.&lt;/p&gt;
&lt;p&gt;Графически это выглядит как &lt;i&gt;колокол нормального распределения,&lt;/i&gt; где, чем дальше мы уходим от математического ожидания в 9 сделок в центре колокола, тем ниже становится вероятность сделать сильно меньше или сильно больше сделок:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/oshibka01.png" width="648" height="372" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Глядя на полученный график, приходится признать, что увидеть меньше 2-х и больше 19-ти сделок практически невероятно.&lt;/p&gt;
&lt;p&gt;Но, можно ли сузить наш &lt;i&gt;доверительный интервал?&lt;/i&gt;&lt;/p&gt;
&lt;h2&gt;Доверительный интервал конверсии&lt;/h2&gt;
&lt;p&gt;Стандартная ошибка (SD) для биномиального распределения считается по формуле:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/CodeCogsEqn-1.png" width="238" height="39" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;где &lt;b&gt;&lt;i&gt;n&lt;/i&gt;&lt;/b&gt; — это число испытаний, &lt;b&gt;&lt;i&gt;p&lt;/i&gt;&lt;/b&gt; — вероятность успеха.&lt;/p&gt;
&lt;p&gt;Для наших 200 заявок текущего года имеем:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/oshibka02.png" width="366" height="310" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;b&gt;SD = 1,98 сделок.&lt;/b&gt; Иными словами, согласно законам нормального распределения (а биномиальное распределение — это частный случай нормального распределения), примерно в 68% случаев, работая с истинной конверсией 2,0%, мы бы попали в доверительный интервал от 2,02 до 5,98 сделок, то есть +/-1SD.&lt;/p&gt;
&lt;p&gt;Для прогнозируемых 480 заявок будущего года получим:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/oshibka03.png" width="372" height="190" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;b&gt;SD = 3,07 сделок.&lt;/b&gt; По законам биномиального (нормального) распределения, известно, что в 68% случаев продажи будущего года будут лежать в пределах +/- 1SD от математического ожидания в 9,6 сделок, а в 90% случаев — в пределах +/- 1,645SD от матожидания. 3,07 сделок * 1,645 = 5,05 сделок, иными словами, в 90% случаев, работай мы весь следующий год с конверсией 2%, мы не выйдем за границы доверительного интервала «от 4,55 до 14,65 сделок». (Примечательно, что, обратно, в 1 случае из 10, мы, все-таки, выйдем за эти границы, по-прежнему, при этом, работая с «истинной» конверсией 2%.)&lt;/p&gt;
&lt;p&gt;Любопытно, какой шум поднимет коммерческий директор, если по итогам года мы продадим всего 4 лимузина на 480 заявок, формально показав конверсию 0,83%... и еще более любопытно, что, статистически, это происходит в 1 из 27 отделов продаж. &lt;b&gt;В одном из 27-ми случаев вас увольняют за невыполнение плана продаж, хотя вы по-прежнему работаете с «истинной» конверсией 2%.&lt;/b&gt;&lt;/p&gt;
&lt;h2&gt;Три конверсии на границе доверительного интервала&lt;/h2&gt;
&lt;p&gt;Как же тогда относится к результатам текущего года, где мы получили 4 сделки на 200 заявок?&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Первый случай, «2,00%».&lt;/b&gt; Его мы рассмотрели сразу. 4 / 200 = 0,02, т. е. наша конверсия равна 2%. При этом, по законам биномиального распределения, все равно есть вероятность колебаться в 90%-м доверительном интервале «+/-1,645SD», т. е., в интервале от 0,74 до 7,26 сделок на 200 заявок.&lt;/p&gt;
&lt;p&gt;Выглядит это примерно так:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/oshibka04.png" width="658" height="372" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Наш результат в 4 сделки совпал с математическим ожиданием от конверсии 2,0%, хотя, в общем, он мог и не совпасть, в целом находясь в 90% доверительном интервале от 1 до 7 сделок.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Второй случай, «1,22%».&lt;/b&gt; В этом случае, в реальности, наша «истинная» конверсия, &lt;b&gt;на самом деле, ниже, и равна, например, 1,22%.&lt;/b&gt; Тогда матожидание числа проданных лимузинов примерно равно 2, и нам &lt;b&gt;повезло&lt;/b&gt; сделать 4 продажи. Степень нашего везения такова, что сделать &lt;i&gt;более&lt;/i&gt; 4 продаж мы могли бы только в 10% случаев. Т. е., мы остаемся в поле 90%-й вероятности, хотя и находимся на границе этого поля. Еще чуть-чуть, и нам повезет слишком сильно, а пока что нам везет «в пределах разумного»:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/oshibka05.png" width="648" height="372" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;b&gt;Третий случай, «3,31%».&lt;/b&gt; Теперь мы предположим, что в текущем году &lt;b&gt;нам не везло,&lt;/b&gt; хотя весь год наша истинная конверсия была выше 2,0% и &lt;b&gt;равнялась 3,31%.&lt;/b&gt; Матожидание для 200 заявок тогда равнялось бы примерно 6 проданным лимузинам, а сделать &lt;i&gt;менее&lt;/i&gt; 4-х продаж было бы возможно лишь в 10% случаев. Тогда мы тоже остаемся в поле 90%-й вероятности, но находимся на левой границе этого поля с нашими невезучими 4 сделками.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/oshibka06.png" width="648" height="372" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;b&gt;Таким образом, приходится признать: мы не знаем наверняка, какая из 3-х конверсий — истинная.&lt;/b&gt; Нам привычно думать, что речь идет о 1-м случае, и мы делим 4 сделки на 200 заявок, получая конверсию 2,00%. Но никто не знает наверняка, является ли текущий год обычным или необычным, везло ли нам в нем, или не везло. В 90% случаев речь могла идти &lt;b&gt;как о везении,&lt;/b&gt; и мы работали в действительности с конверсией 1,22%, &lt;b&gt;так и о невезении,&lt;/b&gt; когда мы работали с конверсией 3,31%. &lt;b&gt;Во всех 3-х случаях вероятность сделать 4 сделки на 200 заявок не выходила за границы 90%.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;К сожалению, у нас пока слишком мало данных, чтобы утверждать что-то можно было более точно.&lt;/p&gt;
&lt;h2&gt;Нужно больше данных&lt;/h2&gt;
&lt;p&gt;Логично задать вопрос — а сколько нужно накопить данных, чтобы более-менее надежно говорить о конверсии 2,0%? Попробуем постепенно увеличивать размер выборки (число заявок, и, следовательно, продаж), пока не увидим, как 90%-й доверительный интервал сомкнется вокруг значения конверсии в 2,00%:&lt;/p&gt;
&lt;div class="e2-text-table"&gt;
&lt;table cellpadding="0" cellspacing="0" border="0"&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;                    Заявки&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;             Сделки&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;Нижняя граница 90% доверительного интервала (-1,645SD)&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;Верхняя граница 90% доверительного интервала (+1,645SD)&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;Нижняя граница конверсии&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;Верхняя граница конверсии&lt;/b&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;200&lt;/td&gt;
&lt;td style="text-align: right"&gt;4&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,7&lt;/td&gt;
&lt;td style="text-align: right"&gt;7,3&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,37%&lt;/td&gt;
&lt;td style="text-align: right"&gt;3,63%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;500&lt;/td&gt;
&lt;td style="text-align: right"&gt;10&lt;/td&gt;
&lt;td style="text-align: right"&gt;4,9&lt;/td&gt;
&lt;td style="text-align: right"&gt;15,1&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,97%&lt;/td&gt;
&lt;td style="text-align: right"&gt;3,03%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;1 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;20&lt;/td&gt;
&lt;td style="text-align: right"&gt;12,7&lt;/td&gt;
&lt;td style="text-align: right"&gt;27,3&lt;/td&gt;
&lt;td style="text-align: right"&gt;1,27%&lt;/td&gt;
&lt;td style="text-align: right"&gt;2,73%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;5 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;100&lt;/td&gt;
&lt;td style="text-align: right"&gt;83,7&lt;/td&gt;
&lt;td style="text-align: right"&gt;116,3&lt;/td&gt;
&lt;td style="text-align: right"&gt;1,67%&lt;/td&gt;
&lt;td style="text-align: right"&gt;2,33%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;10 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;200&lt;/td&gt;
&lt;td style="text-align: right"&gt;177,0&lt;/td&gt;
&lt;td style="text-align: right"&gt;223,0&lt;/td&gt;
&lt;td style="text-align: right"&gt;1,77%&lt;/td&gt;
&lt;td style="text-align: right"&gt;2,23%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;50 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;1 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;948,5&lt;/td&gt;
&lt;td style="text-align: right"&gt;1 051,5&lt;/td&gt;
&lt;td style="text-align: right"&gt;1,90%&lt;/td&gt;
&lt;td style="text-align: right"&gt;2,10%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;100 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;2 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;1 927,2&lt;/td&gt;
&lt;td style="text-align: right"&gt;2 072,8&lt;/td&gt;
&lt;td style="text-align: right"&gt;1,93%&lt;/td&gt;
&lt;td style="text-align: right"&gt;2,07%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;500 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;10 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;9 837,2&lt;/td&gt;
&lt;td style="text-align: right"&gt;10 162,8&lt;/td&gt;
&lt;td style="text-align: right"&gt;1,97%&lt;/td&gt;
&lt;td style="text-align: right"&gt;2,03%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;1 000 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;20 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;19 769,7&lt;/td&gt;
&lt;td style="text-align: right"&gt;20 230,3&lt;/td&gt;
&lt;td style="text-align: right"&gt;1,98%&lt;/td&gt;
&lt;td style="text-align: right"&gt;2,02%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;10 000 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;200 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;199 271,7&lt;/td&gt;
&lt;td style="text-align: right"&gt;200 728,3&lt;/td&gt;
&lt;td style="text-align: right"&gt;1,99%&lt;/td&gt;
&lt;td style="text-align: right"&gt;2,01%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;25 000 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;500 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;498 848,5&lt;/td&gt;
&lt;td style="text-align: right"&gt;501 151,5&lt;/td&gt;
&lt;td style="text-align: right"&gt;2,00%&lt;/td&gt;
&lt;td style="text-align: right"&gt;2,00%&lt;/td&gt;
&lt;/tr&gt;
&lt;/table&gt;
&lt;/div&gt;
&lt;p&gt;Надо ли говорить, что получить более нескольких десятков тысяч заявок-лидов может мало какой из отделов продаж. &lt;b&gt;Поэтому, приходится признать, что ставить планы продаж и принимать кадровые решения относительно сотрудников, работающих с уровнями конверсии 1-5% — это безумие, и на таких маленьких числах математика в продажах не работает.&lt;/b&gt;&lt;/p&gt;
&lt;h2&gt;См. также:&lt;/h2&gt;
&lt;p&gt;&lt;a href="http://italylov.ru/blog/all/ctatisticheskaya-dostovernost-koltrekinga/"&gt;http://italylov.ru/blog/all/ctatisticheskaya-dostovernost-koltrekinga/&lt;/a&gt;&lt;/p&gt;
</description>
</item>

<item>
<title>t-Критерий Стьюдента</title>
<guid isPermaLink="false">5</guid>
<link>https://mathandcoffee.ru/all/t-kriteriy-styudenta/</link>
<pubDate>Mon, 15 Apr 2019 11:44:02 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/t-kriteriy-styudenta/</comments>
<description>
&lt;p&gt;Если однажды перед вами оказывались два набора похожих данных, вам, вероятно, приходило в голову задаться вопросом: насколько эти данные различаются между собой? Или, что еще более важно, наблюдаются ли &lt;i&gt;статистически значимые&lt;/i&gt; различия между этими выборками?&lt;/p&gt;
&lt;p&gt;Поясню, о чем идет речь.&lt;/p&gt;
&lt;p&gt;Допустим, вы проанализировали звонки за прошедший год и обратили внимание, что &lt;b&gt;среднее время звонка в первой половине дня — 2 мин 45 сек, а во второй половине дня — 2 мин 57 сек.&lt;/b&gt; Следует ли из этого, что звонки после обеда в среднем длятся дольше? Или это простое совпадение, и, возьми вы звонки за год до этого, вы бы увидели другую картину?&lt;/p&gt;
&lt;p&gt;Или, например, вы замеряли уровень гемоглобина у контрольной группы до начала исследований нового лекарства, и после. Предположим, &lt;b&gt;средний уровень вырос с 142,5 г/л до 147,1 г/л.&lt;/b&gt; Достаточно ли опираться на увеличение среднего, чтобы сделать заключение об эффективности лекарства? Или, возможно, исследование нужно повторить? Увеличив размер контрольной группы, например?&lt;/p&gt;
&lt;p&gt;Уже из постановки вопроса очевидно, что &lt;b&gt;одной разницы между средними в двух выборках недостаточно, чтобы научно подтвердить их различие.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Вот почему мы обратимся к &lt;b&gt;формуле расчета&lt;/b&gt; и &lt;b&gt;таблице значений t-критериев Стьюдента,&lt;/b&gt; чтобы научиться делать &lt;i&gt;математически корректные&lt;/i&gt; выводы о &lt;i&gt;статистически значимых&lt;/i&gt; различиях между двумя выборками. Или, другими словами, научиться видеть разницу, когда она не заметна, или игнорировать ее, даже если кажется, что она есть.&lt;/p&gt;
&lt;p&gt;Рассмотрим вопрос на примере.&lt;/p&gt;
&lt;h2&gt;Анализ длительности звонков Асланян и Евтушенко&lt;/h2&gt;
&lt;p&gt;В вашем отделе продаж работают 2 менеджера — Ольга Асланян и Кирилл Евтушенко. Вы получили данные по длительности их разговоров с покупателями и хотите проверить гипотезу, что разговоры Асланян в среднем длятся дольше разговоров Евтушенко.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/student01.PNG" width="694" height="474" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Посчитаем среднюю длительность звонка, стандартное отклонение и число звонков, которые попали в выборке.&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=СРЗНАЧ(B2:B999)&lt;/code&gt;&lt;/pre&gt;&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=СТАНДОТКЛОН(B2:B999)&lt;/code&gt;&lt;/pre&gt;&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=СЧЁТ(B2:B999)&lt;/code&gt;&lt;/pre&gt;&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/student02.PNG" width="696" height="403" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;В среднем, звонки Асланян длятся на 34,5 сек дольше звонков Евтушенко. (Кроме того, разброс длительности ее звонков больше, т. к. больше стандартное отклонение. Грубо говоря, короткие и длинные звонки у Асланян найти проще, чем у Евтушенко).&lt;/p&gt;
&lt;p&gt;Достаточно ли полученных данных, чтобы сделать вывод о правильности гипотезы, что Асланян в среднем дольше общается с клиентами, чем Евтушенко? На самом деле, нет. Всегда существует вероятность, что в выборку Асланян случайно попали более длинные звонки, а в выборку Евтушенко — более короткие. Чем больше звонков доступно для анализа (а нам достались 242 и 209 звонков, что не так уж и мало), тем более надежен результат, но он никогда не надежен на 100%.&lt;/p&gt;
&lt;p&gt;Впрочем, надежность 100% нам и не нужна. Не ракету к Марсу запускаем. Даже если нам удастся проверить нашу гипотезу с вероятностью 90-95%, этого будет вполне достаточно для большинства случаев. Пускай мы оставим себе шанс ошибиться в 5-10% случаев, зато нам не нужно будет ждать несколько лет, чтобы накопить достаточно данных для анализа, и управленческие решения (разбор звонков с менеджером, анализ продаж, корректировки скриптов) мы сможем принять уже сейчас.&lt;/p&gt;
&lt;p&gt;Рассмотрим два способа, как нам проверить, случайность ли, что звонки Асланян в среднем длиннее звонков Евтушенко.&lt;/p&gt;
&lt;h2&gt;Проверка гипотезы о равенстве среднего. Простой способ&lt;/h2&gt;
&lt;p&gt;И в Google Таблицах, и в Microsoft Excel, есть &lt;b&gt;функция ТТЕСТ.&lt;/b&gt; Воспользуемся ей для анализа наших выборок.&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=ТТЕСТ(B2:B999;C2:C999;2;3)&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;У функции 4 атрибута, идущие через точку с запятой.&lt;/p&gt;
&lt;ol start="1"&gt;
&lt;li&gt;Диапазон ячеек, содержащих первую выборку.&lt;/li&gt;
&lt;li&gt;Диапазон ячеек, содержащих вторую выборку.&lt;/li&gt;
&lt;li&gt;Количество хвостов распределения. Выбираем «2», чтобы проверить наличие различий вообще, и «1», чтобы проверить, звонки Асланян длиннее, а не наоборот.&lt;/li&gt;
&lt;li&gt;Тип применения t-критерия. По умолчанию выбираем «3». («2» выбираем если стандартные отклонения очень близки, «1» — если, например, вы сравниваете средний балл &lt;i&gt;одних и тех же учеников&lt;/i&gt; на начало и конец года попарно.)&lt;/li&gt;
&lt;/ol&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/student03.PNG" width="694" height="429" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Итак, Т-тест дал вероятность 0,04595, или, округленно, 4,6%.&lt;/p&gt;
&lt;p&gt;Что же это за вероятность? В нашем примере это вероятность того, &lt;b&gt;что статистически значимые различия между звонками Асланян и Евтушенко отсутствуют.&lt;/b&gt; Технически, это вероятность, что наша «нулевая гипотеза» («нет разницы между выборками») была верна, а «альтернативная» («Асланян общается с покупателями дольше Евтушенко») — неверна.&lt;/p&gt;
&lt;p&gt;Оставшиеся 95,4% составляют вероятность того, что между выборками есть статистические различия, и «альтернативная гипотеза» о различиях между выборками верна.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Вывод: с вероятностью 95,4% Асланян, действительно, в среднем общается с клиентами дольше Евтушенко. (С вероятностью 4,6% статистически значих различий между их звонками нет).&lt;/b&gt;&lt;/p&gt;
&lt;h2&gt;Проверка гипотезы о равенстве среднего. Сложный способ&lt;/h2&gt;
&lt;p&gt;Сложный способ будет состоит из двух этапов: расчет t-критерия Стьюдента и сравнение полученного значения t-критерия с контрольным.&lt;/p&gt;
&lt;p&gt;На первом этапе рассчитаем t-критерий Стьюдента по следующей формуле:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/kriteriy_styudenta.jpg" width="247" height="157" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;X&lt;sub&gt;1&lt;/sub&gt; и X&lt;sub&gt;2&lt;/sub&gt; — средняя длина звонков в первой и второй выборке (238,6 сек и 204,1 сек)&lt;br /&gt;
s&lt;sub&gt;1&lt;/sub&gt; и s&lt;sub&gt;2&lt;/sub&gt; — стандартные отклонения первой и второй выборок в квадрате (их дисперсии, другими словами) (201,2&lt;sup&gt;2&lt;/sup&gt; и 164,7&lt;sup&gt;2&lt;/sup&gt; для наших выборок)&lt;br /&gt;
n&lt;sub&gt;1&lt;/sub&gt; и n&lt;sub&gt;2&lt;/sub&gt; — число звонков в первой и второй выборках (242 и 209 звонков)&lt;/p&gt;
&lt;p&gt;Воспользуемся листочком бумаги и калькулятором, или же посчитаем все прямо в Google Таблицах:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/student04.PNG" width="751" height="372" alt="" /&gt;
&lt;/div&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=(F2-G2)/КОРЕНЬ(F3^2/F4+G3^2/G4)&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;t-Критерий равен 2,0014.&lt;/p&gt;
&lt;p&gt;Осталось разобраться, что делать с вычисленным значением нашего t-критерия.&lt;/p&gt;
&lt;p&gt;Но перед этим посчитаем число степеней свободы по формуле n&lt;sub&gt;1&lt;/sub&gt;+n&lt;sub&gt;2&lt;/sub&gt;-2:&lt;/p&gt;
&lt;p&gt;242 + 209 — 2 = 449 степеней свободы&lt;/p&gt;
&lt;p&gt;Воспользуемся теперь &lt;a href="https://ru.wikipedia.org/wiki/%D0%9A%D0%B2%D0%B0%D0%BD%D1%82%D0%B8%D0%BB%D0%B8_%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D1%8F_%D0%A1%D1%82%D1%8C%D1%8E%D0%B4%D0%B5%D0%BD%D1%82%D0%B0"&gt;таблицей коэффициентов Стьюдента&lt;/a&gt; из Википедии, найдя строку, соответствующую нашим 449 степеням свободы.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/student05.PNG" width="1302" height="88" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;В нашем случае, строки именно для числа 449 нет, зато несложно заметить, что значения для 100 и 1000 — ближайших подходящих строк — отличаются на сотые доли, поэтому для большого числа степеней свободны подойдет любая строка.&lt;/p&gt;
&lt;p&gt;Наше значение 2,0014 находится между 1,9623 и 2,3301: 1,9623 &lt; 2,0014 &lt; 2,3301&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/student05.PNG" width="1302" height="88" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;В шапке таблицы это соответствует 95%-му и 98%-му квантилю распределения Стьюдента, т. е. мы захватили 95%-й квантиль, но не захватили 98%-й:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/student06.PNG" width="1303" height="90" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;b&gt;Если расчетное значение t-критерия Стьюдента больше контрольного, значит, «альтернативная гипотеза» верна с соответствующей вероятностью (95%), и выборки статистически различаются.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Если бы мы получили значение t-критерия больше, чем 2,3301 (98%), мы бы могли говорить по правильности «альтернативной гипотезы» уже с 98%-й вероятностью. Аналогично, если бы мы получили значение t-критерия меньше, чем 1,9623 (95%), но больше 1,6464 (90%), мы бы говорили о правильности гипотезы на 90%.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Вывод: расчетное значение t-критерия Стьюдента 2,0014 соответствует, по меньшей мере, 95% уверенности в том, что между выборками есть статистически значимые различия, и звонки Асланян, действительно, в среднем длиннее звонков Евтушенко.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Наша «альтернативная гипотеза» получила 95%-ое подтверждение, мы можем быть уверены в результате и принимать решение о дальнейшей работе с полученный информацией.&lt;/p&gt;
&lt;h2&gt;Полезные ссылки&lt;/h2&gt;
&lt;p&gt;&lt;a href="http://www.evanmiller.org/ab-testing/t-test.html"&gt;http://www.evanmiller.org/ab-testing/t-test.html&lt;/a&gt;&lt;/p&gt;
</description>
</item>

<item>
<title>Кадровые решения, или Повысить нельзя уволить</title>
<guid isPermaLink="false">11</guid>
<link>https://mathandcoffee.ru/all/kadrovye-resheniya-ili-povysit-nelzya-uvolit/</link>
<pubDate>Fri, 29 Mar 2019 18:03:34 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/kadrovye-resheniya-ili-povysit-nelzya-uvolit/</comments>
<description>
&lt;p&gt;Проблему, которую помогает решить использование матстатистики, я бы обозначил как «Повысить нельзя уволить» — вот перед нами результаты работы нашего отдела продаж, и назревают вопросы по нашему новому менеджеру Сухонцеву.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/voronka01.PNG" width="476" height="378" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;У сотрудника подходит к концу испытательный срок, план по сделкам ему был выставлен как «16 сделок на 100 звонков», поскольку исторически коммерческий директор видел конверсию звонков в сделки на уровне 16,1%.&lt;/p&gt;
&lt;p&gt;Сухонцев, хорошо зарекомендовав себя за прошедшие 2,5 месяца работы, имеет 89 звонков и всего 9 сделок, что дает конверсию 10,1%.&lt;/p&gt;
&lt;p&gt;«Увольнять,» — решает коммерческий директор.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Внимание, вопрос: справедливо ли решение коммерческого директора?&lt;/b&gt; Достаточно ли прошло времени (накоплено данных), чтобы принимать такое кадровое решение? Учтен ли фактор «невезения», и не может ли быть так, что Сухонцев работает &lt;b&gt;не хуже&lt;/b&gt; остальных менеджеров, имея, в действительности, конверсию порядка требуемых 16%, но стабильно сталкиваясь с форс-мажорами у клиентов (5 клиентов «отвалились»), «черной полосой» в своей жизни и неудачно вставшей Луной в третьем доме Тельца?&lt;/p&gt;
&lt;h2&gt;Бросаем игральные кости&lt;/h2&gt;
&lt;p&gt;Вспоминая пример с бросками монетки, для разнообразия, в этот раз будем бросать игральную кость с 6-ю гранями. Вероятность выкинуть «1» составляет 1/6, или примерно 16,7%.&lt;/p&gt;
&lt;p&gt;Математическое ожидание для 89 бросков игральной кости составляет 89 * 1/6 = 14,8 «единичек» (и по столько же «двоек», «троек» и т. д.), но, очевидно, их может быть не только 14-15, но и 12, 17, или, даже, 20. А вот &lt;i&gt;совсем их не быть&lt;/i&gt; практически не может (хотя, теоретически, вероятность этого не нулевая).&lt;/p&gt;
&lt;p&gt;Работу Сухонцева можно представить как броски игральной кости, где требуемый результат — «единичка»-сделка —  выпадает примерно на каждый шестой бросок. &lt;i&gt;Примерно,&lt;/i&gt; потому что исторически наблюдаемся конверсия в сделки составляет (без учета работы Сухонцева) 380 сделок на 2361 звонков, или 380/2361 = 16,1%. Математическое ожидание от его 89 «бросков» (звонков) составляет 89 * 0,161 = 14,3 «единичек» (сделок), но, интуитивно понятно, что их может быть чуть больше или чуть меньше.&lt;/p&gt;
&lt;p&gt;Если рассчитать (позже узнаем, как) точные вероятности «выпадения» определенного числа сделок на 89 звонков и вывести их на графике, то наиболее вероятное событие &lt;i&gt;(«математическое ожидание»)&lt;/i&gt; в 14 сделок окажется в середине графика, остальные возможные варианты (13 и 15 сделок, 12 и 16 сделок, и т. п.) каждый раз становятся все менее и менее вероятны, из-за чего график приобретает форму колокола:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/voronka02.PNG" width="740" height="220" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Сказать, что результат в 9 сделок &lt;i&gt;совсем&lt;/i&gt; невероятен не получается — какой-никакой, но этот столбик тоже заметен, и даже имеет вероятность в 0,037. Т. е., в 1 случае из 27 он случается, что, может, и маловероятно, но не &lt;i&gt;крайне&lt;/i&gt; маловероятно.&lt;/p&gt;
&lt;p&gt;Осталось разобраться, как мы получили вероятность «в 1 случае из 27», и как это связать с кадровыми решениями в отделе продаж.&lt;/p&gt;
&lt;h2&gt;Считаем биномиальное распределение&lt;/h2&gt;
&lt;p&gt;И в Excel, и в Google Таблицах есть встроенная &lt;b&gt;функция биномиального распределения.&lt;/b&gt; Она-то и даст нам ответ на вопрос, пора ли увольнять невезучего Сухонцева.&lt;/p&gt;
&lt;p&gt;В ячейке напротив его конверсии в 10,1% посчитаем функцию:&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=БИНОМРАСП(D7;C7;$E$11;1)&lt;/code&gt;&lt;/pre&gt;&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/voronka03.PNG" width="682" height="376" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;В данной функции указываем по порядку: значение числа успехов (сделок), значение числа попыток (звонков), значение вероятности успеха (конверсия 16,1%). Последний, 4-й параметр, указываем «1».&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/voronka04.PNG" width="577" height="351" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Что за 0,0763 мы получили? &lt;b&gt;0,0763 — это вероятность получить не более 9 сделок на 89 звонков при вероятности сделки 16,1%.&lt;/b&gt; Таким образом, это вероятность получить от 0 до 9 сделок &lt;i&gt;включительно&lt;/i&gt; при данных параметрах. Обратно, 1-0,0763 = 0,9237 — это вероятность получить &lt;i&gt;10 и более&lt;/i&gt; сделок.&lt;/p&gt;
&lt;p&gt;(Кстати, если 4-й параметр в функции поменять на «0», мы получим вероятность получить &lt;b&gt;ровно&lt;/b&gt; 9 сделок).&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/voronka05.PNG" width="742" height="223" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Можно сказать, что, принимая сумму всех столбиков на графике за 1, сумма столбиков «0»-«9» равна 0,0763, или 7,63%. Как видим, гораздо более вероятно попасть в синюю часть колокола нормального распределения, чем в красную (92,37% против 7,63%).&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Вывод: вероятность Сухонцеву, работая в действительности с конверсией 16,1%, случайно (возможна «черная полоса», помните?) получить не более 9 сделок из 89 звонков, равна 7,63%.&lt;/b&gt; Обратно, 92,37% вероятность того, что Сухонцев получил бы 10 и более сделок. Грубо говоря, 7,63% за то, что ему не повезло, а 92,37% за то, что одним невезением тут не обошлось, и, скорее всего, он работает с конверсией ниже 16,1%.&lt;/p&gt;
&lt;p&gt;Таким образом, если для коммерческого директора уровня 90% уверенности достаточно, то Сухонцева можно увольнять с испытательного срока — менеджер, действительно, не выполняет план. Если же нужен уровень 95% уверенности, то данных пока недостаточно, и желательно понаблюдать чуть дальше.&lt;/p&gt;
&lt;p&gt;Какой же уровень уверенности выбрать? Правильного ответа здесь не существует.&lt;/p&gt;
&lt;p&gt;Если его выбрать слишком низким, то мы можем случайно уволить хороших менеджеров, зато не придется терять сделки, продолжая работать с плохими.&lt;/p&gt;
&lt;p&gt;Если выбрать его слишком высоким, то слишком долго придется копить данные для принятия математически обоснованного решения об увольнении плохого менеджера, зато и меньше вероятность случайно уволить хорошего. По моему мнению, уровень 90% для описанного кейса оптимален. Сухонцева можно увольнять.&lt;/p&gt;
&lt;h2&gt;Постойте, а что с 19,7% Беляева?&lt;/h2&gt;
&lt;p&gt;Действительно, если существуют «плохие» менеджеры, для которых с вероятностью 92,37% конверсия ниже требуемых 16,1%, то, логично, могут существовать и «хорошие».&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/voronka06.PNG" width="682" height="367" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Наше внимание обратили на себя 19,7% конверсии Беляева. За полгода работы он сделал 56 сделок на 284 звонка, при прогнозируемых 0,161*284 = 46 сделках. Могло ли ему везти эти полгода? Могло ли быть так, что, работая в действительности как все, с конверсией 16,1%, он случайно получил больше сделок, чем прогнозировал коммерческий директор?&lt;/p&gt;
&lt;p&gt;Функция биномиального распределения дает результат в 0,9563 — то есть, с вероятностью 95,63%, работая как все, он бы получил не более 56 сделок... но он и не сделал &lt;i&gt;более&lt;/i&gt; 56 сделок! Он сделал &lt;i&gt;ровно&lt;/i&gt; 56!&lt;/p&gt;
&lt;p&gt;Доработаем функцию, пересчитав ее для 56-1 = 55 сделок:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/voronka07.PNG" width="712" height="358" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Для 55 сделок результат получился 0,9402. То есть, с вероятностью 94,02% Беляев (работая с конверсией 16,1%) получил бы &lt;i&gt;не более&lt;/i&gt; 55 сделок. Получается, вероятность получить &lt;i&gt;более&lt;/i&gt; 55 сделок равна оставшимся 5,98%! Получается, наш Беляев попал в кусочек своего колокола распределения, только с другого конца, и вероятность попасть туда составляет всего около 6%.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/voronka08.PNG" width="742" height="217" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Коммерческий директор уже решил, что, прежде чем принимать кадровые решения, он хочет быть уверен в результатах на 90%. Но в результатах Беляева он уверен на 94,02%! Значит, остается всего 5,98% на то, что Беляеву повезло.&lt;/p&gt;
&lt;p&gt;Значит, либо ему так повезло, хотя он, в действительности, работает как все (с конверсией 16,1%) и недостоин большей зарплаты, либо, он работает с конверсией выше 16,1% и будет справедливо вознаградить его.&lt;/p&gt;
&lt;p&gt;6% явно проигрывают 94%, поэтому, Беляев получает повышение.&lt;/p&gt;
</description>
</item>


</channel>
</rss>