<?xml version="1.0" encoding="utf-8"?> 
<rss version="2.0"
  xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd"
  xmlns:atom="http://www.w3.org/2005/Atom">

<channel>

<title>Математика и кофе: заметки с тегом конверсия</title>
<link>https://mathandcoffee.ru/tags/konversiya/</link>
<description>Отделы продаж, коллцентры, аналитика, цифры и данные, воронки продаж, матстатистика..</description>
<author>Иван Балдин</author>
<language>ru</language>
<generator>E2 (v3565; Aegea)</generator>

<itunes:owner>
<itunes:name>Иван Балдин</itunes:name>
<itunes:email></itunes:email>
</itunes:owner>
<itunes:subtitle>Отделы продаж, коллцентры, аналитика, цифры и данные, воронки продаж, матстатистика..</itunes:subtitle>
<itunes:image href="" />
<itunes:explicit></itunes:explicit>

<item>
<title>График конверсии с доверительным интервалом</title>
<guid isPermaLink="false">45</guid>
<link>https://mathandcoffee.ru/all/grafik-konversii-s-doveritelnym-intervalom/</link>
<pubDate>Tue, 25 May 2021 01:13:50 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/grafik-konversii-s-doveritelnym-intervalom/</comments>
<description>
&lt;p&gt;Некоторое время с удовольствием использую более свежую визуализацию конверсии, добавляя к своим диаграммам &lt;b&gt;границы доверительного интервала.&lt;/b&gt;&lt;/p&gt;
&lt;h2&gt;Конверсия офисов продаж&lt;/h2&gt;
&lt;p&gt;Итак, например, мы оцениваем эффективность работы территориальных офисов продаж. Под &lt;b&gt;&lt;i&gt;эффективностью&lt;/i&gt;&lt;/b&gt; понимаем отношение числа совершенных продаж к числу заявок (конверсию заявок в продажи, или просто &lt;b&gt;&lt;i&gt;«конверсию»).&lt;/i&gt;&lt;/b&gt; То есть, если в офисе «Сокольники» за квартал было 19 продаж на 33 заявки, их эффективность будем считать равной 19/33 = 57,6%.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/candles-sd-00.png" width="642" height="382" alt="" /&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/candles-sd-01.png" width="455" height="454" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Очевидно, что одни офисы работают эффективнее других: конверсия по офисам меняется от 57,6% до 17,6%. Заметно также, что и число заявок в офисах различно: от 33 заявок в «Сокольниках» до 706 заявок в «Лианозово».&lt;/p&gt;
&lt;p&gt;Обычно на этом этапе многие останавливаются, но есть несложный способ воспользоваться понятием «доверительного интервала» или «стандартного отклонения (SD)», чтобы показать то, что, на первый взгляд, не так заметно.&lt;/p&gt;
&lt;h2&gt;Оцениваем размер выборки и величину SD&lt;/h2&gt;
&lt;p&gt;Как нетрудно заметить, из-за неравного числа заявок по разным офисам («Сокольники» отличаются в этом смысле от «Лианозово» почти в 22 раза), уверенность в надежности рассчитанной конверсии будет не одинакова. Так, для «Лианозово» результат в 36,1% достигнут на выборке из 706 заявок и может считаться вполне надежным; в «Сокольниках» мы получили результат 57,6% на небольшой выборке в 33 заявки, из-за чего нет уверенности, что, получи со временем последние свои 706 заявок, они бы удержали результат на том же уровне.&lt;/p&gt;
&lt;p&gt;Разумеется, необходимо прикинуть размер доверительного интервала для каждого офиса продаж, исходя из числа заявок, то есть, размера выборки.&lt;/p&gt;
&lt;p&gt;Уже знакомая нам формула стандартного отклонения (SD), или &lt;i&gt;&amp;sigma;&lt;/i&gt;:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/CodeCogsEqn.png" width="201" height="77" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;где &lt;i&gt;p&lt;/i&gt; — величина конверсии, &lt;i&gt;n&lt;/i&gt; — число заявок.&lt;/p&gt;
&lt;p&gt;Считаем в колонке E:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/candles-sd-02.png" width="637" height="380" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Полученная величина стандартного отклонения (SD) показывает погрешность при расчете конверсии, и, очевидно, оказалась выше там, где была меньше выборка. Чем меньше данных, тем менее надежен рассчитанный результат, и тем меньше мы уверены в нашей оценке эффективности соответствующего офиса продаж.&lt;/p&gt;
&lt;h2&gt;Считаем границы 90%-го доверительного интервала&lt;/h2&gt;
&lt;p&gt;Дополним нашу таблицу рассчитанными нижней и верхней границей 90%-го доверительного интервала. Другими словами, оценим разброс конверсий по каждому из офисов продаж, так, что с вероятностью 90% мы будем уверены, что &lt;i&gt;истинная&lt;/i&gt; конверсия лежит в пределах этого диапазона.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/candles-sd-03.png" width="653" height="381" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Зная о том, что границы 90%-го доверительного интервала лежат в пределах &amp;plusmn;1,645SD, вычитаем и прибавляем 1,645SD для нижней и верхней границ, соответственно. Для «Лианозово» получаем, что их &lt;i&gt;истинная&lt;/i&gt; конверсия лежит в пределах от 33,1% до 39,1%. (По-прежнему, в 1 случае из 10 она выходит за границы нашего интервала, но зато в 9 случаях из 10 мы не ошиблись).&lt;/p&gt;
&lt;h2&gt;Дополняем график, рисуя «свечи»&lt;/h2&gt;
&lt;p&gt;В Excel 2013 воспользуемся &lt;b&gt;«биржевой диаграммой»,&lt;/b&gt; указав вместо &lt;b&gt;&lt;i&gt;самого высокого&lt;/i&gt;&lt;/b&gt; и &lt;b&gt;&lt;i&gt;самого низкого курсов&lt;/i&gt;&lt;/b&gt; верхнюю и нижнюю границу наших доверительных интервалов, а вместо &lt;b&gt;&lt;i&gt;курса закрытия&lt;/i&gt;&lt;/b&gt; — рассчитанную вначале конверсию:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/candles-sd-04.png" width="634" height="600" alt="" /&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/candles-sd-05.png" width="454" height="454" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Доработанная подобным образом диаграмма не меняет выводов, полученных в самом начале. Однако, для наблюдательного руководителя она ненавязчиво напоминает, что полученные значения конверсий офисов продаж &lt;b&gt;не конечны,&lt;/b&gt; и особенно «не конечны» там, где оказались шире границы разброса конверсии.&lt;/p&gt;
&lt;p&gt;«Сокольники», предварительно, обогнали «Беговой», однако, если хороший результат «Бегового» надежен за счет узкого интервала, то результат «Сокольников» очень приблизителен, поэтому уверенные выводы возможно делать лишь о части офисов продаж, для остальных — нужно больше данных, а до тех пор их позиции в рейтинге можно считать лишь предварительными, или, как было сказано выше, не конечными.&lt;/p&gt;
&lt;h2&gt;См. также:&lt;/h2&gt;
&lt;p&gt;&lt;a href="http://italylov.ru/blog/all/ctatisticheskaya-dostovernost-koltrekinga/"&gt;http://italylov.ru/blog/all/ctatisticheskaya-dostovernost-koltrekinga/&lt;/a&gt;&lt;/p&gt;
</description>
</item>

<item>
<title>Доверительный интервал биномиального распределения по методу Уилсона</title>
<guid isPermaLink="false">40</guid>
<link>https://mathandcoffee.ru/all/doveritelny-interval-binomialnogo-raspredeleniya-po-metodu-uilso/</link>
<pubDate>Wed, 01 Apr 2020 16:54:50 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/doveritelny-interval-binomialnogo-raspredeleniya-po-metodu-uilso/</comments>
<description>
&lt;p&gt;В процессе изучения биномиального распределения, обратил внимание, что стандартный способ определения доверительного интервала через &lt;i&gt;&amp;plusmn;1,645SD&lt;/i&gt; не всегда точен. Грубо говоря, если «решка» выпала меньше, чем в 10 бросках, то, скорее всего, либо вы сделали мало бросков, либо у вас вероятность выпадения «решки» в «заколдованной монетке» сильно невелика; если &lt;i&gt;np&lt;/i&gt; &amp;lt; 10, лучше воспользоваться более сложными формулами, дающими более точные оценки при маленьких &lt;i&gt;p&lt;/i&gt; или &lt;i&gt;n:&lt;/i&gt;&lt;/p&gt;
&lt;p&gt;&lt;i&gt;По мнению многих статистиков, наиболее оптимальную оценку доверительных интервалов для частот осуществляет &lt;b&gt;метод Уилсона (Wilson),&lt;/b&gt; предложенный еще в 1927 году &amp;lt;...&amp;gt;. Данный метод не только позволяет оценить доверительные интервалы для очень малых и очень больших частот, но и применим для малого числа наблюдений.&lt;/i&gt;&lt;/p&gt;
&lt;p&gt;Звучит заманчиво. Попробуем разобраться.&lt;/p&gt;
&lt;h2&gt;Метод Уилсона&lt;/h2&gt;
&lt;p&gt;Нижняя и верхняя граница доверительного интервала &lt;i&gt;p = 1—&amp;alpha;/2&lt;/i&gt; вычисляются следующими формулами:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;div class="fotorama" data-width="392" data-ratio="2.6666666666667"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/wilson01.PNG" width="392" height="147" alt="" /&gt;
&lt;img src="https://mathandcoffee.ru/pictures/wilson02.PNG" width="393" height="132" alt="" /&gt;
&lt;/div&gt;
&lt;div class="e2-text-caption"&gt;Формула расчета нижней и верхней границ, соответственно.&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;где &lt;i&gt;&lt;b&gt;p&lt;/b&gt;&lt;/i&gt; — наблюдаемая вероятность «выпадения решки», &lt;i&gt;&lt;b&gt;N&lt;/b&gt;&lt;/i&gt; — число измерений («бросков»), &lt;i&gt;&lt;b&gt;z&lt;/b&gt;&lt;/i&gt; — &lt;i&gt;z-&lt;/i&gt;оценка (например, 1,960 для 95%-го доверительного интервала, или 1,645 для 90%-го).&lt;/p&gt;
&lt;h2&gt;Пример и калькулятор для расчета&lt;/h2&gt;
&lt;p&gt;Предположим, нам удалось прослушать 10 рандомных звонков колл-центра, и в 4 из них оператор забыл или поленился уточнить у клиента источник рекламы. Скорее всего, исходя из данной информации, операторы не уточняют источники рекламы в 40% звонков.&lt;/p&gt;
&lt;p&gt;Однако, это очень смелое утверждение, ведь наша выборка (10 звонков) откровенно мала: для получения более точной оценки качества работы коллцентра, хорошо бы прослушать больше рандомных звонков (прослушать все звонки, очевидно, невозможно).&lt;/p&gt;
&lt;p&gt;Но даже для выборки из 10 звонков, можно рассчитать SD биномиального распределения:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/CodeCogsEqn.png" width="201" height="77" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Имеем, SD = 15,49%. С вероятностью 90%, точная оценка качества работы коллцентра (доля звонков, где не выявлен источник рекламы) лежит в диапазоне 40%&amp;plusmn;1,645SD, или от 14,52% до 65,48%.&lt;/p&gt;
&lt;p&gt;Применяя же формулу Уилсона (что уместно, так как &lt;i&gt;np&lt;/i&gt; = 4 &amp;lt; 10), границы доверительного интервала уточняются: с вероятностью 90%, истинная доля звонков, где не выявляется источник рекламы, лежит в границах от 19,42% до 64,84%. SD, получается, равно 13,80%.&lt;/p&gt;
&lt;p&gt;&lt;a href="https://docs.google.com/spreadsheets/d/1QSvQF7SHUF8QIM8dzxWFT0itI5rP2VOn-tWJ4tHX5qI/edit?usp=sharing"&gt;&lt;b&gt;Калькулятор&lt;/b&gt;&lt;/a&gt; в Google Таблицах (меню «Файл» — «Создать копию»).&lt;/p&gt;
&lt;h2&gt;См. также:&lt;/h2&gt;
&lt;p&gt;«&lt;a href="https://cyberleninka.ru/article/n/doveritelnye-intervaly-dlya-chastot-i-doley/viewer"&gt;Доверительные интервалы для частот и долей&lt;/a&gt;», А.М. Гржибовский, 2008 (стр. 58-59)&lt;br /&gt;
&lt;a href="http://vassarstats.net/prop1.html"&gt;Онлайн-калькулятор&lt;/a&gt; для 95%-го доверительного интервала&lt;br /&gt;
&lt;a href="https://www.wolframalpha.com/input/?i=binomial+distribution+confidence+interval&amp;assumption=%22FSelect%22+-%3E+%7B%7B%22WilsonScoreInterval%22%7D%7D&amp;assumption=%7B%22F%22%2C+%22WilsonScoreInterval%22%2C+%22k%22%7D+-%3E%224%22&amp;assumption=%7B%22F%22%2C+%22WilsonScoreInterval%22%2C+%22c%22%7D+-%3E%220.90%22&amp;assumption=%7B%22F%22%2C+%22WilsonScoreInterval%22%2C+%22n%22%7D+-%3E%2210%22"&gt;Калькулятор&lt;/a&gt; на WolframAlpha.com&lt;br /&gt;
&lt;a href="https://www.ucl.ac.uk/english-usage/staff/sean/resources/binomialpoisson.pdf"&gt;Binomial confidence intervals and contingency tests&lt;/a&gt; (стр.4-5)&lt;br /&gt;
&lt;a href="https://influentialpoints.com/Training/confidence_intervals_of_proportions.htm#wils"&gt;https://influentialpoints.com/Training/confidence_intervals_of_proportions.htm#wils&lt;/a&gt;&lt;br /&gt;
&lt;a href="https://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval#Wilson_score_interval"&gt;Wilson score interval&lt;/a&gt; на Википедии&lt;/p&gt;
</description>
</item>

<item>
<title>Голосовой робот KupiVIP, угадываем размер выборки</title>
<guid isPermaLink="false">27</guid>
<link>https://mathandcoffee.ru/all/golosovoy-robot-kupivip-ugadyvaem-razmer-vyborki/</link>
<pubDate>Sat, 20 Jul 2019 13:18:48 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/golosovoy-robot-kupivip-ugadyvaem-razmer-vyborki/</comments>
<description>
&lt;p&gt;В статье «&lt;a href="https://vc.ru/marketing/54315-keys-zamenili-na-black-friday-koll-centr-kupivip-robotom-i-tolko-5-chelovek-iz-5000-ponyali-chto-obshchayutsya-s-neyrosetyu"&gt;Кейс: заменили на Black Friday колл-центр KupiVIP роботом, и только 5 человек из 5000 поняли, что общаются с нейросетью&lt;/a&gt;» на vc.ru меня, среди прочего, не могла не заинтересовать фраза, где автор рассказывает о росте конверсии с 6% до 8%:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/kupivip_robot_00.PNG" width="690" height="276" alt="&amp;quot;количество активаций промокода у голосового робота доходило до 8% против 6% у реальных сотрудников колл-центра.&amp;quot;" /&gt;
&lt;/div&gt;
&lt;p&gt;Естественно, я задумался, на каком же объеме звонков был зафиксирован данный рост конверсии, и достаточен ли был этот объем, чтобы можно было достоверно утверждать, что голосовой робот эффективнее живых операторов колл-центра.&lt;/p&gt;
&lt;p&gt;Точно вопрос можно было бы сформулировать, например, следующим образом: &lt;b&gt;какой минимальный объем звонков требуется сделать, чтобы с уровнем достоверности, например, 95% зафиксировать рост конверсии с 6% до 8%?&lt;/b&gt;&lt;/p&gt;
&lt;h2&gt;Строим эксперимент в Excel&lt;/h2&gt;
&lt;p&gt;Попробуем выписать имеющиеся данные в Excel. Для дальнейших расчетов нам понадобится параметр &lt;i&gt;«число звонков»&lt;/i&gt; — предположим пока, что и робот, и операторы сделали по 1000 звонков, прежде чем были получены конверсии 6% и 8%:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/kupivip_robot_01.PNG" width="366" height="215" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Вообще, налицо обычный А/Б сплит-тест, и далее нам нужно будет пройтись по его алгоритму для получения &lt;i&gt;Z-оценки&lt;/i&gt; и расчета &lt;i&gt;p-значения&lt;/i&gt;.&lt;/p&gt;
&lt;p&gt;Рассчитаем стандартные ошибки (SD, или &amp;sigma;) для обеих конверсий и стандартную ошибку разницы этих конверсий. Формула для расчета стандартной ошибки конверсии:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/CodeCogsEqn.png" width="201" height="77" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;где &lt;i&gt;p&lt;/i&gt; — конверсия (6%, например), &lt;i&gt;n&lt;/i&gt; — размер выборки (1000 звонков). Считаем в Excel:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/kupivip_robot_02.PNG" width="573" height="217" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Стандартная ошибка разницы конверсий — считаем по формуле:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/CodeCogsEqn02.png" width="230" height="58" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;где &amp;sigma; — это стандартная ошибка каждой из конверсий A и B (оператор и робот). В Excel посчитаем ее чуть ниже:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/kupivip_robot_03.PNG" width="556" height="250" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Насколько разница между конверсиями A и B больше, чем стандартная ошибка этой разницы? Это соотношение называется &lt;i&gt;&lt;b&gt;Z-оценкой.&lt;/b&gt;&lt;/i&gt; В Excel считается совсем просто:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/kupivip_robot_04.PNG" width="506" height="271" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Итак, Z-оценка = 1,7541. На графике нормального распределения это соответствует 96%-му персентилю, то есть, вероятность, что Z-оценка случайно окажется выше 1,7541 составляет порядка 4% (иными словами, 96% площади под колоколом нормального распределения не выходят за пределы +1,7541 стандартных отклонений):&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/kupivip_robot_05.PNG" width="706" height="304" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Откуда мы взяли именно 96%? Точное значение вероятности, &lt;i&gt;p-значение,&lt;/i&gt; вычисляем по формуле:&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=НОРМ.РАСП(1,7541;0;1;ИСТИНА)&lt;/code&gt;&lt;/pre&gt;&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/kupivip_robot_06.PNG" width="571" height="94" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;P-значение = 96,03%.&lt;/p&gt;
&lt;p&gt;Итак, промежуточный вывод: &lt;b&gt;если на выборке в 1000 звонков в каждом из двух случаев мы обнаружили конверсии (активации промокода) в 6% и 8% звонков, то мы на 96% уверены, что эта разница не случайна.&lt;/b&gt; (Остается 4% вероятности, что обнаруженная разница — случайность. Тогда, возможно, конверсия вообще одинакова и равна, например, 7%. Сделай мы больше звонков, разница вскоре сошла бы на нет).&lt;/p&gt;
&lt;h2&gt;Эксперимент минимального размера&lt;/h2&gt;
&lt;p&gt;Однако, вернемся к первоначальной задаче.&lt;/p&gt;
&lt;p&gt;Мы не хотели убедиться, что 8% больше, чем 6%, да и цифра 1000 звонков для робота и операторов была выбрана наугад. Мы хотели рассчитать &lt;b&gt;минимальное количество звонков, чтобы с уровнем уверенности 95% зафиксировать статистическую значимость разницы между 8% и 6%.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;1000 звонков нам оказалось точно достаточно. Теперь нам остается уменьшать это число до той поры, пока p-значение не пересечет границу 95%. (По формуле нормального распределения, кстати, это будет соответствовать Z-оценке, равной 1,6449 — попробуйте проверить.)&lt;/p&gt;
&lt;p&gt;В теории, наверное, можно было бы вывести большую формулу для расчета такого &lt;i&gt;n,&lt;/i&gt; при котором p-значение будет равно 0,95. На практике, быстрее окажется вручную подобрать минимальное n. Или, еще лучше, воспользоваться в Excel инструментом &lt;b&gt;Данные — Анализ «что, если» — Подбор параметра:&lt;/b&gt;&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/kupivip_robot_07.PNG" width="797" height="186" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;(Убедитесь только, что число звонков робота ровно то же самое, что и число звонков оператора, т. е. вы указали =C6 в ячейке C7).&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/kupivip_robot_08.PNG" width="817" height="185" alt="" /&gt;
&lt;/div&gt;
&lt;h2&gt;Выводы&lt;/h2&gt;
&lt;p&gt;Итак, мы вычислили минимальные условия эксперимента для оценки эффективности голосового робота для KupiVIP.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Нужно не менее 878 звонков в каждой из двух групп, чтобы с уровнем достоверности 95% подтвердить наличие разницы между 6% активаций промокодов в контрольной группе (реальные сотрудники) и 8% в тестовой группе (голосовой робот).&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;(Единственное, ни 6%, ни 8% не дают целого числа активаций на выборке из 878 звонков, и, в реальности, конечно, цифры будут другие, причем число звонков в двух группах вообще может быть различным. Но, на самом деле, это не имеет большого значения, т. к., наверняка, в статье были приведены округленные значения конверсий).&lt;/p&gt;
&lt;h2&gt;См. также:&lt;/h2&gt;
&lt;p&gt;&lt;a href="https://abtestguide.com/calc/?ua=1000&amp;ub=1000&amp;ca=60&amp;cb=80"&gt;https://abtestguide.com/calc/?ua=1000&amp;ub=1000&amp;ca=60&amp;cb=80&lt;/a&gt;&lt;/p&gt;
</description>
</item>

<item>
<title>Когнитивная ошибка конверсии</title>
<guid isPermaLink="false">19</guid>
<link>https://mathandcoffee.ru/all/oshibka-konversii/</link>
<pubDate>Tue, 07 May 2019 12:39:07 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/oshibka-konversii/</comments>
<description>
&lt;p&gt;Любопытная особенность работы с понятием &lt;i&gt;конверсия&lt;/i&gt; заключается в том, что, строго говоря, &lt;b&gt;конверсия практически никогда не бывает определена точно.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Вот эти вот «конверсия звонка в продажу 18,4%», «CTR 3,1%», «конверсия в сделки 30%» — это всегда немного упрощенный подход, будто конверсия надежно измерена и, если и изменится, то мы это объясним объективными факторами, не допуская мысли, что изначально никаких «18,4%» и не было, а были только 38 договоров, которые мы сделали на 206 звонках, и это вовсе не значит, что их не могло бы быть больше или меньше.&lt;/p&gt;
&lt;p&gt;Примерно, как местоположение электрона вокруг ядра атома не задается точными координатами, а лишь описывается некоторой областью, в которой он, наиболее вероятно, находится, наша конверсия — это тоже не конкретное число, а, в действительности, &lt;b&gt;интервал, в котором она находится.&lt;/b&gt;&lt;/p&gt;
&lt;h2&gt;Расчет конверсии и когнитивное искажение&lt;/h2&gt;
&lt;p&gt;Рассмотрим вымышленный отдел продаж, в котором с этого года начали продавать новый продукт. Допустим, ммм, &lt;b&gt;лимузины.&lt;/b&gt; Продукт не пользуется большим спросом, поэтому, пока что, данных для анализа не так много, или, лучше сказать, совсем мало:&lt;/p&gt;
&lt;div class="e2-text-table"&gt;
&lt;table cellpadding="0" cellspacing="0" border="0"&gt;
&lt;tr&gt;
&lt;td&gt;&lt;b&gt;месяц&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;Заявки&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;Продажи&lt;/b&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;август&lt;/td&gt;
&lt;td style="text-align: right"&gt;48&lt;/td&gt;
&lt;td style="text-align: right"&gt;1&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;сентябрь&lt;/td&gt;
&lt;td style="text-align: right"&gt;35&lt;/td&gt;
&lt;td style="text-align: right"&gt;1&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;октябрь&lt;/td&gt;
&lt;td style="text-align: right"&gt;24&lt;/td&gt;
&lt;td style="text-align: right"&gt;0&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;ноябрь&lt;/td&gt;
&lt;td style="text-align: right"&gt;61&lt;/td&gt;
&lt;td style="text-align: right"&gt;2&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;декабрь&lt;/td&gt;
&lt;td style="text-align: right"&gt;32&lt;/td&gt;
&lt;td style="text-align: right"&gt;0&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;b&gt;ИТОГО:&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;200&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;4&lt;/b&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/table&gt;
&lt;/div&gt;
&lt;p&gt;Как видно из данных наших продаж, по итогам нескольких месяцев, мы имеем 4 сделки на 200 лидов (заявок), т. е. наша конверсия равна 4 / 200 = 2,0%&lt;/p&gt;
&lt;p&gt;(Дополнительно, исходя из цифр пяти месяцев работы, мы можем примерно спрогнозировать 480 лидов на следующий год и, соответствнно, 480 * 0,02 = 9,6 сделок.)&lt;/p&gt;
&lt;p&gt;В целом, на таких скудных данных ошибиться невозможно, поэтому, безусловно, такой прогноз не будет ошибочным. Однако, он содержит важное когнитивное искажение: 2,0% это не точное значение, а &lt;i&gt;наиболее пока вероятное&lt;/i&gt; значение конверсии заявок в продажи наших лимузинов.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;В действительности, конверсия не может быть определена точно. Она лежит в доверительном интервале от 0,4% до 3,6%.&lt;/b&gt; И в будущем году нужно прогнозировать не 9,6 сделок, а от 5 до 15 проданных лимузинов. К сожалению, определить этот диапазон точнее будет довольно самонадеянным.&lt;/p&gt;
&lt;h2&gt;Колокол конверсии&lt;/h2&gt;
&lt;p&gt;Исходя из предположения, что наша &lt;i&gt;истинная&lt;/i&gt; конверсия стабильна, и &lt;i&gt;точно&lt;/i&gt; равна 2,0%, мы можем прикинуть возможные варианты числа сделок на 480 лидов, ожидаемых в будущем году. Поскольку мы можем отвечать только за стабильность &lt;i&gt;своей&lt;/i&gt; работы, но не можем учесть фактор случайности (настроение клиентов, форс мажор, случайная продажа другу гендиректора), всегда существует вероятность, что число сделок будет немного отличаться от прогнозируемых 480 * 0,02 = 9,6 сделок подобно тому, как число решек на 480 бросков монеты может немного отличаться от 240, и быть 235, 248, или, возможно, даже 223.&lt;/p&gt;
&lt;p&gt;Графически это выглядит как &lt;i&gt;колокол нормального распределения,&lt;/i&gt; где, чем дальше мы уходим от математического ожидания в 9 сделок в центре колокола, тем ниже становится вероятность сделать сильно меньше или сильно больше сделок:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/oshibka01.png" width="648" height="372" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Глядя на полученный график, приходится признать, что увидеть меньше 2-х и больше 19-ти сделок практически невероятно.&lt;/p&gt;
&lt;p&gt;Но, можно ли сузить наш &lt;i&gt;доверительный интервал?&lt;/i&gt;&lt;/p&gt;
&lt;h2&gt;Доверительный интервал конверсии&lt;/h2&gt;
&lt;p&gt;Стандартная ошибка (SD) для биномиального распределения считается по формуле:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/CodeCogsEqn-1.png" width="238" height="39" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;где &lt;b&gt;&lt;i&gt;n&lt;/i&gt;&lt;/b&gt; — это число испытаний, &lt;b&gt;&lt;i&gt;p&lt;/i&gt;&lt;/b&gt; — вероятность успеха.&lt;/p&gt;
&lt;p&gt;Для наших 200 заявок текущего года имеем:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/oshibka02.png" width="366" height="310" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;b&gt;SD = 1,98 сделок.&lt;/b&gt; Иными словами, согласно законам нормального распределения (а биномиальное распределение — это частный случай нормального распределения), примерно в 68% случаев, работая с истинной конверсией 2,0%, мы бы попали в доверительный интервал от 2,02 до 5,98 сделок, то есть +/-1SD.&lt;/p&gt;
&lt;p&gt;Для прогнозируемых 480 заявок будущего года получим:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/oshibka03.png" width="372" height="190" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;b&gt;SD = 3,07 сделок.&lt;/b&gt; По законам биномиального (нормального) распределения, известно, что в 68% случаев продажи будущего года будут лежать в пределах +/- 1SD от математического ожидания в 9,6 сделок, а в 90% случаев — в пределах +/- 1,645SD от матожидания. 3,07 сделок * 1,645 = 5,05 сделок, иными словами, в 90% случаев, работай мы весь следующий год с конверсией 2%, мы не выйдем за границы доверительного интервала «от 4,55 до 14,65 сделок». (Примечательно, что, обратно, в 1 случае из 10, мы, все-таки, выйдем за эти границы, по-прежнему, при этом, работая с «истинной» конверсией 2%.)&lt;/p&gt;
&lt;p&gt;Любопытно, какой шум поднимет коммерческий директор, если по итогам года мы продадим всего 4 лимузина на 480 заявок, формально показав конверсию 0,83%... и еще более любопытно, что, статистически, это происходит в 1 из 27 отделов продаж. &lt;b&gt;В одном из 27-ми случаев вас увольняют за невыполнение плана продаж, хотя вы по-прежнему работаете с «истинной» конверсией 2%.&lt;/b&gt;&lt;/p&gt;
&lt;h2&gt;Три конверсии на границе доверительного интервала&lt;/h2&gt;
&lt;p&gt;Как же тогда относится к результатам текущего года, где мы получили 4 сделки на 200 заявок?&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Первый случай, «2,00%».&lt;/b&gt; Его мы рассмотрели сразу. 4 / 200 = 0,02, т. е. наша конверсия равна 2%. При этом, по законам биномиального распределения, все равно есть вероятность колебаться в 90%-м доверительном интервале «+/-1,645SD», т. е., в интервале от 0,74 до 7,26 сделок на 200 заявок.&lt;/p&gt;
&lt;p&gt;Выглядит это примерно так:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/oshibka04.png" width="658" height="372" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Наш результат в 4 сделки совпал с математическим ожиданием от конверсии 2,0%, хотя, в общем, он мог и не совпасть, в целом находясь в 90% доверительном интервале от 1 до 7 сделок.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Второй случай, «1,22%».&lt;/b&gt; В этом случае, в реальности, наша «истинная» конверсия, &lt;b&gt;на самом деле, ниже, и равна, например, 1,22%.&lt;/b&gt; Тогда матожидание числа проданных лимузинов примерно равно 2, и нам &lt;b&gt;повезло&lt;/b&gt; сделать 4 продажи. Степень нашего везения такова, что сделать &lt;i&gt;более&lt;/i&gt; 4 продаж мы могли бы только в 10% случаев. Т. е., мы остаемся в поле 90%-й вероятности, хотя и находимся на границе этого поля. Еще чуть-чуть, и нам повезет слишком сильно, а пока что нам везет «в пределах разумного»:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/oshibka05.png" width="648" height="372" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;b&gt;Третий случай, «3,31%».&lt;/b&gt; Теперь мы предположим, что в текущем году &lt;b&gt;нам не везло,&lt;/b&gt; хотя весь год наша истинная конверсия была выше 2,0% и &lt;b&gt;равнялась 3,31%.&lt;/b&gt; Матожидание для 200 заявок тогда равнялось бы примерно 6 проданным лимузинам, а сделать &lt;i&gt;менее&lt;/i&gt; 4-х продаж было бы возможно лишь в 10% случаев. Тогда мы тоже остаемся в поле 90%-й вероятности, но находимся на левой границе этого поля с нашими невезучими 4 сделками.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/oshibka06.png" width="648" height="372" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;b&gt;Таким образом, приходится признать: мы не знаем наверняка, какая из 3-х конверсий — истинная.&lt;/b&gt; Нам привычно думать, что речь идет о 1-м случае, и мы делим 4 сделки на 200 заявок, получая конверсию 2,00%. Но никто не знает наверняка, является ли текущий год обычным или необычным, везло ли нам в нем, или не везло. В 90% случаев речь могла идти &lt;b&gt;как о везении,&lt;/b&gt; и мы работали в действительности с конверсией 1,22%, &lt;b&gt;так и о невезении,&lt;/b&gt; когда мы работали с конверсией 3,31%. &lt;b&gt;Во всех 3-х случаях вероятность сделать 4 сделки на 200 заявок не выходила за границы 90%.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;К сожалению, у нас пока слишком мало данных, чтобы утверждать что-то можно было более точно.&lt;/p&gt;
&lt;h2&gt;Нужно больше данных&lt;/h2&gt;
&lt;p&gt;Логично задать вопрос — а сколько нужно накопить данных, чтобы более-менее надежно говорить о конверсии 2,0%? Попробуем постепенно увеличивать размер выборки (число заявок, и, следовательно, продаж), пока не увидим, как 90%-й доверительный интервал сомкнется вокруг значения конверсии в 2,00%:&lt;/p&gt;
&lt;div class="e2-text-table"&gt;
&lt;table cellpadding="0" cellspacing="0" border="0"&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;                    Заявки&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;             Сделки&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;Нижняя граница 90% доверительного интервала (-1,645SD)&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;Верхняя граница 90% доверительного интервала (+1,645SD)&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;Нижняя граница конверсии&lt;/b&gt;&lt;/td&gt;
&lt;td style="text-align: right"&gt;&lt;b&gt;Верхняя граница конверсии&lt;/b&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;200&lt;/td&gt;
&lt;td style="text-align: right"&gt;4&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,7&lt;/td&gt;
&lt;td style="text-align: right"&gt;7,3&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,37%&lt;/td&gt;
&lt;td style="text-align: right"&gt;3,63%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;500&lt;/td&gt;
&lt;td style="text-align: right"&gt;10&lt;/td&gt;
&lt;td style="text-align: right"&gt;4,9&lt;/td&gt;
&lt;td style="text-align: right"&gt;15,1&lt;/td&gt;
&lt;td style="text-align: right"&gt;0,97%&lt;/td&gt;
&lt;td style="text-align: right"&gt;3,03%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;1 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;20&lt;/td&gt;
&lt;td style="text-align: right"&gt;12,7&lt;/td&gt;
&lt;td style="text-align: right"&gt;27,3&lt;/td&gt;
&lt;td style="text-align: right"&gt;1,27%&lt;/td&gt;
&lt;td style="text-align: right"&gt;2,73%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;5 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;100&lt;/td&gt;
&lt;td style="text-align: right"&gt;83,7&lt;/td&gt;
&lt;td style="text-align: right"&gt;116,3&lt;/td&gt;
&lt;td style="text-align: right"&gt;1,67%&lt;/td&gt;
&lt;td style="text-align: right"&gt;2,33%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;10 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;200&lt;/td&gt;
&lt;td style="text-align: right"&gt;177,0&lt;/td&gt;
&lt;td style="text-align: right"&gt;223,0&lt;/td&gt;
&lt;td style="text-align: right"&gt;1,77%&lt;/td&gt;
&lt;td style="text-align: right"&gt;2,23%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;50 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;1 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;948,5&lt;/td&gt;
&lt;td style="text-align: right"&gt;1 051,5&lt;/td&gt;
&lt;td style="text-align: right"&gt;1,90%&lt;/td&gt;
&lt;td style="text-align: right"&gt;2,10%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;100 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;2 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;1 927,2&lt;/td&gt;
&lt;td style="text-align: right"&gt;2 072,8&lt;/td&gt;
&lt;td style="text-align: right"&gt;1,93%&lt;/td&gt;
&lt;td style="text-align: right"&gt;2,07%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;500 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;10 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;9 837,2&lt;/td&gt;
&lt;td style="text-align: right"&gt;10 162,8&lt;/td&gt;
&lt;td style="text-align: right"&gt;1,97%&lt;/td&gt;
&lt;td style="text-align: right"&gt;2,03%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;1 000 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;20 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;19 769,7&lt;/td&gt;
&lt;td style="text-align: right"&gt;20 230,3&lt;/td&gt;
&lt;td style="text-align: right"&gt;1,98%&lt;/td&gt;
&lt;td style="text-align: right"&gt;2,02%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;10 000 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;200 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;199 271,7&lt;/td&gt;
&lt;td style="text-align: right"&gt;200 728,3&lt;/td&gt;
&lt;td style="text-align: right"&gt;1,99%&lt;/td&gt;
&lt;td style="text-align: right"&gt;2,01%&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td style="text-align: right"&gt;25 000 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;500 000&lt;/td&gt;
&lt;td style="text-align: right"&gt;498 848,5&lt;/td&gt;
&lt;td style="text-align: right"&gt;501 151,5&lt;/td&gt;
&lt;td style="text-align: right"&gt;2,00%&lt;/td&gt;
&lt;td style="text-align: right"&gt;2,00%&lt;/td&gt;
&lt;/tr&gt;
&lt;/table&gt;
&lt;/div&gt;
&lt;p&gt;Надо ли говорить, что получить более нескольких десятков тысяч заявок-лидов может мало какой из отделов продаж. &lt;b&gt;Поэтому, приходится признать, что ставить планы продаж и принимать кадровые решения относительно сотрудников, работающих с уровнями конверсии 1-5% — это безумие, и на таких маленьких числах математика в продажах не работает.&lt;/b&gt;&lt;/p&gt;
&lt;h2&gt;См. также:&lt;/h2&gt;
&lt;p&gt;&lt;a href="http://italylov.ru/blog/all/ctatisticheskaya-dostovernost-koltrekinga/"&gt;http://italylov.ru/blog/all/ctatisticheskaya-dostovernost-koltrekinga/&lt;/a&gt;&lt;/p&gt;
</description>
</item>


</channel>
</rss>