{
    "version": "https:\/\/jsonfeed.org\/version\/1",
    "title": "Математика и кофе: заметки с тегом А\/Б-тесты",
    "_rss_description": "Отделы продаж, коллцентры, аналитика, цифры и данные, воронки продаж, матстатистика..",
    "_rss_language": "ru",
    "_itunes_email": "",
    "_itunes_categories_xml": "",
    "_itunes_image": "",
    "_itunes_explicit": "",
    "home_page_url": "https:\/\/mathandcoffee.ru\/tags\/a-b-testy\/",
    "feed_url": "https:\/\/mathandcoffee.ru\/tags\/a-b-testy\/json\/",
    "icon": "https:\/\/mathandcoffee.ru\/user\/userpic@2x.jpg?1559386410",
    "author": {
        "name": "Иван Балдин",
        "url": "https:\/\/mathandcoffee.ru\/",
        "avatar": "https:\/\/mathandcoffee.ru\/user\/userpic@2x.jpg?1559386410"
    },
    "items": [
        {
            "id": "27",
            "url": "https:\/\/mathandcoffee.ru\/all\/golosovoy-robot-kupivip-ugadyvaem-razmer-vyborki\/",
            "title": "Голосовой робот KupiVIP, угадываем размер выборки",
            "content_html": "<p>В статье «<a href=\"https:\/\/vc.ru\/marketing\/54315-keys-zamenili-na-black-friday-koll-centr-kupivip-robotom-i-tolko-5-chelovek-iz-5000-ponyali-chto-obshchayutsya-s-neyrosetyu\">Кейс: заменили на Black Friday колл-центр KupiVIP роботом, и только 5 человек из 5000 поняли, что общаются с нейросетью<\/a>» на vc.ru меня, среди прочего, не могла не заинтересовать фраза, где автор рассказывает о росте конверсии с 6% до 8%:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/kupivip_robot_00.PNG\" width=\"690\" height=\"276\" alt=\"&quot;количество активаций промокода у голосового робота доходило до 8% против 6% у реальных сотрудников колл-центра.&quot;\" \/>\n<\/div>\n<p>Естественно, я задумался, на каком же объеме звонков был зафиксирован данный рост конверсии, и достаточен ли был этот объем, чтобы можно было достоверно утверждать, что голосовой робот эффективнее живых операторов колл-центра.<\/p>\n<p>Точно вопрос можно было бы сформулировать, например, следующим образом: <b>какой минимальный объем звонков требуется сделать, чтобы с уровнем достоверности, например, 95% зафиксировать рост конверсии с 6% до 8%?<\/b><\/p>\n<h2>Строим эксперимент в Excel<\/h2>\n<p>Попробуем выписать имеющиеся данные в Excel. Для дальнейших расчетов нам понадобится параметр <i>«число звонков»<\/i> — предположим пока, что и робот, и операторы сделали по 1000 звонков, прежде чем были получены конверсии 6% и 8%:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/kupivip_robot_01.PNG\" width=\"366\" height=\"215\" alt=\"\" \/>\n<\/div>\n<p>Вообще, налицо обычный А\/Б сплит-тест, и далее нам нужно будет пройтись по его алгоритму для получения <i>Z-оценки<\/i> и расчета <i>p-значения<\/i>.<\/p>\n<p>Рассчитаем стандартные ошибки (SD, или &sigma;) для обеих конверсий и стандартную ошибку разницы этих конверсий. Формула для расчета стандартной ошибки конверсии:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/CodeCogsEqn.png\" width=\"201\" height=\"77\" alt=\"\" \/>\n<\/div>\n<p>где <i>p<\/i> — конверсия (6%, например), <i>n<\/i> — размер выборки (1000 звонков). Считаем в Excel:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/kupivip_robot_02.PNG\" width=\"573\" height=\"217\" alt=\"\" \/>\n<\/div>\n<p>Стандартная ошибка разницы конверсий — считаем по формуле:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/CodeCogsEqn02.png\" width=\"230\" height=\"58\" alt=\"\" \/>\n<\/div>\n<p>где &sigma; — это стандартная ошибка каждой из конверсий A и B (оператор и робот). В Excel посчитаем ее чуть ниже:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/kupivip_robot_03.PNG\" width=\"556\" height=\"250\" alt=\"\" \/>\n<\/div>\n<p>Насколько разница между конверсиями A и B больше, чем стандартная ошибка этой разницы? Это соотношение называется <i><b>Z-оценкой.<\/b><\/i> В Excel считается совсем просто:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/kupivip_robot_04.PNG\" width=\"506\" height=\"271\" alt=\"\" \/>\n<\/div>\n<p>Итак, Z-оценка = 1,7541. На графике нормального распределения это соответствует 96%-му персентилю, то есть, вероятность, что Z-оценка случайно окажется выше 1,7541 составляет порядка 4% (иными словами, 96% площади под колоколом нормального распределения не выходят за пределы +1,7541 стандартных отклонений):<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/kupivip_robot_05.PNG\" width=\"706\" height=\"304\" alt=\"\" \/>\n<\/div>\n<p>Откуда мы взяли именно 96%? Точное значение вероятности, <i>p-значение,<\/i> вычисляем по формуле:<\/p>\n<pre class=\"e2-text-code\"><code class=\"\">=НОРМ.РАСП(1,7541;0;1;ИСТИНА)<\/code><\/pre><div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/kupivip_robot_06.PNG\" width=\"571\" height=\"94\" alt=\"\" \/>\n<\/div>\n<p>P-значение = 96,03%.<\/p>\n<p>Итак, промежуточный вывод: <b>если на выборке в 1000 звонков в каждом из двух случаев мы обнаружили конверсии (активации промокода) в 6% и 8% звонков, то мы на 96% уверены, что эта разница не случайна.<\/b> (Остается 4% вероятности, что обнаруженная разница — случайность. Тогда, возможно, конверсия вообще одинакова и равна, например, 7%. Сделай мы больше звонков, разница вскоре сошла бы на нет).<\/p>\n<h2>Эксперимент минимального размера<\/h2>\n<p>Однако, вернемся к первоначальной задаче.<\/p>\n<p>Мы не хотели убедиться, что 8% больше, чем 6%, да и цифра 1000 звонков для робота и операторов была выбрана наугад. Мы хотели рассчитать <b>минимальное количество звонков, чтобы с уровнем уверенности 95% зафиксировать статистическую значимость разницы между 8% и 6%.<\/b><\/p>\n<p>1000 звонков нам оказалось точно достаточно. Теперь нам остается уменьшать это число до той поры, пока p-значение не пересечет границу 95%. (По формуле нормального распределения, кстати, это будет соответствовать Z-оценке, равной 1,6449 — попробуйте проверить.)<\/p>\n<p>В теории, наверное, можно было бы вывести большую формулу для расчета такого <i>n,<\/i> при котором p-значение будет равно 0,95. На практике, быстрее окажется вручную подобрать минимальное n. Или, еще лучше, воспользоваться в Excel инструментом <b>Данные — Анализ «что, если» — Подбор параметра:<\/b><\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/kupivip_robot_07.PNG\" width=\"797\" height=\"186\" alt=\"\" \/>\n<\/div>\n<p>(Убедитесь только, что число звонков робота ровно то же самое, что и число звонков оператора, т. е. вы указали =C6 в ячейке C7).<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/kupivip_robot_08.PNG\" width=\"817\" height=\"185\" alt=\"\" \/>\n<\/div>\n<h2>Выводы<\/h2>\n<p>Итак, мы вычислили минимальные условия эксперимента для оценки эффективности голосового робота для KupiVIP.<\/p>\n<p><b>Нужно не менее 878 звонков в каждой из двух групп, чтобы с уровнем достоверности 95% подтвердить наличие разницы между 6% активаций промокодов в контрольной группе (реальные сотрудники) и 8% в тестовой группе (голосовой робот).<\/b><\/p>\n<p>(Единственное, ни 6%, ни 8% не дают целого числа активаций на выборке из 878 звонков, и, в реальности, конечно, цифры будут другие, причем число звонков в двух группах вообще может быть различным. Но, на самом деле, это не имеет большого значения, т. к., наверняка, в статье были приведены округленные значения конверсий).<\/p>\n<h2>См. также:<\/h2>\n<p><a href=\"https:\/\/abtestguide.com\/calc\/?ua=1000&ub=1000&ca=60&cb=80\">https:\/\/abtestguide.com\/calc\/?ua=1000&ub=1000&ca=60&cb=80<\/a><\/p>\n",
            "date_published": "2019-07-20T13:18:48+03:00",
            "date_modified": "2019-07-20T14:35:26+03:00",
            "image": "https:\/\/mathandcoffee.ru\/pictures\/CodeCogsEqn03.png",
            "_date_published_rfc2822": "Sat, 20 Jul 2019 13:18:48 +0300",
            "_rss_guid_is_permalink": "false",
            "_rss_guid": "27",
            "_e2_data": {
                "is_favourite": false,
                "links_required": [
                    "system\/library\/highlight\/highlight.js",
                    "system\/library\/highlight\/highlight.css",
                    "system\/library\/highlight\/highlight.js",
                    "system\/library\/highlight\/highlight.css"
                ],
                "og_images": [
                    "https:\/\/mathandcoffee.ru\/pictures\/CodeCogsEqn03.png",
                    "https:\/\/mathandcoffee.ru\/pictures\/kupivip_robot_00.PNG",
                    "https:\/\/mathandcoffee.ru\/pictures\/kupivip_robot_01.PNG",
                    "https:\/\/mathandcoffee.ru\/pictures\/CodeCogsEqn.png",
                    "https:\/\/mathandcoffee.ru\/pictures\/kupivip_robot_02.PNG",
                    "https:\/\/mathandcoffee.ru\/pictures\/CodeCogsEqn02.png",
                    "https:\/\/mathandcoffee.ru\/pictures\/kupivip_robot_03.PNG",
                    "https:\/\/mathandcoffee.ru\/pictures\/kupivip_robot_04.PNG",
                    "https:\/\/mathandcoffee.ru\/pictures\/kupivip_robot_05.PNG",
                    "https:\/\/mathandcoffee.ru\/pictures\/kupivip_robot_06.PNG",
                    "https:\/\/mathandcoffee.ru\/pictures\/kupivip_robot_07.PNG",
                    "https:\/\/mathandcoffee.ru\/pictures\/kupivip_robot_08.PNG"
                ]
            }
        },
        {
            "id": "12",
            "url": "https:\/\/mathandcoffee.ru\/all\/kachestvo-zvonkov-skolko-proslushat\/",
            "title": "Качество звонков: сколько нужно прослушать",
            "content_html": "<p>Распространенным инструментом оценки качества работы менеджеров отдела продаж является <b>аудит качества телефонных звонков,<\/b> «прослушка».<\/p>\n<p>Предположим, вы задались целью не просто <b>замерить<\/b> качество телефонных звонков, но <b>зафиксировать <i>рост<\/i> этого качества.<\/b> Например, провели обучение (тренинг) менеджеров, либо предложили новую мотивацию за соблюдение стандартов качества, либо что-то еще.<\/p>\n<p>Логично предположить, что рост качества в первом попавшемся, после тренинга, звонке, не будет однозначно свидетельствовать о росте качества в остальных звонках. Скорее всего, и второй удачный звонок тоже однозначно не подтвердит гипотезу, что качество выросло.<\/p>\n<p>Таким образом, речь будет идти о том, что вам придется прослушать если не все, то, по крайней мере, достаточное число звонков после введенных вами изменений, и число звонков, которые необходимо будет прослушать, на самом деле, <b>можно однозначно рассчитать.<\/b><\/p>\n<h2>Считаем размер выборки<\/h2>\n<p>На 15-й странице работы «<a href=\"https:\/\/people.ucsc.edu\/~dgbonett\/docs\/wrkshp\/LectureNotes.pdf\">Планирование размеров выборки для исследований в бихевиоризме<\/a>» мне попался подходящий пример 2.4 и формула для расчета таких выборок:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/samplesize00.PNG\" width=\"858\" height=\"506\" alt=\"\" \/>\n<\/div>\n<p>В данном примере рассматривается изменение оценки <a href=\"https:\/\/ru.wikipedia.org\/wiki\/ACT\">ACT<\/a>-теста по математике с 24,5 (дисперсия 8,2) до 26,0 баллов при &alpha; = 0,05 и мощности = 0,90.<\/p>\n<p>Для удобства работы, я собрал приведенную формулу в Гугл-таблицах:<br \/>\n<a href=\"https:\/\/docs.google.com\/spreadsheets\/d\/1c1J88P0i0gmDFpOtfDIkPt-C0HKJOWACbSWVZTx2kL8\/edit?usp=sharing\">Калькулятор размера выборки<\/a><\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/samplesize01.PNG\" width=\"865\" height=\"346\" alt=\"\" \/>\n<\/div>\n<p>Вам остается скопировать файл, и можете подставлять нужные вам значения. Достоверность разумно выбирать от 80% до 95%, значение мощности — от 60% до 80%. Указываете средний балл оценки звонков до изменений, стандартное отклонение (SD) оценки звонков «до», и ожидаемый средний балл оценки звонков после изменений.<\/p>\n<h2>Верификация полученных результатов<\/h2>\n<p>Важно понимать, что, даже прослушав требуемое количество звонков «после», все равно необходимо проверять наличие статистически значимых различий через <a href=\"http:\/\/n4d-d.xyz\/all\/a-b-test-maksimalno-prosto\/\">калькулятор А\/Б-тестов<\/a>.<\/p>\n<h2>См. также:<\/h2>\n<p><a href=\"https:\/\/habr.com\/ru\/post\/339798\/\">https:\/\/habr.com\/ru\/post\/339798\/<\/a><br \/>\n<a href=\"https:\/\/people.ucsc.edu\/~dgbonett\/docs\/wrkshp\/LectureNotes.pdf\">https:\/\/people.ucsc.edu\/~dgbonett\/docs\/wrkshp\/LectureNotes.pdf<\/a><\/p>\n",
            "date_published": "2019-05-26T16:46:00+03:00",
            "date_modified": "2026-04-18T14:39:56+03:00",
            "image": "https:\/\/mathandcoffee.ru\/pictures\/samplesize00.PNG",
            "_date_published_rfc2822": "Sun, 26 May 2019 16:46:00 +0300",
            "_rss_guid_is_permalink": "false",
            "_rss_guid": "12",
            "_e2_data": {
                "is_favourite": false,
                "links_required": [],
                "og_images": [
                    "https:\/\/mathandcoffee.ru\/pictures\/samplesize00.PNG",
                    "https:\/\/mathandcoffee.ru\/pictures\/samplesize01.PNG"
                ]
            }
        }
    ],
    "_e2_version": 3565,
    "_e2_ua_string": "E2 (v3565; Aegea)"
}