{
    "version": "https:\/\/jsonfeed.org\/version\/1",
    "title": "Математика и кофе: заметки с тегом Стьюдент",
    "_rss_description": "Отделы продаж, коллцентры, аналитика, цифры и данные, воронки продаж, матстатистика..",
    "_rss_language": "ru",
    "_itunes_email": "",
    "_itunes_categories_xml": "",
    "_itunes_image": "",
    "_itunes_explicit": "",
    "home_page_url": "https:\/\/mathandcoffee.ru\/tags\/styudent\/",
    "feed_url": "https:\/\/mathandcoffee.ru\/tags\/styudent\/json\/",
    "icon": "https:\/\/mathandcoffee.ru\/user\/userpic@2x.jpg?1559386410",
    "author": {
        "name": "Иван Балдин",
        "url": "https:\/\/mathandcoffee.ru\/",
        "avatar": "https:\/\/mathandcoffee.ru\/user\/userpic@2x.jpg?1559386410"
    },
    "items": [
        {
            "id": "5",
            "url": "https:\/\/mathandcoffee.ru\/all\/t-kriteriy-styudenta\/",
            "title": "t-Критерий Стьюдента",
            "content_html": "<p>Если однажды перед вами оказывались два набора похожих данных, вам, вероятно, приходило в голову задаться вопросом: насколько эти данные различаются между собой? Или, что еще более важно, наблюдаются ли <i>статистически значимые<\/i> различия между этими выборками?<\/p>\n<p>Поясню, о чем идет речь.<\/p>\n<p>Допустим, вы проанализировали звонки за прошедший год и обратили внимание, что <b>среднее время звонка в первой половине дня — 2 мин 45 сек, а во второй половине дня — 2 мин 57 сек.<\/b> Следует ли из этого, что звонки после обеда в среднем длятся дольше? Или это простое совпадение, и, возьми вы звонки за год до этого, вы бы увидели другую картину?<\/p>\n<p>Или, например, вы замеряли уровень гемоглобина у контрольной группы до начала исследований нового лекарства, и после. Предположим, <b>средний уровень вырос с 142,5 г\/л до 147,1 г\/л.<\/b> Достаточно ли опираться на увеличение среднего, чтобы сделать заключение об эффективности лекарства? Или, возможно, исследование нужно повторить? Увеличив размер контрольной группы, например?<\/p>\n<p>Уже из постановки вопроса очевидно, что <b>одной разницы между средними в двух выборках недостаточно, чтобы научно подтвердить их различие.<\/b><\/p>\n<p>Вот почему мы обратимся к <b>формуле расчета<\/b> и <b>таблице значений t-критериев Стьюдента,<\/b> чтобы научиться делать <i>математически корректные<\/i> выводы о <i>статистически значимых<\/i> различиях между двумя выборками. Или, другими словами, научиться видеть разницу, когда она не заметна, или игнорировать ее, даже если кажется, что она есть.<\/p>\n<p>Рассмотрим вопрос на примере.<\/p>\n<h2>Анализ длительности звонков Асланян и Евтушенко<\/h2>\n<p>В вашем отделе продаж работают 2 менеджера — Ольга Асланян и Кирилл Евтушенко. Вы получили данные по длительности их разговоров с покупателями и хотите проверить гипотезу, что разговоры Асланян в среднем длятся дольше разговоров Евтушенко.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/student01.PNG\" width=\"694\" height=\"474\" alt=\"\" \/>\n<\/div>\n<p>Посчитаем среднюю длительность звонка, стандартное отклонение и число звонков, которые попали в выборке.<\/p>\n<pre class=\"e2-text-code\"><code class=\"\">=СРЗНАЧ(B2:B999)<\/code><\/pre><pre class=\"e2-text-code\"><code class=\"\">=СТАНДОТКЛОН(B2:B999)<\/code><\/pre><pre class=\"e2-text-code\"><code class=\"\">=СЧЁТ(B2:B999)<\/code><\/pre><div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/student02.PNG\" width=\"696\" height=\"403\" alt=\"\" \/>\n<\/div>\n<p>В среднем, звонки Асланян длятся на 34,5 сек дольше звонков Евтушенко. (Кроме того, разброс длительности ее звонков больше, т. к. больше стандартное отклонение. Грубо говоря, короткие и длинные звонки у Асланян найти проще, чем у Евтушенко).<\/p>\n<p>Достаточно ли полученных данных, чтобы сделать вывод о правильности гипотезы, что Асланян в среднем дольше общается с клиентами, чем Евтушенко? На самом деле, нет. Всегда существует вероятность, что в выборку Асланян случайно попали более длинные звонки, а в выборку Евтушенко — более короткие. Чем больше звонков доступно для анализа (а нам достались 242 и 209 звонков, что не так уж и мало), тем более надежен результат, но он никогда не надежен на 100%.<\/p>\n<p>Впрочем, надежность 100% нам и не нужна. Не ракету к Марсу запускаем. Даже если нам удастся проверить нашу гипотезу с вероятностью 90-95%, этого будет вполне достаточно для большинства случаев. Пускай мы оставим себе шанс ошибиться в 5-10% случаев, зато нам не нужно будет ждать несколько лет, чтобы накопить достаточно данных для анализа, и управленческие решения (разбор звонков с менеджером, анализ продаж, корректировки скриптов) мы сможем принять уже сейчас.<\/p>\n<p>Рассмотрим два способа, как нам проверить, случайность ли, что звонки Асланян в среднем длиннее звонков Евтушенко.<\/p>\n<h2>Проверка гипотезы о равенстве среднего. Простой способ<\/h2>\n<p>И в Google Таблицах, и в Microsoft Excel, есть <b>функция ТТЕСТ.<\/b> Воспользуемся ей для анализа наших выборок.<\/p>\n<pre class=\"e2-text-code\"><code class=\"\">=ТТЕСТ(B2:B999;C2:C999;2;3)<\/code><\/pre><p>У функции 4 атрибута, идущие через точку с запятой.<\/p>\n<ol start=\"1\">\n<li>Диапазон ячеек, содержащих первую выборку.<\/li>\n<li>Диапазон ячеек, содержащих вторую выборку.<\/li>\n<li>Количество хвостов распределения. Выбираем «2», чтобы проверить наличие различий вообще, и «1», чтобы проверить, звонки Асланян длиннее, а не наоборот.<\/li>\n<li>Тип применения t-критерия. По умолчанию выбираем «3». («2» выбираем если стандартные отклонения очень близки, «1» — если, например, вы сравниваете средний балл <i>одних и тех же учеников<\/i> на начало и конец года попарно.)<\/li>\n<\/ol>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/student03.PNG\" width=\"694\" height=\"429\" alt=\"\" \/>\n<\/div>\n<p>Итак, Т-тест дал вероятность 0,04595, или, округленно, 4,6%.<\/p>\n<p>Что же это за вероятность? В нашем примере это вероятность того, <b>что статистически значимые различия между звонками Асланян и Евтушенко отсутствуют.<\/b> Технически, это вероятность, что наша «нулевая гипотеза» («нет разницы между выборками») была верна, а «альтернативная» («Асланян общается с покупателями дольше Евтушенко») — неверна.<\/p>\n<p>Оставшиеся 95,4% составляют вероятность того, что между выборками есть статистические различия, и «альтернативная гипотеза» о различиях между выборками верна.<\/p>\n<p><b>Вывод: с вероятностью 95,4% Асланян, действительно, в среднем общается с клиентами дольше Евтушенко. (С вероятностью 4,6% статистически значих различий между их звонками нет).<\/b><\/p>\n<h2>Проверка гипотезы о равенстве среднего. Сложный способ<\/h2>\n<p>Сложный способ будет состоит из двух этапов: расчет t-критерия Стьюдента и сравнение полученного значения t-критерия с контрольным.<\/p>\n<p>На первом этапе рассчитаем t-критерий Стьюдента по следующей формуле:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/kriteriy_styudenta.jpg\" width=\"247\" height=\"157\" alt=\"\" \/>\n<\/div>\n<p>X<sub>1<\/sub> и X<sub>2<\/sub> — средняя длина звонков в первой и второй выборке (238,6 сек и 204,1 сек)<br \/>\ns<sub>1<\/sub> и s<sub>2<\/sub> — стандартные отклонения первой и второй выборок в квадрате (их дисперсии, другими словами) (201,2<sup>2<\/sup> и 164,7<sup>2<\/sup> для наших выборок)<br \/>\nn<sub>1<\/sub> и n<sub>2<\/sub> — число звонков в первой и второй выборках (242 и 209 звонков)<\/p>\n<p>Воспользуемся листочком бумаги и калькулятором, или же посчитаем все прямо в Google Таблицах:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/student04.PNG\" width=\"751\" height=\"372\" alt=\"\" \/>\n<\/div>\n<pre class=\"e2-text-code\"><code class=\"\">=(F2-G2)\/КОРЕНЬ(F3^2\/F4+G3^2\/G4)<\/code><\/pre><p>t-Критерий равен 2,0014.<\/p>\n<p>Осталось разобраться, что делать с вычисленным значением нашего t-критерия.<\/p>\n<p>Но перед этим посчитаем число степеней свободы по формуле n<sub>1<\/sub>+n<sub>2<\/sub>-2:<\/p>\n<p>242 + 209 — 2 = 449 степеней свободы<\/p>\n<p>Воспользуемся теперь <a href=\"https:\/\/ru.wikipedia.org\/wiki\/%D0%9A%D0%B2%D0%B0%D0%BD%D1%82%D0%B8%D0%BB%D0%B8_%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D1%8F_%D0%A1%D1%82%D1%8C%D1%8E%D0%B4%D0%B5%D0%BD%D1%82%D0%B0\">таблицей коэффициентов Стьюдента<\/a> из Википедии, найдя строку, соответствующую нашим 449 степеням свободы.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/student05.PNG\" width=\"1302\" height=\"88\" alt=\"\" \/>\n<\/div>\n<p>В нашем случае, строки именно для числа 449 нет, зато несложно заметить, что значения для 100 и 1000 — ближайших подходящих строк — отличаются на сотые доли, поэтому для большого числа степеней свободны подойдет любая строка.<\/p>\n<p>Наше значение 2,0014 находится между 1,9623 и 2,3301: 1,9623 < 2,0014 < 2,3301<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/student05.PNG\" width=\"1302\" height=\"88\" alt=\"\" \/>\n<\/div>\n<p>В шапке таблицы это соответствует 95%-му и 98%-му квантилю распределения Стьюдента, т. е. мы захватили 95%-й квантиль, но не захватили 98%-й:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/student06.PNG\" width=\"1303\" height=\"90\" alt=\"\" \/>\n<\/div>\n<p><b>Если расчетное значение t-критерия Стьюдента больше контрольного, значит, «альтернативная гипотеза» верна с соответствующей вероятностью (95%), и выборки статистически различаются.<\/b><\/p>\n<p>Если бы мы получили значение t-критерия больше, чем 2,3301 (98%), мы бы могли говорить по правильности «альтернативной гипотезы» уже с 98%-й вероятностью. Аналогично, если бы мы получили значение t-критерия меньше, чем 1,9623 (95%), но больше 1,6464 (90%), мы бы говорили о правильности гипотезы на 90%.<\/p>\n<p><b>Вывод: расчетное значение t-критерия Стьюдента 2,0014 соответствует, по меньшей мере, 95% уверенности в том, что между выборками есть статистически значимые различия, и звонки Асланян, действительно, в среднем длиннее звонков Евтушенко.<\/b><\/p>\n<p>Наша «альтернативная гипотеза» получила 95%-ое подтверждение, мы можем быть уверены в результате и принимать решение о дальнейшей работе с полученный информацией.<\/p>\n<h2>Полезные ссылки<\/h2>\n<p><a href=\"http:\/\/www.evanmiller.org\/ab-testing\/t-test.html\">http:\/\/www.evanmiller.org\/ab-testing\/t-test.html<\/a><\/p>\n",
            "date_published": "2019-04-15T11:44:02+03:00",
            "date_modified": "2019-06-15T13:52:59+03:00",
            "image": "https:\/\/mathandcoffee.ru\/pictures\/student01.PNG",
            "_date_published_rfc2822": "Mon, 15 Apr 2019 11:44:02 +0300",
            "_rss_guid_is_permalink": "false",
            "_rss_guid": "5",
            "_e2_data": {
                "is_favourite": false,
                "links_required": [
                    "system\/library\/highlight\/highlight.js",
                    "system\/library\/highlight\/highlight.css",
                    "system\/library\/highlight\/highlight.js",
                    "system\/library\/highlight\/highlight.css",
                    "system\/library\/highlight\/highlight.js",
                    "system\/library\/highlight\/highlight.css",
                    "system\/library\/highlight\/highlight.js",
                    "system\/library\/highlight\/highlight.css",
                    "system\/library\/highlight\/highlight.js",
                    "system\/library\/highlight\/highlight.css",
                    "system\/library\/highlight\/highlight.js",
                    "system\/library\/highlight\/highlight.css",
                    "system\/library\/highlight\/highlight.js",
                    "system\/library\/highlight\/highlight.css",
                    "system\/library\/highlight\/highlight.js",
                    "system\/library\/highlight\/highlight.css",
                    "system\/library\/highlight\/highlight.js",
                    "system\/library\/highlight\/highlight.css",
                    "system\/library\/highlight\/highlight.js",
                    "system\/library\/highlight\/highlight.css"
                ],
                "og_images": [
                    "https:\/\/mathandcoffee.ru\/pictures\/student01.PNG",
                    "https:\/\/mathandcoffee.ru\/pictures\/student02.PNG",
                    "https:\/\/mathandcoffee.ru\/pictures\/student03.PNG",
                    "https:\/\/mathandcoffee.ru\/pictures\/kriteriy_styudenta.jpg",
                    "https:\/\/mathandcoffee.ru\/pictures\/student04.PNG",
                    "https:\/\/mathandcoffee.ru\/pictures\/student05.PNG",
                    "https:\/\/mathandcoffee.ru\/pictures\/student06.PNG"
                ]
            }
        }
    ],
    "_e2_version": 3565,
    "_e2_ua_string": "E2 (v3565; Aegea)"
}