<?xml version="1.0" encoding="utf-8"?> 
<rss version="2.0"
  xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd"
  xmlns:atom="http://www.w3.org/2005/Atom">

<channel>

<title>Математика и кофе: заметки с тегом Стьюдент</title>
<link>https://mathandcoffee.ru/tags/styudent/</link>
<description>Отделы продаж, коллцентры, аналитика, цифры и данные, воронки продаж, матстатистика..</description>
<author>Иван Балдин</author>
<language>ru</language>
<generator>E2 (v3565; Aegea)</generator>

<itunes:owner>
<itunes:name>Иван Балдин</itunes:name>
<itunes:email></itunes:email>
</itunes:owner>
<itunes:subtitle>Отделы продаж, коллцентры, аналитика, цифры и данные, воронки продаж, матстатистика..</itunes:subtitle>
<itunes:image href="" />
<itunes:explicit></itunes:explicit>

<item>
<title>t-Критерий Стьюдента</title>
<guid isPermaLink="false">5</guid>
<link>https://mathandcoffee.ru/all/t-kriteriy-styudenta/</link>
<pubDate>Mon, 15 Apr 2019 11:44:02 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/t-kriteriy-styudenta/</comments>
<description>
&lt;p&gt;Если однажды перед вами оказывались два набора похожих данных, вам, вероятно, приходило в голову задаться вопросом: насколько эти данные различаются между собой? Или, что еще более важно, наблюдаются ли &lt;i&gt;статистически значимые&lt;/i&gt; различия между этими выборками?&lt;/p&gt;
&lt;p&gt;Поясню, о чем идет речь.&lt;/p&gt;
&lt;p&gt;Допустим, вы проанализировали звонки за прошедший год и обратили внимание, что &lt;b&gt;среднее время звонка в первой половине дня — 2 мин 45 сек, а во второй половине дня — 2 мин 57 сек.&lt;/b&gt; Следует ли из этого, что звонки после обеда в среднем длятся дольше? Или это простое совпадение, и, возьми вы звонки за год до этого, вы бы увидели другую картину?&lt;/p&gt;
&lt;p&gt;Или, например, вы замеряли уровень гемоглобина у контрольной группы до начала исследований нового лекарства, и после. Предположим, &lt;b&gt;средний уровень вырос с 142,5 г/л до 147,1 г/л.&lt;/b&gt; Достаточно ли опираться на увеличение среднего, чтобы сделать заключение об эффективности лекарства? Или, возможно, исследование нужно повторить? Увеличив размер контрольной группы, например?&lt;/p&gt;
&lt;p&gt;Уже из постановки вопроса очевидно, что &lt;b&gt;одной разницы между средними в двух выборках недостаточно, чтобы научно подтвердить их различие.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Вот почему мы обратимся к &lt;b&gt;формуле расчета&lt;/b&gt; и &lt;b&gt;таблице значений t-критериев Стьюдента,&lt;/b&gt; чтобы научиться делать &lt;i&gt;математически корректные&lt;/i&gt; выводы о &lt;i&gt;статистически значимых&lt;/i&gt; различиях между двумя выборками. Или, другими словами, научиться видеть разницу, когда она не заметна, или игнорировать ее, даже если кажется, что она есть.&lt;/p&gt;
&lt;p&gt;Рассмотрим вопрос на примере.&lt;/p&gt;
&lt;h2&gt;Анализ длительности звонков Асланян и Евтушенко&lt;/h2&gt;
&lt;p&gt;В вашем отделе продаж работают 2 менеджера — Ольга Асланян и Кирилл Евтушенко. Вы получили данные по длительности их разговоров с покупателями и хотите проверить гипотезу, что разговоры Асланян в среднем длятся дольше разговоров Евтушенко.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/student01.PNG" width="694" height="474" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Посчитаем среднюю длительность звонка, стандартное отклонение и число звонков, которые попали в выборке.&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=СРЗНАЧ(B2:B999)&lt;/code&gt;&lt;/pre&gt;&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=СТАНДОТКЛОН(B2:B999)&lt;/code&gt;&lt;/pre&gt;&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=СЧЁТ(B2:B999)&lt;/code&gt;&lt;/pre&gt;&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/student02.PNG" width="696" height="403" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;В среднем, звонки Асланян длятся на 34,5 сек дольше звонков Евтушенко. (Кроме того, разброс длительности ее звонков больше, т. к. больше стандартное отклонение. Грубо говоря, короткие и длинные звонки у Асланян найти проще, чем у Евтушенко).&lt;/p&gt;
&lt;p&gt;Достаточно ли полученных данных, чтобы сделать вывод о правильности гипотезы, что Асланян в среднем дольше общается с клиентами, чем Евтушенко? На самом деле, нет. Всегда существует вероятность, что в выборку Асланян случайно попали более длинные звонки, а в выборку Евтушенко — более короткие. Чем больше звонков доступно для анализа (а нам достались 242 и 209 звонков, что не так уж и мало), тем более надежен результат, но он никогда не надежен на 100%.&lt;/p&gt;
&lt;p&gt;Впрочем, надежность 100% нам и не нужна. Не ракету к Марсу запускаем. Даже если нам удастся проверить нашу гипотезу с вероятностью 90-95%, этого будет вполне достаточно для большинства случаев. Пускай мы оставим себе шанс ошибиться в 5-10% случаев, зато нам не нужно будет ждать несколько лет, чтобы накопить достаточно данных для анализа, и управленческие решения (разбор звонков с менеджером, анализ продаж, корректировки скриптов) мы сможем принять уже сейчас.&lt;/p&gt;
&lt;p&gt;Рассмотрим два способа, как нам проверить, случайность ли, что звонки Асланян в среднем длиннее звонков Евтушенко.&lt;/p&gt;
&lt;h2&gt;Проверка гипотезы о равенстве среднего. Простой способ&lt;/h2&gt;
&lt;p&gt;И в Google Таблицах, и в Microsoft Excel, есть &lt;b&gt;функция ТТЕСТ.&lt;/b&gt; Воспользуемся ей для анализа наших выборок.&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=ТТЕСТ(B2:B999;C2:C999;2;3)&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;У функции 4 атрибута, идущие через точку с запятой.&lt;/p&gt;
&lt;ol start="1"&gt;
&lt;li&gt;Диапазон ячеек, содержащих первую выборку.&lt;/li&gt;
&lt;li&gt;Диапазон ячеек, содержащих вторую выборку.&lt;/li&gt;
&lt;li&gt;Количество хвостов распределения. Выбираем «2», чтобы проверить наличие различий вообще, и «1», чтобы проверить, звонки Асланян длиннее, а не наоборот.&lt;/li&gt;
&lt;li&gt;Тип применения t-критерия. По умолчанию выбираем «3». («2» выбираем если стандартные отклонения очень близки, «1» — если, например, вы сравниваете средний балл &lt;i&gt;одних и тех же учеников&lt;/i&gt; на начало и конец года попарно.)&lt;/li&gt;
&lt;/ol&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/student03.PNG" width="694" height="429" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Итак, Т-тест дал вероятность 0,04595, или, округленно, 4,6%.&lt;/p&gt;
&lt;p&gt;Что же это за вероятность? В нашем примере это вероятность того, &lt;b&gt;что статистически значимые различия между звонками Асланян и Евтушенко отсутствуют.&lt;/b&gt; Технически, это вероятность, что наша «нулевая гипотеза» («нет разницы между выборками») была верна, а «альтернативная» («Асланян общается с покупателями дольше Евтушенко») — неверна.&lt;/p&gt;
&lt;p&gt;Оставшиеся 95,4% составляют вероятность того, что между выборками есть статистические различия, и «альтернативная гипотеза» о различиях между выборками верна.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Вывод: с вероятностью 95,4% Асланян, действительно, в среднем общается с клиентами дольше Евтушенко. (С вероятностью 4,6% статистически значих различий между их звонками нет).&lt;/b&gt;&lt;/p&gt;
&lt;h2&gt;Проверка гипотезы о равенстве среднего. Сложный способ&lt;/h2&gt;
&lt;p&gt;Сложный способ будет состоит из двух этапов: расчет t-критерия Стьюдента и сравнение полученного значения t-критерия с контрольным.&lt;/p&gt;
&lt;p&gt;На первом этапе рассчитаем t-критерий Стьюдента по следующей формуле:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/kriteriy_styudenta.jpg" width="247" height="157" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;X&lt;sub&gt;1&lt;/sub&gt; и X&lt;sub&gt;2&lt;/sub&gt; — средняя длина звонков в первой и второй выборке (238,6 сек и 204,1 сек)&lt;br /&gt;
s&lt;sub&gt;1&lt;/sub&gt; и s&lt;sub&gt;2&lt;/sub&gt; — стандартные отклонения первой и второй выборок в квадрате (их дисперсии, другими словами) (201,2&lt;sup&gt;2&lt;/sup&gt; и 164,7&lt;sup&gt;2&lt;/sup&gt; для наших выборок)&lt;br /&gt;
n&lt;sub&gt;1&lt;/sub&gt; и n&lt;sub&gt;2&lt;/sub&gt; — число звонков в первой и второй выборках (242 и 209 звонков)&lt;/p&gt;
&lt;p&gt;Воспользуемся листочком бумаги и калькулятором, или же посчитаем все прямо в Google Таблицах:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/student04.PNG" width="751" height="372" alt="" /&gt;
&lt;/div&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=(F2-G2)/КОРЕНЬ(F3^2/F4+G3^2/G4)&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;t-Критерий равен 2,0014.&lt;/p&gt;
&lt;p&gt;Осталось разобраться, что делать с вычисленным значением нашего t-критерия.&lt;/p&gt;
&lt;p&gt;Но перед этим посчитаем число степеней свободы по формуле n&lt;sub&gt;1&lt;/sub&gt;+n&lt;sub&gt;2&lt;/sub&gt;-2:&lt;/p&gt;
&lt;p&gt;242 + 209 — 2 = 449 степеней свободы&lt;/p&gt;
&lt;p&gt;Воспользуемся теперь &lt;a href="https://ru.wikipedia.org/wiki/%D0%9A%D0%B2%D0%B0%D0%BD%D1%82%D0%B8%D0%BB%D0%B8_%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D1%8F_%D0%A1%D1%82%D1%8C%D1%8E%D0%B4%D0%B5%D0%BD%D1%82%D0%B0"&gt;таблицей коэффициентов Стьюдента&lt;/a&gt; из Википедии, найдя строку, соответствующую нашим 449 степеням свободы.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/student05.PNG" width="1302" height="88" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;В нашем случае, строки именно для числа 449 нет, зато несложно заметить, что значения для 100 и 1000 — ближайших подходящих строк — отличаются на сотые доли, поэтому для большого числа степеней свободны подойдет любая строка.&lt;/p&gt;
&lt;p&gt;Наше значение 2,0014 находится между 1,9623 и 2,3301: 1,9623 &lt; 2,0014 &lt; 2,3301&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/student05.PNG" width="1302" height="88" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;В шапке таблицы это соответствует 95%-му и 98%-му квантилю распределения Стьюдента, т. е. мы захватили 95%-й квантиль, но не захватили 98%-й:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/student06.PNG" width="1303" height="90" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;&lt;b&gt;Если расчетное значение t-критерия Стьюдента больше контрольного, значит, «альтернативная гипотеза» верна с соответствующей вероятностью (95%), и выборки статистически различаются.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Если бы мы получили значение t-критерия больше, чем 2,3301 (98%), мы бы могли говорить по правильности «альтернативной гипотезы» уже с 98%-й вероятностью. Аналогично, если бы мы получили значение t-критерия меньше, чем 1,9623 (95%), но больше 1,6464 (90%), мы бы говорили о правильности гипотезы на 90%.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Вывод: расчетное значение t-критерия Стьюдента 2,0014 соответствует, по меньшей мере, 95% уверенности в том, что между выборками есть статистически значимые различия, и звонки Асланян, действительно, в среднем длиннее звонков Евтушенко.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Наша «альтернативная гипотеза» получила 95%-ое подтверждение, мы можем быть уверены в результате и принимать решение о дальнейшей работе с полученный информацией.&lt;/p&gt;
&lt;h2&gt;Полезные ссылки&lt;/h2&gt;
&lt;p&gt;&lt;a href="http://www.evanmiller.org/ab-testing/t-test.html"&gt;http://www.evanmiller.org/ab-testing/t-test.html&lt;/a&gt;&lt;/p&gt;
</description>
</item>


</channel>
</rss>