<?xml version="1.0" encoding="utf-8"?> 
<rss version="2.0"
  xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd"
  xmlns:atom="http://www.w3.org/2005/Atom">

<channel>

<title>Математика и кофе: заметки с тегом рейтинги</title>
<link>https://mathandcoffee.ru/tags/reytingi/</link>
<description>Отделы продаж, коллцентры, аналитика, цифры и данные, воронки продаж, матстатистика..</description>
<author>Иван Балдин</author>
<language>ru</language>
<generator>E2 (v3565; Aegea)</generator>

<itunes:owner>
<itunes:name>Иван Балдин</itunes:name>
<itunes:email></itunes:email>
</itunes:owner>
<itunes:subtitle>Отделы продаж, коллцентры, аналитика, цифры и данные, воронки продаж, матстатистика..</itunes:subtitle>
<itunes:image href="" />
<itunes:explicit></itunes:explicit>

<item>
<title>Продвинутый способ расчета рейтингов</title>
<guid isPermaLink="false">16</guid>
<link>https://mathandcoffee.ru/all/prodvinuty-sposob-rascheta-reytingov/</link>
<pubDate>Sat, 21 Sep 2019 15:59:00 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/prodvinuty-sposob-rascheta-reytingov/</comments>
<description>
&lt;p&gt;Крайне любопытная статья на сайте EvanMiller.org, &lt;a href="https://www.evanmiller.org/ranking-items-with-star-ratings.html" class="nu"&gt;«&lt;u&gt;Ranking Items With Star Ratings&lt;/u&gt;»&lt;/a&gt;, предлагает &lt;b&gt;продвинутый способ расчета рейтингов,&lt;/b&gt; например, по пятибалльной шкале.&lt;/p&gt;
&lt;p&gt;(Вообще, судя по интонации автора, история с рейтингами и методиками их расчета не так проста, как может показаться, и он &lt;a href="https://www.evanmiller.org/how-not-to-sort-by-average-rating.html"&gt;неоднократно к ней возвращается&lt;/a&gt;.)&lt;/p&gt;
&lt;p&gt;Из того, что удалось понять: во-первых, расчет &lt;b&gt;среднего рейтинга&lt;/b&gt; не всегда позволяет однозначно определить место объекта относительно остальных объектов — например, средние рейтинги могут, банально, совпадать. Во-вторых, средний рейтинг не учитывает количество голосов, ведь по идее, чем больше голосов участвует в расчете рейтинга, тем надежнее этот рейтинг.&lt;/p&gt;
&lt;p&gt;Простой пример — оценки двух сотрудников:&lt;/p&gt;
&lt;p&gt;Осипов — 5, 5, 5, 5, 5, 2, 2, 2, 2, 2. &lt;b&gt;Среднее = 3,50.&lt;/b&gt;&lt;br /&gt;
Сухонцев — 4, 4, 3, 3. &lt;b&gt;Среднее = 3,50.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Неразрешимая, на первый взгляд, ситуация решается методами &lt;a href="https://ru.wikipedia.org/wiki/%D0%91%D0%B0%D0%B9%D0%B5%D1%81%D0%BE%D0%B2%D1%81%D0%BA%D0%B0%D1%8F_%D1%81%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0"&gt;байесовской статистики&lt;/a&gt; (что бы конкретно это здесь ни значило), вуаля:&lt;/p&gt;
&lt;p&gt;Осипов — &lt;b&gt;2,72.&lt;/b&gt;&lt;br /&gt;
Сухонцев — &lt;b&gt;2,63.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Чудесным образом то ли меньшее среднеквадратичное отклонение (0,58 против 1,58), то ли меньшее количество оценок (4 против 10), то ли все они вместе &lt;b&gt;уточнили&lt;/b&gt; средний рейтинг Сухонцева, отдав ему предпочтение в несколько сотых.&lt;/p&gt;
&lt;h2&gt;Формула продвинутого расчета среднего рейтинга&lt;/h2&gt;
&lt;p&gt;Приготовьтесь, будет немного больно.&lt;/p&gt;
&lt;p&gt;Итак, &lt;a href="https://www.evanmiller.org/ranking-items-with-star-ratings.html#setup"&gt;предполагается&lt;/a&gt;, что у нас есть &lt;i&gt;&lt;b&gt;K&lt;/b&gt;&lt;/i&gt; возможных оценок, считаемых по &lt;i&gt;&lt;b&gt;k,&lt;/b&gt;&lt;/i&gt; каждая оценка стоит &lt;i&gt;&lt;b&gt;s&lt;sub&gt;k&lt;/sub&gt;&lt;/b&gt;&lt;/i&gt; баллов («1» — это 1 балл, «2» — это 2 балла и т. д.). Имея &lt;i&gt;&lt;b&gt;N&lt;/b&gt;&lt;/i&gt; полученных оценок для каждого объекта, по &lt;i&gt;&lt;b&gt;n&lt;sub&gt;k&lt;/sub&gt;&lt;/b&gt;&lt;/i&gt; оценок для каждого &lt;i&gt;&lt;b&gt;k,&lt;/b&gt;&lt;/i&gt; можно посчитать рейтинг каждого объекта по формуле:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/ratings00.PNG" width="835" height="229" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Где &lt;i&gt;&lt;b&gt;z&lt;sub&gt;α/2&lt;/sub&gt;&lt;/b&gt;&lt;/i&gt; это &lt;i&gt;&lt;b&gt;1−α/2&lt;/b&gt;&lt;/i&gt; квантиль нормального распределения. Посчитанный рейтинг является нижней границей нормальной аппроксимации байесова доверительного интервала для среднего рейтинга. Принимая, например, α=0,10 (z=1,65), рассчитанный рейтинг &lt;i&gt;&lt;b&gt;S&lt;/b&gt;&lt;/i&gt; будет означать, что в 95% случаев средний рейтинг объекта будет выше &lt;i&gt;&lt;b&gt;S&lt;/b&gt;&lt;/i&gt;.&lt;/p&gt;
&lt;p&gt;Упрощая, «продвинутый» расчет среднего рейтинга позволяет дать прогноз возможной средней оценки, рассчитываемой традиционным путем. Ну и, следовательно, как показано выше, ранжировать объекты даже при формально одинаковой средней оценке.&lt;/p&gt;
&lt;h2&gt;Пример расчета продвинутого среднего рейтинга&lt;/h2&gt;
&lt;p&gt;Вооружившись 2000 оценок по пятибалльной шкале условных территориальных офисов продаж, я посчитал средний рейтинг каждого офиса обычным и «продвинутым» способом.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;div class="fotorama" data-width="455" data-ratio="1.0859188544153"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/ratings01.PNG" width="455" height="419" alt="" /&gt;
&lt;img src="https://mathandcoffee.ru/pictures/ratings02.PNG" width="455" height="419" alt="" /&gt;
&lt;/div&gt;
&lt;div class="e2-text-caption"&gt;Среднее 1.0 — средний рейтинг обычный, Среднее 2.0 — средний рейтинг продвинутый.&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;«Таганский» упал со 2-го на 4-е место по всей видимости, из-за того, что выборка в 66 оценок не дает достаточной уверенности в том, что его средний рейтинг действительно настолько высок, и в 90% случаев его рейтинг прогнозируется выше всего лишь 4,55, что примерно соответствует 4-му месту.&lt;/p&gt;
&lt;p&gt;«Академический» формально был на 13-м месте, но, благодаря надежным 249 оценкам, для него прогнозируется, в 90% случаев, средний рейтинг не ниже 4,4, что поднимает его до 10-го места.&lt;/p&gt;
&lt;p&gt;У меня сложилось ощущение, что формула более убедительно работает для коротких шкал оценок, как «от 1 до 5» в приведенном примере.&lt;/p&gt;
&lt;p&gt;В любом случае, делюсь &lt;a href="https://docs.google.com/spreadsheets/d/1Uh5ndL3rFjd9orZ5NCZFInuWN218LDO6N-D90Ih0THo/edit?usp=sharing"&gt;файлом в Google Таблицах&lt;/a&gt; — по идее, он считает рейтинги для всех шкал «длиной» до 100 оценок включительно, позволяет импортировать до 10 000 строк с оценками и корректировать уровень достоверности (90% в нашем примере).&lt;/p&gt;
&lt;h2&gt;Cм. также&lt;/h2&gt;
&lt;p&gt;&lt;a href="https://www.evanmiller.org/ranking-items-with-star-ratings.html"&gt;https://www.evanmiller.org/ranking-items-with-star-ratings.html&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;&lt;a href="https://docs.google.com/spreadsheets/d/1Uh5ndL3rFjd9orZ5NCZFInuWN218LDO6N-D90Ih0THo/edit?usp=sharing"&gt;Продвинутый способ расчета рейтинга&lt;/a&gt; в Google Таблицах&lt;/p&gt;
</description>
</item>


</channel>
</rss>