{
    "version": "https:\/\/jsonfeed.org\/version\/1",
    "title": "Математика и кофе: заметки с тегом Байес",
    "_rss_description": "Отделы продаж, коллцентры, аналитика, цифры и данные, воронки продаж, матстатистика..",
    "_rss_language": "ru",
    "_itunes_email": "",
    "_itunes_categories_xml": "",
    "_itunes_image": "",
    "_itunes_explicit": "",
    "home_page_url": "https:\/\/mathandcoffee.ru\/tags\/bayes\/",
    "feed_url": "https:\/\/mathandcoffee.ru\/tags\/bayes\/json\/",
    "icon": "https:\/\/mathandcoffee.ru\/user\/userpic@2x.jpg?1559386410",
    "author": {
        "name": "Иван Балдин",
        "url": "https:\/\/mathandcoffee.ru\/",
        "avatar": "https:\/\/mathandcoffee.ru\/user\/userpic@2x.jpg?1559386410"
    },
    "items": [
        {
            "id": "16",
            "url": "https:\/\/mathandcoffee.ru\/all\/prodvinuty-sposob-rascheta-reytingov\/",
            "title": "Продвинутый способ расчета рейтингов",
            "content_html": "<p>Крайне любопытная статья на сайте EvanMiller.org, <a href=\"https:\/\/www.evanmiller.org\/ranking-items-with-star-ratings.html\" class=\"nu\">«<u>Ranking Items With Star Ratings<\/u>»<\/a>, предлагает <b>продвинутый способ расчета рейтингов,<\/b> например, по пятибалльной шкале.<\/p>\n<p>(Вообще, судя по интонации автора, история с рейтингами и методиками их расчета не так проста, как может показаться, и он <a href=\"https:\/\/www.evanmiller.org\/how-not-to-sort-by-average-rating.html\">неоднократно к ней возвращается<\/a>.)<\/p>\n<p>Из того, что удалось понять: во-первых, расчет <b>среднего рейтинга<\/b> не всегда позволяет однозначно определить место объекта относительно остальных объектов — например, средние рейтинги могут, банально, совпадать. Во-вторых, средний рейтинг не учитывает количество голосов, ведь по идее, чем больше голосов участвует в расчете рейтинга, тем надежнее этот рейтинг.<\/p>\n<p>Простой пример — оценки двух сотрудников:<\/p>\n<p>Осипов — 5, 5, 5, 5, 5, 2, 2, 2, 2, 2. <b>Среднее = 3,50.<\/b><br \/>\nСухонцев — 4, 4, 3, 3. <b>Среднее = 3,50.<\/b><\/p>\n<p>Неразрешимая, на первый взгляд, ситуация решается методами <a href=\"https:\/\/ru.wikipedia.org\/wiki\/%D0%91%D0%B0%D0%B9%D0%B5%D1%81%D0%BE%D0%B2%D1%81%D0%BA%D0%B0%D1%8F_%D1%81%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0\">байесовской статистики<\/a> (что бы конкретно это здесь ни значило), вуаля:<\/p>\n<p>Осипов — <b>2,72.<\/b><br \/>\nСухонцев — <b>2,63.<\/b><\/p>\n<p>Чудесным образом то ли меньшее среднеквадратичное отклонение (0,58 против 1,58), то ли меньшее количество оценок (4 против 10), то ли все они вместе <b>уточнили<\/b> средний рейтинг Сухонцева, отдав ему предпочтение в несколько сотых.<\/p>\n<h2>Формула продвинутого расчета среднего рейтинга<\/h2>\n<p>Приготовьтесь, будет немного больно.<\/p>\n<p>Итак, <a href=\"https:\/\/www.evanmiller.org\/ranking-items-with-star-ratings.html#setup\">предполагается<\/a>, что у нас есть <i><b>K<\/b><\/i> возможных оценок, считаемых по <i><b>k,<\/b><\/i> каждая оценка стоит <i><b>s<sub>k<\/sub><\/b><\/i> баллов («1» — это 1 балл, «2» — это 2 балла и т. д.). Имея <i><b>N<\/b><\/i> полученных оценок для каждого объекта, по <i><b>n<sub>k<\/sub><\/b><\/i> оценок для каждого <i><b>k,<\/b><\/i> можно посчитать рейтинг каждого объекта по формуле:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/ratings00.PNG\" width=\"835\" height=\"229\" alt=\"\" \/>\n<\/div>\n<p>Где <i><b>z<sub>α\/2<\/sub><\/b><\/i> это <i><b>1−α\/2<\/b><\/i> квантиль нормального распределения. Посчитанный рейтинг является нижней границей нормальной аппроксимации байесова доверительного интервала для среднего рейтинга. Принимая, например, α=0,10 (z=1,65), рассчитанный рейтинг <i><b>S<\/b><\/i> будет означать, что в 95% случаев средний рейтинг объекта будет выше <i><b>S<\/b><\/i>.<\/p>\n<p>Упрощая, «продвинутый» расчет среднего рейтинга позволяет дать прогноз возможной средней оценки, рассчитываемой традиционным путем. Ну и, следовательно, как показано выше, ранжировать объекты даже при формально одинаковой средней оценке.<\/p>\n<h2>Пример расчета продвинутого среднего рейтинга<\/h2>\n<p>Вооружившись 2000 оценок по пятибалльной шкале условных территориальных офисов продаж, я посчитал средний рейтинг каждого офиса обычным и «продвинутым» способом.<\/p>\n<div class=\"e2-text-picture\">\n<div class=\"fotorama\" data-width=\"455\" data-ratio=\"1.0859188544153\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/ratings01.PNG\" width=\"455\" height=\"419\" alt=\"\" \/>\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/ratings02.PNG\" width=\"455\" height=\"419\" alt=\"\" \/>\n<\/div>\n<div class=\"e2-text-caption\">Среднее 1.0 — средний рейтинг обычный, Среднее 2.0 — средний рейтинг продвинутый.<\/div>\n<\/div>\n<p>«Таганский» упал со 2-го на 4-е место по всей видимости, из-за того, что выборка в 66 оценок не дает достаточной уверенности в том, что его средний рейтинг действительно настолько высок, и в 90% случаев его рейтинг прогнозируется выше всего лишь 4,55, что примерно соответствует 4-му месту.<\/p>\n<p>«Академический» формально был на 13-м месте, но, благодаря надежным 249 оценкам, для него прогнозируется, в 90% случаев, средний рейтинг не ниже 4,4, что поднимает его до 10-го места.<\/p>\n<p>У меня сложилось ощущение, что формула более убедительно работает для коротких шкал оценок, как «от 1 до 5» в приведенном примере.<\/p>\n<p>В любом случае, делюсь <a href=\"https:\/\/docs.google.com\/spreadsheets\/d\/1Uh5ndL3rFjd9orZ5NCZFInuWN218LDO6N-D90Ih0THo\/edit?usp=sharing\">файлом в Google Таблицах<\/a> — по идее, он считает рейтинги для всех шкал «длиной» до 100 оценок включительно, позволяет импортировать до 10 000 строк с оценками и корректировать уровень достоверности (90% в нашем примере).<\/p>\n<h2>Cм. также<\/h2>\n<p><a href=\"https:\/\/www.evanmiller.org\/ranking-items-with-star-ratings.html\">https:\/\/www.evanmiller.org\/ranking-items-with-star-ratings.html<\/a><\/p>\n<p><a href=\"https:\/\/docs.google.com\/spreadsheets\/d\/1Uh5ndL3rFjd9orZ5NCZFInuWN218LDO6N-D90Ih0THo\/edit?usp=sharing\">Продвинутый способ расчета рейтинга<\/a> в Google Таблицах<\/p>\n",
            "date_published": "2019-09-21T15:59:00+03:00",
            "date_modified": "2019-09-21T16:01:59+03:00",
            "image": "https:\/\/mathandcoffee.ru\/pictures\/ratings00.PNG",
            "_date_published_rfc2822": "Sat, 21 Sep 2019 15:59:00 +0300",
            "_rss_guid_is_permalink": "false",
            "_rss_guid": "16",
            "_e2_data": {
                "is_favourite": false,
                "links_required": [
                    "system\/library\/jquery\/jquery.js",
                    "system\/library\/fotorama\/fotorama.css",
                    "system\/library\/fotorama\/fotorama.js"
                ],
                "og_images": [
                    "https:\/\/mathandcoffee.ru\/pictures\/ratings00.PNG",
                    "https:\/\/mathandcoffee.ru\/pictures\/ratings01.PNG",
                    "https:\/\/mathandcoffee.ru\/pictures\/ratings02.PNG"
                ]
            }
        }
    ],
    "_e2_version": 3565,
    "_e2_ua_string": "E2 (v3565; Aegea)"
}