{
    "version": "https:\/\/jsonfeed.org\/version\/1",
    "title": "Математика и кофе: заметки с тегом диаграммы и графики",
    "_rss_description": "Отделы продаж, коллцентры, аналитика, цифры и данные, воронки продаж, матстатистика..",
    "_rss_language": "ru",
    "_itunes_email": "",
    "_itunes_categories_xml": "",
    "_itunes_image": "",
    "_itunes_explicit": "",
    "home_page_url": "https:\/\/mathandcoffee.ru\/tags\/diagrammy-i-grafiki\/",
    "feed_url": "https:\/\/mathandcoffee.ru\/tags\/diagrammy-i-grafiki\/json\/",
    "icon": "https:\/\/mathandcoffee.ru\/user\/userpic@2x.jpg?1559386410",
    "author": {
        "name": "Иван Балдин",
        "url": "https:\/\/mathandcoffee.ru\/",
        "avatar": "https:\/\/mathandcoffee.ru\/user\/userpic@2x.jpg?1559386410"
    },
    "items": [
        {
            "id": "45",
            "url": "https:\/\/mathandcoffee.ru\/all\/grafik-konversii-s-doveritelnym-intervalom\/",
            "title": "График конверсии с доверительным интервалом",
            "content_html": "<p>Некоторое время с удовольствием использую более свежую визуализацию конверсии, добавляя к своим диаграммам <b>границы доверительного интервала.<\/b><\/p>\n<h2>Конверсия офисов продаж<\/h2>\n<p>Итак, например, мы оцениваем эффективность работы территориальных офисов продаж. Под <b><i>эффективностью<\/i><\/b> понимаем отношение числа совершенных продаж к числу заявок (конверсию заявок в продажи, или просто <b><i>«конверсию»).<\/i><\/b> То есть, если в офисе «Сокольники» за квартал было 19 продаж на 33 заявки, их эффективность будем считать равной 19\/33 = 57,6%.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/candles-sd-00.png\" width=\"642\" height=\"382\" alt=\"\" \/>\n<\/div>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/candles-sd-01.png\" width=\"455\" height=\"454\" alt=\"\" \/>\n<\/div>\n<p>Очевидно, что одни офисы работают эффективнее других: конверсия по офисам меняется от 57,6% до 17,6%. Заметно также, что и число заявок в офисах различно: от 33 заявок в «Сокольниках» до 706 заявок в «Лианозово».<\/p>\n<p>Обычно на этом этапе многие останавливаются, но есть несложный способ воспользоваться понятием «доверительного интервала» или «стандартного отклонения (SD)», чтобы показать то, что, на первый взгляд, не так заметно.<\/p>\n<h2>Оцениваем размер выборки и величину SD<\/h2>\n<p>Как нетрудно заметить, из-за неравного числа заявок по разным офисам («Сокольники» отличаются в этом смысле от «Лианозово» почти в 22 раза), уверенность в надежности рассчитанной конверсии будет не одинакова. Так, для «Лианозово» результат в 36,1% достигнут на выборке из 706 заявок и может считаться вполне надежным; в «Сокольниках» мы получили результат 57,6% на небольшой выборке в 33 заявки, из-за чего нет уверенности, что, получи со временем последние свои 706 заявок, они бы удержали результат на том же уровне.<\/p>\n<p>Разумеется, необходимо прикинуть размер доверительного интервала для каждого офиса продаж, исходя из числа заявок, то есть, размера выборки.<\/p>\n<p>Уже знакомая нам формула стандартного отклонения (SD), или <i>&sigma;<\/i>:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/CodeCogsEqn.png\" width=\"201\" height=\"77\" alt=\"\" \/>\n<\/div>\n<p>где <i>p<\/i> — величина конверсии, <i>n<\/i> — число заявок.<\/p>\n<p>Считаем в колонке E:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/candles-sd-02.png\" width=\"637\" height=\"380\" alt=\"\" \/>\n<\/div>\n<p>Полученная величина стандартного отклонения (SD) показывает погрешность при расчете конверсии, и, очевидно, оказалась выше там, где была меньше выборка. Чем меньше данных, тем менее надежен рассчитанный результат, и тем меньше мы уверены в нашей оценке эффективности соответствующего офиса продаж.<\/p>\n<h2>Считаем границы 90%-го доверительного интервала<\/h2>\n<p>Дополним нашу таблицу рассчитанными нижней и верхней границей 90%-го доверительного интервала. Другими словами, оценим разброс конверсий по каждому из офисов продаж, так, что с вероятностью 90% мы будем уверены, что <i>истинная<\/i> конверсия лежит в пределах этого диапазона.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/candles-sd-03.png\" width=\"653\" height=\"381\" alt=\"\" \/>\n<\/div>\n<p>Зная о том, что границы 90%-го доверительного интервала лежат в пределах &plusmn;1,645SD, вычитаем и прибавляем 1,645SD для нижней и верхней границ, соответственно. Для «Лианозово» получаем, что их <i>истинная<\/i> конверсия лежит в пределах от 33,1% до 39,1%. (По-прежнему, в 1 случае из 10 она выходит за границы нашего интервала, но зато в 9 случаях из 10 мы не ошиблись).<\/p>\n<h2>Дополняем график, рисуя «свечи»<\/h2>\n<p>В Excel 2013 воспользуемся <b>«биржевой диаграммой»,<\/b> указав вместо <b><i>самого высокого<\/i><\/b> и <b><i>самого низкого курсов<\/i><\/b> верхнюю и нижнюю границу наших доверительных интервалов, а вместо <b><i>курса закрытия<\/i><\/b> — рассчитанную вначале конверсию:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/candles-sd-04.png\" width=\"634\" height=\"600\" alt=\"\" \/>\n<\/div>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/candles-sd-05.png\" width=\"454\" height=\"454\" alt=\"\" \/>\n<\/div>\n<p>Доработанная подобным образом диаграмма не меняет выводов, полученных в самом начале. Однако, для наблюдательного руководителя она ненавязчиво напоминает, что полученные значения конверсий офисов продаж <b>не конечны,<\/b> и особенно «не конечны» там, где оказались шире границы разброса конверсии.<\/p>\n<p>«Сокольники», предварительно, обогнали «Беговой», однако, если хороший результат «Бегового» надежен за счет узкого интервала, то результат «Сокольников» очень приблизителен, поэтому уверенные выводы возможно делать лишь о части офисов продаж, для остальных — нужно больше данных, а до тех пор их позиции в рейтинге можно считать лишь предварительными, или, как было сказано выше, не конечными.<\/p>\n<h2>См. также:<\/h2>\n<p><a href=\"http:\/\/italylov.ru\/blog\/all\/ctatisticheskaya-dostovernost-koltrekinga\/\">http:\/\/italylov.ru\/blog\/all\/ctatisticheskaya-dostovernost-koltrekinga\/<\/a><\/p>\n",
            "date_published": "2021-05-25T01:13:50+03:00",
            "date_modified": "2021-05-25T01:17:18+03:00",
            "image": "https:\/\/mathandcoffee.ru\/pictures\/candles-sd-00.png",
            "_date_published_rfc2822": "Tue, 25 May 2021 01:13:50 +0300",
            "_rss_guid_is_permalink": "false",
            "_rss_guid": "45",
            "_e2_data": {
                "is_favourite": false,
                "links_required": [],
                "og_images": [
                    "https:\/\/mathandcoffee.ru\/pictures\/candles-sd-00.png",
                    "https:\/\/mathandcoffee.ru\/pictures\/candles-sd-01.png",
                    "https:\/\/mathandcoffee.ru\/pictures\/CodeCogsEqn.png",
                    "https:\/\/mathandcoffee.ru\/pictures\/candles-sd-02.png",
                    "https:\/\/mathandcoffee.ru\/pictures\/candles-sd-03.png",
                    "https:\/\/mathandcoffee.ru\/pictures\/candles-sd-04.png",
                    "https:\/\/mathandcoffee.ru\/pictures\/candles-sd-05.png"
                ]
            }
        },
        {
            "id": "2",
            "url": "https:\/\/mathandcoffee.ru\/all\/skolzyaschee-srednee-ili-kak-sgladit-grafik\/",
            "title": "Скользящее среднее, или как сгладить график",
            "content_html": "<p>Честно говоря, не знаю, как правильно называется эта штука, но пусть у нее будет рабочее название <b>«скользящее среднее».<\/b><\/p>\n<p>Очень часто бывает так, что у нас есть <b>данные с разбивкой по дням.<\/b> Например, заходы на сайт или звонки в отдел продаж. И, в попытке проанализировать <b>динамику<\/b> происходящего, мы строим график, получая примерно следующее:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/mvng_avrg_03.png\" width=\"985\" height=\"750\" alt=\"\" \/>\n<\/div>\n<p>Что здесь не так?<\/p>\n<p>Достаточно очевидно, что, во-первых, график постоянно прыгает вверх-вниз, а, во-вторых, имеет некрасивые <i>экстремумы<\/i> вроде 16 заявок в октябре или 122 заявок в августе. День на день не приходится, и данные слишком сильно колеблются вокруг среднего значения (кстати, среднее тут равно 63).<\/p>\n<p>А там, где что-то так некрасиво прыгает, часто можно что-то сгладить, используя понятие <a href=\"https:\/\/www.google.ru\/search?q=moving+average&newwindow=1&tbm=isch\"><b><i>скользящего среднего<\/i><\/b><\/a>.<\/p>\n<h2>Скользящее среднее. Простой способ.<\/h2>\n<p>Попробуем «сгладить» наш прыгающий график путем расчета <b><i>среднего числа заявок на дату,<\/i><\/b> исходя из предыдущих 6 дней (7-й — текущий день, итого ровно неделя).<\/p>\n<p>Напротив 07.01.2018 напишем формулу<\/p>\n<pre class=\"e2-text-code\"><code class=\"\">=СРЗНАЧ(B2:B8)<\/code><\/pre><div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/mvng_avrg_05.png\" width=\"985\" height=\"750\" alt=\"\" \/>\n<\/div>\n<p>Протянув формулу по всему году до самой последней строки, получим <i>среднее число заявок на каждую дату за предыдущую неделю<\/i>. Как будто рамку, шириной в одну неделю, мы двигали по году вдоль с шагом в один день.<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/mvng_avrg_06.png\" width=\"985\" height=\"750\" alt=\"\" \/>\n<\/div>\n<p>Визуально ничего не изменилось. Разве что, раньше были целые значения, а теперь, из-за усреднения, вылезли знаки после запятой — 79,9, 84,1. Обновим наш график:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/mvng_avrg_07.png\" width=\"985\" height=\"750\" alt=\"\" \/>\n<\/div>\n<p>На месте прежнего, «прыгающего», графика, теперь более гладкая линия. Исчезли аномальные дни с 16 и 122 звонками в октябре и в августе, зато теперь, на «недельном» масштабе, стал заметнее провал на майские праздники.<\/p>\n<h2>Скользящее среднее. Сложный способ.<\/h2>\n<p>Некоторое время попрактиковавшись с вычислением скользящего среднего, вы обратите внимание, что, чем шире вы будете брать «окно» для расчета среднего на дату, тем сильнее будет сглаживаться ваш график. Теоретически, вы можете взять окно шириной в 365 дней... и получится практически ровная линия. А при окне шириной в 1 день — график не сглаживается вообще.<\/p>\n<p>В этот момент становится понятно, что «7 дней» из первого примера — это просто случайное число, а на самом деле, оно может быть абсолютно любым — все зависит лишь от ваших предпочтений и представлений о том, что вы хотите увидеть и проанализировать.<\/p>\n<p>Попробуем не задавать жестко ширину нашего «окна», а сделать его <i>параметром<\/i> нашего графика. Пусть «окно» в 7 дней, используемое для сглаживания графика, будет зависеть от цифры «7», помещенной в ячейку C1. И пусть, если мы меняем «7» на «5» или «30», Эксель перестраивает наш график.<\/p>\n<p>Итак, настало время для красивой формулы в ячейке C8:<\/p>\n<pre class=\"e2-text-code\"><code class=\"\">=СРЗНАЧЕСЛИМН(B$2:B$365;A$2:A$365;&quot;&lt;=&quot;&amp;A8;A$2:A$365;&quot;&gt;=&quot;&amp;(A8-$C$1+1))<\/code><\/pre><p>Функция<\/p>\n<pre class=\"e2-text-code\"><code class=\"\">=СРЗНАЧЕСЛИМН()<\/code><\/pre><p>берет и считает среднее значение для тех дат, для которых будут выполняться оба условия:<\/p>\n<ol start=\"1\">\n<li>Дата, которая участвует в расчете среднего, должна быть больше или равна дате, отстоящей от даты, для которой мы рассчитываем среднее, назад на N-1 дней (где N — ширина нашего «окна»).<\/li>\n<li>Дата, которая участвует в расчете среднего, должна быть меньше или равна дате, для которой мы это среднее рассчитываем.<\/li>\n<\/ol>\n<p>Проще говоря, для расчета среднего числа заявок на 18 апреля при N=7 дней, мы возьмем среднее от числа заявок с 12 по 18 апреля (больше или равно 12 апреля и меньше или равно 18 апреля). Для расчета среднего числа заявок на 19 апреля — среднее от числа заявок с 13 по 19 апреля, и так далее.<\/p>\n<p>Выделим ячейку C1 под наш параметр N, тогда формула для 07.01.2018 выглядит так:<\/p>\n<pre class=\"e2-text-code\"><code class=\"\">=СРЗНАЧЕСЛИМН(B$2:B$365;A$2:A$365;&quot;&lt;=&quot;&amp;A8;A$2:A$365;&quot;&gt;=&quot;&amp;(A8-$C$1+1))<\/code><\/pre><p>Итого, теперь мы имеем уже знакомый нам «сглаженный» 7-дневный график, но ширину «окна» задали не строго, а привязали ее к параметру, записанному в ячейке C1:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/mvng_avrg_08.png\" width=\"985\" height=\"750\" alt=\"\" \/>\n<\/div>\n<p>Меняя значение параметра в ячейке C1, получаем все более и более ровную линию. Вот, для сравнения, наложенные друг на друга графики при N=1, N=5, N=30:<\/p>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/mathandcoffee.ru\/pictures\/mvng_avrg_09.png\" width=\"985\" height=\"750\" alt=\"\" \/>\n<\/div>\n",
            "date_published": "2019-05-26T11:23:27+03:00",
            "date_modified": "2019-05-26T11:23:15+03:00",
            "image": "https:\/\/mathandcoffee.ru\/pictures\/mvng_avrg_03.png",
            "_date_published_rfc2822": "Sun, 26 May 2019 11:23:27 +0300",
            "_rss_guid_is_permalink": "false",
            "_rss_guid": "2",
            "_e2_data": {
                "is_favourite": false,
                "links_required": [
                    "system\/library\/highlight\/highlight.js",
                    "system\/library\/highlight\/highlight.css",
                    "system\/library\/highlight\/highlight.js",
                    "system\/library\/highlight\/highlight.css",
                    "system\/library\/highlight\/highlight.js",
                    "system\/library\/highlight\/highlight.css",
                    "system\/library\/highlight\/highlight.js",
                    "system\/library\/highlight\/highlight.css",
                    "system\/library\/highlight\/highlight.js",
                    "system\/library\/highlight\/highlight.css",
                    "system\/library\/highlight\/highlight.js",
                    "system\/library\/highlight\/highlight.css",
                    "system\/library\/highlight\/highlight.js",
                    "system\/library\/highlight\/highlight.css",
                    "system\/library\/highlight\/highlight.js",
                    "system\/library\/highlight\/highlight.css"
                ],
                "og_images": [
                    "https:\/\/mathandcoffee.ru\/pictures\/mvng_avrg_03.png",
                    "https:\/\/mathandcoffee.ru\/pictures\/mvng_avrg_05.png",
                    "https:\/\/mathandcoffee.ru\/pictures\/mvng_avrg_06.png",
                    "https:\/\/mathandcoffee.ru\/pictures\/mvng_avrg_07.png",
                    "https:\/\/mathandcoffee.ru\/pictures\/mvng_avrg_08.png",
                    "https:\/\/mathandcoffee.ru\/pictures\/mvng_avrg_09.png"
                ]
            }
        }
    ],
    "_e2_version": 3565,
    "_e2_ua_string": "E2 (v3565; Aegea)"
}