<?xml version="1.0" encoding="utf-8"?> 
<rss version="2.0"
  xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd"
  xmlns:atom="http://www.w3.org/2005/Atom">

<channel>

<title>Математика и кофе: заметки с тегом формулы</title>
<link>https://mathandcoffee.ru/tags/formuly/</link>
<description>Отделы продаж, коллцентры, аналитика, цифры и данные, воронки продаж, матстатистика..</description>
<author>Иван Балдин</author>
<language>ru</language>
<generator>E2 (v3565; Aegea)</generator>

<itunes:owner>
<itunes:name>Иван Балдин</itunes:name>
<itunes:email></itunes:email>
</itunes:owner>
<itunes:subtitle>Отделы продаж, коллцентры, аналитика, цифры и данные, воронки продаж, матстатистика..</itunes:subtitle>
<itunes:image href="" />
<itunes:explicit></itunes:explicit>

<item>
<title>Доверительный интервал биномиального распределения по методу Уилсона</title>
<guid isPermaLink="false">40</guid>
<link>https://mathandcoffee.ru/all/doveritelny-interval-binomialnogo-raspredeleniya-po-metodu-uilso/</link>
<pubDate>Wed, 01 Apr 2020 16:54:50 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/doveritelny-interval-binomialnogo-raspredeleniya-po-metodu-uilso/</comments>
<description>
&lt;p&gt;В процессе изучения биномиального распределения, обратил внимание, что стандартный способ определения доверительного интервала через &lt;i&gt;&amp;plusmn;1,645SD&lt;/i&gt; не всегда точен. Грубо говоря, если «решка» выпала меньше, чем в 10 бросках, то, скорее всего, либо вы сделали мало бросков, либо у вас вероятность выпадения «решки» в «заколдованной монетке» сильно невелика; если &lt;i&gt;np&lt;/i&gt; &amp;lt; 10, лучше воспользоваться более сложными формулами, дающими более точные оценки при маленьких &lt;i&gt;p&lt;/i&gt; или &lt;i&gt;n:&lt;/i&gt;&lt;/p&gt;
&lt;p&gt;&lt;i&gt;По мнению многих статистиков, наиболее оптимальную оценку доверительных интервалов для частот осуществляет &lt;b&gt;метод Уилсона (Wilson),&lt;/b&gt; предложенный еще в 1927 году &amp;lt;...&amp;gt;. Данный метод не только позволяет оценить доверительные интервалы для очень малых и очень больших частот, но и применим для малого числа наблюдений.&lt;/i&gt;&lt;/p&gt;
&lt;p&gt;Звучит заманчиво. Попробуем разобраться.&lt;/p&gt;
&lt;h2&gt;Метод Уилсона&lt;/h2&gt;
&lt;p&gt;Нижняя и верхняя граница доверительного интервала &lt;i&gt;p = 1—&amp;alpha;/2&lt;/i&gt; вычисляются следующими формулами:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;div class="fotorama" data-width="392" data-ratio="2.6666666666667"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/wilson01.PNG" width="392" height="147" alt="" /&gt;
&lt;img src="https://mathandcoffee.ru/pictures/wilson02.PNG" width="393" height="132" alt="" /&gt;
&lt;/div&gt;
&lt;div class="e2-text-caption"&gt;Формула расчета нижней и верхней границ, соответственно.&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;где &lt;i&gt;&lt;b&gt;p&lt;/b&gt;&lt;/i&gt; — наблюдаемая вероятность «выпадения решки», &lt;i&gt;&lt;b&gt;N&lt;/b&gt;&lt;/i&gt; — число измерений («бросков»), &lt;i&gt;&lt;b&gt;z&lt;/b&gt;&lt;/i&gt; — &lt;i&gt;z-&lt;/i&gt;оценка (например, 1,960 для 95%-го доверительного интервала, или 1,645 для 90%-го).&lt;/p&gt;
&lt;h2&gt;Пример и калькулятор для расчета&lt;/h2&gt;
&lt;p&gt;Предположим, нам удалось прослушать 10 рандомных звонков колл-центра, и в 4 из них оператор забыл или поленился уточнить у клиента источник рекламы. Скорее всего, исходя из данной информации, операторы не уточняют источники рекламы в 40% звонков.&lt;/p&gt;
&lt;p&gt;Однако, это очень смелое утверждение, ведь наша выборка (10 звонков) откровенно мала: для получения более точной оценки качества работы коллцентра, хорошо бы прослушать больше рандомных звонков (прослушать все звонки, очевидно, невозможно).&lt;/p&gt;
&lt;p&gt;Но даже для выборки из 10 звонков, можно рассчитать SD биномиального распределения:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/CodeCogsEqn.png" width="201" height="77" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Имеем, SD = 15,49%. С вероятностью 90%, точная оценка качества работы коллцентра (доля звонков, где не выявлен источник рекламы) лежит в диапазоне 40%&amp;plusmn;1,645SD, или от 14,52% до 65,48%.&lt;/p&gt;
&lt;p&gt;Применяя же формулу Уилсона (что уместно, так как &lt;i&gt;np&lt;/i&gt; = 4 &amp;lt; 10), границы доверительного интервала уточняются: с вероятностью 90%, истинная доля звонков, где не выявляется источник рекламы, лежит в границах от 19,42% до 64,84%. SD, получается, равно 13,80%.&lt;/p&gt;
&lt;p&gt;&lt;a href="https://docs.google.com/spreadsheets/d/1QSvQF7SHUF8QIM8dzxWFT0itI5rP2VOn-tWJ4tHX5qI/edit?usp=sharing"&gt;&lt;b&gt;Калькулятор&lt;/b&gt;&lt;/a&gt; в Google Таблицах (меню «Файл» — «Создать копию»).&lt;/p&gt;
&lt;h2&gt;См. также:&lt;/h2&gt;
&lt;p&gt;«&lt;a href="https://cyberleninka.ru/article/n/doveritelnye-intervaly-dlya-chastot-i-doley/viewer"&gt;Доверительные интервалы для частот и долей&lt;/a&gt;», А.М. Гржибовский, 2008 (стр. 58-59)&lt;br /&gt;
&lt;a href="http://vassarstats.net/prop1.html"&gt;Онлайн-калькулятор&lt;/a&gt; для 95%-го доверительного интервала&lt;br /&gt;
&lt;a href="https://www.wolframalpha.com/input/?i=binomial+distribution+confidence+interval&amp;assumption=%22FSelect%22+-%3E+%7B%7B%22WilsonScoreInterval%22%7D%7D&amp;assumption=%7B%22F%22%2C+%22WilsonScoreInterval%22%2C+%22k%22%7D+-%3E%224%22&amp;assumption=%7B%22F%22%2C+%22WilsonScoreInterval%22%2C+%22c%22%7D+-%3E%220.90%22&amp;assumption=%7B%22F%22%2C+%22WilsonScoreInterval%22%2C+%22n%22%7D+-%3E%2210%22"&gt;Калькулятор&lt;/a&gt; на WolframAlpha.com&lt;br /&gt;
&lt;a href="https://www.ucl.ac.uk/english-usage/staff/sean/resources/binomialpoisson.pdf"&gt;Binomial confidence intervals and contingency tests&lt;/a&gt; (стр.4-5)&lt;br /&gt;
&lt;a href="https://influentialpoints.com/Training/confidence_intervals_of_proportions.htm#wils"&gt;https://influentialpoints.com/Training/confidence_intervals_of_proportions.htm#wils&lt;/a&gt;&lt;br /&gt;
&lt;a href="https://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval#Wilson_score_interval"&gt;Wilson score interval&lt;/a&gt; на Википедии&lt;/p&gt;
</description>
</item>

<item>
<title>Продвинутый способ расчета рейтингов</title>
<guid isPermaLink="false">16</guid>
<link>https://mathandcoffee.ru/all/prodvinuty-sposob-rascheta-reytingov/</link>
<pubDate>Sat, 21 Sep 2019 15:59:00 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/prodvinuty-sposob-rascheta-reytingov/</comments>
<description>
&lt;p&gt;Крайне любопытная статья на сайте EvanMiller.org, &lt;a href="https://www.evanmiller.org/ranking-items-with-star-ratings.html" class="nu"&gt;«&lt;u&gt;Ranking Items With Star Ratings&lt;/u&gt;»&lt;/a&gt;, предлагает &lt;b&gt;продвинутый способ расчета рейтингов,&lt;/b&gt; например, по пятибалльной шкале.&lt;/p&gt;
&lt;p&gt;(Вообще, судя по интонации автора, история с рейтингами и методиками их расчета не так проста, как может показаться, и он &lt;a href="https://www.evanmiller.org/how-not-to-sort-by-average-rating.html"&gt;неоднократно к ней возвращается&lt;/a&gt;.)&lt;/p&gt;
&lt;p&gt;Из того, что удалось понять: во-первых, расчет &lt;b&gt;среднего рейтинга&lt;/b&gt; не всегда позволяет однозначно определить место объекта относительно остальных объектов — например, средние рейтинги могут, банально, совпадать. Во-вторых, средний рейтинг не учитывает количество голосов, ведь по идее, чем больше голосов участвует в расчете рейтинга, тем надежнее этот рейтинг.&lt;/p&gt;
&lt;p&gt;Простой пример — оценки двух сотрудников:&lt;/p&gt;
&lt;p&gt;Осипов — 5, 5, 5, 5, 5, 2, 2, 2, 2, 2. &lt;b&gt;Среднее = 3,50.&lt;/b&gt;&lt;br /&gt;
Сухонцев — 4, 4, 3, 3. &lt;b&gt;Среднее = 3,50.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Неразрешимая, на первый взгляд, ситуация решается методами &lt;a href="https://ru.wikipedia.org/wiki/%D0%91%D0%B0%D0%B9%D0%B5%D1%81%D0%BE%D0%B2%D1%81%D0%BA%D0%B0%D1%8F_%D1%81%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0"&gt;байесовской статистики&lt;/a&gt; (что бы конкретно это здесь ни значило), вуаля:&lt;/p&gt;
&lt;p&gt;Осипов — &lt;b&gt;2,72.&lt;/b&gt;&lt;br /&gt;
Сухонцев — &lt;b&gt;2,63.&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Чудесным образом то ли меньшее среднеквадратичное отклонение (0,58 против 1,58), то ли меньшее количество оценок (4 против 10), то ли все они вместе &lt;b&gt;уточнили&lt;/b&gt; средний рейтинг Сухонцева, отдав ему предпочтение в несколько сотых.&lt;/p&gt;
&lt;h2&gt;Формула продвинутого расчета среднего рейтинга&lt;/h2&gt;
&lt;p&gt;Приготовьтесь, будет немного больно.&lt;/p&gt;
&lt;p&gt;Итак, &lt;a href="https://www.evanmiller.org/ranking-items-with-star-ratings.html#setup"&gt;предполагается&lt;/a&gt;, что у нас есть &lt;i&gt;&lt;b&gt;K&lt;/b&gt;&lt;/i&gt; возможных оценок, считаемых по &lt;i&gt;&lt;b&gt;k,&lt;/b&gt;&lt;/i&gt; каждая оценка стоит &lt;i&gt;&lt;b&gt;s&lt;sub&gt;k&lt;/sub&gt;&lt;/b&gt;&lt;/i&gt; баллов («1» — это 1 балл, «2» — это 2 балла и т. д.). Имея &lt;i&gt;&lt;b&gt;N&lt;/b&gt;&lt;/i&gt; полученных оценок для каждого объекта, по &lt;i&gt;&lt;b&gt;n&lt;sub&gt;k&lt;/sub&gt;&lt;/b&gt;&lt;/i&gt; оценок для каждого &lt;i&gt;&lt;b&gt;k,&lt;/b&gt;&lt;/i&gt; можно посчитать рейтинг каждого объекта по формуле:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/ratings00.PNG" width="835" height="229" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Где &lt;i&gt;&lt;b&gt;z&lt;sub&gt;α/2&lt;/sub&gt;&lt;/b&gt;&lt;/i&gt; это &lt;i&gt;&lt;b&gt;1−α/2&lt;/b&gt;&lt;/i&gt; квантиль нормального распределения. Посчитанный рейтинг является нижней границей нормальной аппроксимации байесова доверительного интервала для среднего рейтинга. Принимая, например, α=0,10 (z=1,65), рассчитанный рейтинг &lt;i&gt;&lt;b&gt;S&lt;/b&gt;&lt;/i&gt; будет означать, что в 95% случаев средний рейтинг объекта будет выше &lt;i&gt;&lt;b&gt;S&lt;/b&gt;&lt;/i&gt;.&lt;/p&gt;
&lt;p&gt;Упрощая, «продвинутый» расчет среднего рейтинга позволяет дать прогноз возможной средней оценки, рассчитываемой традиционным путем. Ну и, следовательно, как показано выше, ранжировать объекты даже при формально одинаковой средней оценке.&lt;/p&gt;
&lt;h2&gt;Пример расчета продвинутого среднего рейтинга&lt;/h2&gt;
&lt;p&gt;Вооружившись 2000 оценок по пятибалльной шкале условных территориальных офисов продаж, я посчитал средний рейтинг каждого офиса обычным и «продвинутым» способом.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;div class="fotorama" data-width="455" data-ratio="1.0859188544153"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/ratings01.PNG" width="455" height="419" alt="" /&gt;
&lt;img src="https://mathandcoffee.ru/pictures/ratings02.PNG" width="455" height="419" alt="" /&gt;
&lt;/div&gt;
&lt;div class="e2-text-caption"&gt;Среднее 1.0 — средний рейтинг обычный, Среднее 2.0 — средний рейтинг продвинутый.&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;«Таганский» упал со 2-го на 4-е место по всей видимости, из-за того, что выборка в 66 оценок не дает достаточной уверенности в том, что его средний рейтинг действительно настолько высок, и в 90% случаев его рейтинг прогнозируется выше всего лишь 4,55, что примерно соответствует 4-му месту.&lt;/p&gt;
&lt;p&gt;«Академический» формально был на 13-м месте, но, благодаря надежным 249 оценкам, для него прогнозируется, в 90% случаев, средний рейтинг не ниже 4,4, что поднимает его до 10-го места.&lt;/p&gt;
&lt;p&gt;У меня сложилось ощущение, что формула более убедительно работает для коротких шкал оценок, как «от 1 до 5» в приведенном примере.&lt;/p&gt;
&lt;p&gt;В любом случае, делюсь &lt;a href="https://docs.google.com/spreadsheets/d/1Uh5ndL3rFjd9orZ5NCZFInuWN218LDO6N-D90Ih0THo/edit?usp=sharing"&gt;файлом в Google Таблицах&lt;/a&gt; — по идее, он считает рейтинги для всех шкал «длиной» до 100 оценок включительно, позволяет импортировать до 10 000 строк с оценками и корректировать уровень достоверности (90% в нашем примере).&lt;/p&gt;
&lt;h2&gt;Cм. также&lt;/h2&gt;
&lt;p&gt;&lt;a href="https://www.evanmiller.org/ranking-items-with-star-ratings.html"&gt;https://www.evanmiller.org/ranking-items-with-star-ratings.html&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;&lt;a href="https://docs.google.com/spreadsheets/d/1Uh5ndL3rFjd9orZ5NCZFInuWN218LDO6N-D90Ih0THo/edit?usp=sharing"&gt;Продвинутый способ расчета рейтинга&lt;/a&gt; в Google Таблицах&lt;/p&gt;
</description>
</item>

<item>
<title>Качество звонков: сколько нужно прослушать</title>
<guid isPermaLink="false">12</guid>
<link>https://mathandcoffee.ru/all/kachestvo-zvonkov-skolko-proslushat/</link>
<pubDate>Sun, 26 May 2019 16:46:00 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/kachestvo-zvonkov-skolko-proslushat/</comments>
<description>
&lt;p&gt;Распространенным инструментом оценки качества работы менеджеров отдела продаж является &lt;b&gt;аудит качества телефонных звонков,&lt;/b&gt; «прослушка».&lt;/p&gt;
&lt;p&gt;Предположим, вы задались целью не просто &lt;b&gt;замерить&lt;/b&gt; качество телефонных звонков, но &lt;b&gt;зафиксировать &lt;i&gt;рост&lt;/i&gt; этого качества.&lt;/b&gt; Например, провели обучение (тренинг) менеджеров, либо предложили новую мотивацию за соблюдение стандартов качества, либо что-то еще.&lt;/p&gt;
&lt;p&gt;Логично предположить, что рост качества в первом попавшемся, после тренинга, звонке, не будет однозначно свидетельствовать о росте качества в остальных звонках. Скорее всего, и второй удачный звонок тоже однозначно не подтвердит гипотезу, что качество выросло.&lt;/p&gt;
&lt;p&gt;Таким образом, речь будет идти о том, что вам придется прослушать если не все, то, по крайней мере, достаточное число звонков после введенных вами изменений, и число звонков, которые необходимо будет прослушать, на самом деле, &lt;b&gt;можно однозначно рассчитать.&lt;/b&gt;&lt;/p&gt;
&lt;h2&gt;Считаем размер выборки&lt;/h2&gt;
&lt;p&gt;На 15-й странице работы «&lt;a href="https://people.ucsc.edu/~dgbonett/docs/wrkshp/LectureNotes.pdf"&gt;Планирование размеров выборки для исследований в бихевиоризме&lt;/a&gt;» мне попался подходящий пример 2.4 и формула для расчета таких выборок:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/samplesize00.PNG" width="858" height="506" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;В данном примере рассматривается изменение оценки &lt;a href="https://ru.wikipedia.org/wiki/ACT"&gt;ACT&lt;/a&gt;-теста по математике с 24,5 (дисперсия 8,2) до 26,0 баллов при &amp;alpha; = 0,05 и мощности = 0,90.&lt;/p&gt;
&lt;p&gt;Для удобства работы, я собрал приведенную формулу в Гугл-таблицах:&lt;br /&gt;
&lt;a href="https://docs.google.com/spreadsheets/d/1c1J88P0i0gmDFpOtfDIkPt-C0HKJOWACbSWVZTx2kL8/edit?usp=sharing"&gt;Калькулятор размера выборки&lt;/a&gt;&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/samplesize01.PNG" width="865" height="346" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Вам остается скопировать файл, и можете подставлять нужные вам значения. Достоверность разумно выбирать от 80% до 95%, значение мощности — от 60% до 80%. Указываете средний балл оценки звонков до изменений, стандартное отклонение (SD) оценки звонков «до», и ожидаемый средний балл оценки звонков после изменений.&lt;/p&gt;
&lt;h2&gt;Верификация полученных результатов&lt;/h2&gt;
&lt;p&gt;Важно понимать, что, даже прослушав требуемое количество звонков «после», все равно необходимо проверять наличие статистически значимых различий через &lt;a href="http://n4d-d.xyz/all/a-b-test-maksimalno-prosto/"&gt;калькулятор А/Б-тестов&lt;/a&gt;.&lt;/p&gt;
&lt;h2&gt;См. также:&lt;/h2&gt;
&lt;p&gt;&lt;a href="https://habr.com/ru/post/339798/"&gt;https://habr.com/ru/post/339798/&lt;/a&gt;&lt;br /&gt;
&lt;a href="https://people.ucsc.edu/~dgbonett/docs/wrkshp/LectureNotes.pdf"&gt;https://people.ucsc.edu/~dgbonett/docs/wrkshp/LectureNotes.pdf&lt;/a&gt;&lt;/p&gt;
</description>
</item>

<item>
<title>Скользящее среднее, или как сгладить график</title>
<guid isPermaLink="false">2</guid>
<link>https://mathandcoffee.ru/all/skolzyaschee-srednee-ili-kak-sgladit-grafik/</link>
<pubDate>Sun, 26 May 2019 11:23:27 +0300</pubDate>
<author>Иван Балдин</author>
<comments>https://mathandcoffee.ru/all/skolzyaschee-srednee-ili-kak-sgladit-grafik/</comments>
<description>
&lt;p&gt;Честно говоря, не знаю, как правильно называется эта штука, но пусть у нее будет рабочее название &lt;b&gt;«скользящее среднее».&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Очень часто бывает так, что у нас есть &lt;b&gt;данные с разбивкой по дням.&lt;/b&gt; Например, заходы на сайт или звонки в отдел продаж. И, в попытке проанализировать &lt;b&gt;динамику&lt;/b&gt; происходящего, мы строим график, получая примерно следующее:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/mvng_avrg_03.png" width="985" height="750" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Что здесь не так?&lt;/p&gt;
&lt;p&gt;Достаточно очевидно, что, во-первых, график постоянно прыгает вверх-вниз, а, во-вторых, имеет некрасивые &lt;i&gt;экстремумы&lt;/i&gt; вроде 16 заявок в октябре или 122 заявок в августе. День на день не приходится, и данные слишком сильно колеблются вокруг среднего значения (кстати, среднее тут равно 63).&lt;/p&gt;
&lt;p&gt;А там, где что-то так некрасиво прыгает, часто можно что-то сгладить, используя понятие &lt;a href="https://www.google.ru/search?q=moving+average&amp;newwindow=1&amp;tbm=isch"&gt;&lt;b&gt;&lt;i&gt;скользящего среднего&lt;/i&gt;&lt;/b&gt;&lt;/a&gt;.&lt;/p&gt;
&lt;h2&gt;Скользящее среднее. Простой способ.&lt;/h2&gt;
&lt;p&gt;Попробуем «сгладить» наш прыгающий график путем расчета &lt;b&gt;&lt;i&gt;среднего числа заявок на дату,&lt;/i&gt;&lt;/b&gt; исходя из предыдущих 6 дней (7-й — текущий день, итого ровно неделя).&lt;/p&gt;
&lt;p&gt;Напротив 07.01.2018 напишем формулу&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=СРЗНАЧ(B2:B8)&lt;/code&gt;&lt;/pre&gt;&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/mvng_avrg_05.png" width="985" height="750" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Протянув формулу по всему году до самой последней строки, получим &lt;i&gt;среднее число заявок на каждую дату за предыдущую неделю&lt;/i&gt;. Как будто рамку, шириной в одну неделю, мы двигали по году вдоль с шагом в один день.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/mvng_avrg_06.png" width="985" height="750" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Визуально ничего не изменилось. Разве что, раньше были целые значения, а теперь, из-за усреднения, вылезли знаки после запятой — 79,9, 84,1. Обновим наш график:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/mvng_avrg_07.png" width="985" height="750" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;На месте прежнего, «прыгающего», графика, теперь более гладкая линия. Исчезли аномальные дни с 16 и 122 звонками в октябре и в августе, зато теперь, на «недельном» масштабе, стал заметнее провал на майские праздники.&lt;/p&gt;
&lt;h2&gt;Скользящее среднее. Сложный способ.&lt;/h2&gt;
&lt;p&gt;Некоторое время попрактиковавшись с вычислением скользящего среднего, вы обратите внимание, что, чем шире вы будете брать «окно» для расчета среднего на дату, тем сильнее будет сглаживаться ваш график. Теоретически, вы можете взять окно шириной в 365 дней... и получится практически ровная линия. А при окне шириной в 1 день — график не сглаживается вообще.&lt;/p&gt;
&lt;p&gt;В этот момент становится понятно, что «7 дней» из первого примера — это просто случайное число, а на самом деле, оно может быть абсолютно любым — все зависит лишь от ваших предпочтений и представлений о том, что вы хотите увидеть и проанализировать.&lt;/p&gt;
&lt;p&gt;Попробуем не задавать жестко ширину нашего «окна», а сделать его &lt;i&gt;параметром&lt;/i&gt; нашего графика. Пусть «окно» в 7 дней, используемое для сглаживания графика, будет зависеть от цифры «7», помещенной в ячейку C1. И пусть, если мы меняем «7» на «5» или «30», Эксель перестраивает наш график.&lt;/p&gt;
&lt;p&gt;Итак, настало время для красивой формулы в ячейке C8:&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=СРЗНАЧЕСЛИМН(B$2:B$365;A$2:A$365;&amp;quot;&amp;lt;=&amp;quot;&amp;amp;A8;A$2:A$365;&amp;quot;&amp;gt;=&amp;quot;&amp;amp;(A8-$C$1+1))&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;Функция&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=СРЗНАЧЕСЛИМН()&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;берет и считает среднее значение для тех дат, для которых будут выполняться оба условия:&lt;/p&gt;
&lt;ol start="1"&gt;
&lt;li&gt;Дата, которая участвует в расчете среднего, должна быть больше или равна дате, отстоящей от даты, для которой мы рассчитываем среднее, назад на N-1 дней (где N — ширина нашего «окна»).&lt;/li&gt;
&lt;li&gt;Дата, которая участвует в расчете среднего, должна быть меньше или равна дате, для которой мы это среднее рассчитываем.&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;Проще говоря, для расчета среднего числа заявок на 18 апреля при N=7 дней, мы возьмем среднее от числа заявок с 12 по 18 апреля (больше или равно 12 апреля и меньше или равно 18 апреля). Для расчета среднего числа заявок на 19 апреля — среднее от числа заявок с 13 по 19 апреля, и так далее.&lt;/p&gt;
&lt;p&gt;Выделим ячейку C1 под наш параметр N, тогда формула для 07.01.2018 выглядит так:&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=СРЗНАЧЕСЛИМН(B$2:B$365;A$2:A$365;&amp;quot;&amp;lt;=&amp;quot;&amp;amp;A8;A$2:A$365;&amp;quot;&amp;gt;=&amp;quot;&amp;amp;(A8-$C$1+1))&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;Итого, теперь мы имеем уже знакомый нам «сглаженный» 7-дневный график, но ширину «окна» задали не строго, а привязали ее к параметру, записанному в ячейке C1:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/mvng_avrg_08.png" width="985" height="750" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Меняя значение параметра в ячейке C1, получаем все более и более ровную линию. Вот, для сравнения, наложенные друг на друга графики при N=1, N=5, N=30:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://mathandcoffee.ru/pictures/mvng_avrg_09.png" width="985" height="750" alt="" /&gt;
&lt;/div&gt;
</description>
</item>


</channel>
</rss>