7 критических ошибок в работе аналитика данных и как их избежать на реальных примерах
Почему математика —
основа анализа данных
Переходим к гайду
  • Читатель этого гайда, здравствуй! Меня зовут Ильдар Мустафин — я преподаватель. С 2005 года помогаю гуманитариям, программистам и тем, кто входит в профессию аналитика, легко понимать математику. Знать ее важно, ведь она — основная опора в работе любого аналитика.

  • 90% ошибок при анализе происходит как раз из-за непонимания математической базы.
Без нее вы рискуете:

  • Делать ложные выводы. Например, принимать случайный рост на бирже за ваш личный успех;

  • Пропускать важные закономерности. Не учитывать данные о сезонности, аномалиях и трендах;

  • Терять деньги через неверные прогнозы и ошибочные A/B-тесты.

Чтобы избежать подобных ошибок, не нужно быть гением чисел — достаточно понимать ключевые инструменты математики.
Изучив этот гайд, вы:

  • Узнаете о 7 разделах математики, которые используют аналитики каждый день;

  • Разберете типичные ошибки аналитиков. Поймете, в чем ценность знаний каждого из 7 разделов;

  • Научитесь применять математику в принятии точных решений, поиска закономерностей и постройке грамотных выводов.
В нем я простыми словами объяснил, как теория вероятностей и комбинаторика помогают аналитикам понимать реальные аналитические задачи.
В конце гайда — бесплатный урок
1. Зависимости и их графики
Главные инструменты для анализа и иллюстрации процессов.

Типичная ошибка: аналитик строит линейный тренд продаж и считает, что зависимость между ценой и спросом прямая. На деле же спрос может снижаться нелинейно. Например, при повышении цены с 9 до 11 тыс. рублей прибыль не вырастет, как предсказано, а уведет продажи в убыток.
Вывод: непонимание базовых типов функций — линейной, квадратичной, экспоненциальной и других — приводит к искажению прогнозов. Без них любые выводы будут случайными.
3. логарифмы
2. Матрицы и векторы
Аналитик рассчитал значения и ответил, после чего собеседование было окончено. Он ошибся, ведь это были 2 графика с одной криптовалютой. Разница только в том, что цены справа были указаны в логарифмическом масштабе.

Почему это критично: когда данные растут или падают в разы, линейный масштаб искажает истину. Логарифмы помогают обнаружить тревожные сигналы в метриках.
Это инструмент для работы с огромными числами и линейными зависимостями. А еще — возможность правильно читать графики.

Типичная ошибка: начинающий аналитик при трудоустройстве в биржевую компанию решал простую задачу. Нужно было ответить на вопрос: во сколько раз различаются цены двух криптовалют в апреле, если их приблизительные значения указаны стрелкой?
Это таблицы данных и операции с ними.

Типичная ошибка: аналитик вручную рассчитывает рекомен-дации пользователям — подбирает циклы в коде. Алгоритм работает медленно, а нагрузка на серверы в 5 раз выше. После перехода на матричный анализ все работает в сотни быстрее.

Почему это критично: аналитика — это Big Data. Объемы данных требуют векторного мышления и работы с матрицами.
Без них — низкая производительность, ошибки в ML-моделях и неэффективный код.

Вывод: незнание линейной алгебры делает аналитика неспособным решать свои задачи. Главные инструменты для анализа и иллюстрации процессов.
Как теория вероятностей
и комбинаторика помогают аналитикам понимать реальные аналитические задачи
4. производные
Почему это критично: просто видеть рост недостаточно — нужно понимать, насколько быстро он идет и как, и принимать решения заранее, до предполагаемой даты прекращения эффективности промо-акции.

Вывод: без производных аналитик рискует опоздать со всем —
с выводами, действиями, сменой стратегии.
Или же скорость изменений. Показывает, насколько быстро растут или падают значения. А это понимание — как и когда нужно оптимизировать бизнес-процессы.

Типичная ошибка: аналитик следит за ростом заказов на фоне промо-акции и видит хорошие продажи, которые приносят всё больший доход день ото дня. Но скорость роста внезапно стала падать нелинейно — 100 т.р. в течение четвертого дня продаж, 400 т.р. в течение пятого, 900 т.р. в течение шестого… Промо-акция перестала работать. Из-за не до конца рассчитанной модели продаж не удалось вовремя предвидеть падение и всего за 3 дня прибыль упала на 1 400 000 р.
5. тригонометрия
Почему это критично: периодичность — ключ к пониманию поведения пользователей по дням, часам и сезонам. Если ее не учесть, любой прогноз будет неточным, а ресурсы — распределены неэффективно.

Вывод: без тригонометрии игнорируются повторяющиеся паттерны, из-за чего упускается потенциальная прибыль.
Синусы, косинусы и другие периодические функции — это инструменты для анализа повторяющихся процессов.

Типичная ошибка: прогноз спроса на такси не учитывал суточные колебания количества заявок со стороны пассажиров. В часы-пик не хватало водителей, а когда их было много — такси вызывали реже. Результат: возможная упущенная прибыль свыше 500 тыс. рублей в месяц и недовольные клиенты.
6. комбинаторика и теория вероятности
Почему это критично: комбинаторика и вероятность позволяют оценивать точность тестов, риски и вариативность. Без них легко принять ложное за истину.

Вывод: если аналитик не знает, как считать вероятность и комбинации — вся аналитика может быть иллюзией.
Выполняют свою роль в расчете шансов и вариантов.

Типичная ошибка: запущено 10 A/B-тестов с пересечением аудиторией. Результаты кажутся значимыми, но на самом деле они ложные. Компания внедрила «успешную» фичу, которая на деле ухудшила показатели. А ведь можно было изначально положиться на плохой прогноз по FWER при проведении множественных статистических тестов.

FWER - вероятность принять хотя бы один результат за верный в то время как он на самом деле ложный.
7. статистика
Помогает анализировать данные и проверять гипотезы.

Типичная ошибка: при трудоустройстве аналитиком в медицинский центр стажеру дали такую задачу: «Вы получили информацию о том, что люди, которые пьют красное вино живут дольше. Как проверить достоверность данной информации?»

Стажер ответил, что сравнил бы количество пьющих и непьющих красное вино, а затем сделал первоначальный вывод о влиянии вина на долголетие.

Он был не прав и завалил собеседование, потому что в исследовании учитываются и другие факторы. Обычно люди, пьющие красное вино, имеют более высокий доход, лучшее питание и медицину. Следовательно, нужно учитывать большие данные, которые не собрать за один день.

Почему это критично: Смешение корреляции (вино и долголетие) с причинностью (вино → долгая жизнь). Без знаний статистики человек верит в ложный вывод.

Вывод: аналитик без знаний статистики — как врач без понимания причин диагноза. Лечит «на глаз» без доказательств болезни.
Общие итоги
Каждая из этих ошибок — не абстрактная. Это типовые провалы, которые тормозят бизнес и карьеру, съедают бюджеты и подрывают доверие к аналитике. Корень всех ошибок в незнании математической базы — а это основа, без которой рушится вся работа.

«Математика для анализа данных. С буквального нуля до Pro» — курс, где я объяснил всю базу по своей авторской методике. Отсюда начинается карьера аналитика, будь вы гуманитарием или программистом. Весь материал объяснен просто и доступно, с реальной практикой и без заучивания теории.
А вот и подарок —
вводный бесплатный урок
Это ваш первый шаг к уверенной работе с данными без догадок и случайностей.
Посмотрите 10-минутное видео и узнайте:

  • Как перестановки среди объектов влияют на исход событий;

  • Почему на вероятность влияет то, как одни объекты сочетаются с другими;

  • Почему работа с данными так тесно связана с понятием «множество»;

  • Как на примере обычной игральной кости можно осознать главную суть понятия «Вероятность».
Made on
Tilda