Аналитик рассчитал значения и ответил, после чего собеседование было окончено. Он ошибся, ведь это были 2 графика с одной криптовалютой. Разница только в том, что цены справа были указаны в логарифмическом масштабе.
Вывод: когда данные растут или падают в разы, линейный масштаб искажает картину. Логарифмы помогают своевременно обнаружить тревожные сигналы в метриках.
Инструмент для работы с числами, которые изменяются в разы — цены акций или рост пользователей приложения.
Типичная ошибка: начинающий аналитик при трудоустройстве в биржевую компанию решал простую задачу: во сколько раз примерно различаются по цене две криптовалюты в апреле, если их приблизительные значения указаны стрелкой?
Помогают понять, как данные представить в виде векторов и матриц для подачи в ML-модели. Например, вы производите эмбеддинг — превращаете определенные слова в наборы чисел для подачи этих чисел на вход нейронной сети (так данные передаются в нейронку):
Типичная ошибка: обработка данных через вложенные циклы вместо использования матричных операций NumPy, что замедляет код в 100+ раз.
Вывод: матрицы и векторы — это основа работы с данными в ML. Умение ими оперировать напрямую влияет на производительность и масштабируемость моделей.