Data Science
Дословно data science — наука о данных. Она объединяет в себе методы по сбору, обработке и анализу больших объемов данных (Big Data) с целью выделить из общего массива данных полезную для заказчика информацию. Big Data называют массивы информации со сложной, неоднородной структурой, как правило характеризующие состояние определенных объектов.
Пример задачи
Приложение для заказа такси с помощью data science может спрогнозировать спрос в 8 утра буднего дня в Москве в районе Ленинградского вокзала, подобрать водителю оптимальный маршрут и контролировать его усталость во время рабочего дня.
Начальные требования
- Хорошее знание Excel (VBA, макросы, сводные таблицы)
- Базовое знание математической статистики и алгоритмов машинного обучения
- Умение писать базовые запросы в SQL
- Плюсом будет знание Python или R, и умение работать в веб-сервисах для совместной работы Trello или Slack
В отличие от большинства профессий в data science нет как таковых начальных должностей. Чтобы занять эту позицию у человека в арсенале уже должен быть опыт работы в разработке или аналитике. Младший продуктовый аналитик — хороший вариант для старта. Он как раз решает задачи, связанные со сбором данных, и использует языки программирования R и Python.
Data Scientist занимается сбором и анализом больших данных . Основная задача Data Scientist — проводить анализ не ради анализа, а чтобы вычленять из массивов данных информацию, которая может качественно улучшить работу заказчика.
Человек, стоящий во главе data science, в большой компании может управлять несколькими Data Scientist и Machine Learning инженерами. На этом уровне карьеры, как и у TeamLead в разработке, управленческие способности и стратегическое видение задачи играют большую роль, нежели hard skills. Важно уметь видеть картину целиком и предотвращать ошибки на старте проекта.
Основное предназначение этой позиции – превращение данных в деньги путем разработки и внедрения инновационных идей на основе анализа накопленной информации. Основными задачами CDO (директора по данным) можно назвать: разработка и реализация концепции развития корпоративных данных; создание и поддержка единой архитектуры данных; обеспечение качества данных; участие в разработке и реализации корпоративных стратегий и формировании требований к новым программным приложениям и хранилищам данных; подготовка и координация работы Data Stewards (специалистов, которые определяют требования и решают инциденты с качеством данных в рамках своего бизнес-подразделения); управление работой аналитиков, инженеров, исследователей, администраторов данных; эффективная организация процессов управления данными.
среднерыночная зарплата
работает на позиции