ЛАФ - Марина Липатова. Data Science и машинное обучение: обзорная экскурсия

Марина Липатова. Data Science и машинное обучение: обзорная экскурсия

Событие: ЛАФ2021

Задавались ли вы вопросом, что собой представляет Data Science и как он может быть полезным в вашей профессиональной деятельности? Марина Липатова в своем выступлении на Летнем Аналитическом Фестивале в Костроме предлагает увлекательное путешествие в мир Data Science и машинного обучения, раскрывая перед зрителями таинственные аспекты этой стремительно развивающейся дисциплины.

Марина начинает с личной истории о своем профессиональном пути от системного анализа к Data Science, объясняя, насколько захватывающей и перспективной оказалась для нее эта сфера. Она делится, что, несмотря на начальные страхи перед множеством сложных терминов и понятий, настойчивость и интерес позволили ей преодолеть барьеры и погрузиться в изучение этой междисциплинарной области.

Перед зрителями открывается структурированная картина мира Data Science, где пересекаются три ключевые дисциплины: программирование, статистика и математика, а также экспертиза в предметной области. Марина подчеркивает, что специалисты, в равной степени владеющие всеми тремя областями, встречаются редко, и именно поэтому существуют узкие специализации, такие как Machine Learning инженер или Data Analyst, каждая из которых играет свою роль в коллективных усилиях по анализу данных.

Слушателям предлагается взглянуть на важность подготовки данных, которая включается в общий процесс решений задач с помощью методов Data Science. Марина объясняет этапы, начиная от чёткого определения бизнес-задачи до внедрения моделей, обращая внимание на необходимость использования актуальных данных и корректных метрик успеха.

Машинное обучение рассматривается через призму его основных направлений: обучение с учителем и без учителя. Марина иллюстрирует различия на примерах, таких как классификация изображений и прогнозирование цены жилья, акцентируя внимание на огромное разнообразие задач, которые помогают решать методы машинного обучения.

Завершая своё выступление, Марина делится опытом участия в соревнованиях на платформе Kaggle, которая предоставляет уникальную возможность всем желающим развивать свои навыки в области Data Science. Она рассказывает о простоте проведения тренировочных упражнений и разнообразие задач, предлагаемых пользователям.

Подводя итоги, Марина Липатова уверяет, что Data Science — это не просто модная тенденция, а насущная необходимость современности, от которой невозможно отмахнуться. Несмотря на высокий порог вхождения, эта дисциплина открыта для всех, кто готов учиться и применять знание на практике.