Иван Пышнограев

Project coordinator,
Мировой центр данных
по геоинформатике и устойчивому развитию.

Тренер курсов:
Основы Data Science (Язык R, Hadoop стек)


Что необходимо знать, чтобы стать специалистом Data Science?

Data Science – это прежде всего, алгоритмическое мышление, программирование, структурирование задачи и выбор стратегии её решения. Не обязательно глубоко разбираться в программировании, но основы данной области знаний жизненно необходимы для Data Science. Математический и статистический аппарат – это второй кит Data Science. Понимание основ статистических методов также является предусловием для развития в данной области знаний. Последний и, на мой взгляд, самый важный навык, это аналитическое мышление. Умение правильно сформулировать вопросы и найти иногда довольно неочевидные ответы формируют ценность специалиста Data Science.

Можно ли изучить Data Science на примерах из библиотек R?

Для понимания механики статистических методов этого может быть достаточно. Однако не следует забывать, что исходные данные вначале могут быть обработаны сотнями циклов предварительной подготовки, анализа и чистки , перед тем как предстать в виде наглядного примера. Реальные данные чаще всего выглядят не настолько красиво и упорядоченно. Для того, чтобы применять Data Science на практике, необходимо пробовать анализировать реальные данные.