Стать специалистом в области науки о данных не означает разворот на 180˚ по отношению к тому, что вы узнали и освоили раньше. Как раз наоборот. Иногда самые интересные для вас проекты будут находиться «рядом с домом». Подумайте о проблемах, с которыми вы сталкиваетесь на своем рабочем месте: есть ли способ решить их с помощью данных?
Гибкие навыки
Хотя это, несомненно, полезно, вы необязательно должны быть экспертом в какой-то области, чтобы иметь фору в науке о данных. Даже гибкие, широко использующиеся навыки, такие как работа в команде и опыт публичных выступлений, могут значительно помочь вам. Они принесут даже больше пользы, чем глубокие знания, тем, кто, еще не успел получить достаточный жизненный опыт или образование. Подумайте о своих навыках: вы легко общаетесь? Можете ли вы адаптировать устоявшиеся решения к различным ситуациям? У вас эстетический вкус? Вы нестандартно мыслите?
Я пришел в науку о данных, будучи специалистом в области финансов, но, хотя мои знания, несомненно, пригодились мультинациональной консалтинговой фирме Deloitte, думаю, что в конечном итоге мне помогли гибкие навыки, которые я приобрел гораздо раньше, еще в школьные годы. Кроме того, начиная заниматься наукой о данных, я хорошо понимал, как визуализировать результаты проектов эстетически привлекательным образом. В детстве я жил в Зимбабве, где дважды в неделю изучал изобразительное искусство. Я приобрел только базовые навыки в рисовании и научился лепить забавную глиняную посуду, но, хотя курс, возможно, и не сделал меня преемником Жоана Миро[20], он научил меня тому, как цвет, эстетика и положительные психологические эффекты могут повлиять на мой итоговый рабочий отчет.
После того как несколько лет спустя я вернулся в Россию, мне преподавали – в трех разных школах – совсем другое, в основном точные науки. Это научило меня академической строгости, которая пригодилась в грядущие годы в университете, но привело к нехватке необходимых социальных навыков. Будучи почти неисправимым интровертом, я работал над собой, чтобы приобрести некоторую уверенность в себе и развить способность к общению – качества, которые, как я знал, мне понадобятся. Я нашел книгу по самопомощи, в которой было все, что мне требовалось знать о том, как выбраться из своей раковины. Упражнения в ней были немного необычными (общаться, лежа посреди оживленной кофейни, или завести непринужденный разговор с людьми в общественном транспорте), но для меня они сработали. Эти усилия, первоначально, возможно, мотивированные юношеским стремлением к участию в университетских мероприятиях и спортивных командах, позже помогли мне зарекомендовать себя коммуникативным человеком, что оказалось привлекательным на моей работе, где были нужны аналитики данных для предоставления отчетов широкому кругу лиц, имеющих отношение к деятельности всей компании.
Это еще один важный фактор для аналитиков данных: если вы хотите получить возможность запустить проект по обработке и анализу данных, вам придется научиться разговаривать с нужными людьми. Это часто будет означать расспросы вне вашей команды и потенциальной зоны комфорта. Данные ничего не скажут вам, если вы не зададите правильные вопросы, поэтому ваша работа – выйти «в свет» и получить ответы от людей, которые внесли свой вклад в вашу базу данных.
В обоих случаях, которые мы здесь обсуждали, – используете ли вы связанное с углубленными знаниями преимущество для поиска информации и применяете ли гибкие навыки для получения ответов от людей, – вы, вероятно, сталкиваетесь с данными, которые не являются числовыми и истинность которых поэтому зависит от контекста и субъективности анализа. Информация такого рода – мы называем ее неструктурированными данными – может быть письменным ответом, либо записанным видео- или аудиоинтервью, либо изображением. По причине того, что неструктурированные данные нельзя оценить количественно, компании часто предпочитают приглашать для их анализа специалистов в соответствующих областях.
4. Практика ведет к совершенству
Одним из замечательных аспектов науки о данных является то, что существует множество бесплатных материалов с открытым исходным кодом, которые позволяют легко продолжать практиковаться. Новички в какой-либо дисциплине склонны месяц за месяцем изучать теорию вместо того, чтобы настроить свое мышление на применение полученных знаний на практике. В качестве упражнения просто введите в поисковике слова «бесплатные массивы данных» / «free datasets» – и найдете множество сайтов, которые позволяют скачать их CSV-файлы (файлы для хранения табличных данных), готовые для анализа. Учитывая огромное количество и диапазон данных, от космических исследований NASA до комментариев Reddit или даже спортивных данных (баскетбол, футбол, бейсбол), я уверен, что вы найдете что-то ценное и интересное