Data Scientist

Data Scientist – специалист, который может работать в любой сфере. Он занимается хранением, обработкой и анализом больших массивов данных. Разбираемся, в каких случаях необходим дата-сайентист, чем он вообще занимается, кому подходит профессия и как ее освоить.

Чем занимается

Само понятие «Big Data» («большие данные») появилось еще в 2008 г., однако профессия Data Scientist возникла немного позже – в 2010 г. Необходимость в специальности появилась в тот момент, когда стандартных знаний по математической статистике для обработки и анализа образовавшихся массивов данных перестало хватать. Работу с информацией усложняла скорость их обновления, разнородность и большой объем.

Чтобы решать задачи с такими объемами данных, человек должен разбираться одновременно в нескольких областях: математика, статистика, информатика, бизнес, экономика и др. Это важно, поскольку дата-сайентист должен уметь пользоваться различными источниками информации, анализировать данные, выявлять неочевидные закономерности и находить уникальные бизнес-решения.

Поскольку Data Scientist часто сталкивается с неструктурированными массивами информации, ему приходится использовать специальные методы науки о данных. Специалист выстраивает и проверяет математические модели поведения данных, чтобы спрогнозировать будущее и выявить закономерные тенденции. К примеру, изучение базы данных и применение алгоритмов машинного обучения позволяет дата-сайентисту определить, какая будет выручка у конкретной компании в следующем году.

Специалистам по Большим данным регулярно приходится находить новые решения проблем и преодолевать различные препятствия (методологические, технические и др.). Отчасти они занимаются и творческой деятельностью. Data Scientist предлагает лаконичное решение сложной бизнес-задачи, преподносит информацию кратко и понятно, создает качественные визуализации. Это не просто аналитик, а специалист, разрывающий шаблоны и делающий открытия.

Яркий пример оригинального предложения, которое существенно развило бизнес, – разработанная Джонатантом Голдманом модель для популярной социальной сети LinkedIn. Он создал алгоритм, показывавший пользователям их возможных знакомых. В результате это принесло миллионы новых просмотров.

Специалист по работе с Big Data
Специалист по работе с Big Data

Какие задачи решает и где нужен

Data Scientist – специалист, который нужен везде, где есть большие объемы данных. Зачастую это различные научные организации, крупные компании и перспективные стартапы. Так как методы работы с информацией одинаковы для всех областей, дата-сайентисты могут работать в любой сфере: от розничной торговли до астрологии.

В целом задачи специалиста в каждой области остаются неизменными. Однако Data Scientist должен подстраиваться под особенности проекта и адаптировать под него свои функции. К должностным обязанностям специалиста по Big Data относятся:

  • сбор данных из различных информационных потоков для дальнейшей обработки;
  • моделирование клиентской базы;
  • анализ и прогнозирование поведения потребителей;
  • индивидуализация предлагаемых услуг и продуктов;
  • выявление потенциальных рисков;
  • исследование эффективности бизнес-процессов;
  • подготовка отчетов за прошедший или еще не наступивший период времени в доступной форме;
  • предупреждение мошенничества.

Например, профессионалу, работающему в сфере розничной торговли, поручили спрогнозировать спрос на новую коллекцию ботинок. В таком случае ему предстоит выполнить следующие задачи:

  • поиск данных о продажах ботинок за предыдущие несколько лет;
  • выбор подходящего алгоритма машинного обучения для прогнозирования спроса на указанный товар;
  • подбор показателей, с помощью которых можно оценить качество модели;
  • написание кода;
  • применение разработанной модели на данных о предыдущих продажах;
  • прогнозирование спроса на товар;
  • предоставление результатов менеджерам по продажам, чтобы они могли определить объем продаж ботинок из новой коллекции.

Data Scientist применяет свои знания и навыки в разных контекстах, выдвигает гипотезы и исследует их с различных точек зрения. Это не просто специалист по сбору, обработке и анализу данных. Ему приходится разрабатывать действенные и оригинальные решения для бизнеса, находя логические закономерности в большом информационном потоке. Поэтому дата-сайентисты – жизненно необходимые сотрудники для всех крупных организаций. Они нужны:

  • ученым, чтобы проводить сложные исследования (к примеру, анализ ДНК);
  • маркетологам для индивидуализации рекламных предложений на основе анализа данных карт лояльности;
  • юристам для распознания текстов с распечатанных документов;
  • логистам для построения грамотных маршрутов;
  • продажникам для прогнозирования спроса на товар и т.д.

Специалисты по данным помогают развиваться компаниям с нуля и выводят бизнес на новый уровень. Например, сервис TikTok не стал бы таким популярным, если бы не его алгоритм по подбору рекомендованных к просмотру коротких видео.

Насколько востребована профессия

Работа в Data Science – новое, востребованное и очень перспективное направление. В 2020 году Всемирный экономический форум пришел к выводу, что эта профессия будет пользоваться большим спросом вплоть до 2025 года.

При этом крупным компаниям всегда не хватает грамотных специалистов, разбирающихся в Big Data. Востребованность профессии с каждым годом стремительно увеличивается. Только за последние 3 года спрос на нее вырос в 4-5 раз.

Специалисты могут найти себе работу в любой отрасли, однако наиболее востребованы они в следующих сферах:

  • розничная торговля;
  • банковское дело;
  • маркетинг;
  • телекоммуникационные системы.

Какие профессиональные навыки нужны

Все работодатели, находящиеся в поиске специалиста по Большим данным, в первую очередь обращают внимание на уровень знания математики. В этой науке кандидат должен разбираться лучше, чем в программировании. Также дата-сайентисту важно понимать все бизнес-процессы, проистекающие в компании, и уметь связывать сотрудников разных должностей в одно звено.

Знание математики, программирования и понимание бизнес-процессов – самые важные профессиональные навыки в Data Science. Хороший специалист должен знать ряд дисциплин, чтобы уметь составлять математические модели. Они помогут выявлять в данных логические закономерности и прогнозировать будущие значения. Однако грамотной разработанной модели недостаточно. Чтобы проверить ее действенность, нужно уметь писать коды, работать с SQL, библиотеками и фреймворками для машинного обучения. Полученные результаты визуализируются – сложная информация усваивается лучше, если она красиво подается в виде диаграмм, графиков и схем.

Грамотный Data Scientist должен владеть следующими профессиональными навыками:

  • знание математики (в том числе статистики, теории вероятности, математического анализа и др.);
  • знание английского языка на уровне Upper Intermediate и выше;
  • умение программировать на языках, адаптированных к работе с Big Data (Python, Java, C++);
  • умение работать с кластерными системами хранения Big Data;
  • владение инструментами, предназначенными для работы со статистикой (MATLAB, SPSS, R, Tableau и др.);
  • знание экономики и законов развития бизнеса;
  • базовые знания сферы, в которой работает специалист (например, если это банковское дело, то нужно знать банковскую систему, разбираться в банковских продуктах и т.д.);
  • умение пользоваться инструментами для визуализации данных (к примеру, с помощью библиотек Matplotlib, Seaborn или Plotly).
Что нужно знать, чтобы стать data scientist
Что нужно знать, чтобы стать data scientist

Личные качества

Одних профессиональных навыков для эффективной работы недостаточно. Без некоторых личных качеств Data Scientist не сможет разрабатывать или продвигать свои бизнес-решения, а также верно прогнозировать будущие значения.

Личные навыки, которыми должен обладать специалист:

  • системное мышление и аналитический склад ума;
  • коммуникабельность и умение подавать сложную информацию просто и понятно;
  • усидчивость и трудолюбие;
  • желание достигать поставленных целей и упорство;
  • внимательность и скрупулезное отношение к деталям;
  • стрессоустойчивость;
  • ответственность и пунктуальность;
  • любознательность, постоянное желание изучать что-то новое;
  • бизнес-интуиция.

Самые важные качества дата-сайентиста – критическое мышление и коммуникабельность. Грамотный специалист должен постоянно задавать вопросы себе и окружающим, чтобы найти реальные закономерности и понять, какие задачи необходимо решить. Каждая гипотеза должна подвергаться сомнениям до тех пор, пока не будет выработано подходящее решение.

Data Scientist постоянно взаимодействует с командой, принимает от нее задачи и объединяет всех сотрудников в одно звено и доносит результаты своей работы с помощью визуализации. Важно, чтобы с коллективом было взаимопонимание. В противном случае проделанная работа будет неэффективна.

Если у человека нет каких-либо перечисленных качеств, это не критично. Однако, например, сложно построить карьеру, если не получается объяснить, в чем заключается суть результатов работы. А при плохой усидчивости и концентрации внимания человек может быстро выгореть.

Плюсы и минусы профессии

В работе по направлению Data Science, как и в любой другой специальности, есть плюсы и минусы.

К плюсам можно отнести:

  • Высокий уровень дохода. В сфере IT это сейчас одна из самых высокооплачиваемых профессий. Предприниматели для развития бизнеса готовы платить крупные деньги.
  • Востребованность. Грамотные специалисты ценятся в любой сфере. Однако Data Science настолько стремительно развивается, что в этом направлении даже наблюдается нехватка кадров. Опытных и умелых профессионалов охотно разбирают рекрутеры, предлагая комфортные условия для сотрудничества.
  • Работа в крупной компании. Поскольку нужно работать с большими массивами данных, скорее всего Data Scientist с помощью своих решений сможет повлиять на развитие бизнеса.
  • Удаленная работа. Чтобы занимать эту должность, необязательно ходить в офис. Работать можно дистанционно, находясь дома.

Среди минусов можно отметить:

  • Необходимость критического мышления. Чтобы освоить эту профессию, важен особый склад ума. Иначе не получится разрабатывать рабочие модели для бизнеса.
  • Ответственность. Профессионалу важно принимать все решения обдуманно, проверять эффективность модели на практике только после предварительного прогнозирования с помощью расчетов и аналитики.
  • Непредсказуемые результаты. Большая часть выдвинутых гипотез окажется провальной. С этим нужно смириться и быть готовым пробовать каждый раз сначала, не оглядываясь на неудачи. Ученый должен решать проблему, а не сдаваться.
  • Необходимость постоянно развиваться. Чтобы заниматься Data Science, нужно идти в ногу со временем. В сфере IT информация часто теряет актуальность и замещается новой. Поэтому человек должен постоянно развивать личные качества и профессиональные навыки, узнавать новое. Желательна всесторонняя развитость. Более того, иногда профессионалам приходится разрабатывать собственные методы хранения, обработки и анализа Big Data.

В целом все минусы компенсируются плюсами. При этом если человек обладает нужными знаниями и аналитическим складом ума, терпелив, любознателен и готов нести ответственность за свои решения, то у него и вовсе нет сложных препятствий для работы в Data Science.

Место работы

Дата-сайентисты способны работать в любой сфере, где требуется обрабатывать и анализировать массивы данных. Профессионалы занимают должности в:

  • торговых сетях;
  • IT-сфере (например, для систематизации новостей, оптимизации выдачи поисковых систем, автоматического распознавания и перевода текста, фильтрации спама и др.);
  • банковских структурах (например, для выявления платежеспособности клиента, чтобы принять решение о выдаче кредита);
  • технологических отраслях (например, производство лекарственных препаратов);
  • медицине (например, для автоматической постановки диагноза);
  • избирательных кампаниях (например, для выявления требований граждан, чтобы разработать грамотную политическую программу);
  • телекомпаниях (например, для составления телепрограммы) и т.д.

В направлении Data Science профессионал может реализовать знания любой отрасли. Поэтому так важно постоянно развиваться и изучать новую информацию.

Как выглядит рабочий день специалиста

Формат работы Data Scientist зависит от самой организации, в которой он занимает должность. Это может быть как удаленный вид деятельности, так и полноценная работа в офисе компании. Некоторые компании совмещают два метода, позволяя работать из дома, а при необходимости появляться в штате. Взаимодействие с сотрудниками компании напрямую зависит от уровня специалиста и спектра его задач. К примеру, Junior Data Scientist контактирует только с начальством компании, получая от него поручения, а специалист уровня Senior самостоятельно общаться с заказчиками, выстраивать стратегию и давать указания команде.

Чаще всего работа дата-сайентиста начинается с изучения полученных электронных писем и установления контакта с командой: выстраивание планов, распределение задач и проверка их выполнения. Далее специалист погружается в работу с аналитическими данными. Пишет SQL-запрос, подготавливает информацию к Machine Learning, пишет код модели на Python, а после прогоняет информацию через нее. В ходе выполнения всех этих задач дата-сайентист часто связывается с командой и менеджером, так как именно они будут использовать модель в на практике.

Как стать Data Scientist

Чтобы стать дата-сайентистом, желательно иметь высшее образование с техническим уклоном. Это связано с тем, что для такого специалиста важно разбираться в математике и программировании, когда как гуманитарные науки не особо помогут Data Scientist в его работе.

Однако это утверждение можно подвергнуть сомнению, так как в мире немало специалистов, которые получили именно гуманитарное образование. К тому же, человек, желающий освоить профессию, всегда может обратиться к специальным курсам, где его обучат нужным областям математики и программирования, исключив всю ненужную информацию.

К тому же, на практике в большинстве случаев работодатели вообще не требуют предоставить диплом о высшем образовании, им важнее умения и технические способности претендента на вакантное место.

Однако если хочется получить высшее образование, следует выбирать направления с уклоном на математику (например, «Прикладная математика»). Наличие профильного образования существенно упростит поиск работы и станет отличным пунктом в резюме. Однако Senior-специалисты рекомендуют пройти обучение на специальных курсах Data Science и Machine Learning даже при наличии высшего образования. Они дадут студенту практические навыки и актуальную в данный момент информацию.

Помимо высшего образования и пройденных специальных курсов для достижения успеха дата-сайентисту важно быть целеустремленным, уметь решать проблемы и постоянно самосовершенствоваться. Последнее особенно важно, так как при устаревших знаниях Data Science быстро потеряет свою актуальность сначала в компании, а потом и вовсе на рынке.

Карьера

Ступени карьеры ничем не отличаются от остальных IT-специальностей:

  • Джуниор. Начинающий специалист, которому нужно ставить задачи и детально их объяснять, направлять по ходу работы. Как правило, джуниорам поручают простую работу: подготовку данных к обработке, очищение их от возможных ошибок, составление сводных таблиц и др.
  • Мидл. Такому профессионалу нужна посторонняя помощь только в случае возникновения нестандартных ситуаций. Базовые задачи он способен выполнять самостоятельно. Мидл создает эффективные алгоритмы и занимается машинным обучением.
  • Синьор. Это настоящий профессионал своего дела. Он может принимать любые задачи и решать их без чьей-либо помощи. Такой специалист может самостоятельно реализовать проект от начала до конца: от сбора и обработки больших данных до работы со сложными фреймворками и визуализации полученных результатов.

Со временем специалист по большим данным может начать управлять Data-проектами – такого человека называют «Chief Data Officer». Также некоторые профессионалы выбирают конкретную специализацию и занимаются углубленно только одним направлением.

В каких случаях становятся дата-сайентистом

Работа в Data Science подойдет не каждому. Заниматься этим направлением можно, если:

  • Есть желание заниматься крупными проектами, человек готов овладеть большим количеством инструментов и имеет опыт в обычной разработке.
  • Хочется вносить вклад в развитие бизнеса и науки с помощью разработки уникальных решений.
  • Есть интерес к передовым технологиям (нейросети, искусственный интеллект и т.д.) и нравится систематизировать, обрабатывать и анализировать данные.
  • Человек готов освоить новое направление, чтобы больше зарабатывать и иметь хорошие перспективы для развития и карьерного роста.

Глеб Синяков, аналитик-разработчик крупного банка «Тинькофф», разделил людей, которые занимаются Data Science, на несколько категорий. Одни из них стали учеными по данным, поскольку получили профильное образование. Вторые ушли из других научных и технических специальностей в поисках больших перспектив и возможностей заработать деньги. Третьим наскучила монотонная работа разработчиком, и они начали реализовывать свои навыки программирования для решения интересных задач. К некоторым наука о данных пришла сама (например, к биоинформатикам). Также есть и те, кто осваивал профессию с нуля. По мнению Глеба Синякова, грамотным специалистом можно стать и без первоначальных знаний, если человек дисциплинирован и испытывает интерес к большим данным.

Поиск вакансий

Чтобы устроиться на работу, нужно составить хорошее портфолио, резюме и отправить его работодателям.

Стратегии поиска

Для начала необходимо определиться с нишей. Нужно выбрать хорошо знакомое направление. По нему должны быть уверенные знания и желательно опыт работы. Например, если у человека есть медицинское образование, он может внести свой вклад в развитие фармацевтики. О всех знаниях, навыках и умениях нужно обязательно указать в профайле или резюме. Это покажет серьезность намерений, зарекомендует как профессионала и поможет быстрее найти работу.

Если нет опыта работы, можно выкладывать в социальных сетях посты на тему выбранной специализации, публиковать наработки своих проектов и т.д. Человек должен показать, что он практикуется, умеет находить решения проблемам. Начинающим специалистам для наработки портфолио можно предлагать свои услуги бесплатно, по бартеру или за небольшую плату.

Следует откликаться даже на вакансии, требованиям которых кандидат соответствует не полностью. Любой возможностью нужно пользоваться, нельзя бояться вести переговоры. Возможно, какой-то навык работодателю не особо важен или ему можно обучиться в процессе работы. Тем более, саморазвитие и самообучение – неотъемлемые элементы в работе с большими данными.

Хороший вариант ускорить поиск работы – приложить к резюме рекомендации. Их можно попросить у любого человека или организации, вне зависимости от репутации или известности. Конечно, будет лучше, если рекомендательное письмо напишет бывший или текущий работник крупной компании или другое авторитетное лицо. Однако сам факт наличия рекомендаций уже указывает на желание и целеустремленность.

Где искать вакансии

Оставление откликов на вакансии – пожалуй, самый энергозатратный этап при поиске работы. Для эффективного поиска предложений необходимо охватить как можно больше онлайн-платформ с вакансиями. Регистрация на сайтах займет много времени, но это того стоит. При этом стоит уделить внимание как крупным и авторитетным порталам, так и менее популярным. На некоторых сайтах для регистрации или отклика на офферы придется внести небольшой взнос.

Заполнению профиля и анкет на портале для поиска работы необходимо уделить особое внимание. Нужно подробно описать опыт и образование, рассказать о прошлых проектах, своих личных качествах и профессиональных навыках. Желательно привести примеры работ. Очень важно указать всю возможную информацию, поскольку это выгодно выделяет среди остальных кандидатов.

Data Science – стремительно развивающееся и чрезвычайно востребованное направление. Дата-сайентисты с помощью своих нестандартных решений выводят бизнес на новый уровень и делают жизнь людей комфортнее. Если человек любит обрабатывать много информации, анализировать данные, ему легко дается математика и программирование, то ему стоит попробовать освоить эту профессию.

Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: