4460

ТОП-8 книг по Data Science, которые помогут прокачаться в науке о данных

По статистике, специалисты Data Science пользуются высоким спросом на рынке труда, а предлагаемые им зарплаты — одни из самых высоких в IT. Поэтому если вы еще не интересовались наукой о данных, то самое время прокачать свои навыки дата-сайентиста, а если вы уже «в теме», то углубиться в нее еще больше будет не лишним. 


Команда SpaceLab сделала подборку из восьми лучших книг по Data Science для специалистов разных уровней. Выбирайте, какая подходит вам больше всего, и приступайте к изучению!

«Data Science for Beginners: 4 books in 1»

Автор: Andrew Park

Языки издания: английский

Количество страниц: 350

Креативы статьи

 

Пособие для новичков, в которое вошло сразу четыре книги:

Python for Beginners. Пособие для тех, кто только начинает кодить. Здесь подробно описана вся база, необходимая для начала работы: от установки и переменных, до работы с файлами. В книгу также вошли практические примеры и задания.


Python for Data Analysis. Описание основных Python-библиотек, использующихся для обработки данных. В том числе PyTorch и Pandas.


Python Machine Learning. Основы работы с машинным обучением и нейронными сетями на языке Python.


Python Data Science. Книга для более продвинутых кодеров, в которой автор углубляется в изучение алгоритмов науки о данных и рассматривает примеры реальных приложений.

«Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython»

Автор: Wes McKinney

Языки издания: английский

Количество страниц: 550


В этом пособии описаны варианты использования Python-библиотеки Pandas, создателем которой является автор книги, а также инструментов NumPy и IPython для обработки, анализа и визуализации данных. Последнее издание от 2017 года актуально для версии Python 3.6, и содержит множество практических примеров, которые также доступны на GitHub.

«Data Science from Scratch: First Principles with Python»

Автор: Joel Grus

Языки издания: русский, английский

Количество страниц: 406

Креативы статьи(17)

 


Автором книги является исследователь института искусственного интеллекта Allen Institute for AI и бывший сотрудник Google. В этом пособии он рассматривает основы линейной алгебры, статистики и теории вероятностей, а также как и когда эти науки используются в Data Science на примере языка Python.


Кроме того, в книге затрагиваются основы Machine learning и наиболее востребованные Data Science модели, в том числе нейронные сети. 


В последнем переиздание 2019 года вся информация была актуализирована для версии Python 3.6. 


Примечательно, что Джоэл Грас концентрируется именно на фундаментальных принципах науки о данных, а не на изучении конкретных Python-библиотек.

«Practical Statistics for Data Scientists: 50+ Essential Concepts Using R and Python»

Авторы: Peter Bruce, Andrew Bruce, Peter Gedeck

Языки издания: русский, английский

Количество страниц: 368


Книга помогает прокачать знания в отдельных областях науки о данных, и предназначена для продвинутых кодеров, которые уже овладели основами Python и R.

Авторы сделали основной фокус на статистике, поскольку, по их мнению, это основная часть Data Science, но многие профильные специалисты не изучают ее отдельно. 


Пособие подробно описывает, как можно получить качественные наборы данных, анализировать их, а также как работать с немаркированными данными. Кроме того авторы разбирают статистические методы в области Machine learning.

В книге приведено множество практических примеров, которые изначально написаны на R, а затем дублируются на Python.

 

Креативы статьи(18)

 

«R for Data Science: Import, Tidy, Transform, Visualize, and Model Data»

Авторы: Hadley Wickham, Garrett Grolemund

Языки издания: русский, английский

Количество страниц: 520

Креативы статьи(19)

 

Книга простыми словами описывает работу с интегрированной средой разработки RStudio и tidyverse — набором пакетов R для Data Science. Она рассчитана на новичков, которые еще не имеют опыта в программировании, и помогает им быстрее погрузиться в науку о данных.


Издание уже получило широкое признание в мире, и входит в шестерку лучших пособий по обработке данных на Amazon, а также находится на втором месте в категории Mathematical & Statistical Software. Его авторы — активные участники разработки языка R.

«How to Lead in Data Science»

Авторы: Jike Chong, Yue Cathy Chang

Языки издания: английский

Количество страниц: 512


«How to Lead in Data Science» предназначена для тех, кто хочет вырасти до уровня Team Lead в сфере науки о данных. Ее авторы — бывшие управляющие командами данных в соцсети LinkedIn, делятся секретами построения стратегий для компаний разного масштаба, и дают практические советы по управлению сотрудниками.

Книгу можно рассмотреть как пособие по построению карьеры в направлении Data Science, которое подойдет даже тем, кто находится в самом начале этого пути. Издание выпущено в 2021 году, и содержит полностью актуальную информацию.

Креативы статьи(20)

 

«Ace the Data Science Interview»

Авторы: Chris Fregly, Antje Barth

Языки издания: английский

Количество страниц: 301

Креативы статьи(21)

 

 

Еще одна книга, которая поможет построить успешную карьеру в направлении Data Science. В ней авторы ответили на 201 популярный вопрос, который задают на собеседованиях в крупнейших технологических компаниях мира — Facebook, Amazon, Apple, Netflix и Google (FAANG). Обладая этими знаниями вы значительно повысите свои шансы на трудоустройство.


Авторы издания — бывшие сотрудники Facebook, которые действительно знают, о чем говорят. В книге они не просто делятся ответами, но также объяснят важные концепции и решения.

«Data Science on AWS: Implementing End-to-End, Continuous AI and Machine Learning Pipelines»

Авторы: Nick Singh, Kevin Huo

Языки издания: английский

Количество страниц: 524


Реальные Data Science недостаточно просто правильно разработать, не менее важную роль играет процесс развертывания. Эта книга как раз и является практическим пособием по работе с Amazon Web Services. В ней авторы рассказывают, как быстро и эффективно работать в облаке, и затрагивают несколько важных тем:

  • Использование NLP на основе BERT.
  • Автоматизированное ML с использованием SageMaker Autopilot.
  • Аналитика в реальном времени с помощью Amazon Kinesis и Managed Streaming для Apache Kafka.
  • Обеспечение безопасности.

Книга выпущена в 2021 году и содержит самые свежие данные.

Креативы статьи(22)