7 книг для начинающего специалиста по анализу данных

0
9826

Книги, которые помогут изучить основы анализа данных и стать специалистом в данной области.

За последние несколько лет я прочел существенное количество книг об анализе данных и выделил семь, на мой взгляд, лучших из них. Вместе данные книги являются основой изучения анализа данных. В них вы найдете все, что вам необходимо знать.

Несмотря на то, что все они доставляют удовольствие при прочтении, ни одна из них не является книгой легкого чтения. Так что если вы решили начать с этих книг, то выделите под это немного времени и сил. Оно того стоит! Если вы совместите данные знания с бесплатным практическим курсом по анализу данных, о котором я писал ранее, то этого будет вполне достаточно, чтобы получить начальный уровень знаний специалиста по обработке данных. (На мой взгляд, по крайней мере.)

Примечание: вы могли заметить, что я включил в список 4 книги O’Reilly, если вам это кажется подозрительным, то могу вас заверить, что я никак не связан с данным издательством. Просто я, правда, считаю их очень полезными.

1. Lean Analytics — Алистер Кролл, Бенджамин Йосковиц

lean-analytics

Первая для прочтения книга содержит основы бизнес-мышления о том, как использовать данные. Книга рассказывает о стартапах, но я считаю, что это больше, чем просто книга о стартапах. Вы изучите, почему важно фокусироваться на одной ключевой метрике, а также узнаете о 6 основных видах онлайн-бизнеса и стратегиях работы с данными в каждом из них.

2. Business value in the ocean of data — Ласло Чер, Тамаш Фехер

business value

Если “Lean Analytics” – это книга о бизнесе и данных для стартапов, то данная книга о бизнесе и данных для больших компаний. Звучит менее красиво, чем первая, но всегда есть шанс получить ценные знания от крупных компаний. Например, как страховые компании используют прогнозную аналитику или с какими вопросами, касающихся данных, сталкиваются банки.

3. Naked Statistics (рус. Голая статистика) — Чарльз Уилан

naked statistics

Я постоянно рекламирую эту книгу на своих каналах. Она предназначена не только для специалистов по обработке данных, в ней содержатся основы статистического анализа с которыми, я считаю, должен ознакомиться каждый. Книга содержит большое количество историй, читая которые, вы узнаете, как не быть обманутым заголовками, наподобие “Как мы ускорили курс обмена валют на 1300%, изменив только одно слово” и т.п.

4. Doing Data Science — Кэти О’Нил, Рэйчел Шатт

doing_data_science

Последняя книга, прежде чем мы перейдем к действительно технической литературе. Данная книга поднимает уровень знаний, полученный из первых трёх книг, на новый уровень. В ней происходит углубленное изучение таких тем, как регрессионные модели, фильтрация спама, рекомендательные машины и даже big data.

5. Data Science at the Command Line – Жерон Янссенс

data-science-at-the-command-line

Другая вещь, которую я постоянно рекламирую, это изучение основ программирования. Со знанием основ программирования, вам будет проще получать, очищать, преобразовывать и анализировать данные. Эта книга расширит ваши возможности в области анализа данных. И когда вы решите начать, я рекомендую начать с данной книги. Так как это единственная книга, содержащая информацию об анализе данных и командной строки, которую я видел. Однако, одной бывает более чем достаточно, чтобы покрыть все.

6. Python for Data Analysis  — Уэс МакКинни

python for data analysis

Вторым языком программирования для изучения анализа данных является Питон. Он не слишком сложный и широко применяется. В Питоне вы можете делать практически все, что связано с анализом, прогнозированием и даже машинным обучением. Это тяжелая книга (более чем 400 страниц), но она охватывает все, что связанно с Питоном.

7. I heart logs — Джей Крепс

i heart logs

Последняя книга данного списка содержит всего 60 страниц, но она очень техническая. Эта книга даст вам хорошее представление о технической стороне сбора и обработки данных. Вероятнее всего, вы, как аналитик или специалист по обработке данных, не будете использовать эти знания напрямую, но, по крайней мере, будете знать, с какими данными работают специалисты по инфраструктуре различных компаний.

Вот и все!

Как я уже говорил, если вы будете придерживаться этого списка, то совместите его с бесплатным практическим курсом по анализу данных, и тогда у вас будут крепкие знания в области анализа данных.

Здесь вы можете узнать о том, как создать хороший исследовательский план.

Спасибо за прочтение!

Ссылка на оригинальную статью
Перевод: Александр Давыдов