
Электронная
1039.9 ₽832 ₽
Это бета-версия LiveLib. Сейчас доступна часть функций, остальные из основной версии будут добавляться постепенно.

Ваша оценкаЖанры
Ваша оценка
Мне нравится серия Грокаем. Эмоции от прочтения этой немного смешанные, но в целом она мне понравилась. Как первая книги в ML думаю подходит.
Читал я ее с минимальным бекграундом в ML. Знал только что такое линейная регрессия. В математике я тоже не особо хорош, значки интеграла и производных не пугают, но если будет их очень много, то уже страшно. Я это к тому, чтобы вы понимали мой уровень и могли сопоставить со своим, чтобы понять - подойдет она вам или нет.
Плюсы книги: много тем, много разрабранных моделей. Есть и про чистку данных, и про переобучение. Все описано достаточно просто, но вот послдение главы уже душат математикой... Надо быть морально готовым к этому. Есть картинки, схемки - в общем как и во всех книгах Грокаем. Есть и теория и практика. Стандартная глава построена так: 70% как работает алгоритм, 30% пишем алгоритм на питоне без либ.
Минусы: ОПЕЧАТКИ И ОШИБКИ. Я не знаю, есть ли они в оригинале, но ошибок в коде немеренно... То отступов нет, то вообще части кода нет и нужно лезть в гитхаб. Это очень портит общее впечатление.
Итого: как первая книги по ML как будто норм. Она дает базовое представление о том, что такое вообще этот ML.

Сказал Luis Serrano, написав одну из самых больших книжек в серии гроккинг. Автор обещает, что после освоения этой книги, вы станете профессионалом в области machine learning, что ж. Сравним в конце книги.
ЦА - все, кто между просмотром сериала на нетфликс и книгой выберет книгу.
Книга фокусируется на предикативных моделях machine learning и не требует специфичного бэкграунда, так что если вы предсказывали на таро и решили повысить квалификацию, велкам!
Считаю, что у автора дар излагать концепции на простом и понятном языке, и книга действительно может приоткрыть дверь в мир machine learning. На 85ой странице первая ссылка на гитхаб. Irl никто конечно не кодит алгоритмы с нуля и все пользуются пакетами, тем не менее it’s good to “know what’s happening in the background”. Так, в книге приводится алгоритм Байеса, но можно воспользоваться готовой реализацией, например в пакете Scikit-Learn.
Автор подчеркивает, что помимо навыка тренировать модели, важно также уметь их оценивать. В книге приводятся такие метрики как:
не путать с Precision = True positives/(True positives+False positives)
Полнота/Чувствительность: recall/sensitivity = True positives/(True positives+False negatives)
Specificity = True negatives/(True negatives+False positives)
и их комбинированные показатели:
F-score, являющийся гармоническим средним полноты (recall) и точности (precision),
а в таких областях как медицина - AUC, или площадь под кривой/area under the ROC curve (receiver operating characteristic) (строится на основе значений sensitivity и specificity)
Помимо навыков обучения и оценки моделей в арсенале дата-сайентиста, автор также выделяет критический навык очистки и предварительной обработки данных, так как для того чтобы сделать это должным образом, важно иметь хорошее представление о решаемой проблеме и самих данных. Также автор призывает быть mindful и помнить о предрассудках (касательно расы, гендера, сексуальной ориентации, социального статуса, национальности и т.д.), дабы не увековечить их в моделях.
Про то как выбрать признак для разбиения датасета для генерации дерева решений здесь тоже расскажут (путем минимизации средней точности/Gini impurity index (мера неоднородности Джини) /энтропии или максимизации прироста Джини / информации).
В книге рассмотрены такие модели как линейная регрессия (с функцией средней абсолютной MAE и среднеквадратичной ошибки MSE), перцептроны (с функцией ошибки перцептрона PE), логистические классификаторы и нейронные сети с логарифмической функцией потерь LL, модели с использованием регуляризации (L1 или L2 норма, добавляемая к функции ошибки, чтобы уменьшить оверфиттинг) и другие.
Последние 100 страниц - это ответы к упражнениям и немножко математики.
Возможно, в будущем перечитаю. Хорошая база.













Это бета-версия LiveLib. Сейчас доступна часть функций, остальные из основной версии будут добавляться постепенно.

Ваша оценкаЖанры
Ваша оценка
Мне нравится серия Грокаем. Эмоции от прочтения этой немного смешанные, но в целом она мне понравилась. Как первая книги в ML думаю подходит.
Читал я ее с минимальным бекграундом в ML. Знал только что такое линейная регрессия. В математике я тоже не особо хорош, значки интеграла и производных не пугают, но если будет их очень много, то уже страшно. Я это к тому, чтобы вы понимали мой уровень и могли сопоставить со своим, чтобы понять - подойдет она вам или нет.
Плюсы книги: много тем, много разрабранных моделей. Есть и про чистку данных, и про переобучение. Все описано достаточно просто, но вот послдение главы уже душат математикой... Надо быть морально готовым к этому. Есть картинки, схемки - в общем как и во всех книгах Грокаем. Есть и теория и практика. Стандартная глава построена так: 70% как работает алгоритм, 30% пишем алгоритм на питоне без либ.
Минусы: ОПЕЧАТКИ И ОШИБКИ. Я не знаю, есть ли они в оригинале, но ошибок в коде немеренно... То отступов нет, то вообще части кода нет и нужно лезть в гитхаб. Это очень портит общее впечатление.
Итого: как первая книги по ML как будто норм. Она дает базовое представление о том, что такое вообще этот ML.

Сказал Luis Serrano, написав одну из самых больших книжек в серии гроккинг. Автор обещает, что после освоения этой книги, вы станете профессионалом в области machine learning, что ж. Сравним в конце книги.
ЦА - все, кто между просмотром сериала на нетфликс и книгой выберет книгу.
Книга фокусируется на предикативных моделях machine learning и не требует специфичного бэкграунда, так что если вы предсказывали на таро и решили повысить квалификацию, велкам!
Считаю, что у автора дар излагать концепции на простом и понятном языке, и книга действительно может приоткрыть дверь в мир machine learning. На 85ой странице первая ссылка на гитхаб. Irl никто конечно не кодит алгоритмы с нуля и все пользуются пакетами, тем не менее it’s good to “know what’s happening in the background”. Так, в книге приводится алгоритм Байеса, но можно воспользоваться готовой реализацией, например в пакете Scikit-Learn.
Автор подчеркивает, что помимо навыка тренировать модели, важно также уметь их оценивать. В книге приводятся такие метрики как:
не путать с Precision = True positives/(True positives+False positives)
Полнота/Чувствительность: recall/sensitivity = True positives/(True positives+False negatives)
Specificity = True negatives/(True negatives+False positives)
и их комбинированные показатели:
F-score, являющийся гармоническим средним полноты (recall) и точности (precision),
а в таких областях как медицина - AUC, или площадь под кривой/area under the ROC curve (receiver operating characteristic) (строится на основе значений sensitivity и specificity)
Помимо навыков обучения и оценки моделей в арсенале дата-сайентиста, автор также выделяет критический навык очистки и предварительной обработки данных, так как для того чтобы сделать это должным образом, важно иметь хорошее представление о решаемой проблеме и самих данных. Также автор призывает быть mindful и помнить о предрассудках (касательно расы, гендера, сексуальной ориентации, социального статуса, национальности и т.д.), дабы не увековечить их в моделях.
Про то как выбрать признак для разбиения датасета для генерации дерева решений здесь тоже расскажут (путем минимизации средней точности/Gini impurity index (мера неоднородности Джини) /энтропии или максимизации прироста Джини / информации).
В книге рассмотрены такие модели как линейная регрессия (с функцией средней абсолютной MAE и среднеквадратичной ошибки MSE), перцептроны (с функцией ошибки перцептрона PE), логистические классификаторы и нейронные сети с логарифмической функцией потерь LL, модели с использованием регуляризации (L1 или L2 норма, добавляемая к функции ошибки, чтобы уменьшить оверфиттинг) и другие.
Последние 100 страниц - это ответы к упражнениям и немножко математики.
Возможно, в будущем перечитаю. Хорошая база.












