Инфографика
odvis
- 4 книги

Ваша оценка
Ваша оценка
После прочтения книги осталось больше нейтральное впечатление, чем положительное.
Если говорить про авторов, то они на основе своего 20+ -летнего опыта в data science попытались сформулировать концептуальные положения работы с данными. Много внимания уделено вопросам классификации, кластеризации и прогнозирования, приведены примеры возможных бизнес-задач. К недостаткам можно отнести минимальный объем математических реализаций. Причем, авторы выделяют в книге блоки с формулами и сами часто пишут, что их можно пропустить.
Много замечаний возникает к редакторам и переводчикам книги. Т.к. ощущается, что это были люди далекие от экономико-математического моделирования и не владеющие необходимой терминологией.
И поэтому "витік диних" становится "течею", "інтервал довіри" - "вірчим інтервалом" и т.п. В цитатах в тексте авторы или не переведены, или встречатся в разночтениях. Например, в тексте "Рон Когаві", а на задней обложке "Ронні Кохаві". Или трансформируются в разные варианты: "Ляпоїн" (стр. 172), "Лапоїн" (стр. 173), "Лапуант" (стр. 188), "Лепуан" (стр. 198). В описании таблицы пользователь кредитной карты по имени "Давид", а в самой таблице "Девід" (стр. 176). На странице 305 упоминание Перис Хилтон в мужском роде. И подобного очень много.
На стр. 115 есть интересное определение:
Т.е. можно отметить, что невычитанности встречаются часто.
Удобным вариантом прочтения, возможно, будет ознакомление с "Додаток А. Інструкція до оцінки пропозиції", а затем прочтение соответствующих глав, на которые ссылаются в нужном пункте приложения.
Книгу сложно порекомендовать как один из основных учебников для работы с данными, но для понимания фундаментальных подходов можно порекомендовать как дополнительную литературу.

Фундаментальні концепції можна розбити на три групи:
1. Загальні концепції про те, як data science може стати частиною організації і конкурентного поля — способи привабити, структурувати й підтримувати команди data science, способи використати її для переваги над конкурентами, способи втримати цю перевагу, і тактичні принципи, як керувати data science проектами;
2. Загальні способи, як думати дата-аналітично, які допомагають збирати потрібні дані й вибирати потрібні методи. Серед цих концепцій — процес майнингу даних, добірка висококласних завдань data science, і також такі принципи:
• Команда data science повинна пам’ятати про задачу і сценарій використання під час процесу майнингу даних;
• Дані належить вважати надбанням, а отже, потрібно уважно підходити до того, які зробити інвестиції, щоб отримати від нашого активу найбільше;
• Принцип очікуваного значення допомагає структурувати задачу, і ми можемо побачити складові задачі на майнинг даних, а також які витрати, прибутки й перепони є в бізнес-середовищі;
• Генералізація і перенавчання: якщо ми досить сильно придивимося до даних, то знайдемо в них патерни; нам потрібні патерни, які генералізуються на дані, яких ми ще не бачили;
• Застосовувати data science до структурованої задачі і майнити дані з метою дослідження—це різні зусилля і різні стадії процесу майнингу даних.
3. Загальні концепції, як отримувати знання з даних, які лежать в основі великої кількості напрямків data science. Сюди входять такі концепції:
• Визначення інформативних атрибутів—таких, що корелюють з невідомою потрібною нам величиною або дають нам про неї інформацію;
• Навчання числової функціональної моделі під дані за допомогою вибору цілі й пошуку набору параметрів, основаних на цілі;
• Контроль складності необхідний, щоб знайти правильний компроміс між генералізацією і перенавчанням;
• Обчислення подібності об’єктів на основі даних.