
Ваша оценкаЦитаты
odvis8 июня 2024 г.Читать далееФундаментальні концепції можна розбити на три групи:
1. Загальні концепції про те, як data science може стати частиною організації і конкурентного поля — способи привабити, структурувати й підтримувати команди data science, способи використати її для переваги над конкурентами, способи втримати цю перевагу, і тактичні принципи, як керувати data science проектами;
2. Загальні способи, як думати дата-аналітично, які допомагають збирати потрібні дані й вибирати потрібні методи. Серед цих концепцій — процес майнингу даних, добірка висококласних завдань data science, і також такі принципи:
• Команда data science повинна пам’ятати про задачу і сценарій використання під час процесу майнингу даних;
• Дані належить вважати надбанням, а отже, потрібно уважно підходити до того, які зробити інвестиції, щоб отримати від нашого активу найбільше;
• Принцип очікуваного значення допомагає структурувати задачу, і ми можемо побачити складові задачі на майнинг даних, а також які витрати, прибутки й перепони є в бізнес-середовищі;
• Генералізація і перенавчання: якщо ми досить сильно придивимося до даних, то знайдемо в них патерни; нам потрібні патерни, які генералізуються на дані, яких ми ще не бачили;
• Застосовувати data science до структурованої задачі і майнити дані з метою дослідження—це різні зусилля і різні стадії процесу майнингу даних.
3. Загальні концепції, як отримувати знання з даних, які лежать в основі великої кількості напрямків data science. Сюди входять такі концепції:
• Визначення інформативних атрибутів—таких, що корелюють з невідомою потрібною нам величиною або дають нам про неї інформацію;
• Навчання числової функціональної моделі під дані за допомогою вибору цілі й пошуку набору параметрів, основаних на цілі;
• Контроль складності необхідний, щоб знайти правильний компроміс між генералізацією і перенавчанням;
• Обчислення подібності об’єктів на основі даних.017