Анализ данных уже лет пять как стал одним из главных IT-направлений для бизнеса. Его используют интернет-поисковики, магазины, отделы логистики, промышленные производства — сфера применения только растет. Вместе с ней растут «дружелюбность» и доступность инструментов анализа данных и машинного обучения.
Появляются новые библиотеки, сервисы, среды разработки. Основные методы остаются кодоцентричными — строятся вокруг написания программного кода. Но сами концепции работы становятся все более высокоуровневыми и наглядными.
На вебинаре вы познакомитесь с Orange3 — визуальной средой анализа данных и построения data workflow. Она написана на языке Python, что делает её переносимой и доступной в Windows, macOS и Linux. Среда использует стандартные (де-факто) «питоновые» библиотеки Numpy, Scipy и Scikit-learn.
Вы увидите Orange3 в действии
Для наглядности мы возьмем данные о реальных краудфандинговых кампаниях с Kickstarter и применим к ним такие инструменты анализа классификационных задач:
- логистическая регрессия;
- наивный байесовский метод;
- деревья решений;
- нейронные сети;
- оценка и сравнение моделей.