Наука о данных

Наука о данных (Data science) новая междисциплинарная область, объединяющая в себе статистику и новейшие методы обработки и анализа данных.

Но это не все. Обработка и анализ данных, а также гипотезы и призрачные прогнозы – это прошлое. Теперь, опираясь на новые инструменты (Data science и искусственный интеллект) мы можем прогнозировать результаты с точностью до 96% (для некоторых отраслей) и строить рабочие, дееспособные бизнес- и производственные модели будущих процессов.

В основе самой Науки о данных лежит идея того, что анализ большого количества данных (big data), ставший быстрым, реальным и эффективным благодаря современным  IT технологиям и в первую очередь Искусственному Интеллекту, открывает новые возможности для прогнозирования, моделирования и планирования.

До 2010 года  мир глобально решал проблему хранения и обработки больших массивов данных, но 2010 год считается переломным моментом в индустрии. Проблема хранения данных была решена. Мир вступил в качественно новую фазу – использование ВСЕХ доступных данных (как структурированных, так и фрагментарных) и развитие инструментов Data science в качестве инструментов создания будущих процессов, проектов и идей.

Фактически все, что сегодня мы можем видеть в научно-фантастических фильмах, становится гипотетически возможным благодаря Data science.

Ключевая разница между классической статистикой и Наукой о данных в подходах. Фокусом статистических методов являются сбор количественных данных и описание процессов, которые эти данные иллюстрируют.

В Науке о данных в фокусе находится прогнозирование процессов и моделирование гипотез и вероятностей на основе огромных массивов структурированных и фрагментарных  данных, их динамики и взаимосвязей.

Вот несколько примеров для получения более ясной картины:

Изучая точные желания ваших клиентов на основе существующих данных, таких как история покупок, интересы клиента,  просмотренные страницы, возраст и доход вы можете сформировать именно то предложение, которое они ждут.  Несомненно, все эти данные у вас были и раньше, но теперь, имея огромный объем и разнообразие данных, вы можете более эффективно обучать модели и более точно рекомендовать продукт своим клиентам. А разрабатывая программы лояльности и диверсифицируя бизнес, вы сможете предложить клиенту дополнительные сервисы, специальные возможности и многое другое, о чем прежде никогда не задумывались.

А вот другой сценарий, который позволит хорошо понять прикладную роль Data science. Например,  беспилотный автомобиль. Как он работает? Беспилотный автомобиль собирает разрозненные, фрагментарные данные в реальном времени с датчиков, камер и радаров. На основе этих данных он принимает решения, например, когда увеличивать скорость, когда снижать скорость, когда обгонять, где делать поворот и так далее. Искусственный Интеллект беспилотника совершенствует сам себя с помощью алгоритмов машинного обучения (одна из ключевых отраслей Data science).

Давайте посмотрим, как Data science можно использовать в прогнозной аналитике. Самое привычное – это прогноз погоды. Данные с кораблей, самолетов, радаров, спутников можно собирать и анализировать для построения моделей. Эти модели не только предсказывают погоду, но и помогают предсказывать возникновение любых стихийных бедствий. Это поможет вам заранее принять соответствующие меры и спасти множество человеческих  жизней.

Аналогичным способом мы будем действовать при прогнозировании эффективности рекламы, тенденций покупательской активности или продолжительности жизни.  Сфера не имеет значения, главное – верная постановка задачи и доступ к информации.

Почему точность прогнозов в некоторых отраслях достигает 96%? Благодаря Искусственному Интеллекту, машинному обучению и современной скорости обработки данных мы можем обрабатывать (т.е. находить взаимосвязи и анализировать их) не только структурированные, но и фрагментарные данные из разных источников, а также менять алгоритмы обработки. Гибкость подхода – один из принципов машинного обучения, когда Искусственный Интеллект снова и снова ищет наиболее оптимальные решения поставленных задач.

X