Больше, чем дата

Еще несколько лет назад мы и представить себе не могли, что большие данные, оказывается, уже давно формируют наш ежедневный образ жизни и влияют на наши решения. Судите сами: утром мы смотрим прогноз погоды, определяемый метеорологами, которые в наблюдениях анализируют огромное количество источников. Чтобы мы добрались до офиса вовремя, информационные системы собирают сведения о перемещениях людей и регулируют сигналы светофоров. После работы мы заходим в магазин, который предлагает нам персональные скидки.

Все это возможно благодаря большим данным. И сам термин Big Data уже на слуху у всех. С их помощью, к примеру, бизнес может прогнозировать поведение клиентов и управлять производством, а администрации городов – проектировать строительство новых объектов инфраструктуры. В совместном спецпроекте МегаФона и “Ъ” мы расскажем о том, как большие данные и решения на их основе упрощают нашу жизнь и помогают развивать целые регионы.

Кому помогает Big Data?

Администрации

Бизнес

Жители

Как Big Data
помогает администрации
Город

В мире, где каждый второй человек является городским жителем, невозможно представить развитие мегаполиса без современных технологий — и, в частности, без анализа больших массивов данных. Некоторое время назад аналитики даже ввели в обиход понятие Data Driven City (DDC) — «город, управляемый данными». Такой город характеризуется способностью муниципалитетов использовать технологии сбора, обработки и анализа данных для повышения качества жизни граждан.

Москва, например, давно внедряет решения на основе «больших данных», которые позволяют оценивать необходимость развития социальных объектов, например, строительства новых больниц, детских садов и открытия школ. Для этого могут использоваться обезличенные данные с транспортной инфраструктуры, камер наружного наблюдения или городских порталов. Успехи российской столицы на этом поприще неоспоримы: так, в 2016 году PwC поставила столицу на второе место в мире после Нью-Йорка в рейтинге DDC.

Сам термин big data появился в 2008 году с легкой руки редактора журнала Nature Клиффорда Линча,
который употребил это выражение в спецвыпуске, посвященном взрывному росту мировых объемов информации.
В бывшей столице Китая, городе Нанкин, датчики установлены на 10 тыс. такси, 7 тыс. автобусов и на 1 млн частных машин. Данные, которые удается собрать таким образом, ежедневно поступают в информационный центр Нанкина.
Эксперты централизованно отслеживают и анализируют сведения о транспортных потоках, а затем отправляют обновления на смартфоны пассажиров. Это позволяет властям города создавать новые маршруты, которые улучшают транспортную ситуацию без строительства новых дорог.
Туризм

Активное развитие внутреннего туризма в России в 2020 году наглядно продемонстрировало необходимость использования технологий аналитики для выявления потребностей отдыхающих и развития потенциала регионов. Применение для этого анализа массивов больших данных позволит местным властям принимать эффективные финансовые решения, ведь развитие городской инфраструктуры не дешевый процесс.

О намерении использовать технологии Big Data для оценки туристического потенциала развития региона еще в 2019 году объявил глава Госкомитета Татарстана по туризму Сергей Иванов. Заинтересовано в использовании подобных решений и правительство Пермского края, которое в феврале 2020 года объявило о совместном проекте с МегаФоном по исследованию туризма с помощью геоаналитики.

Основным источником информации является нагрузка на базовые станции оператора, которые фиксируют перемещение абонентов сотовой связи. На основе обезличенных данных клиентов сервис определяет, откуда приехали гости, как долго находились в городе, где останавливались, какие места посетили. Система выгружает агрегированную статистику по социально-демографическим показателям, которые позволяют изучать демографическое состояние и изменения структуры и численности населения региона. Сервис МегаФона также анализирует самодостаточность территорий по занятости проживающего на них населения, трудовую маятниковую миграцию между муниципальными образованиями внутри региона и из Прикамья в Москву, Московскую область и другие регионы.

Эффективным механизмом является также привлечение самих жителей к решению проблем города. Например, в столице реализована пока самая масштабная платформа краудсорсинга «Активный гражданин», с помощью которой жители могут оповестить власти о необходимости установки детской площадки, пешеходного перехода или светофора в конкретном месте. Подобные решения внедряют и регионы: так, власти Челябинска, Нижнего Новгорода, Воронежа и других крупных городов также используют опросы, сборы статистики и «умные» технологии на основе Big Data для внедрения новых стандартов градостроительства и формирования комфортной городской среды.

Специальные решения для этих задач есть и в портфеле МегаФона, который предлагает использовать аналитику больших данных для оценки ключевых показателей развития города или региона. Его сервисы позволяют выстраивать профиль населения, проводить оценку его плотности и рост числа, определять потребности в инфраструктуре социальных учреждений и планировать строительство новых жилых и производственных кварталов.

Большая проблема городов сегодня состоит в том, что высокие темпы урбанизации приводят к ухудшению состояния окружающей среды, в частности, воздуха. Но современные технологии позволяют в режиме реального времени отслеживать содержание в воздухе различных веществ и принимать превентивные меры. Похожая ситуация обстоит и с мониторингом состояния зеленых насаждений в городе. Аналитика Big Data может помочь уходу за городскими парками, а также обеспечить своевременный вывоз бытовых отходов в жилых домах.

В ведении главной ж/д компании Италии TrenItalia более чем 2 тыс. скоростных поездов. Перевозчик перешел на прогнозное обслуживание оборудования благодаря технологиям интернета вещей и машинного обучения.
Снимая информацию с 6 млн датчиков, установленных на поездах, TrenItalia экономит не менее 8% затрат, связанных с ремонтом оборудования без потери качества и надежности работы деталей и узлов.
Согласно прогнозам IDC, общий объем мирового рынка технологий обработки больших данных и бизнес-аналитики будет ежегодно расти на 13,2% и к 2022 году составит $274,3 млрд (20,3 трлн руб.).
По итогам 2018 года рынок больших данных оценивался в России в 45 млрд руб., к 2024 году при базовом сценарии отрасль вырастет на 100 млрд руб. в год, говорила руководитель стратегического комитета Ассоциация больших данных, управляющий директор Sberdata Мария Поликанова.

Аналогичный проект оператор запустил и в Ханты-Мансийском автономном округе. Сервисы МегаФона также успешно применялись для анализа туристического потока в Москве во время чемпионата мира по футболу в 2018 году.

Сервис позволяет оценивать не только количество туристов, посетивших анализируемый регион или город, но и доходы региона от туристической отрасли, ранжировать их по социально-демографическим параметрам туристов, их домашним странам и регионам. Анализ получаемых от туризма доходов дает возможность определить целевые туристические места и сформировать портрет туристов, которых необходимо привлекать в регион. В результате полученные с помощью анализа данные позволяют местным властям оценивать долю туристической отрасли в регионе, находить точки притяжения туристов, развивать новые направления бизнеса, например, открывать гостиницы или запускать новые торговые компании, нацеленные за продажу интересных туристам товаров, проводить мероприятия, привлекая инвестиции и в целом повышая качество жизни проживающих в регионе людей.

Intel производит процессоры. Перед поставкой в магазин каждый процессор должен пройти примерно 19 тыс. тестов — это долго и дорого.
Анализ данных всего производственного процесса помог понять, какие тесты избыточные. В итоге на них удалось сэкономить около $30 млн.

Геоаналитика полезна и после открытия торговых точек. Данные о том, сколько времени покупатели проводят в торговых центрах и у каких витрин задерживаются, помогают управлять потоками клиентов.

Amazon уже давно и успешно использует анализ больших данных, чтобы знать каждого своего клиента в лицо. Пока вы находитесь на сайте, компания анализирует буквально все: время, проведенное на каждой страничке, тепловые точки (куда вы перемещаете мышь) и все клики. Кроме того, Amazon по адресу доставки делает вывод о финансовой состоятельности клиентов и исходя из этого предлагает товары, которые точно будут по карману покупателям, пишет консалтинговое агентство Bernard Marr & Со.

Инструменты, с помощью которых можно проанализировать ключевые характеристики аудитории и сформировать цифровой портрет клиента, актуальны не только для сферы торговли. Аналитический сервис МегаФона «Смарт Профиль» дает оценку аудитории в разрезе конкретных локаций. На основе агрегированных данных проводится анализ посетителей торговых и деловых центров, парков, организованных мероприятий — культурных, спортивных. При профилировании учитываются такие параметры, как пол, возраст, уровень дохода, длительность пребывания в анализируемой локации, район проживания или работы и на их основе формируется обезличенная статистика. Это дает понимание интересов аудитории и ее потребностей, удовлетворив которые заказчик сможет привлечь больше посетителей.

Как Big Data
помогает бизнесу в регионах
РИТЕЙЛ

Технологии на основе больших данных уже массово применяются в розничной торговле. Big Data позволяет прогнозировать объемы продаж промо-товаров, анализировать поведение покупателей и их корзины покупок. Например, собранная и проанализированная информация о среднем чеке клиента поможет предложить ему наиболее подходящую скидку или акцию. По сути, Big Data дает возможность динамически моделировать ситуации влияния внешних факторов на выручку.

«Использование данных о реальном поведении потребителей в каждом отдельном сегменте позволяет эффективно управлять ассортиментом, повышает результативность проводимых рекламных кампаний и применяемых программ лояльности», — рассказывает партнер технологической практики КПМГ в России и СНГ Тимофей Хорошев. Геоаналитика на основе больших данных от сотовых операторов позволит, например, узнать, сколько человек, с каким достатком и когда проходят в определенных районах города. Это поможет понять, какой магазин и где расположить. В одних точках удачно «зайдут» небольшие магазины с базовым набором продуктов, а в других — супермаркеты с дорогими позициями.

Amazon использует большие данные для системы рекомендаций товаров. Их система основана на машинном обучении — она учитывает поведение других покупателей, ваши предыдущие покупки, время года и десятки других факторов.
В итоге 35% всех продаж в Amazon генерируют рекомендации, а 86% пользователей сервиса утверждают, что рекомендации влияют на их решения о покупке.
Mastercard работает не только как платежная система — она собирает данные, которые помогают выявлять неплатежеспособных контрагентов, не возвращающих кредиты.
Mastercard предупреждает финансовые организации, что с такими контрагентами не стоит вести дела.

Как бы то ни было, для большинства логистических компаний Big Data — это все еще terra incognita. Согласно исследованию KPMG, 57% транспортных компаний не имеют конкретных планов по цифровизации, и только 24% из них сейчас внедряют предиктивную аналитику.

HUMAN RESOURCES

В HR Big Data будет полезна в найме сотрудников и предупреждении увольнений, оптимизации HR-стратегии. На начальном этапе найма часто требуется отсеять тех, кто мало заинтересован в работе или совсем для нее не подходит. Эту задачу можно решать с помощью больших данных: собирать информацию о кандидатах и резюме, выявлять в них закономерности, использовать их для разработки скриптов или обучения роботов и нейросетей, избавляясь от ручного труда.

На одну вакансию в крупных компаниях может приходить около 100 резюме в день. Просматривать их все очень трудоемко. Поэтому компании внедряют интеллектуальные системы, эффективно работающие с данными, рассказывают в «Инфосистемах джет». Список заявок ранжируется по категориям, подбираются подходящие кандидаты, после чего предиктивная модель анализирует данные об их заслугах и составляет карьерные траектории, с помощью которых можно представить, чего ожидать от сотрудника на рассматриваемой должности.

ЛОГИСТИКА

Логистика, пожалуй, самая сложная и интересная сфера, в которой используют технологии обработки больших массивов данных: беспилотный транспорт, трекинг грузов, оптимизация «последней мили». Если собрать всю информацию о загрузке складов, пробках на дорогах, состоянии парка машин, расположении автозаправок, сопоставить ее и проанализировать, то можно намного эффективнее планировать маршруты и время доставки, чтобы избежать простоев транспорта. Так поступила компания ПЭК: она запустила центр управления перевозками на базе Big Data. Это помогло ей прогнозировать загрузку 189 складов по всей России на месяц вперед и планировать маршруты грузового транспорта.

Аналитика Big Data в логистике нужна в том числе, чтобы постоянно быть в курсе операционной деятельности компании. С помощью дэшбордов, куда стекаются обработанные данные о цепочках поставок, грузоперевозках и загрузке складов, руководитель в реальном времени может видеть настоящую картину происходящего, получать отчеты о проблемах и решать их на месте. Без звонков и переговоров.

Однако в логистике, как объясняют в Ассоциации больших данных, аналитика Big Data играет важную роль именно при организации работы складов. Основной принцип — товар должен находиться на складе минимальное количество времени, и технологии позволяют организовать эффективное управление логистикой товара. С помощью сопоставления графиков поставок и отгрузок, а также анализа многих других показателей товар может покинуть склад практически сразу после поступления.

В Google есть отдел People Analytics, который анализирует большие данные, связанные с поведением сотрудников. У них есть несколько успешных кейсов применения big data:
- еще в 2002 году в компании проанализировали работу тысяч менеджеров и создали «8 стратегий поведения менеджеров Google». Сейчас стратегии регулярно дополняют и используют при найме и обучении сотрудников
- аналитики постоянно отслеживают поведение и состояние сотрудников: сколько они зарабатывают, часто ли задерживаются на работе, насколько эффективны. На основе этого принимают решение о дополнительных выплатах или продлении отпусков
- специальные алгоритмы предупреждают, что конкретный сотрудник в ближайшее время захочет уволиться. Это помогает менеджерам вовремя среагировать.
Thaspol - stock.adobe.com
В детской больнице Торонто внедрили проект Artemis. Больничная система собирает и анализирует данные по новорожденным — она каждую секунду анализирует 1260 показателей.
На основе этих данных система может предсказать нестабильное состояние ребенка, чтобы ему смогли вовремя помочь.

Если потенциальный покупатель больше всего времени проводит в Facebook, то он, как правило, более обеспечен, внимательно исследует товар, читая тексты, и не склонен к спонтанным покупкам. Фанаты Instagram любят глазами и наоборот, покупают продукты и услуги спонтанно (здесь важно напомнить, что все данные о пользователях собираются и анализируются в обезличенном виде).

С большими данными стало возможным лучше таргетировать предложения. Ковровые бомбардировки заменяются рекламой для тех, кто потенциально интересен рекламодателю и соответствует представлениям о целевых потребителях его товаров и услуг, указывает гендиректор «ТМТ Консалтинг» Константин Анкилов.

Формирование обширного поведенческого профиля с помощью Big Data для привлечения клиентов, их развития и удержания — уже не просто конкурентное преимущество для самых продвинутых компаний, а must have для бизнеса любого размера.

Также большие данные применяют для анализа эффективности маркетинговой деятельности: измерение эффекта рекламы на продажи, на лояльность клиентов, на изменение доли рынка, рассказывает директор по аналитике и алгоритмам oneFactor Максим Воеводский.

Это делает подбор претендентов более предсказуемым и сокращает расходы на поиск новых сотрудников в будущем. Такая система уже работает в крупном российском банке.

Согласно данным исследования HeadHunter, проведенного в январе 2020 года, сейчас 30% российских компаний используют системы автоматического подбора персонала. И они ими довольны: 42% опрошенных HR-специалистов сказали, что у них появилось больше времени на выполнение задач, 28% стали лучше понимать, куда идут деньги, и еще 26% заметили, что наем в их компании стал быстрее, чем у конкурентов.

Используя большие данные, работодатели могут понимать, как мотивировать сотрудника и улучшить результаты его работы. Такие инструменты, как анализ социальных сетей, опросы работников и их тестирование дают HR-специалистам информацию, позволяющую сделать работнику выгодное предложение.

РЕКЛАМА

Когда заходит речь об использовании бизнесом Big Data, то едва ли не первое, что приходит на ум — это реклама. Компании должны максимально четко понимать потребности своего клиента: сколько средств он в среднем тратит на покупку тех или иных товаров, какой у него уровень дохода, в каких местах он бывает в будние дни и в выходные, какие мессенджеры он предпочитает использовать для общения. Последнее, кстати, может многое сказать о клиенте.

Сети Walmart, в которую входят 20 тыс. магазинов, расположенных в 28 странах, приходится каждый час обрабатывать 2,5 петабайт данных.
Ритейлер получает информацию из 200 источников – это метрологические, экономические данные, данные Nielsen, телекоммуникаций, соцсетей, даже цены на газ и местные новости. Чтобы справиться с таким потоком, Walmart создала аналитический хаб Café data: каждый час он обрабатывает около 25 тыс. запросов, 90% которых анализируется в течение 2 секунд.
У Lamoda есть исследовательская лаборатория Data Science, которая регулярно изучает покупателей, выделяя их ключевые характеристики.
Поведение пользователей на платформе тщательным образом анализируется, учитывается буквально все: от кликов на товары до истории покупок.

А технологии искусственного интеллекта и машинного обучения позволяют моментально оценить существующие поверхности и места для установки новых конструкций. Таким образом, предприятия получают возможность заранее, еще на этапе планирования медиакампании, понять количество возможных контактов целевой аудитории с площадкой.

Похожим образом построен рынок телерекламы, обращают внимание в Ассоциации больших данных (АБД). Например, Smart TV тоже снимает информацию, что смотрит пользователь в данный момент, и мгновенно собирает потребительский профиль, в основе которого социальные и демографические данные. На их базе формируется портфель рекламных сообщений, которые имеет смысл транслировать на данную целевую аудиторию, а также формируются цены для рекламодателей. Реклама утром и вечером стоит дороже, чем реклама днем, поскольку большинство потенциальных потребителей днем уходят на работу и не видят рекламные ролики.

Большие данные также помогают оптимизировать цены на размещение наружной рекламы, продолжают в АБД: «Анализируются машинопотоки в различных местах, и там, где чаще образуются пробки, реклама будет дороже, чем в местах, где машины едут быстро, и водители не успевают смотреть по сторонам».

Новый вектор развития технологий Big Data в рекламе и маркетинге — это оценка офлайн-взаимодействий клиентов с рекламой. Два года назад МегаФон разработал технологию, позволяющую оценивать эффективность наружной рекламы, чтобы бизнес еще до запуска рекламной кампании мог понять, какая офлайн-реклама будет востребована у их потенциальных покупателей. Технология оценивает около 80% всех поверхностей на территории страны независимо от формата и расположения. Система на основе агрегированных из различных источников данных (нагрузка на сети сотовых операторов, информация от веб-партнеров, данные из мобильных приложений) рассчитывает медиапоказатели.

В Х5 Retail Group, сети с более чем 15 тыс. магазинов, развернута платформа больших данных из 270 серверов (ядром которой выступает кластер Hadoop объемом 4 петабайта данных), к которой подключены 70 источников.
Все это для того, чтобы максимально эффективно взаимодействовать покупателем, строить для него персонализированные сервисы, прогнозировать его интересы, анализировать изменения потребностей.

В Москве, которой уже много лет предрекают транспортный коллапс, с 2011 года развивается интеллектуальная транспортная система на основе Big Data, при ее создании учитывался опыт США, Гонконга, Сингапура, а также европейских стран. В рамках проекта работает ситуационный центр ЦОДД, специалисты которого отвечают за организацию дорожного движения и все системы, задействованные в его работе — в том числе управляющие светофорами, следящие за условиями дорожного движения, фото и видеофиксацию, управление городским пассажирским транспортом. Текущая ситуация отслеживается с помощью динамической транспортной модели, которая обновляется в реальном времени и позволяет властям оперативно реагировать на возникающие проблемы. В этой системе собираются данные, полученные с датчиков ГЛОНАСС на городском транспорте, камер и специальных датчиков, которые считывают интенсивность движения, скорость автомобилей и ряд других параметров. В результате транспортная система столицы признается сегодня одной из лучших в мире.

Как Big Data
помогает жителям
ТРАНСПОРТ

Анализ Big Data сегодня активно используется для решения проблем управления транспортной отраслью и оптимизации всей дорожной инфраструктуры. В нашей стране не самая большая протяженность дорог — всего около 1,5 млн км по сравнению с 5,3 млн км в Европе и 6,6 млн км в США, — и в ряде регионов это обостряет риски перегрузки магистралей. Предиктивная аналитика, основанная на больших данных, помогает определять необходимость ввода новых развязок и путепроводов.

В крупных городах неотъемлемой частью транспортной системы становятся интеллектуальные системы управления трафиком. Такие технологии позволяют прогнозировать ситуацию на дорогах с учетом разных вариантов изменения обстановки. С их помощью можно также рассчитывать перекрытия дорожного движения, установку новых светофоров, обнаруживать и устранять очаги аварийности.

Забавный кейс на заре использования Big Data от Amazon. Жительница США начала получать персонализированные предложения со скидками на товары для новорожденных.
Все бы ничего, но у нее не было детей. Возмущение женщины спустя небольшой период времени сменилось удивлением: выяснилось, что она беременна, и ритейлер узнал об ее положении раньше нее самой. Но никакой магии: машинный алгоритм Amazon просто анализировал запросы в поисковых сетях, выявил такую закономерность и оказался прав.
Наглядный пример применения Big Data при формировании ассортиментной политики продемонстрировала H&M. В 2018 году на протяжении 10 месяцев прибыль сети падала. Ритейлер решил найти причину с помощью высоких технологий.
В одном из стокгольмских магазинов H&M аналитики детально проанализировали продажи и возвраты и пришли к выводу, что клиентская база (в основном женщины) предпочитает одежду и аксессуары пастельных тонов и готова платить за них даже больше, чем предполагал ритейлер. В итоге он сократил SKU мужской одежды, добавил посуду, дорогие кожаные сумки и кашемировые свитера. Проанализировав данные и других своих магазинов, сеть смогла убрать 40% невостребованного ассортимента, не снизив при этом показатели продаж.

Строительство железных дорог тоже сегодня стало объектом для применения больших данных. Анализ информации, собираемой с составов, позволяет создавать более эффективные и экономичные решения для содержания ж/д полотна. Например, в Саудовской Аравии Bombardier построила монорельсовые дороги для поездов, которые на 25% легче и на 10% менее энергозатратны, чем поезда в метро, а в Нидерландах анализ данных о пассажиропотоке и состоянии железных дорог позволяет регулировать отправления и экономить государству десятки миллионов евро ежегодно.

МЕДИЦИНА

Сегодня медицинские организации по всему миру обладают недоступными ранее инструментами и объемами данных, которые можно собирать, анализировать и использовать для диагностики, лечения и прогнозирования заболеваний. Но в силу чувствительности медицинской информации во многих странах власти пока не спешат их применять.

Однако пандемия коронавируса в этом году стала толчком в использовании технологий на основе сбора больших обезличенных данных в медицине. В частности, технологии Big Data и система машинного обучения для мониторинга здоровья BlueDot зафиксировали вспышку пневмонии, вызванной коронавирусом, раньше специалистов Всемирной организации здравоохранения (ВОЗ) – еще 31 декабря 2019 года.

Специально для развития городских проектов, в том числе в транспортном комплексе, свое решение геопространственной аналитики на основе больших данных запустил МегаФон. Техническая база оператора позволяет городским властям изучать и анализировать поведение больших групп людей, оценивать их перемещения в границах территорий любой площади и по разным маршрутам, а также прогнозировать изменения в будущем. В конечном итоге на основе полученных данных можно сформировать объективную картину потребностей города в строительстве инфраструктурных объектов, дорог, мостов, развязок.

Московские власти используют большие данные не только для строительства дорог, но и для развития наземного транспорта и метрополитена. Сейчас данные обо всех перемещениях в городе анализируются с помощью чипов в билетах, каждый из которых имеет свой идентификационный код, считывающийся при валидации билета. Данные собираются в обезличенном виде и позволяют оценить, как пассажиры передвигаются в разных районах города и где необходимы новые станции. Например, открытие станций Московского центрального кольца (МЦК) «Хорошево» и «Панфиловская» в районе Хорошево-Мневники позволило разгрузить ближайшие станции метро. В целом пассажиропоток МЦК продолжает расти, и по итогам 2019 года он увеличился на 14,5%, превысив 148 млн пассажиров.

Кульминацией успешного использования «больших данных» Apple является распространение Apple Watch. Теперь возможности сбора данных о пользователе становятся практически безграничными:
в компании знают, что носитель часов ел, сколько шагов он прошел, какая у него температура. Сейчас эти данные используются в основном для улучшения здоровья потребителей. IBM также выразила заинтересованность в технологии и заключила с Apple партнёрское соглашение. Вместе компании используют Big Data для предотвращения распространения болезней, их лечения и профилактики.
Denys Prykhodov - stock.adobe.com
«Яндекс.Деньги» разработали антифрод-систему для защиты онлайн-бизнеса, платежей и данных пользователей от мошеннических действий.
Она помогает снизить риск мошеннических операций, повысить конверсию, уменьшить расходы на претензионную работу с клиентами и защититься от репутационного урона. Система умеет работать с большими данными: оценивая множество параметров операции и сравнивая их с имеющимися профилями, она ищет аномалии и выдает резолюцию. При этом в анализе задействованы как статические правила, так и модели, позволяющие классифицировать операцию в реальном времени и относить к мошеннической или легитимной.

Фармацевтическая отрасль тоже активно использует анализ больших данных. В частности, в клинических испытаниях новых препаратов. Чем больше сведений о потенциальных испытуемых получит компания до начала исследования, тем больше у нее будет шансов сформировать подходящую группу и успешно провести испытания. Записи в электронных медицинских картах, данные с датчиков на мобильных устройствах и даже соцсети — источники дополнительной информации об участниках тестов. Когда фармкомпании с разрешения пациентов получают эти сведения и применяют инструменты для их обработки, им становится проще формировать группы для клинических испытаний.

БЕЗОПАСНОСТЬ

Повышение безопасности граждан — один из приоритетов городских властей всех без исключения стран, а использование для этого современных технологий только набирает обороты. Чаще всего для предотвращения и расследования преступлений и инцидентов в городе используется и анализируется информация с камер видеонаблюдения, но это только один из возможных каналов для получения необходимых сведений.

Например, по данным TAdviser, в Лондоне и Нью-Йорке пожарные службы используют социально-демографические данные и профили риска зданий для поиска объектов противопожарной инспекции и определения наиболее опасных районов.

Эта платформа в режиме реального времени анализирует новостные сводки в СМИ на иностранных языках, официальные заявления властей, а также отчеты о болезнях в животном и растительном мирах. Искусственный интеллект агрегирует и косвенные данные: посты в блогах и на форумах, а также брони авиабилетов по всему миру. Благодаря этому система верно определила не только место возникновения эпидемии, но и пути ее дальнейшего распространения: от китайского Уханя в Бангкок, Сеул, Тайбэй и Токио. Другие методы анализа больших данных уже используются для разработки вакцин и лекарств от коронавируса.

Крупнейшие IT-компании тоже пытаются найти себе место в медицинском секторе, используя свою экспертизу в Big Data. Apple уже несколько лет стремится занять свою нишу в системе здравоохранения с помощью умных часов, которые отслеживают пульс человека и могут вызвать службы спасения в случае сердечного приступа. Еще в 2014 году компания представила систему HealthKit, в которой собираются все медицинские данные пользователя, полученные с iPhone, и затем становятся доступными медицинским работникам, представляющим организации, сотрудничающие с Apple. Есть примеры работы IT-корпораций в сфере здравоохранения и по другую сторону океана. Например, в состав Alibaba Group входит подразделение Alibaba Health, которое помогает фармацевтическим компаниям с трекингом и идентификацией медицинских продуктов.

Более трети (36%) опрошенных руководителей промышленных предприятий сообщили о внедрении технологий сбора, обработки и анализа больших данных.
Планы по их дальнейшему использованию имеет почти каждая пятая организация (18,5%): в 2020 г. – 5%, в течение ближайших пяти лет – 14,2%. Наиболее востребованы эти технологии в добывающей промышленности: их применяют 39,8% организаций, еще 28% планируют внедрить в будущем, говорится в отчете Института статистических исследований и экономики знаний (ИСИЭЗ) НИУ ВШЭ.
С помощью Big Data «Газпром нефть» нашла причины сбоев автоматического перезапуска электроцентробежных насосов после аварийного отключения электропитания.
Рабочая группа использовала более 200 млн записей, полученных в 2014 году с контроллеров систем управления насосами на 1649 скважинах, а также записи рестартов напряжения из аварийных журналов. Проанализировать информацию традиционными методами было невозможно из-за большого объема неструктурированных данных в разных форматах и необходимости учесть множество различных факторов: скважинные условия, условия эксплуатации, схемы электроснабжения и др. Применение инструментов Big Data позволило не только сформировать и проверить набор гипотез о причинах сбоев в автозапуске, но и получить информацию о ранее неизвестных взаимосвязях в работе насосного оборудования.

На основе фактов совершенных преступлений разрабатывается график патрулирования местности. Данные о количестве преступлений, их месте, времени, типе и числе пострадавших позволяют определить, сколько требуется патрулей, где и в какое время, и оптимизировать маршрут с учетом этой информации.

В России для поиска пропавших детей и взрослых в 2019 году МегаФон запустил специальную платформу с использованием технологии анализа Big Data. Система «МегаФон Поиск» анализирует круг людей, которые могли быть рядом с пропавшим человеком, и рассылает им сообщения с фотографией, приметами, возрастом. Технология разработана и протестирована совместно с поисково-спасательным отрядом «Лиза Алерт». Таким образом, внедрение цифровых технологий в социальной сфере помогает спасению жизней пропавших людей, которые чаще всего не обладают силами или возможностью вернуться домой самостоятельно.