Как крупные компании изучают своих пользователей

18 февраля 2019 г.

Данные о пользователях - ресурс, который имеет особую ценность для бизнеса. Лидеры рынка — Facebook, Google, Twitter, Amazon, Uber ежедневно собирают и анализируют информацию о миллионах пользователей, постоянно увеличивая точность своих вычислений. Алгоритмы обработки данных позволяют компаниям проводить исследования рынка, конкурентную разведку, управлять репутацией бренда, детектировать информационные атаки, выявлять мошенничества и решать многие другие задачи. Ниже мы приводим обзор алгоритмов, с которыми работают крупные платформы.

Facebook

Facebook — платформа, которая оперирует постоянно увеличивающимся объемом информации о пользователях. Помимо данных, которые люди загружают самостоятельно, некоторую информацию Facebook узнает, используя алгоритмы. Так, благодаря алгоритму распознавания лиц Facebook может следить за перемещениями и социальными взаимодействиями пользователей, подгружая графические данные всей сети. О предпочтениях пользователей Facebook узнает, отслеживая файлы cookie. Другими словами, если пользователь вошел в Facebook и одновременно просматривает другие сайты, социальная сеть может сохранять и использовать информацию о траектории пользователя. Тем самым платформа способна формировать предлагаемый контент.

Анализируя отклики на страницах пользователя (лайки, комментарии и репосты), возможно предсказать ряд его личных предпочтений, в том числе, с достаточной степенью точности предсказать уровень интеллекта, эмоциональную стабильность, религиозные убеждения, семейный статус, возраст, пол, расу и политические взгляды.

Amazon

Amazon известен точностью персональных рекомендаций, построенных благодаря механизму совместной фильтрации (CFE). Алгоритм анализирует, какие товары вы приобрели ранее, что именно находится в вашей онлайн-корзине или в списке пожеланий, какие продукты вы оценили, а также, какие товары вы ищете больше всего. Эта информация используется для создания рекомендации по покупке продуктов на основе того, что купили вместе с выбранными вами товарами другие пользователи.

Amazon Web Services (AWS) — сервис облачных вычислений используется партнерами компании и предоставляет аналитику кликов, вычисляет механизмы рекомендаций, помогает обнаруживать мошенничества. Благодаря AWS компании могут анализировать демографические данные клиентов, привычки расходов и другой необходимой информации для более эффективной перекрестной продажи продуктов компании способами, аналогичными Amazon.

Uber

Сервис бронирования такси - Uber связывает водителей и пассажиров посредством собственных групп алгоритмов. Ценобразование (Surge pricing) - алгоритм, который отслеживает условия движения и длительность поездки в режиме реального времени. Благодаря этому алгоритму цены могут корректироваться по мере изменения спроса на поездки и загруженности дорог. Алгоритм UberPool позволяет пользователям находить тех, кто часто совершает поездки по тому же маршруту в одно и то же время, и предлагает поделить поездку.

Алгоритм рейтинговых систем опирается на детальную систему оценки — пользователи могут оценивать водителей и наоборот — для укрепления доверия и предоставления обеим сторонам возможности принимать обоснованные решения о том, с кем они хотят осуществлять поездки.

Twitter

Twitter можно назвать одним из самых “подготовленных” среди соцсетей в вопросах анализа аккаунтов пользователей. С этой целью было создано приложение для Twitter — Foller.me — которое дает исчерпывающую информацию о любом общедоступном профиле. Приложение собирает данные о темах, упоминаниях, хэштегах, подписчиках, местоположении в режиме реального времени. Foller.me анализирует содержание твиттов и отображает темы в виде “облаков тэгов”, основываясь на шести метриках: информация, статистика, темы и время. Помимо общего анализа профиля, сам Twitter обладает особыми алгоритмами временной шкалы подачи твитов. Это означает, что персональная лента Twitter состоит из трех основных разделов:

  1. Ранжированные твиты
  2. «Если ты пропустил это»
  3. Оставшиеся твиты в обратном хронологическом порядке

Каждый раз, когда вы заходите в Twitter, алгоритм изучит все твиты из учетных записей, на которые вы подписаны, и дает каждому из них оценку релевантности, основанную на нескольких факторах:

  1. Содержание твита: актуальность твита, наличие изображения или видео и общее вовлечение аудитории
  2. Автор твита: ваши прошлые взаимодействия с этим автором, сила вашей связи с ним и происхождение ваших отношений
  3. Ваши предпочтения: твиты, которые вы нашли интересными в прошлом, и как часто вы используете Twitter

Затем Twitter поместит твиты, которые, по его мнению, будут привлекать вас, в первые два раздела — ранжированные твиты и «если вы пропустили это».

Google

В отличие от других рассматриваемых платформ Google не является социальной сетью. Однако, представляя собой поисковую систему, Google еще пристальнее изучает своих пользователей.

Алгоритм “Колибри” (Hummingbird) помогает Google лучше интерпретировать поисковые запросы и предоставлять результаты, соответствующие намерениям поисковика, в отличие от отдельных терминов в запросе. Это достигается с помощью обработки естественного языка, которая опирается на скрытое семантическое индексирование, встречающиеся термины и синонимы.

Алгоритм “Голубь” (Pigeon) оптимизирует те поисковые запросы, в которых местоположение пользователя играет важную роль. Основными факторами ранжирования становятся местонахождение пользователя и расстояние от него до объекта, предлагаемого как результат выдачи.

Алгоритм “Опоссум” (Possum) гарантирует, что локальные результаты различаются в зависимости от местоположения поисковика: чем ближе вы находитесь к адресу компании, тем больше вероятность, что вы увидите ее среди локальных результатов.

Подробнее об алгоритмах:

  1. https://www.investopedia.com/articles/insights/090716/7-ways-amazon-uses-big-data-stalk-you-amzn.asp
  2. https://blog.iconosquare.com/facebook-analytics-tools-2019/
  3. https://foller.me/
  4. https://buffer.com/library/twitter-timeline-algorithm
  5. https://searchengineland.com/8-major-google-algorithm-updates-explained-282627
  6. https://www.datasciencecentral.com/profiles/blogs/the-amazing-ways-uber-is-using-big-data
  7. https://www.simplilearn.com/how-facebook-is-using-big-data-article