Большинство систем мониторинга упоминаний в социальных медиа, онлайн-СМИ, блогах и форумах работают по общим принципам и правилам. Знание о том, как устроены системы мониторинга, на базе каких технологий они работают и как  Шмаков.Медиа позволяет эффективно подбирать инструменты для решения задач. Мы решили поделиться со всеми своим опытом, чтобы вы могли использовать дорогостоящие инструменты так же эффективно, как это делаем мы.

В первой части мы расскажем про

  • сообщение

Давайте для начала рассмотрим стандартный процесс обслуживания клиента в системе мониторинга упоминаний:

  1. У пользователя есть возможность создать "тему" \ "канал" \ "ленту"
  2. Пользователь системы создает "тему" \ "канал" \ "ленту", в которую по какой-то логике должны будут поступать сообщения
  3. Пользователь или "поддержка сервиса"  с помощью поисковых операторов формирует логику поискового запроса, по которому будут отбираться сообщения в тему
  4. После сохранения темы система мониторинга упоминаний начинает поставлять в тему нужные сообщения, которые удовлетворяют п.2

Теперь обозначим ключевые термины:

  • Тема
  • Сообщение
  • Поисковая фраза
  • Поисковые операторы
  • Источник данных

Что такое сообщение в системе мониторинга

Сообщение — цифровой объект, содержащий определенный набор мета-данных: текст, время публикации, автор публикации и т.д.

Сообщение — цифровой объект, содержащий определенный набор данных: текст, время публикации, автор публикации и т.д.

Сообщения можно разбить на несколько основных категорий:

  • Статья в СМИ \ блоге
  • Пост \ Репост \ комментарий в социальных медиа
  • Видео на Youtube
  • Сообщение в канале\чате Telegram
  • Радио\Теле-эфир
  • любое! сообщение, которое передано в систему мониторинга упоминания

Параметры данных сообщения по способу их получения

параметры данных сообщений в мониторинге упоминаний

Источник нам передает сообщение, которое изначально содержит основную информацию

  • дату
  • текст
  • автора
  • рейтинг (для площадок отзывов)
  • изображения
  • гео-координаты
  • медиа-объекты

Часть параметров сообщения система мониторинга добывает или обогащает, то есть добавляет к параметрам такие параметры, которых не было в сообщении источника. К таким параметрам можно отнести:

  • пол автора
  • возраст автора
  • географию автора
  • количество подписчиков автора
  • рейтинг цитируемости автора или источника
  • тональность
  • тематика сообщения
  • прямая речь
  • роль объекта
  • именованные сущности (Named-entity recognition, NER.): персоны, организации, локации
  • любая извлекаемая информация, которая не содержалась в основных параметрах сообщения

Подведем итог

Сообщение – это объект, который по определенным правилам был собран системой упоминаний в тему. Сообщение обладает основной и извлекаемой информацией.  На базе этих данных после строятся все графики и фильтры.

В следующей статье мы поговорим о создании тем, поисковых операторах и параметрах запроса, которые могут очень сильно упростить работу или наоборот.


Подписывайтесь на нас в социальных медиа: