Из чего сделан и как работает «Контент Метр» от TNS

Артур Ризнык

Компания TNS каждую неделю публикует Топ-10 популярных новостных тем Уанета. Эти данные собираются системой измерения интернет-просмотров TNS «Контент Метр», которая, кроме анализа прессы, призвана решать конкретные коммерческие задачи. О возможностях и перспективах проекта мы говорили с бизнес директором компании «TNS Украина» Сергеем Ткаченко.

Каковы цели проекта «Контент Метр»?

Это новое поколение измерителей в интернете (и не только в интернете). Вообще проект очень большой: мы планируем в ближайшие 2-3 года выйти на так называемые мультимедийные исследования. Это значит, что одна платформа будет измерять и телевидение, и радио, и прессу, и Интернет независимо от способа доставки контента потребителю. Всё это будет делаться по единой методике, на общей панели.


В чем особенность ваших измерений?

До недавнего времени исследования интернета отталкивались от понятия «клик» - факта захода на страницу. С моей точки зрения, такой подход придумывали люди, далекие от социологии. Это были веб-мастера, которые для своих нужд запустили некую систему измерения посещений сайта. Телевидение использует, так называемые, пиплметры, которые, по своей сути, обеспечивают измерение аудитории и телевизионного контента, который передается с помощью телевизионных каналов. И если мы говорим, что первый канал в 17:23 смотрели 1 млн. человек, это значит, что миллион человек контактировал с одним и тем же контентом.

Подсчет «кликов» переносит эту логику в интернет, но в интернете она не работает. Потому что если, допустим, новостной сайт в 17:32 посетило 2000 пользователей, то все они увидели разный контент. По целому ряду причин: таргетирование, прочие особенности рекламной кампании, её объем, изменения в ленте новостей и т. д. Это говорит о том, что традиционные методы измерения, которые лежали в основе пиплметрии, должны быть модифицированы с учетом особенностей Интернета. С точки зрения эффективности рекламы, совершенно неинтересно, сколько пользователей посетили страницу. Гораздо важнее, сколько людей видели мою рекламу, сколько человек из посмотревших были из Украины, сколько смотрели её больше 5 секунд, сколько были в видимости окна и какой у них был соцдем? Мы не получим такой информации, если будем просто исследовать контакт пользователя с сайтом, а не с контентом.

Как собирается информация?

Из двух источников: счетчики на сайтах и счетчики на юзерах. Есть ряд источников, с помощью которых мы собираем информацию о контенте. Весь коммерческий контент систематизируется и вставляется в единое дерево. Сейчас мы собираем 500 000 000 транзакций в сутки. У нас растет база со скоростью 1 Тб. в неделю. Сырые данные мы удерживаем 3 мес. Мы обрабатываем 20 млн. куков, отслеживаем их серфинг, как они движутся. Специальными алгоритмами выделяем, какие из них активные, а какие нет. Таким образом, получаем возможность для рассчета Rch (охват), средняя частота контактов AF (average frequency), GRP (gross raiting point). Мы возвращаем в интернет социологические параметры, которыми пользуются все.

Сколько человек участвует в панели?

Мы её только наращиваем.

Ваши респонденты рекрутируются офлайн?

90% - офлайн.

На скольких сайтах уже стоят ваши счетчики?

Пока 2500 доменов.

Есть ли крупные сайты, которые отказались от размещения счетчика?

Ну, Google мы и не спрашивали, это практически нереально, а переговоры ведем практически со всеми. У нас нет глубоко отрицательной реакции. Хоть на самом деле мы не очень-то зависим от площадок. Если сайты не готовы с нами сотрудничать, то мы всё равно получим данные о размещенном контенте от панелистов. Это не проблема. К концу второго квартала мы рассчитываем получить более продуктивные данные. Уже сейчас мы предоставляем отчетность по некоторым кампаниям. Информация доступна онлайн с задержкой в 2 минуты.

Как вы автоматизировали обработку такого количества контента? Разве это возможно сделать программными средствами?

Автоматизировать контент-анализ нереально. Но при всём объеме информации в интернете, коммерчески значимая её часть имеет вполне разумные объемы. Достаточно сказать, что один сайт знакомств генерирует тысячи фотографий в сутки, но кому они нужны? Поэтому у нас имеется штат редакторов, которые отбирают информацию. Конечно, основным элементом остается баннер, но мы работаем со стрим-потоками, видео, интернет-радио. Всё это будет представлять единую систему. Плюс, мы работаем и с приставками. Set-top box, на которых установлено наше ПО, работают так же, как компьютеры. Следующий шаг – это пиплметры. Мы планируем развернуть пиплометрическую панель нового поколения.

Что ж, поживем – увидим. «Контент Метр» пока только набирает обороты. В то же время, идея объединения сайт-центрического и юзер-центрического подходов, так или иначе, уже реализована другими крупными игроками рынка (в проекте AdOpinion от InMind и fusion-панели компании Gemius). Также, система AdvertTrack компании InMind, которая была запущена ещё в прошлом году, направлена как раз на исследование рекламного медиа-контента и эффективности рекламных кампаний в интернете. В любом случае, развитие действующих проектов и появление новых игроков на рынке исследований Уанета может подстегнуть конкуренцию, что должно позитивно сказаться на общем качестве исследований.