YouTube рассказал, как работает его алгоритм рекомендаций

Рекомендации направляют зрителей и приносят больше половины общего количества просмотров на YouTube: больше, чем подписки на каналы или поиск. Однако зачастую пользователи не представляют, как на самом деле работают рекомендации, поэтому Google рассказал, как устроены и как совершенствуются рекомендации.

Что такое система рекомендаций

Система рекомендаций основывается на простом принципе — она должна помогать пользователям находить видео, которые им интересны и полезны. Рекомендации отображаются в двух основных разделах: на главной странице и на панели «Следующее». Главная страница — это первое, что пользователь видит на YouTube, на ней доступны персонализированные рекомендации, подписки, а также свежие новости и информация. Панель «Следующее» появляется во время просмотра видео и предлагает дополнительный контент, сформированный на основе информации о том, что смотрит пользователь в данный момент, а также на основе контента, который может его заинтересовать.

В 2008 году система работала совершенно иначе. Видео отбирались исходя из их популярности и группировались на одной странице. Мало кто смотрел такие рекомендации, и большую часть просмотров на YouTube приносил поиск и внешние ссылки.

Сегодня система классифицирует миллиарды видео, чтобы подобрать контент, соответствующий интересам аудитории. В отличие от других платформ, YouTube не подбирает для пользователей контент на основании социальной активности.

Система сравнивает действия пользователей в сервисе с похожим поведением и на основании этой информации предлагает контент, который может их  заинтересовать. При этом для новостных и информационных разделов принцип работы рекомендаций может отличаться.

Конечно, не все пользователи готовы делиться личной информацией. Поэтому разработчики создали настройки конфиденциальности, чтобы они сами могли решать, доступ к каким данным хотят предоставлять. Здесь можно удалять, редактировать и временно отключать историю поиска и просмотров на YouTube.

Как рекомендации персонализируются

Для того, чтобы предложить каждому пользователю индивидуальные рекомендации,  система не основана на жестком регламенте. Она постоянно развивается и обучается, анализируя 80 миллиардов информационных объектов. Чтобы определить предпочтения, алгоритмы принимают во внимание множество сигналов: нажатия, время просмотра, результаты опросов, ссылки на контент, а также отметки «Нравится» и «Не нравится».

  1. Клики. Когда пользователь кликает на видео, это с большой вероятностью говорит о том, что оно покажется ему интересным.
  2. Время просмотра. Анализируя, какие видео зрители смотрели и как долго, система получает персонализированные сигналы о том, какой контент им скорее всего понравится.
  3. Результаты опросов. Чтобы наверняка определить, довольны ли зрители контентом, который они смотрят, YouTube учитывает так называемое «ценное время просмотра». Это время, которое сами пользователи оценивают как проведенное с пользой. «Ценное время просмотра» определяется с помощью опросов, где пользователь ставит видео оценку по шкале от одного до пяти. При подсчете ценного времени просмотра учитываются только те ролики, которым поставили четыре или пять звезд. Конечно, не все пользователи проходят опрос после каждого просмотренного видео. На основе полученных ответов модель машинного обучения научилась предсказывать возможные оценки.
  4. Ссылки на контент, а также отметки «Нравится» и «Не нравится». Обычно если пользователь делится видео или ставит ему отметку «Нравится», это означает, что он доволен этим контентом. Система использует эту информацию, чтобы предсказывать вероятность того, что он поделится следующими роликами или поставите им отметку «Нравится». Когда зритель нажимает «Не нравится», это сигнал, что контент не показался ему интересным.

Фокус на качественные рекомендации

Анализ нажатий, просмотров, времени просмотра, опросы пользователей, ссылки на контент, отметки «Нравится» и «Не нравится» — все это эффективно работает для подбора рекомендаций на самые популярные темы на YouTube такие, как музыка и развлечения. Но за последние годы наблюдается тенденция, что все больше пользователей приходят на YouTube за новостями и информацией. Будь это актуальные новости или сложные научные исследования, для таких тем очень важно качество контента и контекст. Кто-то может поставить высокую оценку видео, где утверждается, что Земля плоская, но это не значит, что соцсеть будет рекомендовать подобный некачественный контент.

Именно поэтому рекомендации играют важную роль в процессе построения платформы, которая внушает доверие. YouTube предлагает зрителям проверенную информацию и минимизируем вероятность того, что они столкнутся с сомнительным контентом. При этом учитываются правила сообщества, определяющие, какие материалы разрешены, а какие запрещены.

В последние годы увеличилось количество недостоверной информации, поэтому разработчики улучшили систему рекомендаций, чтобы она могла обрабатывать видео с неверными данными, а также спорный контент (материалы, которые близки к нарушению правил сообщества, но технически этого не делают). Например, ролики с конспирологическими теориями («высадка человека на Луну была сфальсифицирована») и другие видео, распространяющие неверную информацию («апельсиновый сок может вылечить рак»).

Платформа отделяет проверенный контент от пограничного с помощью классификаторов. Оценку качества информации, представленной на канале или в видео, осуществляют специалисты со всего мира, которые обучаются по подробным общедоступным правилам. YouTube также обращается к сертифицированным экспертам, например, врачам, когда контент содержит информацию, касающуюся здоровья.

Чтобы определить авторитетность контента, специалисты по оценке отвечают на несколько ключевых вопросов. Материалы отвечают заявленной цели? Какой уровень квалификации требуется, чтобы понять смысл видео? Какая репутация у выступающего в ролике человека и канала, на котором оно опубликовано? Какая основная тематика видео (например, «Новости», «Спорт», «История», «Наука» и т. д.)? Контент задуман как сатирический? Ответы на эти и другие вопросы определяют, насколько видео заслуживает доверия. Чем выше оценка, тем активнее ролик продвигается в рамках новостного и информационного контента. Чтобы определить пограничные видео, специалисты по оценке отмечают факт присутствия неточного, вводящего в заблуждение, оскорбительного, нетолерантного, реально или потенциально вредоносного контента и другие. На основании общих результатов  определяется вероятность, что в ролик содержит вредоносную информацию или пограничный контент. Видео, которые классифицируются как пограничный контент удаляются из рекомендаций.

Источник

Добавить комментарий