«Комусь подобається відео, що Земля пласка – ми не хочемо таке рекомендувати». Як працює система рекомендацій YouTube

Крістос Гудроу, віцепрезидент з технологічних питань YouTube, розповів, як працює система рекомендацій відеосервісу. AIN.UA обрала саме основне.

Що таке система рекомендацій?

Майже для кожного відео є своя аудиторія, і завдання нашої системи рекомендацій ‒ знайти цю аудиторію. Рекомендації стимулюють значну частину загальної кількості глядачів на YouTube, навіть більше, ніж підписки на канали або пошук.

Наша система рекомендацій побудована на простому принципі ‒ допомогти людям знайти відео, яке вони хочуть подивитися. Ви можете знайти рекомендації у двох основних місцях: на домашній сторінці та в розділі «Далі».

  • Ваша домашня сторінка ‒ це те, що ви бачите, коли вперше відкриваєте YouTube. На ній відображається суміш персоналізованих рекомендацій, підписок, останніх новин та інформації.
  • Панель «Далі» з’являється під час перегляду відео та пропонує додатковий вміст на основі того, що ви зараз дивитесь, поряд з іншими відео, які, на нашу думку, вам можуть бути цікаві.

Як ми підбираємо відео для вас

У кожного є унікальні звички перегляду. Система порівнює ваші звички перегляду зі схожими на вас і використовує цю інформацію, щоб запропонувати інший контент, який ви, можливо, захочете подивитися. Тому, якщо вам подобаються відео про теніс, і наша система помічає, що іншим користувачам, яким подобаються такі ж відео про теніс, як і вам, також подобаються відео з музикою в стилі джаз, вам можуть бути рекомендовані такі відео, навіть якщо ви ніколи раніше не дивилися жодного.

Звичайно, не всі хочуть завжди ділитися цією інформацією з нами. Тому ми створили елементи керування, які допоможуть вам вирішити, скільки даних ви хочете надати.

Система щодня вивчає понад 80 млрд одиниць інформації, яку ми називаємо сигналами. Ряд сигналів будується один на одному, щоб допомогти інформувати нашу систему про те, що вас задовольняє: кліки, час перегляду, відповіді на опитування, обмін, оцінки «подобається» та «не подобається».

  • Кліки: натискання на відео дає вагому ознаку того, що воно вам також сподобається. Зрештою, ви б не натискали на те, що не хочете дивитися.
  • Час перегляду. Ваш час перегляду ‒ які відео ви переглядали і скільки часу ‒ надає персоналізовані сигнали нашій системі про те, що ви, швидше за все, хочете подивитися. Якщо шанувальник тенісу подивився 20 хвилин уривків Вімблдону та лише кілька секунд відео аналізу матчів, можна сміливо припустити, що для нього цікавіше саме моменти гри.

  • Відповіді на опитування: Щоб переконатися, що глядачі задоволені вмістом, який вони переглядають, ми вимірюємо «цінність часу перегляду» ‒ це час, витрачений на перегляд відео, яке ви вважаєте цінним. Ми оцінюємо цінність часу перегляду за допомогою опитувань користувачів, де просимо оцінити відео, яке ви переглянули, від однієї до п’яти зірок, даючи нам показник, який визначає, наскільки ви задоволені своїм вмістом. Якщо ви оцінюєте відео від однієї до двох зірок, ми запитуємо, чому ви дали такий низький рейтинг. Подібним чином, якщо ви даєте відео чотири-п’ять зірок, ми запитуємо чому ‒ тобто, було воно надихаючим чи значущим? Тільки відео, які ви високо оцінили чотирма чи п’ятьма зірками, зараховуються до оціненого часу перегляду. 

Звичайно, не кожен заповнює опитування щодо кожного відео, яке переглядає. Виходячи з отриманих нами відповідей, ми навчили модель машинного навчання передбачати потенційні відповіді на опитування для всіх.

  • Спільний доступ, оцінки «подобається» та «не подобається»: в середньому люди частіше задоволені відео, якими вони діляться або які їм подобаються. Наша система використовує цю інформацію, щоб спрогнозувати ймовірність того, що ви поділитеся або вам сподобається подальше відео. Якщо вам не подобається відео, це сигнал, що, ймовірно, це не те, що ви хочете дивитися.

Однак, як і у рекомендаціях, важливість кожного сигналу залежить від вас. Якщо ви належите до тих людей, які діляться будь-яким відео, яке ви дивитеся, в тому числі тими, яким ви поставили одну або дві зірки, наша система буде знати, рекомендуючи контент ‒ те, що ви ділитесь відео, не є вирішальним фактором. Все це тому, що наша система не дотримується встановленої формули, а динамічно розвивається, коли змінюються ваші звички перегляду.

Як ми відсортовуємо дезінформацію

Все більше глядачів приходить на YouTube за новинами та інформацією. Це теми, де є найважливішим якість інформації та контекст. Хтось може повідомити, що вони дуже задоволені відео, які стверджують, що «Земля пласка», але це не означає, що ми хочемо рекомендувати такий тип неякісного вмісту.

В останні роки нашу систему рекомендацій все частіше використовують для включення дезінформації та прикордонного вмісту (близький, але не зовсім порушує наші Правила спільноти). Це відео з теорії змови («посадка на Місяць була підробкою») або інший контент, який поширює дезінформацію («апельсиновий сік може вилікувати рак»). Ми можемо визначити за допомогою класифікаторів, чи є відео «авторитетним» або «прикордонним». Ці класифікатори спираються на оцінювачів, які оцінюють якість інформації в кожному каналі чи відео. Ці оцінювачі з усього світу навчаються за допомогою детальних, загальнодоступних рекомендацій щодо рейтингу. Ми також покладаємось на сертифікованих експертів, таких як лікарі, коли вміст містить інформацію про стан здоров’я.

Щоб визначити авторитетність, оцінювачі відповідають на кілька ключових питань:

  • Чи вміст виконує свої обіцянки чи досягає своєї мети?
  • Які знання необхідні для досягнення цілі відео?
  • Яка репутація спікера у відео та каналу, на якому він виступає?
  • Яка основна тема відео (наприклад, новини, спорт, історія, наука тощо)?
  • Чи вміст насамперед має бути сатирою?

Чим вищий бал, тим більше рекламується відео, коли йдеться про новини та інформаційний контент.

Щоб визначити прикордонний вміст, оцінювачі оцінюють чинники, зокрема чи є вміст:

  • неточним, оманливим;
  • нетерпимим або образливим,
  • шкідливим або потенційно шкідливим.

Результати об’єднуються, щоб оцінити, наскільки ймовірно, що відео містить шкідливу дезінформацію. Будь-яке відео, класифіковане як прикордонне, знижується в рекомендаціях.

Ці оцінки людей потім навчають нашу систему моделювати рішення, і тепер ми використовуємо таку оцінку для всіх відео на YouTube.

Ви можете запитати, чому б нам просто не видалити прикордонний вміст? Дезінформація має тенденцію змінюватися та швидко розвиватися, і на відміну від таких тем, як тероризм чи безпека дітей, тут часто не вистачає чіткого консенсусу. Крім того, дезінформація може змінюватись залежно від особистої точки зору та досвіду.

Ми усвідомлюємо, що іноді це означає залишення суперечливого або навіть образливого вмісту. Тому ми продовжуємо в значній мірі зосереджуватися на формуванні відповідальних рекомендацій і вживаємо значних заходів, щоб наша система не рекомендувала цей вміст широко.

У сукупності вся наша відповідальна робота навколо рекомендацій показала реальний вплив. Час перегляду авторитетних новин різко збільшився, а прикордонного контенту ‒ скоротився.

Це не означає, що ми вирішили проблеми ‒ це просто означає, що нам потрібно продовжувати вдосконалювати та інвестувати в наші системи, щоб продовжувати вдосконалюватися. Наша мета ‒ отримати обсяг переглядів прикордонного вмісту з рекомендацій нижче 0,5% від загальних переглядів на YouTube.

Источник: ain.ua

Читайте также

Вверх