Анализ монетизации / исследование (перевод)

Анализ монетизации / исследование (перевод)

MARU KARLAPLAN (Eng.)

Мы рассмотрим связь между состоянием монетизации видео на YouTube и их продвижению алгоритмами. Мы использовали официальный интерфейс YouTube "Data API V3", чтобы получить 25 лучших видеороликов для видео на 100 тысяч. Это эквивалентно связанным видеороликам, которые вы видите на правой стороне при просмотре видео. Затем мы разломаем соответствующие видеосюжеты для информации, касающейся статуса монетизации, взглядов и т. д. Затем был подробно проанализирован корпус, содержащий информацию о снятых с металлолома видео. Согласно нашему анализу, YouTube систематически подавляет содержание, имеющее ограниченную монетизацию или полностью демонетизацию. Это, в свою очередь, ведет к цензуре политических идеологий, HTBQ+, информированию о психическом здоровье, информированию и предотвращению самоубийств и т. д.

1. Введение

В настоящем докладе мы имеем в своем адресе недавнее изменение алгоритма YouTube, которое предположительно было реализовано на 30 августа. Изменение алгоритма было обнаружено в начале сентября путем внутреннего тестирования в группе карлаплан. На 19 октября Бюллет Барри опубликовала первое видео, заявив о взаимосвязи между продвижение алгоритмами и демонетизацией, называемой "испытанием на демонетизацию".

После того, как это видео было распространено, все создатели YouTube написали в Твиттере, что они заметили четкую связь между демонетизацией и продвижение алгоритмами. Многие из них продемонстрировали небольшие снимки экрана, сравнивая производительность с неденежным видео по сравнению с производительностью. Насколько нам известно, ни одно исследование или публикация не доказало, что YouTube подвергает цензуре видеосюжеты, основываясь на их статусе монетизации на основе существенных доказательств. Наши исследования продиктованы весьма негативными последствиями такого рода цензуры. Это побудило нас публично выпустить отчет, который доказал это изменение алгоритма без ущерба для каких-либо карлаплан активов.

Основываясь на нашем предыдущем тестировании, у нас есть квалифицированная гипотеза о том, что если YouTube активно ограничивает пропаганду демонетизацных видеороликов, то для соответствующих видеороликов будет присутствовать четкая связь между статусом монетизации и рекламой. Ссылки на видеосюжеты, рекомендуемые в отношении видео и отображаемые справа от любого видео на YouTube.

2. Доказательства и мнения сообщества YouTube

Хотя опубликованные свидетельства другого создателя далеки от того, чтобы квалифицировать их как надлежащие доказательства, количество выступающих создателей является явным свидетельством того, что систематическая цензура на самом деле существует вместо того, чтобы иметь ограниченное дело с плацебо. Несмотря на то, что представленные доказательства являются весьма ограниченными и конкретные дела, статистические данные, особенно в цифрах, четко свидетельствуют о взаимосвязи между демонетизацией и продвижением алгоритмами. Существенные различия также являются огромным фактором, который необходимо учитывать при вынесении каких-либо выводов на основе доказательств.

Рис. График, демонстрирующий ежедневный объем представлений. Загружается в Twitter с помощью @adam22 с содержанием "Вот что происходит, когда YouTube отдает видео. твои взгляды идут на дерьмо. так чертовски неприятно. "Опубликовано 26/11-2017



В то время как график и заголовок не имеют никакого правильного указания на то, когда видео было демонетизацо, это означает, что видео было отделено в начале убывающей тренда до флатлинед средства просмотра. Представленные доказательства весьма ошибочны, поскольку они не могут надлежащим образом указать точную дату демонетизации.

В Твиттере @Jameskii предполагается, что YouTube не содействовала его демонетизации на любой из домашней страницы своего зрителя, не подписывалась или не подписывалась. Очевидно, что YouTube активно не поощряет его видео из-за демонетизации его видео.

Рисунок III. В Твиттере, сделанном @ProSyndicate с надписью "плотина, с которой я сталкивался с @Youtube.. Но когда видео становится неденежным. он получает часть представлений. Кто-нибудь еще может это испытать?"

Высокопрофильный синдикат на YouTube с более чем 10 000 000 подписчиками, делиться своим опытом в области демонетизацных видеороликов гораздо хуже по сравнению с полностью денежными видео.

Очевидно, что профессионалы не одиноки, по их мнению, YouTube активно подвергает цензуре неденежные видео.

Рисунок V. YouTube, квеббелкоп с более чем 7 500 000 подписчиком, уверен, что YouTube содействует демонетизации видео в меньшей степени. Как было замечено в его Твиттере на его счету @Kwebbelkop, 17/11-2017.

Это всего лишь один из многих твитов, квеббелкоп на эту тему. Все с ясным мнением о незаконных видеороликах несправедливо цензуры алгоритмом.

3. Идентификация демонетизацных видеороликов с разбивкой по конкретным категориям

Для того чтобы рекламодатели могли больше контролировать размещение рекламы, YouTube внедрила систему, которая помечает видеосюжеты с определенной категорией демонетизации. Эта система упоминается в адвордс справочнике Google для управления рекламными объявлениями HTTPS://goo.gl/cpDXPJ. Google адвордс является единственным открытым способом рекламы рекламодателей на YouTube.

Когда YouTube демонетизирует видео, они не уведомляют канал о типе категории содержимого, для которого было переданное видео. То, что мы обнаружили, скрывается в исходном коде видеороликов YouTube-функция под названием "Excluded_ads". Как ясно указано, эта функция отвечает за отслеживание того, какие типы категорий YouTube не будет размещать рекламу. Короче говоря, если у вашего видео есть Excluded_ads переменная, которая помечает ее как противоречивое, то YouTube не будет размещать рекламу от рекламодателей, которые не хотят, чтобы их реклама была помещена на противоречивые видеосюжеты.

Список Excluded_ads присутствует только в том случае, если видео в денежном выражении. Если видеозапись не является денежной, полностью демонетизаца или если пользователь включил красный YouTube, эта функция не будет видна. Функция Excluded_ads структурирована как словарь, включающий основной идентификатор категории с соответствующим списком подзначений. Пример, использующий основной код категории "102", и его обычные значения представлены следующим образом.

102=1_1,1_3,2_1,2_3;

Список вспомогательных значений рассматривается как способ категоризации различных уровней серьезности. 17_1 и т. д. никогда не присутствуют без более низких значений, если основная категория имеет меньшие значения, например 1_1 и т. д. Такое поведение является четким указанием на то, что более высокие цифры получают более сильное обозначение. Таким образом, сильный язык может рассматриваться как имеющий разный уровень серьезности, обозначенный разными подзначениями.

Мы проделали тестирование с помощью программ в папке файла ZIP с открытыми исходными программами, которые использовались для отчета. Мы обнаружили, что никакие переменные с 102, 104, 105, 109 не были в денежном выражении% по сравнению с 40%. 115 также продемонстрировали значительную разницу, но с более высокой общей монетизацией%, чем 40%.

Основываясь на том факте, что все видеосюжеты, протестированные с идентификатором основной категории 102, 104, 105 и 109, на% меньше, чем 40%, мы пришли к выводу, что все переменные непосредственно соответствуют категориям чувствительного фильтра содержимого, упомянутым в Adwords Справка по использованию рекламных объявлений HTTPS://goo.GL/GcPbc9. Наша личная догадка и наша уверенность в нашей метке-это следующее.

Мы твердо верим в то, что это является точным представлением того, что соответствует номеру основной категории. Мы твердо верим в то, что это не ограничивается категориями чувствительных фильтров Google Adwords. Мы считаем, что существуют и многие другие категории. Мы уверены, что большинство представленных категорий имеют прямое отношение к рекламным рекомендациям YouTube HTTPS://goo.GL/BfVt9i. Многие категории, такие как зажигание и унижение, насилие и т.д. Не представлены в категориях Google Adwords. Так многие из других категорий, например, 10, 25, 80, исключая стандарт 46 и т. д., скорее всего соответствуют некоторым другим категориям. Переменная 2, почти наверняка, свидетельствует о том, что запрос сделан роботом, а не человеком, так как никогда не представляется для ручной проверки в обозревателе, но всегда присутствует для запросов, сделанных программой. Таким образом, выступая в качестве какого-то рода защиты от виевботтинг.

Одна из проблем с этим методом заключается в том, что система Excluded_ads не является надежной на 100%. Для некоторых видеороликов значения могут быть несогласованными. Мы отправим это на различные серверы, имеющие разные индексы статуса рекламного объявления. Так что, если недавно было снято видео для монетизации, некоторые серверы, возможно, не обновили переменные правильно. Для некоторых видеороликов мы считаем, что они также не будут правильно обновляться для всех серверов. Это создает вопрос о том, будет ли по-прежнему повлиять на неденежную цензуру, которую мы собираем доказательства. Потому что если на отдельном сервере есть видео с неправильным индексом, то можно предположить, что их призыв к пропаганде этого видео будет сделан с этим устаревшим индексом. Несмотря на то, что это не относится ко всем серверам, она по-прежнему будет влиять на большую часть аудитории.

4. Методология, используемая для выработки и анализа доказательств

Мы проделали лом с использованием металлолома, предоставленного в папке B нашего ZIP-файла, с открытыми исходными программами, которые использовались для отчета. Предварительно забракованный корпус, который мы использовали для анализа, также включается в папку B. Отходы используют официальный "Youtube Data Api V3" YouTube для получения соответствующих запросов видеороликов. Соответствующие видеозапросы сделаны по поиску. List с включенным параметром relatedToVideoId. Для других параметров, таких как safeSearch, устанавливается значение None, а не средняя конфигурация по умолчанию. В течение 5 дней было использовано в общей сложности 6 счетов. Все используемые счета составляют более 25 лет без каких-либо других ограничений. Видеосюжеты были взяты из 264 каналов с максимальным предельным числом 300 видеороликов на канал.

Отходы связанного видео включают следующие свойства:

Views, VideoId, Video_upload_date, Video_monetised, Excluded_ads, isFamilyFriendly, channelId, main_vid_id, main_vid_monetised, main_vid_excluded_ads, main_vid_channel, main_vid_family_friendly, main_vid_upload_date, main_vid_views, MainQ, SubQ

Связь между различными переменными и Excluded_ads переменными будет иметь важное значение для анализа того, как алгоритм ведет себя в отношении демонетизационных видео.

5. Анализ ломаных данных

В общей сложности 1 200 000 видео были забракованы для 57к, связанных с запросами videoId. Из-за очень большого размера лома результаты анализа будут иметь точное представление о том, как ведет себя алгоритм. Будут рассмотрены любые предвзятые отношения, а методы, используемые для минимизации и исключения из них, будут документально подтверждены. Все источники информации включаются в папку B.


Рисунок VI. На графике показано, как процентная доля от 102, 104, 109 для связанных видеороликов между конкретными интервалами разрабатывается по мере повышения уровня просмотра.

На графике отображается процент видеороликов с 102, 104 или 109 для определенных интервалов времени. Этот график в конечном счете показывает четкую тенденцию без каких-либо отклонений от того, что видеоролики с 102, 104 или 109 рекомендуются гораздо меньше на более низком уровне просмотра, чем на более высоком уровне. В связи с большим количеством видеороликов, а также явная тенденция без каких-либо отклонений, ясно свидетельствует о том, что для видеороликов с 102, 104 и 109 используется определенный алгоритм девальвации. С тех пор, как на графике демонстрируются все видеосюжеты, есть небольшая предвзятость в сторону демонетизации или в денежном виде. Причина этого заключается в том, что видеозаписи, из которых были сделаны соответствующие запросы, не совпадают с аналогичными материалами по представлениям, сумме и т. д. Чтобы свести к минимуму это предубеждение, мы имеем следующий граф, который только подсчитывает связанные видеосюжеты с демонетизированными видео.

Как упоминалось ранее, на этом графике показаны только связанные видеосюжеты с демонетизацными видео. Таким образом, любые предвзятые отношения к видеосюжетам с более низкой зрительной помощью, которые являются денежными, и, следовательно, вызывая образец, исключены из этого графика. Этот шаблон является четким указанием на то, что YouTube имеет некоторую функцию алгоритма сортировки, которая отменяет неденежные видеозаписи.

На графике демонстрируется совокупный процент предлагаемых видеороликов с 102. Диапазон от 500 до 200 000 с общим количеством видеороликов 440 786, представленным 400ом различными точками на графике.

Использование совокупного процента таким образом имеет недостатки. Когда представления будут выше, любые различия будут менее заметны в графике. Несмотря на недостатки, метод, который обычно используется для того, чтобы обнаружить тенденцию при меньших размерах. Поскольку в наших исследованиях составило 1, 2 м видеороликов для анализа, график, показанный ранее на рисунке X, является лучшим представлением, чем этот график. При рассмотрении предрассудков она по-прежнему представляет собой тенденцию, которая просто не будет существовать в этой степени, если YouTube не будет активно подвергать цензуре видеоматериалы, подавляя их продвижение.


Для объяснения того, почему продемонстрированные образцы настолько важны, важно понимать, что не должно быть никакой закономерности. Единственный способ такой четкой закономерности может произойти без каких-либо отклонений, если YouTube активно подвергает цензуре видеосюжеты, основанные на метках, привязанных к демонетизации. Тот факт, что более демонетизированные видеосюжеты связаны с более низкими зрителями, противоречит логической предпосылке о том, что больше видеосюжетов в нижней части средства просмотра будет относиться в денежный режим, поскольку в меньшей степени они имеют возможность обжаловать свои видеосюжеты. То, что предполагается, представляет собой сандбаггинг функцию, которая оказывает гораздо большее влияние на видеосюжеты с более низкими зрителями. Из-за ограничений API данных YouTube, по-видимому, нет возможности получить оценку какой-либо постоянной доли подавления. Очень вероятно, что постоянная подавление% или аналогична также в игре. Единственный способ правильно сказать, что это полная обработка алгоритма с сопоставлениями разных дат. Наша личная догадка в исследовании "Карлаплан" - это полное подавление на 30-40%. Мы не будем давать никаких доказательств или мотивировать эту догадку, так как это просто предположение.

6. Заключение

YouTube, кажется, имеет систему, которая систематически подвергает цензуре видео с Excluded_ads метками 102, 104, 105, 106, 109, 115. Переменные Excluded_ads, несомненно, имеют отношение к категориям, перечисленным в справочнике Google Adwords HTTPS://goo.gl/cpDXPJ. Другие переменные, как представляется, связаны с текущим устройством пользователя, а другие могут быть связаны с другими категориями демонетизации, не указанными в справочнике Google Adwords.


Все данные связаны в описании моего основного видео. Youtube также удалили «Excluded_ads». Они не отрицали, какие-либо из претензий, сделанных в этом отчете, удалили только эту переменную.

Основной видеоролик / видеозапись с раскрытием содержания исследования

HTTPS://youtu.be/n3H8D2LrLHc






Report Page