ПОСЛЕЗАВТРА

Эксперты предупредили об опасности ИИ-контента

Ряд экспертов предупреждают о скорой деградации генеративного ИИ ввиду наступления «коллапса модели» (model collapse) — гипотетического сценария, при котором все новые ИИ-системы будут все глупее предыдущих. В основе этой теории лежит идея о том, что быстрое распространение в Интернете контента, сгенерированного ИИ-системами, уже в скором времени приведет к значительному ухудшению обучения новых моделей.

При разработке новой ИИ-системы степень ее интеллектуальности во многом зависит от качества данных, на которых она обучается. По этой причине OpenAI, Google, Meta, Nvidia и другие компании вынуждены тратить большие средства на анализ терабайтов данных в Интернете, отбирая правильный контент, подходящий для эффективного обучения нейронных сетей. Однако появление в 2022 году доступных систем на базе генеративного ИИ привело к резкому росту контента, написанного машиной. Такой контент выглядит гораздо предпочтительней данным, которые создал человек, поскольку он гораздо дешевле и не требует решения вопросов этики и авторских прав. Тем не менее в скором времени выяснилось, что обучение исключительно на сгенерированном ИИ контенте приводит к деградации новых ИИ-систем.

Проблема с искусственно сгенерированным контентом усугубляется еще и тем, что становится все сложнее отличать его от материалов, созданных человеком. В качестве примера можно привести документацию к GPT-4, в которой указано беспрецедентное количество специалистов, участвовавших в отборе массивов данных для обучения новой версии чат-бота. По некоторым оценкам, пул сгенерированного человеком контента может полностью иссякнуть уже в 2026 году. Вероятно по этой причине OpenAI и другие разработчики ИИ столь спешат заключить эксклюзивные партнерства с такими гигантами, как Shutterstock, Associated Press и NewsCorp, владеющими крупными массивами проприетарного контента, сгенерированного человеком и не всегда доступного в Интернете.

С другой стороны, прогнозы коллапса генеративных ИИ-систем могут быть преувеличены. Вполне вероятно, что контент, созданный человеком и машиной, будет расти параллельно. Не стоит исключать и того, что новый ИИ-контент будет генерироваться сразу несколькими конкурирующими ИИ-системами.

Однако помимо возможного негативного влияния на развитие новых ИИ-систем, сгенерированный машиной контент также может навредить и простому человеческому общению в Интернете. Так, спустя год после релиза чат-бота ChatGPT на популярном среди программистов портале StackOverflow наблюдалось 16%-ое падение активности пользователей. Это наводит на мысль о том, что людям стало гораздо проще советоваться с чат-ботом, нежели с себе подобными.

ПОСЛЕЗАВТРА

Report Page