ПОСЛЕЗАВТРА

Google проверила правдивость чат-ботов

Компания Google DeepMind, занимающаяся разработкой систем искусственного интеллекта, создала умное приложение, способное проверять правдивость ответов популярных чат-ботов. Результаты своей работы создатели опубликовали на сервере arXiv, а также выложили открытый код новой системы на GitHub.

Чат-боты вроде ChatGPT, работающие на т.н. больших языковых моделях (LLM), стали весьма популярны за последние пару лет благодаря своей способности давать ответы на вопросы и даже решать математические задачи. Однако все подобные системы страдают от одного общего недуга, заключающегося в точности даваемых ответов. Говоря простым языком они зачастую лгут или просто выдумывают «факты». По этой причине достоверность ответов чат-ботов следует обязательно проверять, прежде чем принимать на веру.

В этой связи приложение от Google DeepMind, получившее название Search-Augmented Factuality Evaluator (SAFE), может существенно сэкономить время пользователей, решивших воспользоваться услугами чат-бота. Дело в том, что анализируя ответы чат-бота, умная программа самостоятельно проверяет достоверность информации через поисковик Google — т.е. проводит фактчекинг так же, как это бы делал сам пользователь, но только гораздо быстрее.

Во время тестирования приложение SAFE проверяло достоверность 16 тыс. ответов, полученных от нескольких чат-ботов. Результаты проверки оказались на 72% соответствующими результатам, полученным в результате фактчекинга людьми. В спорных же моментах приложение SAFE оказалось точнее человека в 76% случаев.

ПОСЛЕЗАВТРА

Report Page