История КАПЧИ

История КАПЧИ



Да-да, каждый раз, вбивая символы в форму, вы проходите тест на определение робот вы или человек. Сам термин КАПЧА произошел от английской аббревиатуры CAPTCHA, которая расшифровывается как Completely Automatic Public Turing Test to tell Computers Humans Apart, что можно перевести на русский как «полностью автоматизированный публичный тест Тьюринга, призванный отличить компьютер от человека». В русский язык пришло лишь фонетическое название термина, которое никак не расшифровывается.

К 2000 году разработка методов противодействия спам-роботам стала особенно актуальной. Инженеры Университета Карнеги-Меллон, возглавляемые Льюисом Фон Аном, предложили свой вариант фильтрации автоматических роботов от живых людей: выводить на экран специально искаженные символы, которые мог прочитать человек, но не мог распознать ни один существовавший в то время спам-робот. Вводя данные символы в специальную форму, пользователь подтверждал, что он – человек.

Долгое время система не претерпевала никаких изменений, но к 2009 году группа Льюиса Фон Ана решила усовершенствовать свою систему (точнее, подумала, что старания миллионов людей по вводу символов с картинки в форму не должны пропадать даром) и представила новую версию «капчи», назвав её «reCAPTCHA». Наверняка на просторах интернета вам встречалась подобная форма.

Не возникало ли у вас впечатления, что слова, выдаваемые системой – какие-то отсканированные части книг, где часто попадаются запятые или иные знаки препинания, а иногда символы и вовсе затерты и непонятны? Так и есть на самом деле! Новая система дает пользователю два слова (системно искаженных, чтобы роботы не смогли их прочитать): одно из них — контрольное — уже распознано и известно (именно по нему осуществляется проверка), второе же берется из отсканированного фрагмента, который автоматическая система распознавания текста не смогла обработать. Интересно, что для прохождения теста пользователю достаточно ввести одно слово, второе же вводить не обязательно, но об этом нигде не сказано, и обычно интернет-пользователи его тоже вводят (тем более, в каком порядке расположены слова тоже неизвестно).

В случае, когда контрольное слово заполнено правильно, результат второго слова запоминается и отправляется специалистам по оцифровке материала, помогая им переводить книги/журналы/газеты в цифровой формат. А после того, как его одинаково распознали несколько десятков человек, используется для последующих распознаваний в качестве первого слова. Так, миллионы ничего не подозревающих пользователей ежедневно помогают проводить оцифровку старых книжных изданий.

Простая и удобная система быстро обрела популярность, но её создатели не учли одного: желания людей заработать легких денег. В интернете и по сей день существует сотни сайтов, которые предлагают заработать, просто вводя в форму «капчу», с которой роботы справиться не могут. Зачастую пользователи таких сайтов не знают, что каждая введенная ими «капча» – это очередное письмо со спамом, которое, быть может, придет и на его электронную почту.

Кроме того, не стоит на месте и искусственный интеллект: анализ, проведенный компанией Google в 2014 году, показал, что новейшие спам-роботы могут распознать символы «капчи» с точностью до 99,8% , что практически сводит на нет её присутствие на веб-сайте.

Вскоре Google предложила свой вариант «капчи», назвав её «NO CAPTCHA reCAPTCHA». Ее основная идея заключается в том, чтобы снизить взаимодействие пользователя с системой до минимума: когда пользователь заходит на веб-сайт, срабатывает скрипт, анализирующий его поведение на странице. Дело в том, что даже самый современный робот по своему поведению отличается от поведения человека, и система от Google умеет их отличать. Получается, что пользователь проходит тест «человек-робот», просто находясь на сайте. Единственное, что требуется от пользователя – нажать на галочку «Я не робот».


Report Page