Пора победить мракобесие по теме: ИИ, нейронных сетей и машинного обучения. Часть 1. Общие сведения о ИИ

Примерная схема стадий развития искуственного интеллекта

Мне кажется, хуже инфобизнесменов только люди, которые врут, что в их продукте используется: искусственный интеллект, "нейронки", machine learning, data mining, ну еще что-нибудь из этого массива тегов. По моему опыту, 90% тех, кто это заявляет - лгунишки. Просто это красивый маркетинговый ход. Каждый год в сфере стартапов и в общем технологических трендов появляются какие-то ключевые слова, которые становится очень популярно прибавлять к описанию своей компании или продукта. По моим ощущениям, хронология примерно такая:

2014 год - Big Data,

2015 год - Data mining,

2016 год - Нейросети.

Самое интересное, что все это - ключевые слова из собственно одной технологии: искусственного интеллекта. В том или ином его проявлении.

Меня ужасно злит, что, скажем так, нехорошие маркетологи не преминут вставить эти слова в свои рекламные кампании и описания продукта, пользуясь неосведомленностью больших масс людей о всех аспектах этих технологий.

Именно поэтому я хочу сделать цикл из нескольких статей, и не слишком подробно, но и не слишком поверхностно рассказать вам, что к чему в этой очень популярной теме. Чтобы вы всегда могли пристыдить пустозвонных говорунов.

Резонный вопрос: с какой стати я сам в этой теме разбираюсь?

А мне пришлось в этом разобраться, да еще и очень хорошо, потому что компания наша работает на белого дядю из силиконовой долины в качестве подрядчика офшорной разработки. Пилим мы один сервис (который уже давно не стартап). Так вот, много примочек в этом сервисе как раз построены на обработке и категоризации данных при помощи нейросетей.

Эта первая статья будет обзорной, я бы даже сказал фундаментальной. Она важна для понимания последующего изложения фишечек и нюансов. Тут я вам расскажу в целом об отцах-основателях, их идеях и всех обстоятельствах, связанных с термином artificial intelligence (по-нашему - искусственный интеллект, хотя перевод этот не очень правильно описывает изначальные идеи).

Началось все с двух персонажей: Алана Тьюринга и Джона Фон Неймана. В общем можно сказать, что они додумались до вещей, которые сейчас кажутся крайне очевидными, но на тот момент совершенно таковыми не являлись. Эту парочку можно назвать отцами-основателями всех современных компьютерных технологий. Ну и стоит также отметить, что вместе они никогда не работали, а лишь читали интеллектуальные труды друг друга.

Алан Тьюринг - слева, Джон Фон Нейман - справа

Итак, перейдем к делу: еще до начала второй мировой Тьюрингу приходит в голову идея доселе невиданная: "А что если сделать универсальный компьютер, который мог бы производить любые вычисления, сводя их к простейшим?" То есть, те аппараты, что были созданы до этого, имели четкие аппаратные схемы на решение конкретных арифметических задач: вот этот блок складывает, вот этот делит, вот этот умножает, ну и так далее. Получался громоздкий шкаф с реле, гайками, винтиками и всем таким прочим, который был нацелен на решение только одной очень конкретной задачи со строго определенным форматом данных и их количеством.

Подобный аппарат не мог справиться с той же задачей, но с измененными входными данными. Чтобы было понятней: если аппарат мог складывать только целые числа, то подача на него дробных чисел уже не давала никаких результатов, и исправить это, кроме как переделать весь аппарат, было нельзя.

Тьюринг, кстати, свою машину собрал во время второй мировой на государственные деньги (вот хитрец :-)), для расшифровки немецких кодов.

Машина Тьюринга для расшифровки немецких кодов. Слева - в закрытом виде, справа - в открытом

Этому даже целый художественный фильм посвящен: Игра в имитацию. Название фильма не отражает сути происходящих в нем событий, что вызывает у некоторых зрителей вопросы. Но тут авторы пытались лишь сделать отсылку ко второму главному творению Алана: тесту Тьюринга. О нем я расскажу чуть позже. Вещь эта очень занимательная, и до сих пор многими считается мерилом для уровня искусственного интеллекта.

Машина Тьюринга в художественном фильме "Игра в имитацию"

Фон Нейман, в свою очередь, прочитал статьи Тьюринга на эту тему, и пошел дальше в универсализации работы вычислительных машин. Он предложил не только данные хранить в памяти машины, но и команды. Стоит сказать, что раньше входные команды (программа) задавалась на аппаратном уровне переключением различных кнопочек, тумблеров, перевтыканием проводов и так далее. То есть, все это занимало просто кучу времени. А этим своим нововведением Фон Нейман фактически создал архитектуру современных компьютеров, которая используется до сих пор. Так называемая архитектура Фон Неймана. Слышали наверное? Кстати, стоит сказать, что он не один все это придумал, а в кооперации с еще несколькими учеными. Но получилось так, что над конечной статьей в заголовке стояла только его фамилия, а остальных указали в конце статьи. И когда эта статья разлетелась по миру, все стали называть архитектуру именно фон-неймановской. Помимо идеи с архитектурой, Джон также предложил очень и очень важную идею - использование двоичного кода (до этого использовали десятичный) для обработки, хранения и преобразования любых электронных данных. Именно это впоследствии позволило легко добавить в вычислительные машины работу с изображениями, видео, звуком и так далее.

Теперь, когда наконец вычислительные машины стали максимально универсальными, и на одной аппаратной платформе можно было обрабатывать любые данные любым набором команд, впервые начали появляться мысли о создании умных машин, которые могут обрабатывать данные самостоятельно и также самостоятельно принимать решения.

Тут стоит отдельно рассмотреть эволюцию архитектуры вычислительных устройств. В школе и в институте на уроках информатики вы наверняка часто слышали подобное высказывание: "Компьютер создан как подобие человеческой головы. Есть процессор - мозг, он же память. Есть устройства ввода - сенсоры (глаза, уши, язык и так далее) и устройства вывода - речь, жестикуляция". Ну так вот, вычислительные машины делали по примеру человека не потому, что просто поленились придумать что-то новое. Человеческий мозг - это венец текущего состояния эволюции. На земле были протестированы миллиарды комбинаций живых организмов и различных форм жизни, чтобы в итоге создать самый эффективный инструмент выживания - разум (человеческий мозг).

И пускай человек использует в качестве копии не биологический компьютер (как раз из-за сложности его повторения), а машину на основе кремниевого процессора, в целом ее архитектура повторяет наш мозг.

Еще следует сказать пару слов об эволюции, чтобы вы лучше понимали масштабы проведенных природой испытаний и вычислений за сотни тысяч лет эволюции.

Существует дисциплина эволюционное программирование, которое при решении задач, например, поиска оптимального пути в графе, использует не алгоритмы и уравнения, а метод эволюции, как в природе. Выбирается изначальная популяция, и дальше выясняется ее пригодность для решения задачи (выживаемость), остаются лучшие и дальше они скрещиваются, также используется мутация. И, конечно же, есть механизм антивырождения, который предотвращает ситуацию, когда остаются только особи, которые постоянно выживали, и в итоге набор различных комбинаций при скрещивании сводится к нулю. Для этого в живых оставляется часть популяции, которая была плохо приспособлена и с ней происходит спаривание сильных.

Так вот, методы этой дисциплины могут решать лишь крайне простые задачи, причем требуют очень больших вычислительных затрат, и на текущий момент почти не применяются для решения практических задач, поскольку проигрывают по своей производительности алгоритмическим. То есть, как вы понимаете, созданные на текущий момент человеком вычислительные мощности не составляют и 1% от мощностей природы на планете Земля. Вот как раз поэтому человек и пытается максимально скопировать самого себя, а затем и вовсе улучшить, потому что природа уже сделала большую часть работы по проектированию и улучшению за него.

Здесь мы, наконец, подошли к предметной области этой статьи - "искусственному интеллекту". Предыдущие несколько абзацев должны были дать вам понять цель этой научной дисциплины: "повторить способности человека именно к мышлению: классицификация объектов, обучение, установление причинно-следственных связей". А после достижения этой цели, уже попытаться улучшить его способности. Обратите внимание: нет цели повторить умственные способности кошки или собаки (это лишь проходная стадия). Также как, например, нет цели повторить коллективный разум (полноценный, а не социологический термин). Фишка коллективного разума - это централизованное управление группой отдельных друг от друга субьектов, причем центра его может не существовать, и пока жива хотя бы одна особь - жив и весь разум.

Итак, повторить ученым и разработчикам хочется именно человеческий разум.

А теперь ответим на вопрос: что такое разум? И когда его можно считать повторенным. Каковы критерии успеха?

И вот тут самый противоречивый момент, который на самом деле пока не имеет ответа.

Для начала нужно понимать, что термин "Artificial intelligence" не равен нашему переводу "Искусственный интеллект". Более дословный перевод - это "Разумные действия". Результат таких действий - это когда нам кажется, например, что новый текст, речь, изображение или музыка - результат деятельности человека, а не машины. Именно такую суть вкладывали в эту дисциплину ее основоположники. А вот перевод на русский, первоначально некорректный, создает представление какого-то робота, которого невозможно отличить от человека.

Именно нацеливаясь на первоначальную задачу просто "разумных действий машины" создал свой тест уже хорошо знакомый нам Алан Тьюринг. Альтернативное название: "Имитационная игра".

Она заключается в следующем: в дружеской компании, на вечеринке, человеку (у него роль судьи) предлагают сыграть в игру: за ширмой сажают двух человек: мужчину и женщину. Они могут обмениваться с судьей записками. Судья не видит их рук, не слышит их, и не имеет никакого физического контакта. То есть, фактически общается с ними в чате (просто во времена Тьюринга не существовало Телеграма :-)). Задача судьи - определить, где мужчина, а где женщина, задавая вопросы. Через несколько раундов вместо одного из людей подсовывают машину, и если человек не заподозрит, что ответы ему дает не человек, то тест считается пройденным. Каждый раунд идет примерно 10 минут.

Именно этот формат изначально предлагал Тьюринг, а не вариант, когда судья заведомо знает, что один из участников - машина. Поскольку в данном случае он начинает задавать вопросы, специально нацеленные на выявление машины, а не обычный диалог, который он ведет каждый день с любым человеком.

Как видите, основная проблема этого теста в том, что машины пытаются обмануть и ИМИТИРОВАТЬ (отсюда и игра в имитацию) живого человека, при том, что полноценной копией человеческого разума она может и не быть.

То есть, слабое место этого теста в том, что большинство судей (среднестатистических людей) - не академики, и будут задавать примерно одинаковые вопросы. И при достаточно большом числе раундов (10-20 тыс.), машина может банально запомнить правильные ответы на 99% задаваемых вопросов за 10 или даже 5 минут одного раунда (это вариация, когда нет записок, а переписка идет в чате). То есть, достаточно мощная нейросеть с хорошей обучающей выборкой может выполнить эту задачу. Но про нейросети мы поговорим в следующей статье :-).

Тем не менее, при кажущейся небольшой сложности теста, еще ни одна машина не смогла его пройти в 100% раундов. О различных попытках можете почитать на Geektimes. Посмотрите обязательно статью. Обратите внимание, что лучший результат (в 30% случаев не смогли отличить робота от человека) у робота, который имитирует 13-летнего мальчика Евгения Густмана, живущего в Одессе. Успех его заключается в очень большом отсечении вопросов, ответить на которые 13-летнему мальчику позволительно в формате "Не знаю", "Мы еще такого в школе не проходили", "Я о таком не слышал" - и это будет выглядеть естественно. Проработанная история его жизни позволяет многие диалоги свести именно к тем вопросам, на которые машина знает ответ. Женя Густман целенаправлено добавляет фразы в свои ответы, которые напрямую не отвечают на вопрос, но дают понять, что это тинейджер с крайне ограниченным кругозором, тем самым заталкивая вас в гораздо более узкие рамки.

А вот и Евгений Густман собственной персоной

Помимо довольно очевидных минусов теста Тьюринга, когда все сводится к задаче обмана судьи, и неспособности на прочие интеллектуальные действия, есть и еще один подводный камешек.

Его описал в виде мысленного эксперимента Джон Сёрл, и назвал "Китайская комната". Если очень кратко, то идея в следующем: можно посадить человека в комнату и дать ему инструкцию, как работать с китайскими иероглифами, в случае, если ему придет та или иная последовательность. В результате, у человека нет абсолютно никаких знаний по китайскому языку, но когда ему будут приходить вопросы на китайском, он сможет по своей инструкции на них как-будто бы осмысленно отвечать. При этом продолжая абсолютно ничего не понимать.

Товарищ Сёрл конечно знатно этим посадил всех в лужу, поскольку любые модернизации машины с целью повторения разума человека будут упираться в этот мысленный эксперимент. То есть, машина всегда на самом деле не осознает, что она такое на самом деле, она лишь выполняет инструкции.

Тут возникает вопрос, а что такое тогда человеческое сознание? Для решения этого вопроса есть целая наука - когнитивистика, которая пытается выяснить, что же такое сознание и разум. Как именно они образуются в мозгу, за счет каких физических процессов.

Если очень кратко, то пока мнение такое, что сознание - это всего лишь система образов. В случае эксперимента китайской комнаты - у вас есть инструкции с иероглифами, вы когда-то их выучили, и они стали для вас безусловными, но кроме того, когда вы их видите - у вас вызывается ассоциативный ряд образов. Вот этот иероглиф - означает "Лошадь". И вы тут же представляете, как выглядит лошадь, какие звуки издает, как пахнет, как скачет и как стоит. И вы такой: "Даааа, Лошадь. Я раньше любил лошадей, катался на них, а потом я подошел к одной сзади, она лягнула меня и выбила 3 зуба. Теперь у меня там импланты, которые стоили моему отцу кругленькой суммы".

В общем, сознание - это, по большому счету, лишь мощная система образов.

Если говорить про разум, то главное его умение - это рефлексия. Анализ своих поступков и действий, своего места в мире, своей природы происхождения и целей пребывания на Земле.

Как вы уже наверно догадались, никакого таинства в этом нет, и все эти задачи могут выполнять алгоритмы, нацеленные на поиски ответов. Единственная проблема на текущий момент для разработчиков искусственного интеллекта в том, что у нас пока нет таких мощных компьютеров, которые могли бы поддерживать настолько сложную структуру образов, памяти и так далее.

Текущий уровень развития ИИ стоит примерно на уровне насекомого, вроде мухи или навозного жука, но мы все ближе и ближе приближаемся к мощности интеллекта вроде мышки или голубя.

Также стоит отметить, что ИИ делится на слабый и сильный. Слабый - это тот, что пытается обмануть человека в тесте Тьюринга и сидит в китайской комнате. Сильный - это тот, что наделен разумом и сознанием. И вот он пока не создан.

Итак, бойцы, основную теоретическую подготовку мы с вами прошли. В следующем выпуске хорошенько обсудим нейросети.

Материал из telegram-канала Digital хейтер

Пора победить мракобесие по теме: ИИ, нейронных сетей и машинного обучения. Часть 1. Общие сведения о ИИ

Пора победить мракобесие по теме: ИИ, нейронных сетей и машинного обучения. Часть 1. Общие сведения о ИИ

Поделитесь этой статьей:

Вконтакте или Facebook

Report Page