ЗАДАЧНЫЙ ПОДХОД К ИСКУССТВЕННОМУ ИНТЕЛЛЕКТУ И ЕГО ТЕОРЕТИЧЕСКАЯ И ТЕХНОЛОГИЧЕСКАЯ БАЗА

sergey shishkin

Д.И. Свириденко (dsviridenko47@gmail.com) Е.Е. Витяев (vityaev@math.nsc.ru) Институт математики им. С.Л. Соболева СО РАН, Новосибирск

В работе рассматривается задачный подход, который способен интегрировать различные подходы к искусственному интеллекту. Описывается методология, теория и возможные приложения задачного подхода. Дается формальное определение понятия «задача». Основой задачного подхода является концепция логиковероятностного семантического моделирования.

Ключевые слова: искусственный интеллект, моделирование, задача, логика, вероятность

Сибирская школа искусственного интеллекта, которую представляют авторы настоящего доклада, рассматривает искусственный интеллект (ИИ) как сбалансированное и гармоничное сочетание его научных, технологических и практических аспектов. Далее, в докладе, речь будет идти, в основном, о научном и технологическом аспектах ИИ. Что касается научного аспекта, то он, по мнению авторов, должен включать в себя, с одной стороны, методологию, базирующуюся на том или ином целостном подходе (или совокупности таких подходов), представляющих собой некий непротиворечивый мировоззренческий взгляд на природу и содержание ИИ, и, с другой стороны, теоретическую основу указанного подхода в виде набора уточняющих и развивающих эту методологию формальных и эвристических теорий.

Сибирская школа ИИ в качестве оригинального методологического подхода к ИИ придерживается так называемого задачного подхода [Гончаров и др., 2018а], [Витяев и др., 2019] объявляющего основным своим объектом изучения понятие «задача» и в связи с этим раскрывающего как структуру и содержание этого понятия, так и структуру, а заодно и содержание процесса формулирования и решения задачи. Более развернуто, целью задачного подхода является получение ответов на следующие вопросы: Откуда берутся задачи? Почему и зачем нужно решать задачи? Что такое задача? Что значит решить задачу? Какие бывают задачи? Как и чем следует решать задачи?

Следует отметить, что задачный подход был впервые успешно применен еще в середине 80-х годов прошлого столетия для анализа оснований математики академиком РАН Ю.Л. Ершовым и д.ф.н. К.Ф. Самохваловым [Ершов и др., 2007], обратившими внимание на исключительную важность для математики нахождения исчерпывающих ответов на вопрос: для решения каких задач предназначается та или иная математическая теория? В те же 80-е годы задачный подход был применен для создания логикоматематической теории семантического программирования, ориентированной на анализ проблемы автоматического решения интеллектуальных задач с помощью компьютеров [Goncharov et al., 1986, 1989, 2018], [Гончаров, 2017], [Гончаров и др., 2018b, с]. Что же касается идеи применения задачного подхода к ИИ [Гончаров и др., 2018а], [Витяев и др., 2019], то здесь главной причиной послужила фрагментарность направлений исследований в современном ИИ с претензией на самостоятельность отдельных направлений. Примерами могут служить такие направления исследований в ИИ как машинное зрение, перевод и понимание естественных языков, робототехника и другие. Естественно встает вопрос об объединения этих разрозненных областей на основе некого единого понимания проблем ИИ.

Нужно сказать, что идея интеграции ИИ не нова. Еще в середине 90-х годов была сформулирована концепция интеграции ИИ на базе агентного подхода, рассматривающего ИИ как науку проектирования рациональных агентов, функционирующих в некоторой среде и взаимодействующих с ней [Рассел и др., 2006]. В этот же период начал формироваться и общий искусственный интеллект (ОИИ или AGI – Аrtificial General Intelligence) [Goertzel, 2010], [Cassimatis, 2006], [Langley, 2006], по своей философии весьма близко примыкающий к выше упомянутому агентному подходу, и где в качестве главной интеграционной идеи предлагалось рассматривать «способность агента решать когнитивные задачи в целом, действуя целенаправленно, адаптируясь к условиям среды через обучение, минимизируя при этом риски и оптимизируя потери на достижение своих целей». При более тесном знакомстве с обоими подходами бросается в глаза одно важное обстоятельство – пытаясь объяснить единую природу ИИ и, тем самым, систематизировать и объединить с единых позиций имеющиеся и привлекаемые знания, основное внимание авторы обоих подходов вынуждены были уделять все-таки детальному анализу решаемых задач и соответствию используемых для их решения технологий, методов и инструментов. Таким образом, можно сделать вывод, что и агентный подход, и AGI в действительности неявно следуют задачному подходу. Отсюда центральными вопросами в задачном подходе применительно к ИИ являются следующие – как устроены задачи ИИ и что значит решить задачу ИИ?

Отвечая на эти вопросы, задачный подход обращает внимание, прежде всего, на то, что понятие задачи является многокомпонентным. Что же касается конкретных компонент понятия задачи, то наиболее важными с точки зрения задачного подхода из них являются хорошо структурированная, адекватная и развитая модель предметной области и запрос к ней. Также желательно при формулировке задачи учитывать результаты ее контекстного анализа, поскольку в процессе изучения контекста задачи мы можем получить весьма важную информации для успешного ее решения. По этой причине, прежде чем окончательно зафиксировать формулировку запроса и приступить к поиску ответа на него, желательно предварительно ответить на вопросы «почему появился этот запрос?» и «зачем он нужен?». Сразу отметим, что эти вопросы существенно различаются по своему назначению – первый предполагает ответ, касающийся истории происхождения и причин появления запроса, второй же вопрос относится уже к цели, обоснованию необходимости и последствий реализации ответа на запрос. Заметим, что присутствие цели в формулировке задачи дает возможность более точно понимать, что же есть результат решения задачи, какими свойствами он должен обладать и что делать, если результат окажется отрицательным. Таким образом, принимая во внимание все вышесказанное, мы имеем дело с задачей только в том случае, когда в ее формулировке присутствуют указания или описания того:

к какой предметной области относится запрос, и что мы знаем об этой предметной области, зафиксированное в виде ее модели, включая описание сигнатуры и структуры языка описания предметной области, набора терминов и понятий, исходные данные, факты, правила и гипотезы;
на какой запрос, относящийся к предметной области, мы должны получить ответ;
в каком случае можно считать, что запрос будет удовлетворен (снят), т.е. определить критерий удовлетворения запроса;
в каком контексте следует искать ответ на запрос, в том числе, какую цель мы преследуем, решая задачу, т.е. что мы ожидаем от результата, который мы получим, решив задачу, каковы последствия решения задачи и что делать, если ответ окажется отрицательным

Хотелось бы обратить внимание на обязательное присутствие в формулировке задачи критерия ее «решённости», поскольку задачный подход постулирует, что задача осмысленна тогда и только тогда, когда мы имеем критерий, с помощью которого можно для каждого предъявляемого решения задачи определить – является ли предъявляемая конструкция решением или нет (т.е. решение найдено или нет). Заметим, что такой критерий позволяет не только определять – является ли ответ на вопрос решением задачи или нет, но и существенно проясняет, уточняет и одновременно фиксирует смысл (семантику) запроса, поскольку необходимость формулировки критерия заставляет исследователя сосредоточить свое внимание на том, с какой же целью формулируется запрос, тем самым подчеркивая важность контекста рассмотрения запроса и условий поиска ответов на него. Именно совместное формулирование запроса, модели предметной области, критерия «решенности», а также контекста, включая цель поиска ответа на запрос, во многом определяет, как смысл и содержание самого запроса, который требует ответа, так и процесс поиска этого ответа

Прежде чем ответить на вопрос «что значит решить задачу ИИ?», зададимся другим вопросом – а в чем заключается назначение ИИ? Задачный подход считает, что назначением ИИ является автоматизация решения задач, понимая термин «автоматизация» в самом широком смысле. И здесь мы вынуждены перейти от методологических изысканий к теоретическим рассуждениям.

Теоретическая основа задачного подхода включает в себя сочетание математической логико-вероятностной концепции семантического моделирования и оригинальных вариантов когнитивного анализа данных и когнитивной архитектуры [Goncharov et al., 1986, 1989, 2018], [Гончаров, 2017], [Гончаров и др., 2018b, с], [Витяев, 2014], [Vityaev, 2015a, b], [Demin et al., 2014]. Предложенный в рамках задачного подхода логико-математический формализм семантического моделирования отличается от существующих подходов к решению проблемы автоматизации сложных задач своим оригинальным выбором базовой модели вычислений. В качестве такой модели была выбрана ∑-определимость вычислений [Ершов, 2000] и проверка истинности логических ∑-формул на конструктивной модели М и ее списочной надстройке HW(M) [Goncharov et al., 1986, 1989, 2018], [Гончаров, 2017], [Гончаров и др., 2018b, с]. Задача, решение задачи и критерий решения задачи в этих терминах определяется следующим образом.

Предполагается, что в нашем распоряжении имеется многосортная конструктивная модель M вместе со своей списочной надстройкой HW(M), выступающая как некий базовый вычислитель. Модель предметной области рассматриваемой задачи формулируется в сигнатуре языка исчисления предикатов этой базовой конструктивной модели М вместе с ее списочной надстройкой HW(M) как набор ∑-определений, т.е. ∑- формул и ∑-термов этого языка. При этом допускаются рекурсивные схемы ∑-определений с некоторыми ограничениями на вхождения в них определяемых предикатов и термов.

Запрос к модели предметной области определяется как ∑-формула, в записи которой могут использоваться как сигнатурные конструкции базовой конструктивной модели, так и определяемые предикаты, и термы предметной области. Под решением задачи понимается набор констант, делающий ∑-формулу запроса при означивании ее переменных этими константами истинной на модели предметной области. Истинность ∑- предложения, получаемого подстановкой найденных констант в ∑-запрос вместо переменных, и есть критерий решенности задачи. Обратим внимание на то, что таких наборов, претендующих на роль решения задачи, может оказаться несколько, и потому возникает проблема выбора в каком-то смысле наилучшего решения. В этом случае критерий решенности задачи должен содержать и критерий выбора наилучшего ответа на запрос. Естественно, что формулировка такого критерия во-многом зависит от природы самой задачи. Например, если константы-решения вычисляются неким множеством замкнутых ∑-термов, то в качестве критерия выбора может выступать сложность вычисления этих термов.

Было установлено, что для практических целей вместо ∑-определений достаточно рассматривать так называемые Δ0-формулы, содержащие только ограниченные кванторы существования и всеобщности. Оказалось, что язык Δ0-формул, хоть и не является Тьюринг-полным, в отличие от языка ∑-формул, тем не менее, обладает целым рядом достоинств и позитивных свойств. Так, например, он допускает естественное обогащение условными и рекурсивными термами [Гончаров, 2017], [Гончаров и др., 2018b], что позволяет предложить практикам весьма выразительный логикофункциональный язык исполнимых спецификаций, который может оказаться полезным при проектировании широкого круга рациональных агентов, решающих задачи путем осуществления некого набора действий. Примером такого языка может служить язык документных моделей Libretto, используемый при создании управляющих бизнес-процессами систем [Mantsivoda et al., 2019]. При этом выяснилось, что этот формализм позволяет при определенных условиях гарантировать полиномиальную сложность вычислений [Гончаров и др., 2018c].

Исключительно большое значение в семантическом моделировании придается возможности осуществлять решение задач с помощью так называемых оракулов, в роли которых могут выступать некоторые предикаты как исходного базового Решателя, так и определяемой модели. Особенно это важно при решении так называемых гибридных задач, поскольку оракулы могут мыслиться как некие внешние Решатели, осуществляющие поиск ответа на обращенный к ним запрос с использованием моделей различной природы и содержания, например, некой искусственной нейронной сети. Естественно присущий теоретико-модельному подходу, каковым и является семантическое моделирование, механизм оракулов выгодно отличает данную концепцию от, например, символьного доказательного подхода, поскольку позволяет в виде оракулов на равных использовать как строгие математические, так и эвристические модели, скажем, те же нейронные сети или алгоритмы машинного обучения. Таким образом, в семантическом моделировании не только допускается, но и приветствуется использование относительной вычислимости, реализуемой в виде механизма оракулов и позволяющей декомпозировать задачи на подзадачи и, тем самым, создавать целые иерархии моделей, когда создаваемые логико-вероятностные модели могут сами оказаться подмоделями более общих моделей и, следовательно, играть роль оракулов. Подобная возможность декомпозиции сложных и масштабных задач на подзадачи и выстраивания иерархии моделей, состоящих из набора моделей проблемных областей и используемых внешних Решателей, позволяет проектировать и создавать сложные многоуровневые системы ИИ, моделирующие процесс решения человеком сложных и масштабных задач. При этом, постулируется, что модель самого верхнего уровня, представляющая исходную задачу, должна носить отчетливый логико-вероятностный характер. Оракулы, вычисляя ответы для модели более верхнего уровня, могут, в свою очередь, также обращаться к своим оракулам и т.д. При этом выбор нужного оракула может носить вероятностный или нечеткий характер, что используется при решении проблемы адаптации.

Ответы, сгенерированные моделью самого верхнего уровня, поступают на вход в оценочную модель, которая пользуясь различными критериями (последствия, риски, ресурсы, полезность, формальные аналоги эмоциональных оценок и т.п.), выставляет оценки сгенерированным вариантам ответов и передает их блоку принятия решений, который и делает окончательный выбор ответа.

Описанная выше возможность сочетания путем использования механизма оракулов взаимодополняющих друг друга моделей различной природы позволяет рассматривать и эффективно решать широкий круг когнитивных задач, зачастую превосходящих по своей сложности и масштабности способности человека.

Отметим, что выбор того или иного способа решения задачи часто связано с прогнозом достижимости решения, что влечет за собой необходимость эффективного синтеза логических рассуждений и вероятностного вывода. В рамках задачного подхода Сибирской школе удалось предложить решение задачи прогноза достижимости решения в когнитивных задачах с использованием семантического вероятностного вывода [Витяев, 2017], который:

позволяет обнаруживать на данных максимально специфические логико-вероятностные правила (знания), предсказания по которым не приводит к противоречиям [Vityaev et al., 2019];
множество всех максимально специфических правил при прогнозе аппроксимирует логический вывод и дает заведомо не худшие оценки прогноза [Витяев, 2017];
позволяет определить вероятностные формальные понятия как неподвижные точки максимально специфических правил. Вероятностные формальные понятия моделируют «естественные» понятия в когнитивных науках и «естественную» классификацию объектов внешнего мира [Vityaev, 2015b];
иерархия вероятностных формальных понятий дает оригинальный вариант глубокого логико-вероятностного обучения;  целенаправленное поведение агентов по достижению своих целей может быть представлено как решение агентом задачи по удовлетворению некоторой потребности, как оно описано в теории функциональных систем П.К. Анохина [Anokhin, 1974], [Demin et al., 2014], [Витяев, 2014], [Vityaev, 2015a].

В заключении рассмотрим технологические аспекты задачного подхода, «материализующих» его методологические положения и теоретические результаты. Речь идет об общем схематическом описании технологии семантического моделирования, которая, естественно, должна поддерживаться соответствующим инструментарием в виде некоего технологического комплекса (платформы), обслуживающего эту технологию по построению программных систем, автоматизирующих процессы решения задач. При этом речь будет идти, главным образом, о сложных и масштабных задачах, автоматизация решения которых может потребовать декомпозиции этих задач. Тем самым, фактически, следует говорить о классах задач. Естественно, что разные классы задач требуют уточнения и адаптации предлагаемой схемы.

Этап 1. Предварительная формулировка задачи, что предполагает идентификацию и содержательное описание предметной области и запроса к ней. На этом этапе строится онтология задачи, описываются исходные знания о предметной области (факты, правила и гипотезы) и прецеденты (данные), включая указание соответствующих данным шкал измерений, уточняется цель решения задачи и критерий ее решения, т.е. критерия того, что цель достигнута.

Этап 2. Анализ содержательной постановки задачи. Прежде всего, речь идет о применении так называемого контекстного оператора, включая определение ближайшей надзадачи, декомпозицию исходной задачи на подзадачи и построения соответствующего дерева задач, естественно при этом проверяя выполнение требований непротиворечивости и полноты декомпозиции.

Этап 3. Окончательная содержательная формулировка исходной задачи, включающая в себя дерево подзадач, требующих решения для того, чтобы получить решение исходной задачи.

Этап 4. Построение формальной семантической модели задачи как пары «логико-вероятностная модель предметной области»  «Δ0-запрос». На этом шаге сам процесс создания формальной модели задачи в терминах языка семантического моделирования Дельта-0 рассматривается как проектно-организованный процесс. Для задач/подзадач строим формальные логико-вероятностные модели либо, обобщаем задачу/подзадачу и, тем самым, поднимаемся на уровень выше с тем, чтобы формулировать задачу в более общей постановке таким образом, чтобы исходная задача/подзадача была частным случаем более общей задачи.

Этап 5. Апробация решения задачи.

Список литературы

[Витяев, 2014] Витяев Е.Е. Логика работы мозга. Подходы к моделированию мышления / Под ред. В.Г. Редько. – М.: УРСС Эдиториал, 2014.

[Витяев, 2017] Витяев Е.Е. Семантический вероятностный вывод предсказаний // Известия Иркутского гос. университета. Серия «Математика» Т. 21.

[Витяев и др., 2019] Витяев Е.Е., Гончаров С.С., Свириденко Д.И. Задачный подход к искусственному интеллекту // Сибирский философский журнал. 2019. Т. 17. № 4.

[Гончаров, 2017] Гончаров С.С. Условные термы в семантическом программировании // Сибирский математический журнал. 2017. Т. 58. № 5.

[Гончаров и др., 2018а] Гончаров С.С., Свириденко Д.И. Семантическое моделирование и искусственный интеллект // Сибирский философский журнал. 2018. Т. 16. № 4.

[Гончаров и др., 2018b] Гончаров С.С., Свириденко Д.И. Рекурсивные термы в семантическом программировании // Сибирский математический журнал. 2018. Т. 59, № 6.

[Гончаров и др., 2018c] Гончаров С.С., Свириденко Д.И. Логический язык описания полиномиальной вычислимости // Доклады РАН. 2018. Т. 485. № 1.

[Ершов, 2000] Ершов Ю.Л. Определимость и вычислимость. – Новосибирск: Научная книга, 2000.

[Ершов и др., 2007] Ершов Ю.Л., Самохвалов К.Ф. Современная философия математики: недомогания и лечение. – Новосибирск: Параллель, 2007.

[Рассел и др., 2006] Рассел С., Норвиг П. Искусственный интеллект: современный подход. – М.: Вильямс, 2006.

[Anokhin, 1974] Anokhin P.K. Biology and neurophysiology of the conditioned reflex and its role in adaptive behaviour, Oxford etc.: Pergamon press, 1974.

[Cassimatis, 2006] Cassimatis N.L. A Cognitive Substrate for Achieving Human-Level Intelligence. AI Magazine. 2006. Vol. 27. No. 2.

[Demin et al., 2014] Demin A.V., Vityaev E.E. Learning in a virtual model of the C. elegans nematode for locomotion and chemotaxis // Biologically Inspired Cognitive Architectures. 2014. Vol. 7.

[Goertzel, 2010] Goertzel B. Toward a Formal Characterization of Real-World General Intelligence // Advances in Intelligent Systems Research. 2010. Vol. 10.

[Goncharov et al., 1986] Goncharov S.S., Sviridenko D.I. Theoretical aspects of Σprogramming // Lecture Notes in Computer Science. 1986. Vol. 215.

[Goncharov et al., 1989] Goncharov S.S., Sviridenko D.I. Σ-programming // Transl., II. Ser., Am. Math. Soc. 1989. Vol. 142.

[Goncharov et al., 2018] Goncharov S.S., Sviridenko D.I. Semantic modeling and hybrid models // Siberian Symposium on Data Science and Engineering (SSDSE). Novosibirsk, Russia. 2018. [Langley, 2006] Langley P. Cognitive Architectures and General Intelligent Systems // AI Magazine. 2006. V. 27. No 2.

[Mantsivoda et al., 2019] Mantsivoda A.V., Ponomaryov D.K. Towards Semantic Document Modelling of Business Processes // The Bulletin of Irkutsk State University. Series “Mathematics”. 2019. V. 29.

[Vityaev, 2015a] Evgenii E. Vityaev Purposefulness as a Principle of Brain Activity // Anticipation: Learning from the Past, (ed.) M. Nadin. Cognitive Systems Monographs, Springer. 2015. V.25. Chapter 13.

[Vityaev, 2015b] Evgenii Vityaev Unified formalization of “natural” classification, “natural” concepts, and consciousness as integrated information by Giulio Tononi // The Sixth international conference on Biologically Inspired Cognitive Architectures (BICA 2015, Lyon, France), Procedia. Elsevier. 2015. Vol.71.

[Vityaev et al., 2019] Vityaev E.E., Odintsov S.P. How to predict consistently? // Studies in Computational Intelligence. 2019. Vol. 796.

ЗАДАЧНЫЙ ПОДХОД К ИСКУССТВЕННОМУ ИНТЕЛЛЕКТУ И ЕГО ТЕОРЕТИЧЕСКАЯ И ТЕХНОЛОГИЧЕСКАЯ БАЗА

Report Page