Задачи управления безопасным движением при встрече с препятствием и выбор метода решения. Дипломная (ВКР). Транспорт, грузоперевозки.

⚡ 👉🏻👉🏻👉🏻 ИНФОРМАЦИЯ ДОСТУПНА ЗДЕСЬ ЖМИТЕ 👈🏻👈🏻👈🏻

Вы можете узнать стоимость помощи в написании студенческой работы.

Помощь в написании работы, которую точно примут!

Похожие работы на - Задачи управления безопасным движением при встрече с препятствием и выбор метода решения

Скачать Скачать документ
Информация о работе Информация о работе

Скачать Скачать документ
Информация о работе Информация о работе

Скачать Скачать документ
Информация о работе Информация о работе

Скачать Скачать документ
Информация о работе Информация о работе

Скачать Скачать документ
Информация о работе Информация о работе

Скачать Скачать документ
Информация о работе Информация о работе

Нужна качественная работа без плагиата?

Не нашел материал для своей работы?

Поможем написать качественную работу Без плагиата!

При управлении подвижными объектами различного
класса, такими как наземный городской транспорт, летательные аппараты при
маловысотном полете, речные и морские суда, возникает проблема обеспечения
безопасности движения при встрече с различными препятствиями. Существующие
методы автоматического управления позволяют синтезировать структуры линейных
регуляторов в аналитической форме, однако они не дают оценки степени риска при
опасном сближении с препятствием.

Между тем при ручном управлении человек испытывает
реальные ощущения нарастания тревоги в случае недопустимого снижения
безопасности движения, что вызывает последующую перестройку способа обхода
препятствий. Поэтому целью настоящей работы являет воспроизведения поведения
человека путем количественной оценки текущего риска в движении с помощью
предложенной системы контроля и, главное, последующей перестройки системы
управления на примере обхода препятствий при встречном движении.

1. Постановка задачи управления
безопасным движением при встрече с препятствием и выбор метода решения

Метод динамического
программирования, разработанный в 50-х годах американским математиком
Р.Беллманом, представляет собой новый подход к решению вариационных задач. Идея
этого подхода состоит в том, что оптимальное поведение рассматривается как
функция состояния системы, описываемого с помощью значения фазовых координат в текущий
момент времени t. Беллман очень точно подметил связь между причинностью и
оптимальностью для динамических систем в том смысле, что если изменение
состояния любой
динамической системы под воздействием входного управляющего сигнала можно
описать функциональным уравнением, характеризующим причинность

то у оптимальной системы для
описания изменения ее состояния, характеризуемого некоторой функцией как степень
достижения подавленной цели, существует по аналогии такого же типа
функциональной уравнение лишь с той разницей, что достигается минимум или
максимум целевой функции при выборе управления :

При этом выбор управления на отдельном шаге
производится с точки зрения интересов не только данного шага, но и всего
процесса в целом, как на текущем, так и на всех последующих шагах.

Исходя из этого, Беллманом был сформулирован
принцип оптимальности: каковы бы ни были начальное состояние и начальное
управление, последующие управления должны быть оптимальными относительно
состояния, являющегося результатом применения первого управления. Принцип
оптимальности можно также сформулировать следующим образом: оптимальное поведение
не зависит от предыстории системы, а определяется только начальным (к данному
моменту времени) условием и конечной целью, и текущее управление должно
выбираться с учетом последствий в будущем. Классическим примером оптимального
поведения является стратегия бегуна на дальнюю дистанцию. На старте бегун
составляет график своего бега так, чтобы пройти дистанцию за минимальное время.
Это не значит, что каждый участок он должен бежать как можно быстрее. Наоборот,
находясь на дистанции, он в каждый момент времени должен распределять свои силы
так, чтобы с учетом своего состояния пробежать оставшийся участок за
минимальное время, чему может соответствовать и бурный финиш в конце дистанции.

Динамическому программированию органически
присуще решение задач, дискретных по своей природе в силу рекуррентности
последовательного выбора управления в многошаговой процедуре оптимизации.
Заметим, что принцип оптимальности справедлив как для непрерывных
детерминированных, так и для стохастических процессов управления, благодаря
чему динамическое программирование может широко применяться в ряде
кибернетических задач.

Несмотря на кажущуюся простоту принципа
оптимальности из него можно вывести ряд нетривиальных условий оптимальной
траектории.

1.1.1 Дискретная форма динамического
программирования

Изучение метода начнем с решения одномерной
задачи, когда управляемый автономный одномерный объект описывается либо в
дискретной форме

которой соответствует разностное
уравнение

где u - ограниченное в общем случае
управление, т.е. ; Δt - дискрет
времени, равный .

При заданном начальном состояний объекта и
свободном правом конце необходимо за фиксированное время обеспечить
минимум заданного функционала

или в виде аддитивной целевой функции

Таким образом, J есть функция (к +
1) выбираемых переменных ,
присутствующих в (к +1) уравнениях связи, т.е. можно попытаться решить задачу с
помощью множителей Лагранжа. Однако это сложно из-за большой размерности
задачи, поэтому применим иной подход.

Выведем сначала функциональное
уравнение Беллмана, рассуждая следующим образом. Пусть минимизируемое значение
функционала J в начальный момент времени определенным образом зависит от
начального состояния системы, т.е. от t 0 и x(t 0 ).
Обозначим эту зависимость через , называемую функцией Беллмана,
понимая под этим не любое значение функционала, а его минимум при оптимальном
поведении системы.

Представим теперь, что система
функционировала некоторое время , в результате чего к моменту она пришла
в новое состояние . Тогда,
согласно принципу оптимальности, оставшееся значение минимизируемого
функционала

как результат последующих
оптимальных действий есть также функция Беллмана , но уже зависящая от новых значений
x(t 1 ) и t 1 . Теперь осталось связать функции и друг с
другом, представив последствия от выбираемого управления в
промежуток времени в виде двух
слагаемых - потерь внутри
данного шага и потерь на всех последующих шагах вплоть до конца решения задачи,
зависящих от , потому что
последствия в будущем определяются новым состоянием , которое
описывается выражением

Поэтому, преследуя цель минимизации
суммарных потерь, как текущих так и последующих, можно записать:

Рассуждая аналогичным образом при
переходе к следующему шагу от момента к моменту и т.д. к
моменту , можно записать
следующее функциональное уравнение:

Развивая этот же подход применительно к
многомерному неавтономному объекту, можно получить функциональное уравнение
Беллмана:

Пошаговый выбор управления с помощью
уравнения (1.5) удобен для расчетов на ЭВМ. В этом случае численное решение
обычно осуществляют с правого конца задачи. Поскольку краевые условия на правом
конце не определены однозначно, то расчеты начинают, задавшись множеством значений
вектора , разбивая,
например, диапазон возможных значений на R- 1 участков. В результате для
каждого из R n вариантов конечного состояния определяется
единственное управление на последнем
шаге (в предположении, что управления на остальных шагах будут найдены позже),
поскольку при заданном только от
него зависит последнее слагаемое в функции (1.3):

Эта операция проводится также
численно, например путем разбиения каждого из диапазонов возможных значений и на ( М -1 )
участков, что образует вариантов
управления. Результаты наилучшего варианта запоминаются, а именно для каждого
из вариантов
фиксируются три величины - вектор состояния , оптимальное управление и минимум
целевой функции . Таким
образом, в памяти ЭВМ хранится чисел.

На следующем шаге, являющемся уже
типичным для расчетов, снова формируются варианты состояния , а затем
для каждого из них численно определяется управление , но уже
исходя из минимума суммы двух слагаемых, причем второе слагаемое отыскивается в
памяти ЭВМ в соответствии с переходом из B ;

Результаты расчета для нового шага
также запоминаются в ЭВМ. Эта процедура повторяется, двигаясь от конца к началу
для всех шагов,
кроме первого. При этом необходимый объем памяти непрерывно растет. Наконец на
первом шаге, воспользовавшись единственным вариантом заданного начального
состояния, численно определяют оптимальное управление , но именно
ради этого необходимо было запомнить итоги оптимизации на втором шаге, а это
приводит к необходимости помнить результаты на предыдущих шагах.

Теперь, поскольку управление найдено и,
значит, определено значение , представляющее собой
минимизируемое значение функционала, осталось выявить конкретные значения ,
соответствующие данной оптимальной траектории. Для этого на основании уравнения
(1.7) и известного управления определяется состояние , которому
соответствует свое запомненное управление . Продолжая теперь движение слева
направо, последовательно восстанавливают всю программу управления и оптимальную
траекторию за все к шагов.

Рис 1.1 Иллюстрация численного решения с правого
конца задачи при дискретной форме динамического программирования

Рассмотренным методом решаются задачи, когда на
правом конце часть фазовых координат закреплена. Например, на рис. (1.1)
представлен случай перехода из точки А в точку В с произвольной конечной
скоростью; Тогда движение справа налево, как это показано на рис. (1.1), при к
= 3 требует переменного объема запоминаемых результатов, поскольку по
координатам x 1 и x 2 вначале оценивается малое число вариантов,
а потом число растет, вплоть до момента достижения точки А. При этом основное
содержание расчета на каждом шаге остается прежним.

Нужно отметить, что, несмотря на
определенную утомительность рассмотренной вычислительной процедуры, метод
динамического программирования сводит задачу минимизации функции переменных отдельным
шагам расчетами минимизации функции Беллмана, зависящей только от г переменных.
Это экономит время расчета, требуя, правда, значительного объема памяти ЭВМ.
Достоинством метода при численных расчетах является также и снижение объема
вычислений при сужении области допустимых управлений или
допустимого множества значений . Однако с увеличением размерности
задачи дискретизация увеличивает число вариантов расчета запоминаемых
результатов в степени n, что известно как «проклятие размерности», и требует
иных подходов к применению динамического программирования.

.1.2 Непрерывная форма динамического
программирования

Принцип оптимальности Беллмана дает достаточно
общее условие, которое можно применять как для дискретных, так и для
непрерывных систем управления.

Рассмотрим следующий предельный
случай, когда дискрет времени бесконечно мал, т.е. . Обратимся
к функциональному уравнению Беллмана для одномерного объекта, заменив в нем
дискретный момент времени ( на
текущее время ) и согласно (1.2) и (1.3) функции и соответственно на и . Тогда
можно получить выражение

При этом функция S во втором
слагаемом правой части уравнения также имеет бесконечно малые приращения.
Допустим, что функция Беллмана S непрерывна и, кроме того, существуют частные
производные . Тогда
можно разложить функцию ряд Тейлора
в точке (х,t) и, пренебрегая членами второго порядка малости, получить

Заметим, что последнее слагаемое
может быть учтено, если переменная х (t) есть случайный процесс, в котором
присутствует составляющая типа белого шума с бесконечно большой дисперсией D,
равной где -
коэффициент диффузии. Подставим полученный результат в правую часть уравнения
(1.8). С учетом того, что функции и от управления на зависят как
результаты уже проведенной оптимизации и могут быть вынесены за фигурные
скобки, уравнение (3.8) можно представить в виде

Перенеся первые два члена в левую
часть, разделим уравнение на :

Последними двумя слагаемыми при можно
пренебречь из-за их малости. Тогда с учетом случайного характера
оптимизируемого процесса получим уравнение.

Если рассматривать детерминированный
случай при и, наконец,
исследовать поведение системы с п координатами и r управлениями ,то можно
получить известное уравнение Беллмана в частных производных

Очень важно подчеркнуть, что уравнение Беллмана
(1.10) является нелинейным дифференциальным уравнением, поскольку в нем
присутствует операция минимизации. В векторной форме его можно записать так:

Поясним теперь смысл слагаемых,
входящих в правую часть уравнения (1.10). Первое слагаемое характеризует
потери на текущем шаге, второе слагаемое в виде суммы членов оценивает
последствия от принятого решения в будущем. Причем каждый член учитывает
изменение текущего состояния по координате x i , возникающее за счет
управления , с помощью
производной , которая
умножается на свой весовой коэффициент . Таким образом, производные есть своего
рода «коэффициенты чувствительности» оставшегося значения минимизируемого
функционала к изменениям текущих значений фазовых координат . Это
соображение иллюстрирует дальновидность метода и оживляет представление о
функции Беллмана как о
некоторой функции отклика критерия оптимальности на измененные вектора
состояния . Часто в
технических задачах можно физически уяснить себе характер зависимости функции S
от фазовых координат системы. Поэтому удается найти управление в функции от
состояния фазовых координата , что позволяет прийти к замкнутой
системе управления с обратной связью и тем самым ускорить решение задачи, что будет
показано ниже в примерах.

С помощью динамического
программирования можно решать задачи и с незакрепленным временем управления . В
частности, для автономных систем можно получить уравнение Беллмана в виде

где функция от времени
не зависит. Для задач максимального быстродействия в уравнении (1.11) нужно
ввести замену .

В заключение отметим, что вывод уравнений (1.10)
и (1.11) требовал дифференцируемости функции S. Однако существуют задачи, где
эта функция не является дифференцируемой, а оптимальное управление существует.
Поясним на примере, что на линии переключения функция S всегда
недифференцируема.

1.1.3 Связь динамического
программирования с вариационным исчислением и принципом максимума

Метод динамического программирования носит более
универсальный характер, чем методы, основанные на принципе максимума и
вариационном исчислении, поскольку он был разработан для оптимального
управления процессами, не обязательно описываемыми системой дифференциальных
уравнений. Вместе с тем этот метод не имеет строгого обоснования в ряде случаев
по сравнению с принципом максимума и вариационным исчислением, хотя и тесно
связан с ними.

Связь метода динамического программирования
с вариационным исчислением. Пусть целевая функция зависит от
скорости изменения
фазовых координат. Тогда уравнение (1.10) можно записать в виде

Продифференцируем уравнение (1.12)
по с учетом
того, что функция Беллмана от не зависит:

Затем запишем полную производную по
t:

Продифференцируем теперь уравнение
(1.14) по ;

Вычитая из полученного результата предыдущее
уравнение, приходим к уравнению Эйлера в вариационном исчислении

Заметим, это соотношение было получено в
предположении о непрерывности частных производных второго порядка.

Пусть теперь граничное условие
задачи в конечный момент времени есть соотношение

Тогда с учетом равенства (1.13) получим из
(1.12) следующее соотношение, идентичное условию задачи с подвижным концом в
вариационном исчислении:

Кроме того, можно убедиться, что
уравнение (1.13) есть необходимое условие минимума для выражения в правой части
(1.13), поскольку, во-первых, уравнение (1.13) есть частная производная от
этого выражения по ,
приравненная к нулю. Во-вторых, дифференцируя по уравнение (1.13) вторично и
учитывая равенство нулю производной от первого слагаемого, получаем еще одно
необходимое условие минимума, состоящее в положительной определенности
матрицы частных производных второго порядка, что совпадает с условием Лежандра
в вариационном исчислении.

Можно также показать, что если
экстремум в точке совпадает с
абсолютным минимумом, т.е.

то это соответствует известному
условию Вейерштрасса.

Связь метода динамического
программирования с принципом максимума. Геометрическая интерпретация
динамического программирования. Связь с функцией Ляпунова. Классическое описание
данной взаимосвязи строится на том, что из уравнений динамического
программирования при определенных допущениях выводятся результат ты,
соответствующие принципу максимума. Основной смысл этих сопоставлений состоит в
том, чтобы показать, что для применения динамического программирования нужны
излишне жесткие требования, связанные с существованием непрерывных частных
производных .
Действительно, если для задачи с закрепленным временем ввести (n + 2)-мерную
вектор-функцию

то уравнение Беллмана (1.10) можно
записать в виде:

или так , что
соответствует принципу максимума, если ввести функцию .

Если рассмотреть задачу
максимального быстродействия, то, воспользовавшись уравнением (1.14) для
автономных систем и продифференцировав его по , получим

Первое слагаемое можно преобразовать, учитывая
очевидное соотношение

откуда получаем следующий результат:

Видно, что в оба слагаемых входят
одни и те же функции которые мы
теперь «обозначим через . Тогда
условие (1.14) для оптимального процесса приобретет вид,

что сразу же позволяет левую часть
этого равенства обозначить через
гамильтониан Н, а из соотношения (1.15) получить используемую в
принципе максимума систему дифференциальных уравнений относи
тельно вспомогательных переменных

Таким образом, результаты
динамического программирования и принципа максимума совпадают, если ввести
обозначения

Рис. 1.2. Геометрическая интерпретация
динамического программирования в задаче максимального быстродействия.

Это позволяет дать следующую
геометрическую интерпретацию динамического программирования. На рис. 1.2
представлены поверхности изохрон S = const для задачи максимального
быстродействия, причем величина S, по смыслу равная оставшемуся минимизируемому
времени убывает по
мере приближения к конечной точке, т.е.

При этом движение должно
осуществляться в направлении убывания функции S, т.е. в направлении,
противоположном ее градиенту внутрь изоповерхностей S = const. Из физических
соображений очевидно, что движение вдоль нормали - самое быстрое по времени,
так как движение вдоль изоповерхности не дает приближения к конечной точке.

С помощью функции Беллмана S можно
дать и другую трактовку процессу ее убывания, связав ее с функцией Ляпунова.
Действительно, если целевая функция положительно определена,

то, выразив уравнение (1.12) в виде

видим, что функция S есть функция
Ляпунова.

Значит, если функция S положительно определена,
то оптимальная система обладает еще одним замечательным свойством - она
асимптотически устойчива, что особенно важно для нелинейных систем.

Отличие динамического
программирования от других методов состоит в том, что если принцип максимума
есть необходимое условие оптимальности, то уравнения динамического
программирования при соблюдении всех требуемых допущений понимаются как
достаточное условие. Необходимо также подчеркнуть, что в принципе максимума
переменные мыслятся
как функции времени, а в динамическом программировании это функции от фазовых
координат, характеризующие чувствительность минимизируемого значения
функционала к изменению текущего состояния .

Формально это требует решения
нелинейных дифференциальных уравнений вида (1.9) или (1.10) в частных
производных, что так же сложно, как и решение краевых задач в принципе
максимума.

1.2 Аналитическое конструирование
регуляторов и применение для их синтеза динамического программирования

Поскольку динамическое программирование наиболее
близко к получению оптимального управления в замкнутой форме, нужно подробнее
остановиться на задаче синтеза систем автоматического управления,
удовлетворяющего при существующих ограничениях требуемому качеству. Одним из
направлений в этой области является разработанный у нас в стране А.М. Летовым
подход, названный аналитическим конструированием регуляторов, когда алгоритм
управляющего устройства замкнутой системы находится аналитически в соответствии
с определенным функционалом качества, соответствующим квадратическому критерию
вида

Минимизация функционала (1.16) соответствует
задаче о регуляторе состояния, когда важно удерживать около нуля все компоненты
вектора состояния. Возможны другие варианты удержания около нуля некоторой
ошибки, представляющей собой разность между желаемым и выходным сигналами в
задачах слежения, но смысловое содержание структуры критерия остается
неизменным. Первое слагаемое характеризует терминальную ошибку в конечный
момент, второе слагаемое преследует цель обеспечить малость ошибки при
удерживании системы в заданном положении. Последнее слагаемое представляет
«штраф за большие управления» и оценивает затрачиваемую на управление энергию.

Соответственно положительно полуопределенные
матрицы М, Р и положительно определенная матрица R выбираются с учетом
значимости указанных факторов, преимущественно с ненулевыми диагональными
элементами, либо, по желанию проектировщика, можно положить некоторые из матриц
нулевыми. При этом, как правило, рассматривается линейный нестационарный объект,
описываемый уравнениями

где на управление никаких
прямых ограничений не наложено. В связи с этим для аналитического решения можно
применять как вариационное исчисление, так и принцип максимума, но для
получения решения в замкнутой форме воспользуемся методом динамического
программирования. С учетом терминального члена функцией Беллмана S является
функция

С учетом (1.16) и (1.17) уравнение
Беллмана имеет вид

При отсутствии ограничений на оптимальное
управление вычислим производную от выражения в фигурных скобках и, приравняв ее
нулю, получим

Поскольку матрица Д положительно определена,
можно найти, во-первых, оптимальное управление

и, во-вторых, записать уравнение
Беллмана без операции минимизации:

Уравнение (3.20) можно решить при
условии .Можно
показать [31], что уравнение (3.20) имеет точное аналитическое решение, которое
представляет собой квадратичную форму

где К(t) - симметричная
нестационарная матрица с искомыми элементами.

Учитывая, что , уравнение
(1.22) можно преобразовать к виду

что соответствует равенству нулю
выражения в квадратных скобках, имеющего вид системы линейных неоднородных
дифференциальных уравнений с граничным условием :

Уравнение (1.23) называется матричным уравнением
Риккати, решение которого обычно находят численно на ЭВМ до начала работы
системы. Оптимальному управлению соответствует в общем случае линейный закон
управления с переменным коэффициентом передачи

И снова, возникает закономерный
вопрос: при каких условиях структура и параметры регулятора будут неизменны. В
работах Калмана доказывается, что при М= 0 и для стационарных объектов, т.е. при
постоянных матрицах А, В, К и Р, решение уравнения Риккати есть постоянная
матрица К, соответствующая уравнению

В этом случае оптимальная замкнутая
система является стационарной

и асимптотически устойчивой
вследствие установившегося поведения
при , несмотря
на то, что объект управления может быть неустойчив.

Проведенный анализ известных методов управления
позволяет сделать следующие выводы:

.       Среди существующих методов синтеза
регуляторов, учитывающих динамику объекта управления, наиболее подходящим
является динамическое программирование, поскольку структура регулятора
находится в пространстве вектора состояния объекта, что соответствует замкнутой
форме системы управления;

.       Метод АКОР обладает возможностью
аналитически определить закон линейного управления объектом в квадратурах, что
удобно, однако функцию штрафов в интегральном функционале нужно свести как минимум
к квадратичной форме, учитывая при необходимости степенные функции более
высокого порядка.

2. Синтез оптимального регулятора
при заданной постоянной функции штрафов без контроля безопасности движения

.1 Синтез оптимального линейного
регулятора для стабилизации бокового движения без встречи с препятствием

Постановка задачи в рассматриваемом случае может
быть формулирована следующим образом на примере управления речным транспортом:

.       Заданы дифференциального уравнения
движения транспорта, описываемого динамической системой второго порядка

где - координата бокового отклонения
судна от заданной траектории (фарватер), - координата боковой скорости судна.

.       Поступательное движение
транспорта происходит с заданной постоянной скоростью , в
результате чего меняется длина y пройденного пути.

.       Задан интегральный критерий
качества  (2.2) где (2.3)-
подынтегральное выражение функционала J, учитывающего постоянный штраф за
отклонение от фарватера, штраф за боковую скорость и штраф за
потраченную мощность при управлении;

- штраф за квадрат управления рулём
;

- штраф за отклонение от фарватера ;

- удаление от фарватера или боковой
путь ;

Требуется решить прямую задачу
динамического программирования. В прямой задаче нужно найти функцию управления

4.     Решение прямой задачи методом
динамического программирования может быть получена следующим образом

Функция Беллмана записывается таким образом:

.       Запишем уравнение Беллмана
и представим функцию Беллмана степенным полиномом:

6.     Оптимизируем функцию Беллмана по
параметру u , получаем таким образом:

Подставим (2.7) в
выражение (2.6) получим :

Подставим функцию (2.8) в
уравнение Беллмана (2.5) и представив правую часть уравнения Беллмана степенным
рядом:

.       Приравнивая сомножители при одинаковых
степенях, группируем их по степеням и получим систему дифференциальных
уравнений

8.     Заменим дифференциальные уравнения
алгебраическими при:

После преобразования всех уравнений,
если пренебрежем составным элементом в четвёртом уравнении системы
(2.11), окончательно найдём нижеследующее решение:

Подставим два коэффициента решения
(2.12) в выражение и получим :

Подставив полученную функцию в выражение
(2.1), получим:

Проведем моделирование на ЭВМ движения
судна на примере стабилизации бокового пути вблизи фарватера при условиях:

После подстановки всех вышеуказанных
параметров в выражение (2.13) и (2.14) получим: ,

Рис. 2.1 Процесс стабилизации бокового движения
судна при его возвращения слева на фарватер

Рис. 2.2 Процесс стабилизации бокового движения
судна при его возвращении справа на фарватер

2.2 Синтез оптимального линейного
регулятора при встрече с протяженным неподвижным препятствием

Постановка задачи в рассматриваемом случае может
быть формулирована следующим образом на примере управления речным транспортом:

.       Заданы уравнения движения транспорта

2.     Поступательное движение транспорта
происходит с заданной постоянной скоростью v1, в результате чего меняется длина
y пройденного пути.

3.     Задан интегральный критерий
качества (2.16) где (2.17)-
подынтегральное выражение функционала J, учитывающего теперь штраф r3 за
приближение к неподвижному препятствию;

- штраф за квадрат управления рулём
;

- штраф за отклонение от фарватера ;

- штраф за приближение к препятствию
;

- расстояние от фарватера до острова
;

- дистанция от управляемого объекта
до острова;

- удаление от фарватера или боковой
путь ;

Требуется решить прямую задачу
динамического программирования. В прямой задаче нужно найти функцию управления

4.     Решение прямой задачи методом
динамического программирования может быть получена следующим образом

Функция Беллмана записывается таким образом:

.       Запишем уравнение Беллмана
и представив функцию Беллмана степенным полиномом:

6.     Оптимизируем функцию Беллмана по
параметру u , получаем таким образом:

Подставим (2.21) в
выражение (2.20) получим :

Подставим функцию (2.22) в
уравнение Беллмана (2.19) и представив правую часть уравнения Беллмана
степенным рядом:

7.     Приравнивая сомножители при одинаковых
степенях, группируем их по степеням и получим систему дифференциальных
уравнений

.       Заменим дифференциальные
уравнения алгебраическими при:

После преобразования всех уравнений,
если пренебрежем составным элементом в четвёртом уравнении системы
(2.25), окончательно найдём нижеследующее решение:

Подставим два коэффициента решения
(2.26) в выражение и получим :

Подставив полученную функцию в выражение
(2.15), получим :

Проведем моделирование на ЭВМ
движения судна на примере стабилизации бокового пути вблизи фарватера при
условиях:

После подстановки всех вышеуказанных
параметров в выражение (2.27) и уравнения (2.28) получим (см. рис.2.3 и
рис.2.4)

Проведенные исследования позволяют сделать
следующие выводы:

.       Моделирование на ЭВМ показало, что при
постоянной функции штрафов боковое движение успешно стабилизируется
относительно заданного постоянного значения и удовлетворяет процессу в
отсутствии мешающего препятствия, либо в случае его значительной протяженности;

.       Если препятствие имеет ограниченные
размеры, то для возвращения на заданный путь синтезируемый регулятор должен
строиться с помощью переменной функции штрафов, учитывающей сближение с
препятствием.

Похожие работы на - Задачи управления безопасным движением при встрече с препятствием и выбор метода решения Дипломная (ВКР). Транспорт, грузоперевозки.
Критерии И Нормы Научного Познания Реферат
Реферат: Психоаналитическое исследование Э.Фромма в работе "Бегство от свободы". Скачать бесплатно и без регистрации
Реферат На Тему Профилактика Заболеваний
Реферат Население Великобритании
Собрание Сочинений Оскара Уайльда
Курсовая работа: Гражданский процесс. Иск и его предъявление. Скачать бесплатно и без регистрации
Реферат по теме Режим Деев в эйалете Западный Триполи (1603—1711)
Эссе Про Ивана Москвитина
Молодежный Экстремизм Реферат
Роль Моей Семьи В Вов Реферат
Лекция по теме 'Золотое правило' механики
Реферат: Налоговая система. Значение финансового контроля
Реферат: Экономическая сущность налогов. Определение налогов
Реферат по теме Десталинизация в СССР
Курсовая работа: Социальная работа с семьей
Эссе Что Мне Дало Образование
Ответы На Контрольную Работу По Английскому Языку
Контрольная работа по теме Либерализм, экономическая свобода и государство
Контрольная Работа 2 Никольский 6 Класс
Дипломная работа по теме Суд присяжных в России: прошлое и настоящее
Реферат: Совершенствование оценки травмобезопасности рабочих мест
Контрольная работа: Вовлечение несовершеннолетнего в совершение преступления. Заражение ВИЧ-инфекцией
Реферат: финансовая система России

Задачи управления безопасным движением при встрече с препятствием и выбор метода решения. Дипломная (ВКР). Транспорт, грузоперевозки.

Report Page