Машинное Обучение Курсовая Скачать

Машинное Обучение Курсовая Скачать



➡➡➡ ПОДРОБНЕЕ ЖМИТЕ ЗДЕСЬ!






























Машинное Обучение Курсовая Скачать

Главная
Коллекция "Otherreferats"
Педагогика
Машинное обучение

Понятие и содержание машинного обучения, его разновидности и основные задачи, алгоритмы и сферы практического применения, возможные проблемы и недостатки. Образовательные онлайн-платформы. Модель и принципы предсказания академического успеха студента.


посмотреть текст работы


скачать работу можно здесь


полная информация о работе


весь список подобных работ


Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
· Традиционный образовательный процесс подразумевает тысячи часов, проведенных в учебном заведении и за выполнением различных заданий дома в течение многих лет. Такое взаимодействие студентов с учебными материалами генерирует множество информации.
· В системах управления образованием (LMS - Learning Management System) и образовательных онлайн платформах собирается данные о взаимодействии студента с онлайн системой, о его прогрессе и результате выполнения заданий и упражнений, о вовлеченности в групповые проекты и обсуждения.
За годы работы университет накапливает данные о своих абитуриентах: их пол, возраст, баллы за ЕГЭ по различным предметам, выигранные олимпиады и внеучебные достижения. Позже собираются данные об этих же людях, но уже как о студентах: их посещаемость, оценки по различным предметам, успехи в научной деятельности, какие типы заданий давались лучше или хуже, какие преподаватели вели курс.
Правильный анализ такой информации может помочь составить более полную картину процесса обучения, выявить полезные и, возможно, неочевидные связи: как уровень первоначальной подготовки влияет на успеваемость по конкретному предмету, зависит ли успех в освоении дисциплины от пола, посещаемости или преподавателя, студенты каких преподавателей показывают лучшие результаты. Методы машинного обучения могут позволить предсказать исход какой-либо ситуации, основываясь на исторических данных. В отличие от традиционных мер измерения результатов учащихся, таких как оценки и накопленные баллы, которые помогают измерять только конечный результат студента, применение методов машинного обучения может помочь педагогам и исследователям получить ценную информацию о том, как улучшить и персонализировать обучение, составлять прогнозы и рекомендации, проводить изменения в режиме реального времени, когда это имеет смысл и необходимо.
1. Изучить основы машинного обучения
2. Провести обзор сфер применения машинного обучения
3. Исследовать существующий опыт использования машинного обучения в сфере образования
4. Разработать модель предсказания успешности прохождения студентом определённой дисциплины.
При обучении с учителем для каждого прецедента задана пара «ситуация, требуемое решение». Задача такого обучения состоит в поиске зависимости принятого решения от заданной ситуации и построении алгоритма, способного принять на вход описание ситуации, а на выходе предсказать для неё решение.
При обучении без учителя на входе подаются только описания объектов без принятого решения по этой ситуации, а задача состоит в поиске зависимостей между представленными объектами.
Частичное обучение является промежуточным звеном между обучением с учителем и без учителя, так как каждый прецедент задаётся парой «ситуация, требуемое решение», однако ответы известны лишь для части этих ситуаций.
При обучении с подкреплением не существует «правильных ответов» для каждой ситуации, алгоритм ищет оптимальную стратегию поведения, опираясь на реакцию внешней среды. [5]
Задача классификации является задачей обучения с учителем. Все вводимые данные разделяются на два и более классов, а задача обучающегося алгоритма состоит в том, чтобы определять новые вводимые данные в один из этих классов. [6]
Главным отличием задачи регрессии от задачи классификации является то, что при регрессии выходные данные являются непрерывными, а не дискретными. [7]
При прогнозировании оценок студента перед алгоритмом стоят именно эти задачи, так как на входе имеются данные о «ситуации», то есть наборе характеристик студента, и «решении», то есть оценке студента, при этом количество оценок может быть ограничено: например, разделение на два класса «зачёт» и «незачёт», 4 класса «отлично», «хорошо», «удовлетворительно» и «неудовлетворительно» или большее количество классов, а может быть и непрерывно для более глубокой детализации оценки.
Кластеризация является задачей обучения без учителя, целью которой является группировка объектов в кластеры на основании характеристик каждого объекта. [8]
Задача фильтрации выбросов заключается в поиске аномальных измерений, выделяющихся на фоне всей выборки. [9]
Рисунок 1 . Выбор алгоритма машинного обучения , Microsoft Azure
Далее будут рассмотрены некоторые классы самых популярных и используемых алгоритмов.
Линейная регрессия . Модели линейной классификации основаны на предположении о том, что данные можно разделить на классы прямой линией или её многомерным аналогом. В некоторых случаях модели линейной регрессии могут существенно снизить точность модели. [10] На рисунке 2 зелёным цветом показана настоящая граница двух классов, а оранжевая прямая - линейная граница классов. На изображении отчётливо видно, что в данном примере линейная модель оказалось не очень точной.
Рисунок 2 . Алгоритм линейной классификации , Microsoft Azure
Логистическая регрессия - это также инструмент классификации, в котором вместо прямой используется S-образная кривая. [11] Пример логистической регрессии представлен на рисунке 3.
Рисунок 3 . Логистическая регрессия , Microsoft Azure
Деревья решений - это базовый алгоритм машинного обучения, который подразделяет все признаки на области с одинаковой меткой. Дерево решений может быть представлено в виде структуры «листьев» и «веток», где на «листьях» записаны значения атрибутов, по которым различаются случаи, а на «ветках» дерева вариант решения для данного значения. Дерево решений позволяет показать процесс принятия алгоритмом решения в виде логической цепочки «если значение такое, то результат такой».[12] Пример дерева решений представлен на рисунке 4.
Рисунок 4 . Дерево принятия решений , Microsoft Azure
Методы опорных векторов позволяют найти границу, которая разделяет классы настолько широко, насколько это возможно. Такие границы могут как линейными, так и нелинейными. [13] Пример классификации данным методом продемонстрирован на рисунке 5.
Рисунок 5 . Метод опорных векторов , Microsoft Azure
Рисунок 6 . Цикл зрелости технологий Gartner 2016 год
На данный момент технологии машинного обучения уже широко применяются в таких сферах, как:
· Распознавание речи, жестов и образов
Сферой применения машинного обучения, с которой практически каждый современный человек сталкивается на ежедневной основе, является оптимизация поиска в интернете . Пользователь заходит в поисковик и задаёт свой вопрос, задача же поисковой системы заключается в том, чтобы произвести ранжирование миллионов подходящих вариантов и выдать вначале те, которые наиболее актуальны для каждого конкретного человека. [16] Алгоритм отслеживает действия пользователя: перешёл ли он по первой ссылке, как долго он задержался на этом сайте, перешёл ли к следующей странице поиска или ввёл новый запрос. Алгоритм может отслеживать не только действия одного конкретного человека, но и учитывать поведение пользователей со схожими запросами. Таким образом, поисковый алгоритм может улучшать качество своей работы. [17]
Классическим примером решения задачи классификации является обнаружение спама в электронных письмах. Для каждого входящего письма алгоритм должен определить, является ли оно спамом или нет, то если отнести объект к одному из двух классов. Для обучения алгоритм может использовать различные характеристики письма: кем и откуда было отправлено письмо, длину письма, наличие в нём каких-либо специфических слов. При этом алгоритм может переобучаться с помощью человека, который отмечает спамом письма, пропущенные алгоритмом, или наоборот достаёт письма по ошибке попавшие в спам. [18]
Распознавание речи уже давно широко используется в повседневной жизни: люди дают своим смартфонам различные голосовые команды, такие как создать напоминание, поставить будильник, написать сообщение или позвонить определённому человеку.
Одним из развивающихся трендов современного мира являются беспилотные автомобили - транспортные средства, оборудованные системой автоматического управления, которые могут передвигаться без помощи человека. Для того, чтобы автомобиль «видел», куда он едет, используются алгоритмы распознавания образов . [19]
Ещё один пример применения методов машинного обучения, с которым многие люди сталкиваются в повседневной жизни, это персонализированный маркетинг . Чем больше компания знает о своих клиентах, тем эффективнее она может нацеливать рекламу, обеспечивая лучший сервис клиентам и большие прибыли себе. Компании могут регулировать, какие рекламные письма, скидки и купоны должны быть показаны потенциальному клиенту, учитывая его предыдущее поведение в интернете. [20] На этих же принципах основываются и рекомендательные системы . Эти системы могут определить, в какой ценовой категории необходимы товары, какие характеристики товара важны, а какие нет, покупает ли человек данную вещь для себя или в подарок. Некоторые системы будут обучаться только на информации, собранной с одного пользователя, другие же могут учитывать предпочтения людей со схожим поведением. [21]
Банки начинают использовать методы машинного обучения для кредитного скоринга - оценки платежеспособности клиента банка. Опираясь на накопленный опыт, алгоритм может позволить банку оценить уровень кредитного риска заёмщика, выявить вероятность потенциального мошенничества, предсказать финансовое поведение (наличие или отсутствие отсрочек по платежам, заинтересованность в других услугах и продуктах банка), а также определить, какие действия более эффективно применять к каждому конкретному должнику. [22]
Задача выявления финансового мошенничества решается с помощью метода фильтрации выбросов. Практически невозможно предсказать, как в данных будет выглядеть финансовое мошенничество, потому что вариантов очень много, а выборка, на которой должен обучаться алгоритм мала. Для решения этой задачи следует изучать нормальную активность, на фоне которой будут выделяться транзакции со значительными отличиями. [23]
Технологии анализа больших данных уже успешно используется в некоторых областях страхования , например, на рынке страхования автомобилей. Страховые компании просят водителя установить в своей машине электронное устройство, которое собирает все данные и все параметры автомобиля. Это позволяет определить структуру вождения водителя, например, скорость его вождения, осуществляет ли он опасные маневры, как резко он трогается с места, время суток, в которое он чаще всего водит. [24] Используя эти данные, компании могут назначать цену на страховое покрытие адекватную риску этого водителя. Страховые компании уже по-разному используют подобные данные, некоторые вводят систему скидок, если данные «говорят», что в течение какого-то отрезка времени водитель «вел себя хорошо». Другие компании определяют, будут ли они осуществлять страховую выплату в зависимости от того, нарушал ли водитель в момент аварии правила дорожного движения, например, превышал ли скорость. Очевидно, что с помощью такого устройства, факт превышения скорости устанавливается очень легко. Находя различные поведенческие паттерны, страховые компании смогут определять, если люди имеющие определенные привычки поведения в интернете, выходящие в социальные сети в определенное время дня или выкладывающие определенные типы фотографий, имеют тенденцию к тому, чтобы жить меньше, чаще терять работу или иметь проблемы с законом. [25]
Очень быстро развивающейся сферой применения машинного обучения является сфера медицинской диагностики . Применение искусственного интеллекта может повысить скорость диагностирования заболевания, уменьшить количество ошибок при диагностировании, помочь назначить нужные анализы, тем самым оптимизировав расходы больницы. Применение машинного обучения также позволяет увеличить производительность диагностирования, так как компьютер может хранить и анализировать гораздо больше данных, чем любой врач в своей голове. Машинное обучение уже используется для диагностирования некоторых форм рака и различных редких заболеваний (болезнь Гоше, множественный склероз) и имеет высокий потенциал для использования в медицине. [26]
· женщины сильнее подвержены затратам, связанным с рождением ребенка или возникновения рака груди;
· ожидаемая продолжительность жизни мужчин меньше, чем у женщин;
· афроамериканцы сильнее ассоциированы с затратами, связанными с лечением серповидно клеточной анемии.
Этот список можно продолжать довольно долго. Эти группы населения действительно сильнее подвержены риску по данным показателям, однако по социальным и этическим соображениям, а также потому, что, например, в США Конституция защищает различные группы граждан от дискриминации по половому, расовому, религиозному и прочим признакам, страховые компании предпочитают игнорировать эти факторы риска. Даже если выявится корреляция по поводу определенной группы людей, которая не защищается по своему отличительному признаку конституцией, отнесение людей из этой группы к какой-либо классификации риска может расцениваться как дискриминация, особенно, если у людей нет власти над этой характеристикой. Так, например, женщины, подвергавшиеся домашнему насилию, должны тратить больше денег на восстановление психического и физического здоровья. Поэтому встает вопрос, этично ли назначать такой категории людей высокую цену на медицинское страхование, ведь очевидно, что у женщин нет власти над этой характеристикой. [25]
Машинное обучение является технологией, позволяющей строить алгоритмы, способные самостоятельно обучаться на основе предыдущего опыта. В данной главе были описаны виды машинного обучения, какие задачи оно позволяет решать и с помощью каких алгоритмов. Также были описаны сферы, в которых машинное обучения уже активно применяется, и были даны примеры возможных недостатков и проблем, связанных с использованием машинного обучения.
Такие крупные онлайн академии имеют очень широкий охват аудитории, который стремительно увеличивается с каждым годом. На данный момент Coursera является самой крупной онлайн системой образования и на ее долю приходится чуть менее 50% всех студентов МООК. На конец 2015 года общее количество студентов, подписавшихся по крайней мере на один онлайн курс, составило 35 миллионов человек, из них 17 миллионов являются пользователями Coursera. [28] Количество студентов, подписавшихся на одну сессию одного курса, исчисляется десятками, а иногда и сотнями тысяч. Например, одна сессия курса «Understanding IELTS: Techniques for English Language Tests» от академии FutureLearn собрала 370 000 студентов. [29]
Таким образом, платформы МООК обладают большими возможностями для глубоко анализа данных о своих студентах, так как:
Во-первых , на онлайн платформах каждый курс имеет не одну сессию и запускается в среднем один раз в месяц, а на каждую сессию подписываются десятки тысяч человек со всего мира. Традиционные образовательные учреждения же располагают данными нескольких сотен студентов для каждого курса, а периодичность таких курсов чаще всего составляет один год.
Во-вторых , весь процесс прохождения МООК происходит онлайн, что дает возможность собирать данные о полном пути прохождения курса студентом, начиная от выбора конкретного курса среди схожих по тематике до момента сдачи финального проекта и получения диплома или сертификата.
В-третьих , данные, получаемые системами онлайн образования, могут дать более полное представление о том, почему студенты не проходят какие-либо курсы, прекращают свое обучение. Учеба в традиционных учебных заведениях обычно не дает возможность пройти курс с нескольких попыток.
В-четвертых , МООК способны получать более полную информацию о студентах со всего мира, так как студентами являются люди разных возрастов, разных профессий, проживающие в разных странах. А выборка данных, получаемая университетами, чаще всего однородна, так как большинство студентов одного возраста, проживают в одном городе и находятся в схожих социальных кругах. [27]
Таблица 1 . Точность модели в зависимости от входных данных
Наивный байесовский классификатор - это один из самых простых из алгоритмов классификации, основанный на теореме Байеса для определения вероятности принадлежности наблюдения (элемента выборки) к одному из классов. Смысл теоремы на простом языке можно выразить следующим образом: теорема Байеса позволяет переставить местами причину и следствие. Зная с какой вероятностью причина приводит к некоему событию, с помощью теоремы можно рассчитать вероятность того, что именно эта причина привела к наблюдаемому событию. Наивный байесовский классификатор позволяет легко и быстро произвести многклассовую классификацию и хорошо обучается на сравнительно небольших выборках, что и можно было наблюдать в проведённом эксперименте.
Также в статье было отмечено, что самое сильное влияние на точность модели оказывали именно оценки за письменные задания, встречи с преподавателями и уровень компьютерной грамотности на момент старта курса. Демографические же показатели, такие как пол, возраст, семейное положение не добавляли существенную точность предсказательной модели.
· Систему сбора данных, собирающую информацию о знаниях студентов, уровне усвоения и понимания проходимых курсов.
· Систему выводов, обобщающую информацию, основываясь на полученных данных об особенностях студента, его реакциях на изменение траектории обучения
· Систему персонализации, которая на основе данных всей системы оценивает возможности студента, и с учётом этого корректирует цели и формирует оптимальную стратегию обучения каждого студента
Данные, используемые платформой для анализа собираются приложением внутри самого образовательного учреждения и передаются на сервер Knewton. Далее платформа анализирует полученные данные по сотням параметров (например, темп работы студента, его способность к обработке информации) и возвращает их в виде рекомендаций студенту или преподавателю, основанных на знаниях и потребностях учащихся. Система определяет пробелы в знаниях студентов и может порекомендовать конкретные действия для их устранения, например, обучающее видео, материалы для чтения или интерактивные упражнения. Технологии компании позволяют выполнять сложный анализ данных о показателях студентов в режиме реального времени, делать прогнозы относительно их успехов и неудач (например, скорость выполнения работы, вероятность достижения цели, вероятность выбытия из учебного процесса), определять сильные и слабые стороны каждого студента, вести личную статистику успеваемости студента на всех этапах обучения. [32]
Рисунок 7 . Цикл взаимодействия с образовательной системой , Romero , Ventura 2007
Студенты и преподаватели взаимодействуют с образовательными системами, тем самым накапливая данные об учебных планах и участии студентов в процессе обучения. После применения методов анализа данных, например, классификации или кластеризации, и студенты и преподаватели могут получить рекомендации по улучшению своей деятельности. [35]
В ходе исследования были собраны данные студентов первого курса факультета экономики университеты Тузлы. Данные собирались путём проведения опроса студентов после окончания первого курса и после удаления выбросов содержали информацию о 257 студентах. Данные содержали такую информацию как:
· Количество часов в неделю, уделяемых учёбе
· Материалы, которые используются для подготовки
· Использование интернета в образовательных целях
Полную информацию о всех собранных данных можно посмотреть в таблице 14 в приложениях.
В ходе эксперименты было построено три предсказательных модели, на основе таких алгоритмов, как наивный байесовский классификатор (NB - naпve Bayes), дерево решений (decision tree) и многослойный перцептрон (MLP - multilayer perception). В таблице 2 приведён сравнительный анализ выбранных подходов по трём заданным критериям.
Таблица 2 . Сравнительный анализ различных классификаторов
Время на построение модели (в секундах)
Количество верно классифицированных
Количество неверно классифицированных
Можно заметить, что наивный байесовский алгоритм и дерево решений практически не требуют время на анализ данных, при этом наибольшую точность показала модель, основанная на именно наивном байесовскм алгоритме, что продемонстрировано на диаграмме 1. Аналогичный результат был получен и С. Котсиантисом.
Однако авторы статьи также обращают внимание на то, что для построения системы принятия решений, основанной на использовании методов машинного обучения, алгоритм принятия решений должен быть максимально прозрачен и понятен пользователям системы. Среди рассмотренных алгоритмов самым понятным для неподготовленного человека является дерево решений, так как оно может быть преобразовано в набор правил «Если-то», а это самая простая форма представления модели, которую легко понять и интерпретировать. [34]
В данной главе было рассказано, как именно и какие данные образуются в сфере образования, а также приведены примеры того, как различные образовательные учреждения применяют машинное обучение для анализа этой информации.
· Фамилия, имя и отчество абитуриента
· Баллы за ЕГЭ по предметам Математика, Русский язык, Обществознание и Иностранный язык
· Был ли получен этот балл именно за ЕГЭ или по результатам выигранной олимпиады абитуриенту были присуждены 100 баллов за этот предмет.
После были взяты данные об успеваемости студентов в течение первого курса: рейтинги студентов за первый и второй семестр до пересдач. Были выбраны именно рейтинги до пересдач, так как они наиболее точно отражают уровень знаний студента на момент сдачи экзамена, и показывают больший разброс полученных оценок. В Высшей Школе Экономики принята десятибалльная система оценивания, для которой существует следующая шкала перевода количественной оценки в качественную, представленная в таблице 3:
Таблица 3 . Перевод оценки из 10 - б алльной шкалы в 5 - б алльную
Для каждого студента в рейтинге содержалась информация о его имени, месте в рейтинге, группе, оценке за экзамен или зачёт по каждому предмету данного семестра по десятибалльной шкале, средний балл, минимальный балл, а также наличие неудовлетворительных оценок.
Было решено анализировать данные для студентов образовательных программ «Экономика» и «Экономика и статистика» вместе, так как:
· на оба направления принимаются одинаковые вступительные экзамены (ЕГЭ по математике, русскому языку, иностранному языку и обществознанию)
· программы первого курса по основным предметам совпадают (совпадают учебные дисциплины, темы, которые должны быть освоены, часы, выделенные на лекционную, семинарскую и самостоятельную работу)
Все данные были взяты с сайта НИУ ВШЭ в момент, когда они были доступны.
· NumPy - базовая библиотека для научных вычислений в среде Python, позволяющая поддержку массивов, матриц и функций для работы с этими типами данных.
Особенности догматического, объяснительно-иллюстративного, проблемного, программированного, развивающего и модульного обучения, их достоинства, недостатки, приоритеты и эффективные сферы применения. Основные задачи учителя при применении метода обучения. реферат [18,2 K], добавлен 12.09.2011
Сущность и классификация технических средств обучения, их разновидности. Особенности применения технических средств обучения в современном мире. Преимущества и недостатки этой сферы образования. Новейшие разработки и технологии будущего в сфере обучения. реферат [33,2 K], добавлен 27.02.2017
Общие и конкретные формы организации процесса обучения, их содержание, сходные и отличительные признаки, оценка преимуществ и недостатков, условия практического применения на современном этапе. Методы психологического обучения в группе и их особенности. реферат [18,3 K], добавлен 05.03.2013
История развития и становления методов обучения. Понятие и сущность процесса обучения, его задачи. Особенности традиционного обучения. Основные представления об обучении в аспекте программированного подхода. Принципы воспитания и их характеристика. реферат [167,6 K], добавлен 13.01.2011
Классификация современных моделей обучения в ВУЗе. Сопоставительный анализ различных моделей обучения. Эффективность применения и тенденции развития американской модели обучения в вузе. Создание условий для становления личности студента как специалиста. курсовая работа [42,5 K], добавлен 01.02.2014
Дидактика как часть педагогики, разрабатывающая проблемы обучения и образования, ее основные категории, закономерности функционирования и назначение. Принципы обучения и существующие в данной сфере технологии, преимущества и недостатки их использования. презентация [186,8 K], добавлен 25.08.2013
Индивидуализация и автоматизация процесса обучения. Бихевиористская теория научения. Основные признаки, принципы, концептуальные основы, задачи и цели программированного обучения, его достоинства и недостатки. Применение алгоритма в дидактике. презентация [1,2 M], добавлен 23.06.2014
Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д. PPT, PPTX и PDF-файлы представлены только в архивах. Рекомендуем скачать работу .

© 2000 — 2020, ООО «Олбест»
Все права защищены


Машинное обучение
Министерство науки и высшего образования российской федерации...
Научно-исследовательская работа обучающегося " Машинное обучение ..."
СКАЧАТЬ [GeekBrains] Машинное обучение . Часть 1/5 (2020) БЕСПЛАТНО на...
Реферат. Машинное обучение - PDF Скачать Бесплатно
Сочинение На Картину Левитана Осенний День
Отчет По Практике Общепита
Эссе Преимущества И Недостатки
Большой Порт Спб Дипломный Отдел Pasp Ru
Сочинение Стих Про Маму

Report Page