Корпусная лингвистика как раздел прикладной лингвистики - Иностранные языки и языкознание дипломная работа

Корпусная лингвистика как раздел прикладной лингвистики - Иностранные языки и языкознание дипломная работа




































Главная

Иностранные языки и языкознание
Корпусная лингвистика как раздел прикладной лингвистики

Основные понятия корпусной лингвистики. Общая характеристика Национального корпуса русского языка. Изучение лексических категорий многозначности и омонимии, синонимии и антонимии. Использование данных Корпуса при изучении синтаксиса и морфологии.


посмотреть текст работы


скачать работу можно здесь


полная информация о работе


весь список подобных работ


Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

1. Корпусная лингвистика как раздел прикладной лингвистики
1.1 Понятие о корпусной лингвистике
1.3 Основные понятия корпусной лингвистики
1.4 Общая характеристика Национального корпуса русского языка
2. Использование НКРЯ в преподавании русского языка в школе
2.1 Использование данных Корпуса при изучении лексики
2.1.1 Изучение лексических категорий многозначности и омонимии
2.1.2 Изучение лексических категорий синонимии и антонимии
2.2 Использование НКРЯ при изучении морфологии
2.3 Использование данных Корпуса при изучении синтаксиса
Мы живем в эпоху повсеместного становления информационного общества. Процессы информатизации значительно меняют и облегчают нашу жизнь. Наиболее важным ресурсом в современном обществе становится информация. Сохранение, преумножение и рациональное использование этого ресурса стало иметь огромнейшее значение для общества.
Все больше информации используемой нами в повседневной жизни поступает в электронном формате, более того, традиционные печатные издания, произведения литературы, ставшие классикой, бесценные музейные манускрипты переводятся в информационный формат. Эта форма представления информации позволяет организовать работу и доступ к ней на совершенно ином качественном уровне.
Обеспечение публичного доступа пользователей к электронным информационным ресурсам стало одной из первоочередных задач информационного обслуживания науки, образования и культуры. Существующая сейчас система информационного обслуживания позволяет нам получить доступ практически к любой информации в неограниченном количестве. Огромную роль в этом играет система Интернет, которая с 1991 года успела превратиться в самобытную и практически неисчерпаемую информационную среду.
С появлением сети Интернет создалась принципиально новая ситуация в системе образования. Возможности сети для целей образования и развития личности поистине уникальны. Информационный потенциал Интернета просто неисчерпаем. Использование Интернет-ресурсов позволяет разнообразить учебный процесс, а также организовать его с учётом интересов учащихся, уровня их подготовки.
XXI век требует принципиально новых подходов к образованию. Обучение должно быть развивающим в плане развития самостоятельного критического и творческого мышления. Но для этого недостаточно наличия в системе образования только учителя и учебника (понимаемого в широком смысле, как система средств обучения), отражающих одну точку зрения, принятую в обществе. Необходимо широкое информационное поле деятельности, различные источники информации, различные взгляды, точки зрения на одну и ту же проблему, побуждающие ученика к самостоятельному мышлению, поиску собственной аргументированной позиции.
В Интернете в учебных целях используются самые разные по масштабам ресурсы - от веб-страничек с интересными учебными материалами до объёмных проектов. Одним из таких крупных проектов является Национальный корпус русского языка. Разработкой, созданием и использованием лингвистических корпусов занимается такой раздел языкознания, как корпусная лингвистика. Национальный корпус - это информационно-справочная система, основанная на собрании текстов в электронной форме. Им могут пользоваться все желающие, но в первую очередь он рассчитан на тех, кто занимается лингвистическими исследованиями, изучает или преподает русский язык. Хороший научный аппарат (обычно его называют разметкой, или аннотацией, корпуса) позволяет быстро и эффективно находить в текстах примеры интересующих пользователя слов, форм и конструкций.
Одна из основных функций корпуса в преподавании русского языка - служить источником примеров. Корпус может оказать неоценимую помощь преподавателям в поиске языкового материала для составления индивидуальных, контрольных и проверочных заданий по лексике, морфологии, синтаксису.
В.А. Плунгян утверждает: «Использование Корпуса в преподавании гуманитарных дисциплин в школе поможет успешно решать и чисто научные, и собственно педагогические задачи» [1, с. 12].
Изучением возможностей Национального корпуса русского языка занимаются такие исследователи, как Н.Р. Добрушина, А.И. Левинзон, С.А. Анохина, Г.И. Кустова и другие. Благодаря стараниям многих специалистов, был подготовлен сборник «Национальный корпус русского языка: 2006 - 2008. Новые результаты и перспективы». Специальный раздел сборника посвящен использованию Корпуса при обучении русскому языку и литературе. Большинство статей в этой области было подготовлено Н.Р. Добрушиной и А.И. Левинзон.
В статье «Информационные технологии в гуманитарном образовании: Национальный корпус русского языка» Н.Р. Добрушина и А.И. Левинзон рассматривают три основных направления по применению Корпуса:
2. Организация самостоятельной исследовательской работы студентов и школьников.
3. Верификация данных словарей и учебников.
Широкое распространение в учебном процессе получают также электронные библиотеки. Преимуществами электронной формы документа по сравнению с печатной является надежность и компактность хранения информации, возможность оперативного ее распространения и широкого использования.
Электронная библиотека способствует выполнению следующих основных функций:
1. Информационная, направленная на удовлетворение потребности в информации различных категорий пользователей по всем отраслям знаний либо одной из предметных областей.
2. Просветительная, реализуемая, в том числе за счет популяризации электронных документов, относящихся к истории и культуре.
3. Научно-исследовательская, ориентированная на содействие глубокому изучения темы (предмета) научными работниками и специалистами.
4. Образовательная, в рамках которой осуществляется поддержка, как основного, так и дополнительного образования путем предоставления не только мультимедийного учебного материала, но и необходимой литературы.
5. Справочная, позволяющая получать достоверные сведения, отраженные в документах определенного вида.
Таким образом, преподаватель, используя систему Интернет, может:
а) актуализировать материал собственных учебников;
б) найти дополнительную информацию;
в) разработать обучающие материалы;
В данной работе рассматривается широкое использование системы Интернет в преподавании русского языка. Актуальность данной темы обусловлена стремительным развитием информационных технологий и необходимостью их внедрения в сферу образования.
Целью данного дипломного проекта является выявление возможностей использования системы Интернет в преподавании русского языка в школе.
а) рассмотреть основные понятия корпусной лингвистики и принципы создания лингвистических корпусов;
б) описать, каким образом можно использовать материалы Национального корпуса русского языка при изучении лексики, морфологии, синтаксиса;
в) дать краткую характеристику крупнейших электронных библиотек.
1. Корпусная лингвистика как раздел прикладной лингвистики
1.1 Понятие о корпусной лингвистике
Корпусная лингвистика - это раздел прикладной лингвистики, занимающийся разработкой общих принципов построения и использованием лингвистических корпусов (корпусов текстов).
Одним из основных источников языкового материала, необходимого для проведения лингвистических и филологических исследований, является текст, письменный или устный. На основе анализа множества текстов можно сделать вывод об интересующем исследователя языковом явлении, например, о поведении грамматической конструкции, использовании выразительных средств в языке и т.п. Развитие вычислительной техники способствовало тому, что большое количество текстов стало доступно в электронном виде. Для того чтобы можно было работать с такими объемами текстов, извлекая из них нужную информацию, во всем мире стали создаваться лингвистические корпусы, т.е. коллекции текстов, специально отобранных, размеченных по различным лингвистическим параметрам и обеспеченных системой поиска. Увеличение объема материала исследования потребовало применения новых методов анализа лингвистических данных, включая их статистическую обработку.
Таким образом, корпусная лингвистика включает два аспекта: во-первых, создание и разметка (аннотирование) корпусов текстов и разработка средств поиска по ним и, во-вторых, собственно лингвистический аспект - экспериментальные исследования на базе корпусов.
Возможность пользоваться обширными электронными ресурсами значительно облегчила процесс сбора материала в лингвистических исследованиях. Однако такая доступность языковых данных радикально изменила требования к доказательной базе лингвистических исследований: в наше время недостаточно привести несколько примеров в подтверждение выдвигаемой концепции, необходимо представить достаточно полную выборку данных того или иного языка. Однако работать с мегабайтами «сырых» текстов не менее трудно, чем искать примеры вручную.
Необходимость и возможность обработки большого массива текстов для извлечения из них лингвистических, литературоведческих и других данных обусловили бурный рост электронных ресурсов, включая лингвистически аннотированные корпуса текстов.
Использование корпусов текстов дает возможность наблюдать поведение интересующих исследователя языковых единиц (слов, словосочетаний, грамматических категорий, синтаксических конструкций и т.д.) в естественной языковой среде, т.е. в реально существующих, а не искусственно сконструированных контекстах.
Кроме того, корпусные исследования позволяют, используя статистические методы, сформулировать, подтвердить или опровергнуть некоторую гипотезу о том или ином языковом явлении на большом объеме материала.
При этом если исследователь пользуется уже существующим корпусом, он полностью минует долгий и трудоемкий этап сбора материала (опрос информантов, работа со словарными картотеками или письменными текстами и т.д.).
Для некоторых целей оказывается достаточным использование в качестве корпуса уже существующих электронных коллекций текстов, таких как виртуальные библиотеки, архивы электронных версий периодических изданий или новостных лент. Гигантским собранием текстов является весь Интернет. Существует даже такое направление исследований - Интернет как корпус. Однако поскольку тексты в сети не систематизированы и не имеют лингвистической аннотации (разметка корпуса) - что относится и к прочим виртуальным коллекциям текстов, - дать точную статистическую оценку всего множества или некоторого подмножества текстов затруднительно, поэтому и возникает потребность в структурированных и аннотированных лингвистических корпусах.
Одним из приоритетных направлений корпусной лингвистики является создание и расширение универсальных национальных корпусов (корпусов того или иного естественного языка), представительных по отношению ко всему языку, которые могут служить для исследования самых разнообразных явлений этого языка [2, с. 53]. Большинство языков мира уже имеют свои национальные корпуса. Общепризнанным образцом является, в частности, Британский национальный корпус (BNC). Среди корпусов славянских языков выделяется Чешский национальный корпус, созданный в Карловом университете Праги. Национальные корпуса существуют также для немецкого, китайского, финского и других языков. Для русского языка таким представительным корпусом является Национальный корпус русского языка (НКРЯ).
По мере создания все большего количества корпусов и развития различных технологий обработки текстовой информации вырабатывались некоторые универсальные принципы и языки разметки лингвистической информации в корпусе, создавались специальные инструменты для работы с корпусом на любом языке так называемые корпусные менеджеры. Выработка универсальных стандартов и технологий сделало возможным создавать большие представительные корпуса за очень короткий срок.
Таким образом, предметом корпусной лингвистики являются «теоретические основы и практические механизмы создания и использования представительных массивов языковых данных, предназначенных для лингвистических исследований в интересах широкого круга пользователей» [3, с. 5].
Можно сказать, что первые корпуса и корпусные методы появились задолго до возникновения корпусной лингвистики как научного направления. По сути, любое лингвистическое исследование, основанное на сопоставлении и анализе контекстов, является корпусным.
Еще в конце XIX - начале XX в. в целях усовершенствования средств связи, а также в целях быстрого обучения языку создавались частотные словари. Частотность слов оценивалась по специальным выборкам текстов.
Первые корпуса в строгом смысле этого слова появились в 60-х гг. ХХ в. Прообразом для них послужили словарные картотеки - собрания фрагментов текстов, обычно в виде карточек, содержащих то или иное слово, и систематизированные относительно описываемого слова (в основном, по алфавиту).
В 1963 г. в Брауновском университете (США) для создания частотного словаря американского варианта английского языка был создан большой корпус на цифровом носителе (Brown Corpus), включающий 1 млн. слов. При оценке частоты некоторого слова в языке возникает проблема "сбалансированности" выборки. В языке частотность многих слов обусловлена тематикой текстов. Так, например, слово «переменная» будет чрезвычайно частотно в математических текстах. Вероятность же встретить данное слово в художественной литературе очень мала. Для обеспечения корректности данных относительно частоты употребления слов создатели корпуса (У. Френсис и Г. Кучера) разработали строгую процедуру отбора текстов: в корпус вошли 500 фрагментов прозаических текстов, относящихся к 15 наиболее массовым жанрам и напечатанных в 1961г.
Возникновение корпусных методов связано с бурным развитием компьютерных технологий во второй половине ХХ в. Возможность сканирования и распознавания текста (перевод в текстовый формат), появление баз данных и систем управления базами данных сделали возможным сбор, хранение и обработку огромных массивов текстовых данных. Не последнюю роль в развитии корпусной лингвистики сыграла популяризация мировой сети Интернет, т.к. корпуса стали доступны широкому кругу пользователей, значительно расширились возможности их наполнения.
С тех пор накоплен значительный опыт разработки и применения корпусов. Ежегодно публикуется множество работ по данной тематике.
В России разработкой и исследованием корпусов занимаются специалисты Центра лингвистической документации при Независимом Московском университете, отдела экспериментальной лексикографии Института русского языка им. В. В. Виноградова РАН, Института языкознания РАН, Института проблем передачи информации РАН, Института лингвистических исследований РАН в Санкт-Петербурге и др.
Теоретические и практические проблемы корпусной лингвистики обсуждаются на специализированных семинарах и в рамках научных конференций по прикладной и компьютерной лингвистике: ежегодная международная конференция по компьютерной лингвистике «Диалог», конференция «Мегалинг», конференция «Корпусная лингвистика» при кафедре математической лингвистики СПбГУ.
Важной вехой в развитии отечественной корпусной лингвистики явилось создание Национального корпуса русского языка. Работы по созданию Корпуса были начаты в 2001 году группой лингвистов из Москвы, Петербурга, Воронежа и других городов. В рамках развития проекта ведется работа по созданию новых ресурсов на базе корпуса.
1.3 Основные понятия корпусной лингвистики
корпусный лингвистика синонимия морфология
Центральное понятие корпусной лингвистики - лингвистический корпус. Тексты в корпус выбираются не случайным образом, а в соответствии с проблемной областью, т.е. областью реализаций интересующих исследователя языковых явлений. Проблемная область имеет два аспекта: языковой и речевой. Языковой аспект - это само изучаемое явление, а речевой - это множество контекстов, в которых это явление представлено. Проблемная область может быть как очень широкой (все произведения Достоевского Ф.М.), так и достаточно узкой (случаи согласования сказуемого с количественной группой по числу).
Одним из принципиальных вопросов является вопрос о том, какие тексты и в каком объеме необходимо отобрать в корпус. С одной стороны, хотелось бы, чтобы исследуемое явление, как бы оно ни было редко в языке, нашло отражение в корпусе. Одним из требований, предъявляемым к составу и структуре корпуса является требование полноты.
Данное требование входит в противоречие с другим важным принципом создания корпуса - требованием репрезентативности. Задача создателей корпуса - собрать как можно большее количество текстов, относящихся к тому подмножеству языка, для изучения которого корпус создается. Каким бы специфичным ни был феномен, ни один корпус не может содержать все его реализации. Поэтому корпус - это всегда определенная выборка из проблемной области, которая осуществляется на основе некоторых критериев, устанавливаемых исследователем в зависимости от задачи. Такая выборка должна отражать те или иные параметры исследуемого языкового явления в той же пропорции, что и в языке вообще или в некотором исследуемом подмножестве языка.
С точки зрения отбора текстов в корпус различают сбалансированные корпусы и мониторные корпуса. В сбалансированных корпусах в корпус включаются тексты, представляющие разные модусы дискурса (включая как письменные, так и устные тексты), разнообразные по жанрам, стилям и тематике. При разработке корпуса устанавливаются пропорции, в которых должны быть представлены тексты разных жанров, стилей и т.п. Такие корпусы имеют фиксированный объем. Пополнение таких корпусов происходит только после тщательной процедуры отбора новых текстов. Мониторные корпусы постоянно пополняются новыми текстами на данном языке, при этом баланс текстов разных модусов, стилей и жанров не соблюдается. Создатели мониторных корпусов считают, что "статистическая" обоснованность данных, полученных из корпуса, будет достигнута за счёт объема корпуса, исчисляемого в миллиардах слов.
Важным параметром корпуса является его объем. Если первые корпусы достигали миллиона слов (точнее, словоупотреблений или текстоформ), то объем современных корпусов исчисляется сотнями миллионов (например, объем Национального корпуса русского языка на данный момент составляет около 360 млн. словоупотреблений) или миллиардами (например, объем корпуса английского языка Bank of English превышает 2,5 миллиарда слов).
Как уже отмечалось, для решения различных лингвистических задач необходимо, чтобы тексты и отдельные языковые единицы внутри текстов содержали дополнительную лингвистическую и металингвистическую информацию - разметку (аннотацию). Аннотированный корпус приобретает такие преимущества, как простота использования и многофункциональность [4, с. 63]. В современных корпусах помимо метаразметки (отражающей различную экстралингвистическую информацию о тексте, включая его название, автора, жанровую принадлежность и т.п.), содержится разметка, соответствующая различным уровням лингвистического описания, - морфологическая, синтаксическая, фонетическая и др.
Взаимодействия пользователя с корпусом: поиск в корпусе в соответствии с запросом пользователя обеспечивается с помощью специальных программ - корпусных менеджеров. Они обеспечивают сортировку результатов поиска, статистические подсчеты, составление конкордансов и словников (списков слов, систематизированных некоторым образом) на основе корпуса.
Большинство современных корпусных менеджеров позволяют осуществлять поиск различного рода информации: поиск конкретных словоформ; поиск словоформ по лемме (поиск всех форм одной и той же лексемы, встретившихся в тексте); поиск неразрывных и разрывных словосочетаний. При наличии соответствующей разметки осуществляется поиск по набору морфологических признаков (например, поиск всех словосочетаний вида «предлог по + существительное в предложном падеже») и другой информации, соответствующей уровням лингвистической разметки, представленных в корпусе. Благодаря наличию метаразметки пользователь имеет возможность создавать свой подкорпус текстов, отобранных по жанру, тематике, времени написания и т.п. Результат выдачи представляет собой конкорданс (множество контекстов, в котором встретилось запрашиваемое языковое выражение). Каждый из примеров снабжается информацией об источнике, откуда взят пример. В ряде корпусов возможно также получить статистическую информацию о запрашиваемом языковом выражении: его относительную частоту по всему корпусу, распределение по жанрам или временным срезам, информацию о частоте его сочетаемости.
Корпусы, как правило, предназначены для многократного использования многими пользователями. Для унификации работы с разными корпусами, для обеспечения "независимости" корпусных данных от конкретной программной реализации интерфейса работы с корпусом разрабатываются стандарты разметки текстовых корпусов. В настоящее время выработались стандарты представления метаданных, базирующиеся на описании текстов в рамках проекта Text Encoding Initiative (TEI) и на рекомендациях EAGLES (Expert Advisory Group on Language Engineering Standards).
1.4 Общая характеристика Национального корпуса русского языка
Корпус - это информационно-справочная система, основанная на собрании текстов на некотором языке в электронной форме. Национальный корпус представляет данный язык на определенном этапе (или этапах) его существования и во всём многообразии жанров, стилей, территориальных и социальных вариантов.
Национальный корпус создается специалистами по корпусной лингвистике для научных исследований и обучения языку. Большинство крупных языков мира уже имеет свои национальные корпуса (различающиеся по полноте и уровню научной обработки текстов). Общепризнанным образцом является, в частности, Британский национальный корпус: на него ориентированы многие другие современные корпуса. Среди корпусов славянских языков выделяется также Чешский национальный корпус, созданный в Карловом университете Праги.
Национальный корпус русского языка размещен в сети Интернет с 2004 года на сайте www.ruscorpora.ru. Им могут пользоваться все желающие, но прежде всего он рассчитан на тех, кто занимается лингвистическими исследованиями, изучает или преподает русский язык. Корпус постоянно пополняется и развивается, предоставляя пользователям новые возможности.
Национальный корпус русского языка представляет русский язык в наиболее полном виде: во всем многообразии жанров, стилей, территориальных и социальных вариантов и содержит все типы письменных и устных текстов, представленных в русском языке. В Корпусе собраны художественные тексты разных жанров от Фонвизина до Улицкой, поэзия с конца XVIII века, публицистика XX-XXI веков (особенно широко представлена публицистика последних 40 лет), научная литература всех направлений (точные, естественные, гуманитарные науки), официально-деловые тексты: заявления, служебные записки, инструкции, тексты бытовых жанров: мемуары, дневниковые записи, личная переписка, фрагменты интернет-чатов, записи устной разговорной речи, а также записи устной речи из фильмов, диалектные тексты и др.
«Отличительной чертой Корпуса является наличие разных типов разметок. Разметка - главная характеристика корпуса; она отличает корпус от простых коллекций (или «библиотек») текстов» [5, с. 49].
Первый вид разметки - «метаразметка» [6, с. 98]. Для каждого текста указаны автор, пол и возраст автора, время создания текста, общая характеристика: художественный текст (с дальнейшими характеристиками - «историко-приключенческая литература», «сатира», «фантастика» и т.п.) или нехудожественный (с указанием сферы деятельности - бытовая, официально-деловая, производственно-технологическая публицистическая, учебно-научная, церковно-богословская), жанр текста, общая тематика (домашнее хозяйство, война, экономика, политика, право, наука, искусство и т.п.), хронотоп текста (место и время описываемых событий).
Второй вид разметки - «морфологическая» [7, с. 189]. Она приписывает каждому слову грамматические признаки: часть речи, набор грамматических значений (для изменяемых слов). У пользователя есть выбор между подкорпусом со снятой грамматической омонимией и с неснятой грамматической омонимией. Под грамматической омонимией в Корпусе понимается наличие у слова совпадающих форм с разными грамматическими значениями (например, короны - род. п. ед. ч. и мн. ч.). Программа морфологической разметки автоматически приписывает словоформе все возможные значения, тем самым у омонимичных форм оказывается несколько значений. В результате этого возможен довольно большой процент «шума», т.е. тех форм или конструкций, которые не удовлетворяют условиям запроса. Если пользователь хочет найти грамматические формы или грамматические конструкции и для него важны точные морфологические характеристики, ему удобнее пользоваться подкорпусом со снятой омонимией. Если же запросы имеют лексический характер, то лучше вообще не задавать корпус.
Третий вид разметки - «семантическая» [8, с. 224]. Семантические признаки - это те семантические классы, к которым относятся слова разных частей речи. Например, у глаголов выделяются классы «движение», «физическое воздействие», «существование», «восприятие», «речь» и др., у прилагательных - классы «качества человека», «место», «время», «размер», «цвет» и другие. Семантические признаки нужны прежде всего для лингвистических исследований, но, разумеется, могут применяться и в практике преподавания.
Наличие трех параметров поиска и нескольких строк позволяет формулировать сложные запросы и искать примеры не только на отдельные слова и грамматические формы, но и на целые конструкции с заданными грамматическими и семантическими признаками.
Национальный корпус русского языка в настоящее время включает следующие подкорпуса:
- основной корпус, в который входят прозаические (включая драматургию) письменные тексты XVIII - начала XXI века;
- синтаксический (глубоко аннотированный) корпус, в котором для каждого предложения построена полная морфологическая и синтаксическая структура (дерево зависимостей);
- газетный корпус (корпус современных СМИ), в котором представлены статьи из средств массовой информации 1990-2000-х годов;
- параллельные корпуса, в которых можно найти все переводы для определенного слова или словосочетания на русский язык или с русского языка. В настоящее время для поиска доступны англо-русский, русско-английский, немецко-русский, украинско-русский и русско-украинский параллельные корпуса;
- корпус диалектных текстов, включающий запись диалектной речи различных регионов России с сохранением их грамматической специфики; предусмотрен специальный поиск с учётом диалектной морфологии;
- корпус поэтических текстов, в котором возможен поиск не только по лексическим и грамматическим, но и по специфическим для стиха признакам (поиск определённого сочетания в сонетах, в эпиграммах, в стихотворениях, написанных амфибрахием, с определённым типом рифмовки и т. п.).
- обучающий корпус русского языка, в который включены, в основном, произведения из школьной программы (или их фрагменты, если речь идет о романах Гончарова, Достоевского, Толстого), поэтому его объем существенно меньше, чем у большого Корпуса. Здесь нет семантической разметки, зато, по сравнению с основным Корпусом, увеличено количество признаков в грамматической разметке добавлены:
· лексико-грамматические разряды существительных (конкретные, отвлеченные, вещественные, собирательные);
- разряды местоимений (личные, возвратные, отрицательные и т.д.);
- корпус устной речи, включающий расшифровки магнитофонных записей публичной и частной устной речи, а также транскрипты кинофильмов. Устный корпус удобно использовать при преподавании:
- лингвистических дисциплин, таких как «Современный русский язык. Лексикология», тема: «Лексический состав русского языка: лексика с точки зрения функционально-стилистического расслоения», «Современный русский язык. Орфоэпия», «Основы стилистики»;
- дисциплин, связанных с проблемами языковой нормы, в частности, «Русский язык и культура речи», «Синтаксис и стилистика». Корпус живой устной речи содержит следующие подразделы:
- устная публичная речь (можно выбрать речевые жанры, например, беседа, дискуссия, лекция, интервью, репортаж и др.);
- устная непубличная речь (можно выбрать жанры: беседа, микродиалог, пересказ, разговор, рассказ, спор);
- речь кино (можно выбрать киножанры).
- акцентологический корпус (корпус истории русского ударения) - тексты, несущие информацию об истории русского ударения (все тексты поэтического корпуса и акцентуированные записи устной речи, в том числе кинофильмов). Эти тексты доступны для поиска по месту ударения и просодической структуре слова;
- мультимедийный корпус, куда входят снабжённые видео- и аудио рядом фрагменты кинофильмов 1930-2000-х годов. Возможен поиск не только по произносимому тексту, но и по жестам (кивание головой, похлопывание по плечу и т. п.) и типу речевого действия (согласие, ирония и т. п.)
В преподавании Корпус оказывается наиболее необходимым для следующих видов работы:
· составление учебных материалов для занятий;
· составление упражнений, тестов и контрольных;
· организация самостоятельной учебной работы студентов и школьников;
Определенные виды поиска удобны для определенных направлений научной и педагогической работы:
1. Поиск слова или словосочетания в фиксированной форме, или во всех возможных формах, или в нескольких нужных формах. Это самый простой и самый необходимый вид поиска: он подходит для решения очень многих задач, в частности, может быть использован при создании собственных текстов, для проверки своей интуиции относительно употребления того или иного слова или словосочетания.
2. Поиск слова, включающий определенный сегмент (морфему или части основы). Этот вид поиска удобен при работе в области словообразования, а также при составлении орфографических упражнений на написание приставок и суффиксов.
3. Поиск всех слов с определенной грамматической характеристикой. Этот вид поиска удобен при работе в области формообразования и морфологии, а также при составлении орфографических упражнений на написание формообразующих морфем.
4. Поиск слова с определенной семантической характеристикой. Этот вид поиска удобен при работе, связанной с классификацией слов по значениям, например в области семантики и лексикологии, в частности при работе над описанием семантического поля, а также при составлении упражнени
Корпусная лингвистика как раздел прикладной лингвистики дипломная работа. Иностранные языки и языкознание.
Практическая Работа Типы Данных
Сочинение Описание Кабинета Химии 6 Класс
Почему Важно Быть Толерантным Итоговое Сочинение Примеры
Концовка Сочинения Про Лето
Аксенову Прибыв На Место Сочинение Егэ
4 Разговор С Собой Итоговое Сочинение
Мини Эссе Роль Морали В Жизни Общества
Курсовая Работа Мерчандайзинг В Аптеке 36.6
Урок Сочинение По Творчеству Пушкина 7 Класс
Ремонт Цифровой Техники Реферат
Шэньси Землетрясение Реферат
Реферат: Свобода совісті в процесі демократизації українського суспільства: соціально-філософський аналіз
Дипломная работа по теме Анализ системы управления затратами на предприятии СПК 'Красноармейское'
Комплекс Упражнений Для Разминки Реферат По Физкультуре
Дипломная работа: Проектируемое депо РЖД
Диагностическая Контрольная Работа По Химии
Доклад: Психологические типы людей
Сочинение: Становление личности в эпохе образ Петра Первого по роману Петр Первый
Реферат: Методические рекомендации по внедрению в практику санкт-петербург
Биг Эссе Порно
Договор перевозки грузов автомобильным транспортом - Государство и право дипломная работа
Инвестиционные споры - Государство и право презентация
Профессиональное правосознание юриста - Государство и право реферат


Report Page