Изучение пунктуации на примерах корпуса школьных текстов - Программирование, компьютеры и кибернетика дипломная работа

Изучение пунктуации на примерах корпуса школьных текстов - Программирование, компьютеры и кибернетика дипломная работа




































Главная

Программирование, компьютеры и кибернетика
Изучение пунктуации на примерах корпуса школьных текстов

Корпус текстов школьников в контексте корпусной лингвистики, его содержание и пополнение. Пунктуационная разметка текстов, классификация ошибок. Использование языка разметки TEI для кодировки пунктуации. Обработка корпуса с помощью программы Интерробанг.


посмотреть текст работы


скачать работу можно здесь


полная информация о работе


весь список подобных работ


Нужна помощь с учёбой? Наши эксперты готовы помочь!
Нажимая на кнопку, вы соглашаетесь с
политикой обработки персональных данных

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.


· interrobang.py: стартовый модуль программы, создает объект приложения QApplication, устанавливает язык программы в соотв. с системными настройками и создает главное окно программы;
· IebMainWindow.py: определяет главное окно программы, обрабатывает нажатие кнопок в главном окне и выбор пунктов меню. Является производным от класса QMainWindow;
· IebDocument.py: определяет документ, обрабатываемый программой. Документ отображается в главном окне программы элементом QTextEdit. IebDocument является производным от QTextDocument. Переопределяет обработчик события изменения документа contentsChange, в котором осуществляет выделение символов пунктуации. Реализует функции преобразования документа в формат TEI и загрузки из TEI;
· IebTextCharFormat.py: определяет представление символов пунктуации в документе. Является производным от класса QTextCharFormat;
· stats.py: вычисляет общую статистику по файлам Interrobang;
· find.py: ищет файлы, содержащие запрашиваемые значения атрибута subtype тега pc. Выдает абзацы с заданным значением.
titleStmt - основные свойства документа
authgrade - класс, в котором учится автор (нестандартный тег)
format - формат (печатный, рукописный) (нестандартный тег)
confidence - уровень доверия (нестандартный тег)
front - описание обложки документа TEI
type - атрибут divGen, указывающий тип текста, принимает значения: Essay, Dictation, Exposition, Another
pc - символ пунктуации (может быть также внутри sic или cor)
Subtype - атрибут pc, указывающий причину постановки/удаления знака препинания, принимает значения: "subject_predicate_dash", "blank_dash", "quotes", "author_mark", "allocution", "expletive", "specifier", "dangling_object", "similie", "dangling_adverbial", "dangling_attribute", "apposition", "clauses", "homogeneous_clauses", "homogeneous", "homogeneous_generalization.
В верхней части основного окна программы расположено главное меню:
· меню «Файл» с традиционным функционалом для большинства программ: «Импорт» - в нашем случае импортирует файл в формате .txt в обрабатываемый TEI-формат .ieb; «Открыть» - открывает уже имеющиеся в базе файлы в формате .ieb; «Сохранить»; «Сохранить как»; «Печать» - выводит на печать документ с основными атрибутами в заголовке, с проверенным текстом (с исправлениями и обозначениями причин правки), с результатами статистической обработки в конце; «Выход».
Рис. 1. Главное рабочее окно программы Интерробанг
· Меню «Сервис» с двумя пунктами: «Статистика» - выводит статистическую информацию об ошибках, отмеченных проверяющим в открытом файле, и «Дамп» - открывает окно с TEI-разметкой открытого файла.
· Меню «Справка» - выводит справку по графическим обозначениям причин постановки/удаления знака препинания.
Под меню расположена панель инструментов с кнопками основных операций:
При загрузке файла с помощью кнопок «Открыть» или «Импортировать» в основной части окна появится пригодный для правки текст с выделенными программой знаками препинания. Все эти знаки препинания будут обозначены синим цветом (например, ), а в TEI-формате им будут присвоены теги с соответствующими значениями.
Правка осуществляется с клавиатуры компьютера.
Каждому знаку препинания можно приписать при помощи специальных значков в поле «Разметка» (внизу справа) причину постановки или удаления знака (рис. 2).
Рис. 2 Поле «Разметка» с объяснительными значками
О соответствии объяснительных значков правилам и типам ошибок можно прочесть в конце Главы 3.
При исправлении фон знака препинания меняется с синего на красный. Если знак удаляется (это действие осуществляется с помощью стандартных средств компьютерной клавиатуры), знак препинания зачеркивается и ему присваивается соответствующий TEI-тег исправления. Если понятно, с каким правилом связана ошибка, выбирается соответствующий значок в поле «Разметка» основного окна (справа внизу), а знаку препинания в .ieb-файле присваивается коррелирующий с выбранным значком TEI-тег.
Если знак добавляется, он автоматически оформляется нижним подчеркиванием, а проверяющим из набора значков в поле «Разметка» выбирается один или несколько символов, объясняющих причину постановки знака. В этом случае знаку препинания будет присвоен тег пунктуационной правки с одним или несколькими значениями.
Если один знак исправляется на другой или другие, то неправильный знак зачеркивается, а для новых выбирается значок, указывающий на причину замены, а в TEI-разметке появляется соответствующие теги внесенных исправлений.
Справа в главном окне находится специальное поле для ввода атрибутов текста - «Свойства» (см. рис. 3): автор; класс; тип текста - сочинение, изложение, диктант, другое; название текста; формат - печатный/рукописный; степень доверия - высокая/низкая; проверяющий.
Рис. 3. Поле «Свойства» для ввода значений основных атрибутов текста
Значения свойств будут сохранены в метатегах TEI-размтеки.
Данные о тексте можно вводить в любой момент, даже при повторном открытии документа, так же как и осуществлять пунктуационную правку.
После внесения исправлений и данных о тексте документ сохраняется.
Если интересна статистика об ошибках без вывода на печать, нажимается кнопка «Статистика», которая вызывает появление окна, где последовательно сообщается, в каких знаках ошибся писавший текст и сколько на каждое правило было сделано ошибок (см. рис. 4).
Рис. 4. Окно с выводом статистической информации о пунктуации в тексте
Если интересует TEI - разметка текста, достаточно нажать выбрать в «Сервисе» пункт «Дамп», чтобы вызвать программное окно (Shell, Python) с результатом TEI-обработки (см. рис. 5 и 6).
-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

· обобщающее слово при однородных членах предложения,
· разделение частей сложного предложения,
· тире между подлежащим и сказуемым,
Появление искусственных систем, способных воспринимать и понимать человеческую речь. Автоматическая обработка естественного языка. Анализ, синтез текстов. Системы автоматического синтеза. Проблема понимания, оживление текстов. Модели коммуникации. реферат [19,0 K], добавлен 02.11.2008
Характеристика Русского Учебного Корпуса. Типы ошибок в русском учебном корпусе, совместная встречаемость тегов, алгоритм классификации. Проблема несбалансированности выборки. Результаты классификации, вклад признаков в различные классификаторы. курсовая работа [51,5 K], добавлен 30.06.2017
Изучение алгоритма рекурсивного спуска и системы построения грамматики с помощью лексического анализатора Lex. Написание программы интерпретатора языка разметки HTML. Проверка входной последовательности на корректность входа как общая функция программы. контрольная работа [226,7 K], добавлен 25.12.2012
Использование комплекта диакритических знаков и букв для набора текстов на европейских языках. Обозначение времени, знаков валют. Британские и американские особенности английского языка. Правила французской, испанской, итальянской и немецкой типографики. контрольная работа [216,2 K], добавлен 06.01.2015
Компьютерная программа как последовательность инструкций, предназначенная для исполнения устройством управления вычислительной машины. Анализ стандартов перевода текстов компьютерных игр. Рассмотрение особенностей ИТ-перевода, примеры грубейших ошибок. реферат [65,5 K], добавлен 29.01.2013
Морфологические анализаторы (морфологизаторы) на различных языках программирования. Анализ методов и технологий автоматической обработки ЕЯ-текстов. Разработка модуля графематического анализа и создания таблицы лексем. Программная реализация классов. дипломная работа [3,0 M], добавлен 06.03.2012
Инструменты анализа академического стиля английского языка. Проектирование архитектуры портала для анализа и оценки стиля научных публикаций на основе методов корпусной лингвистики. Моделирование жизненного цикла системы и взаимодействия её компонентов. дипломная работа [2,4 M], добавлен 27.08.2017
Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д. PPT, PPTX и PDF-файлы представлены только в архивах. Рекомендуем скачать работу .

© 2000 — 2021



Изучение пунктуации на примерах корпуса школьных текстов дипломная работа. Программирование, компьютеры и кибернетика.
Реферат: Основы методики самостоятельных занятий физическими упражнениями 2
Курсовой Проект По Менеджменту
Принципы Управления Недвижимостью Реферат
Реферат по теме Разновидности размножения растений
Курсовая работа: Словацкая республика в 1993 г. - начало ХХІ в.
Сочинение На Кабардинском Языке Про
Сочинение По Русскому Языку Про Церковь
Реферат по теме Старые боги под новыми именами
Лекция На Тему Отравляющие Вещества Общеядовитого Действия
Контрольные Работы Афанасьева 2 Класс Скачать
Реферат по теме Методы изучения рынка
Курсовая работа по теме Метрологічне забезпечення
Диссертация Сколько Времени
Курсовая работа по теме Варианты дивидендной политики, их характеристика
Отчет По Практике В Уралсиб Банке
Реферат: Зміна системи державних закупівель сільськогосподарської продукції в 1950-60 рр.
Цель Объект И Предмет Курсовой Работы
Сочинение На Английском Про Лунтика
Сочинение По Социологии Обществознание
Межпредметные связи в курсе школьного предмета химии на предмете углерода и его соединений
Коррекционно-развивающая программа для детей с псевдобульбарной дизартрией - Педагогика курсовая работа
История международных отношений США и КСА - Политология реферат
Особенности ипотечного договора по законодательству Российской Федерации - Государство и право дипломная работа


Report Page