Немного про DH в литературе и писательстве

Немного про DH в литературе и писательстве

Ilya Patricha

Слышали когда-нибудь про DH (Digital Humanities - цифровые гуманитарные науки)? Это сравнительно молодая наука, которая выходит за рамки компьютерной лингвистики, не только описывая и используя естественные языки при помощи компьютерных и математических методов, но и создавая новые технологии, работая как с текстами, так и с изображениями, 3D-моделями, реконструкциями в формате виртуальной реальности и так далее. Например, одна из новых технологий позволяет автоматически извлекать факты или отношения из текста.

Вот визуализация, представляющая результаты исследования стилометрии, которая показывает, насколько стилистически романы, драмы и нехудожественные произведения далеки друг от друга.

Каждая вершина графа — отдельное произведение, а каждое ребро показывает степень близости одного произведения другому (то есть чем тоньше ребро между двумя точками, тем меньше произведения похожи между собой стилистически). В качестве основного стилистического показателя была использована частотность слов, встречающихся в каждом произведении. В самом общем виде граф демонстрирует, насколько словарный состав одного произведения соответствует словарному составу остальных произведений. Цвет — от зеленого к красному — обозначает дату выхода рукописи.

Также вы наверняка слышали о технологии «анализа тональности», то есть определения эмоционального «фона» текста: насколько он положительный или отрицательный. Если упростить, то это способность компьютера определить, говорят сейчас о чем-то хорошем или о чем-то плохом.

Вот занятная диаграмма, описывающая сюжет трагедии "Ромео и Джульетта" в терминах эмоций, "тональности" текста:

Такие графики — один из способов построить модель произведения. В этой конкретной модели важна эмоциональная составляющая; учёные выяснили, что эмоция очень сильно коррелирует с движением сюжета. Эмоции, в свою очередь, очень сильно влияют на механизм восприятия: поэтому читатели, например, не всегда могут удовлетвориться краткими пересказами содержания произведений.

Вопрос в том, насколько правильно и эффективно опираться на такие вот исследования писателям. Скажем, я хочу написать успешный роман. В арсенале у меня 40 различных диаграмм и графов, раскрывающих важнейшие детали структуры и семантики шедевров литературы последних двух веков. Стану ли я новым Хемингуэем, Брэдбери или ещё кем-то жутко популярным? Вряд ли можно сказать однозначно, пока никто не проверил это на практике. Хотя недавняя попытка AI написать рассказ на основе уже знаменитых произведений не увенчалась особым успехом. Рассказ вышел сумбурный и бессмысленный. Хотя кто знает, может он опередил свое время.

Мне же, как начинающему писателю, такие анализы данных кажутся однозначно полезными. Наблюдать за тем, как что-то абстрактное становится визуально понятным и доступным - большое удовольствие. Кажется, ты можешь постичь всю гениальность автора в простом графике за пару минут. Но опять же, это только кажется. Все мы отлично понимаем, что технологии написания романа невозможно вписать в какой-то граф, что здесь имеет место быть спонтанности и непонятности ходов автора, учитывая, что общие правила безусловно существуют и действуют.

Лично я за то, чтобы наука DH развивалась в этом направлении, если это поможет нам, как читателям, наслаждаться бОльшим количеством талантливых, увлекательных произведений, а писателям эти шедевры создавать. А что вы думаете на этот счёт? Поделитесь своей точкой зрения в опросе ниже и со мной лично в @ipatricha и жмакайте палец вверх, если было интересно и вы "за" такой контент в будущем.


Материал взят из ресурса nplus1.ru

Report Page