Как возникают языки и почему именно так?

Как возникают языки и почему именно так?

@tany_savelieva

Emergence of linguistic communication from referential games with symbolic and pixel input

https://openreview.net/pdf?id=HJGv1Z-AW

Когда - 24 февраля 2018 года

В чем понт

Почему современные языки такие странные и о чем думали наши предки? Кому вообще могло придти в голову называть белый порошок и страдание одним набором символов ‘мука’? Что оптимально, а что нет в создании языка? Эти вопросы мы часто задаем себе. И теперь у нас есть уникальная возможность получить на них ответы, запустив эксперимент в пробирке, используя машинное обучение. Например, давайте придумаем говорящего и слушающего агента, дадим им среду, заставим коммуницировать между собой и посмотрим, какой язык они придумают. Постановка задачи выглядит так - есть первый агент (говорящий), ему показывают какой-то объект (например картинку), он может из определенного набора символов выбрать такую комбинацию, чтобы второй агент(слушающий), получив эту комбинацию на вход, понял, к какому именно изображению подходит это описание (Картинка 0). В статье авторы исследуют то, какими особенностями обладают языки, которые придумывают алгоритмы, чтобы общаться по разным задачам - например, обьяснить понятие, состоящее из бинарных признаков или картинку.

Картинка 0. Постановка задачи создания языка


Подробнее

Модель

Модель можно разделить на две части - модель для говорящего и слушающего агента, так как параметры у этих агентов разделены. Говорящий агент берет на вход объект, например картинку (назовем его таргетом), пропускает через энкодер и из полученного скрытого представления генерит сообщение агенту-слушателю. Важно, что когда говорящий генерит свое сообщение, он последовательно выбирает наиболее подходящие символы из фиксированного заранее набора, используя политику. Изначально никакие символы никакого смысла не несут - в процессе обучения мы формируем их сами. Слушающий агент состоит из энкодера с независимыми от говорящего параметрами, который обрабатывает входящие картинки и сообщение от говорящего агента и предсказывает, какая из 5 картинок, поданная ему на вход является таргетом.

Эксперимент с концептами

Сначала рассмотрим решение более простого варианта задачи . Вместо картинок возьмем набор из 500 понятий (например, кошка, машина) и зададим их с помощью вектора признаков (живое ли это, если ли колеса у этого и тд). Говорящему дают на вход этот понятие и просят описать его вектором из заранее заданного набора символов. Задача слушающего - из 5 таких же понятий по описанию говорящего выбрать то понятие, которое описывал говорящий. В задаче авторов интересовали следующие вопросы:

Размер имеет значение?

Авторы разрешали говорящему составлять свое сообщение из 2, 5 или 10 символов, размер алфавита, из которого можно было выбирать - это 100 возможных значения символа. При этом размер эффективного алфавита был заметно меньше возможного, что ограничивало лексикон и вызывало возникновение полисемии - когда у одного и того же сообщения может быть много смыслов. Авторы говорят, что так получается из-за того, что задача оптимизации достаточно сложная и локальные минимумы задевают сообщения с большим количеством смыслов. Несмотря на такую непонятно зачем выучиваемую(прям как в реальной жизни) полисемию, качество при угадывании слушающим таргета получается достаточно высоким (92%, 98% и 98%, для длин 2, 5 и 10 соответственно) и полисемия немного отступает с увеличением разрешенного размера сообщения (размер лексикона приближается к количеству обьектов) (Картинка 1)

Картинка 1. Как допустимый размер сообщения влияет на омонемию и качество полученного языка.


Что будет, если добавить немножко контекста?

В обычной жизни мы хотим различать слова не просто в случайном наборе слов, а в контексте. Например понятие ‘кошка' мы хотим выделять не среди понятий ‘жвачка’, ‘карандаш’ и ‘сюрреализм’, а среди слов ‘диван’, ‘собака’ и ‘молоко’. Поэтому правильней слушателю давать выбирать не из 5 случайных понятий наше истинное, а среди 5 понятий, близких по смыслу. Авторы сделали такой эксперимент и выяснили, что в случае близких 5 понятий, полисемия задевает более разные объекты, чем в случае случайных 5 понятий. То есть все как в реальной жизни - среди одинаковых по смыслу понятий (например, овца и коза) редко встречаются омонимы, омонимами чаще являются совсем разные понятия - замок(здание и механизм для запирания), мука(страдание и белый порошок), орган (инструмент и часть организма, обьединенная общей функцией).

Есть ли структура у созданного агентом языка и насколько она сложная?

На этот вопрос сложно ответить сходу, так как нет формального определения того, что такое сложная структура языка. Однако, очевидно, что если язык имеет композиционную структуру, то он может объяснять новые для себя понятия - аналогично студент на экзамене, который вызубрил конкретный пример, не может решить новый, а студент с композиционной структурой знаний сможет решить совершенно новую для себя задачу. Слушающий агент в статье способен воспринимать понятия, которые он никогда не видел, а также понятия, которые не свойственны для языка(красная железная мышь, сделанная из колес), но уже гораздо хуже.
Также авторы смотрели, есть ли корреляция между расстоянием Левенштейна в пространстве признакового описания сообщений от говорящего агента и косинусного расстояния в пространстве понятий. Выяснилось, что для языков, которым общаются пока не выученные аенты такой корреляции нет, но для обученных агентов, чем больше похожи обьекты, тем больше похожи сообщения.

Картинка 2. Корреляция между расстоянием в пространстве объектов и сообщений от говорящего агента.


Эксперимент с картинками

Также авторы решили попробовать заставить агентов создать язык в условиях, больше похожих на реальную жизнь - подавая им на вход не признаковое описаний понятий, а картинки разных цветов, на которых изображены фигуры разной формы в разных местах (Картинка 0). Энкодеры слушателя и говорящего состоят теперь из сверхточных сетей - интересно, что несмотря на то, что агенты не знают про веса друг друга, структура сеток получается очень похожей - язык способствует формированию общего культурного пласта говорящего и слушающего. Несмотря на то, что задача сложная, ее удается достаточно эффективно решить для разных постановок экспериментов.

К чему пришли

Когда мы заставляем агентов объяснять друг другу различные понятия, у них получается создать язык с проблемами и преимуществами, с которыми сталкиваемся и мы при создании языка - композиционная структура, омонимия, специфика, связанная с важностью распознавания понятий, похожая структура модели для говорящего и слушающего.


Report Page