Новости от 4 ноября
SkillFactoryЭтика vs. эффективность алгоритмов
Профессора Пенсильванского университета Майкл Кернс и Аарон Рот рассказывают в книге «Этический алгоритм» о том, как механики машинного обучения решают за нас, за кого голосовать на выборах, кого зачислять в университет и кому выдавать кредит. Очень часто такие решения основаны на предрассудках и приводят к пагубным последствиям. Авторы предлагают решать вопрос этики алгоритмов еще на стадии разработки.
Но тут возникают проблемы: например, могут ли современные модели быть одновременно этичными и эффективными? Авторы блога «Потерянное письмо Гёделя и P = NP», посвященного теории алгоритмов, отмечают несколько противоречий:
1. Если исключить из обучающих выборок данные-предрассудки, то это может исказить представление об объекте исследования.
2. Анонимность нужна для проведения честного конкурсного отбора, но невозможна при проектировании алгоритма — ему нужны глубокие данные о личности кандидатов. Нельзя организовать разработку модели вслепую, чтобы никто не знал, кто есть кто.
3. Чтобы грамотно оценивать риски и погрешности при работе с моделями, информация о работе алгоритмов должна быть открытой, но это может привести к нежелательным утечкам.
В конце концов, некоторые важные и болезненные проблемы общества могут попросту не иметь алгоритмического решения, которое будет соответствовать нормам морали.
Исследователи нашли в хаосе произведения Джорджа Мартина социальный порядок и геометрическое распределение
«Песнь льда и пламени» Джорджа Р.Р. Мартина — произведение эпических масштабов с огромным количеством персонажей, событий и, конечно, убийств. Исследователи из пяти университетов Великобритании и Ирландии решили навести порядок в этой вселенной и понять, действительно ли кажущаяся хаотичность не подчиняется никаким правилам (спойлер: подчиняется). Для этого они провели статистический анализ текста и хронологии повествования, построили социальные графы, изображающие взаимоотношения между героями и диаграммы распределения их появлений и смертей.
Вот что выяснили:
— Взаимодействие героев не преувеличено и соответствует реально-общественному: социальный круг каждого персонажа растет по ходу повествования, но редко превышает 150 человек (видимо, на большее количество персонажей у читателя не хватит внимания).
— Чуть больше 10 из 2000 человек являются главными лицами по ходу действия саги — Для группы такого размера это и есть, согласно социологическим исследованиям, приблизительное количество лидеров.
— Автор выстроил хронологию повествования так, чтобы периодически происходило нечто внезапное и читатель постоянно находился в напряжении. Ощущение непредсказуемости возникает из-за расположения событий в тексте в так называемом геометрическом распределении из теории вероятностей.
Так что это только читателям кажется, что Мартин убивает своих персонажей рандомно, а с точки зрения статистического анализа все логично и предсказуемо.