Новости от 4 ноября

Новости от 4 ноября

SkillFactory

Этика vs. эффективность алгоритмов 


Профессора Пенсильванского университета Майкл Кернс и Аарон Рот рассказывают в книге «Этический алгоритм» о том, как механики машинного обучения решают за нас, за кого голосовать на выборах, кого зачислять в университет и кому выдавать кредит. Очень часто такие решения основаны на предрассудках и приводят к пагубным последствиям. Авторы предлагают решать вопрос этики алгоритмов еще на стадии разработки.


Но тут возникают проблемы: например, могут ли современные модели быть одновременно этичными и эффективными? Авторы блога «Потерянное письмо Гёделя и P = NP», посвященного теории алгоритмов, отмечают несколько противоречий:


1. Если исключить из обучающих выборок данные-предрассудки, то это может исказить представление об объекте исследования. 

2. Анонимность нужна для проведения честного конкурсного отбора, но невозможна при проектировании алгоритма — ему нужны глубокие данные о личности кандидатов. Нельзя организовать разработку модели вслепую, чтобы никто не знал, кто есть кто.

3. Чтобы грамотно оценивать риски и погрешности при работе с моделями, информация о работе алгоритмов должна быть открытой, но это может привести к нежелательным утечкам.


В конце концов, некоторые важные и болезненные проблемы общества могут попросту не иметь алгоритмического решения, которое будет соответствовать нормам морали. 



Исследователи нашли в хаосе произведения Джорджа Мартина социальный порядок и геометрическое распределение


«Песнь льда и пламени» Джорджа Р.Р. Мартина — произведение эпических масштабов с огромным количеством персонажей, событий и, конечно, убийств. Исследователи из пяти университетов Великобритании и Ирландии решили навести порядок в этой вселенной и понять, действительно ли кажущаяся хаотичность не подчиняется никаким правилам (спойлер: подчиняется). Для этого они провели статистический анализ текста и хронологии повествования, построили социальные графы, изображающие взаимоотношения между героями и диаграммы распределения их появлений и смертей. 


Вот что выяснили:


— Взаимодействие героев не преувеличено и соответствует реально-общественному: социальный круг каждого персонажа растет по ходу повествования, но редко превышает 150 человек (видимо, на большее количество персонажей у читателя не хватит внимания). 

— Чуть больше 10 из 2000 человек являются главными лицами по ходу действия саги — Для группы такого размера это и есть, согласно социологическим исследованиям, приблизительное количество лидеров.

— Автор выстроил хронологию повествования так, чтобы периодически происходило нечто внезапное и читатель постоянно находился в напряжении. Ощущение непредсказуемости возникает из-за расположения событий в тексте в так называемом геометрическом распределении из теории вероятностей.


Так что это только читателям кажется, что Мартин убивает своих персонажей рандомно, а с точки зрения статистического анализа все логично и предсказуемо.