Члены банд как эксперты

Члены банд как эксперты


Вместе с большими данными приходят большие проблемы. Одна из них состоит в том, что по оценке Форбс, 80% компаний не знают, что делать со своими данными, и вообще не представляют, как их анализировать. Это проблема получила название проблемы «неструктурированных данных».

Это проблема характерна не только для бизнеса, но и для государства. Особенно для правоохранительных органов. Сегодня полиция всех стран собирает огромное количество данных о местах преступления и самих преступниках. В том числе это касается данных из социальных сетей. По оценке Международной ассоциации начальников полиции, 95% всех полицейских отделений работают с данными из социальных сетей. Кажется, что с анализом данных полицейскими проблем быть не должно: в полиции работают компетентные эксперты, которые могут классифицировать собираемый огромный массив данных. Но исследователи отмечают, что классификации полицейских экспертов часто носят пристрастный характер. В России это касается выборочного привлечения к ответственности за оскорбление власти или отдельных социальных групп. В США это проблема того, что полицейские тщательно следят и мониторят профили потенциальных членов банд или просто молодежь из районов, где находятся эти банды. Причем очень часто речь идет об афроамериканцах. Известно, что молодежь, которая живет в районах где много банд, старается перенимать способ общения, характерный для банд и использовать его для того, чтобы поднять свою репутацию. Однако это не значит, что кто-то действительно член банды. Но полицейские могут использовать их подражание бандам как аргумент для ареста.

Пример твитта потенциальных членов банд

Чтобы избежать пристрастности полицейских экспертов и при этом разобраться в огромном массиве данных из социальных сетей, которые оставляют представители маргинальных групп, исследователи из Колумбийского университета решили обратиться к самим членам банд. Они наняли двух молодых людей из Чикаго, которые ранее были в бандах, и попросили их категоризовать сообщения из твиттера, которые оставляют возможные члены банд и молодежь в отдельных маргинальных кварталах. Категоризации этих двух людей были использованы для того, чтобы научить специальный алгоритм искусственного интеллекта понимать смысл сообщений в твиттере и других социальных сетей. Эти двое предметных экспертов также поправляли сеть и обучали ее в ходе проекта.

Примеры того, что обозначают эмоджи в твитах потенциальных членов банд

Общая цель исследователей из Колумбийского университета сводится к тому, чтобы научить искусственный интеллект предсказать появление насилия за пределами социальных сетей и тем самым помочь социальным работникам и полиции предотвращать возможные вспышки агрессии оффлайн. Но делается это за счет экспертизы самих бывших членов банд. Тем самым достигается большая объективность и при этом снижается пристрастность полицейских экспертов. Таким образом, проблема неструктурированных данных решается привлечением экспертов из той самой среды, откуда данные были взяты.

Frey W. R. et al. Artificial intelligence and inclusion: Formerly gang-involved youth as domain experts for analyzing unstructured twitter data // Social Science Computer Review. 2018. С. 1 - 15.


Report Page