Гендер и человеко-машинное взаимодействие

Видит Бог, не хотел я поднимать вопрос о гендере и человеко-машинном взаимодействии, но тут такое дело: попала мне на выходные в руки статья Marek Posard о экспериментах для проектирования “женской” и “мужской” версии компьютера и понеслась. Сама статья лежит здесь: http://www.sciencedirect.com.sci-hub.io/science/article/pii/S0747563214002349 Я немного попереводил некоторые основные тезисы и дизайн эксперимента: основной вывод статьив том, что мужская версия выглядит в глазах респондентов дороже и интерепретируется почти как роскошь, а вот гипотезы о профессионализме “мужского” или “женского” компьютера не подтвердились, что достаточно забавно.

В конце 1990-х годов холдинг BMW отозвал голосовую навигационную панель своей 5-й серии автомобилей. Причина отзыва заключалась в жалобах клиентов, которые с тревогой описывали, что указания, которые они получали от навигационной системы были произнесены женским голосом.

Этот пример отлично доказывает гендерный аспект человеко-машинного взаимодействия.

Характеристики статуса относятся к человеческим атрибутам, которые люди используют для формулирования убеждений о выполнении задач в группах. Процесс организации статуса происходит, когда такие убеждения различаются по статусу членов группы . Большинство исследований статусных процессов в социологии были сосредоточены на группах двух или более людей. По мнению авторов статьи существуют убеждения в отношении социальных групп, которые люди широко участвуют в жизни общества. Когда эти убеждения формируют ожидания и оценки для членов группы, они действуют как статусные характеристики. Это предположение гласит, что члены группы будут рассматривать характеристику состояния, которая будет актуальной для задачи, если только они не будут активно отделять ее от задачи. Проводились десятилетия исследований, показывающих, что члены группы обычно не могут отделить эти характеристики от выполнения задач в группах: и этническая принадлежность, и врожденными способностями к задачам, не связанным с этими социальными категориями.

Исследования показали, что гендер является характерным, диффузным статусом, характерным для смешанных гендерных групп, где партнеры работают по гендерно-нейтральным задачам. Экспериментальные исследования по двойным стандартам показывают, что участники будут давать более высокие оценки за ту же работу мужчине, чем женщине . Эти гендерные различия влияют на то, как люди оценивают свою собственную компетентность и, в свою очередь, формулируют свои собственные рабочие показатели. Гендер также влияет на то, как члены группы воспринимают женщин и мужчин на руководящих должностях. Исследования показывают, что люди оценивают показатели групп, возглавляемых женщинами, как более низкие по сравнению с показателями лидеров с мужчинами. Однако эти группы способны преодолевать эти гендерные различия, когда они институционализируют роль женщин как лидеров.

Гендерные роли не только влияют на самовосприятие тех, кто использует компьютерные технологии, но также могут влиять на то, как пользователи воспринимают эти машины. Это то, что Nass, Moon и Green нашли в одном исследовании, где участники работали над гендерно-стереотипной задачей (например, компьютерными технологиями в сравнении с любовью и отношениями) с компьютеризированными преподавателями, а не с инструкциями, использующими мужской или женский голос. Участники оценили своего репетитора как более информативного в отношении компьютерных технологий, когда он предоставлял информацию не только женскому, но и в мужском роде. Противоположное было верно, когда участники оценивали своего наставника как более информативное о любви и отношениях, когда оно использовало женский вместо мужского голоса. Настоящее исследование продвигает эту линию исследований, исследуя конкретный процесс, который заставляет людей-пользователей полагаться на статусные характеристики (например, пол) при формировании убеждений об их компьютерах.

Убежденность в выполнении задания компьютеризированного партнера, который они олицетворяют как мужчина или женщина. В предположении, что люди полагаются на эти убеждения при определении ценности объектов, следует, что пол влияет на их оценки экономической ценности для этих компьютеров.

3. Прогнозы

Гипотеза 1. Люди ожидают, что компьютерный партнер, персонифицированный как мужчина, будет лучше выполнять гендерно-нейтральную задачу, чем когда эта машина описывается как женщина.

Есть некоторые доказательства из исследований взаимодействия человека и компьютера, которые люди оценивают по-разному, когда они олицетворяются как мужчина или женщина. Насс и его коллеги обнаружили, что пользователи оценили компьютер с мужским голосом более позитивно, чем машина, используя голос женщины по гендерно-стереотипным задачам. Гипотеза 2 предсказывает аналогичный эффект, когда люди работают в группах с компьютерным партнером по имени Джеймс или Джули по гендерно-нейтральной задаче:

Гипотеза 2. Люди будут оценивать эффективность компьютеризированного партнера, который персонифицируется как человек выше по гендерно-нейтральной задаче, чем тот же партнер, который описывается как женщина.

Первая гипотеза предсказывает, что люди ожидают, что компьютер будет лучше работать на гендерно-нейтральной задаче, когда эта машина персонифицируется как человек, а не женщина. Вторая гипотеза предсказывает, что люди будут оценивать общую производительность этой машины выше, если его зовут Джеймса по сравнению с женским именем Джулия. Если люди полагаются на эти соображения при оценке экономической ценности партнера, чем на компьютере, то следует, что люди оценивали бы более высокую стоимость для компьютеризованного партнера, который имеет имя Джеймса по сравнению с одним из них по имени Джули. Это предположение приводит к следующему предсказанию:

Гипотеза 3. Люди оценят более высокую экономическую ценность компьютеризированного партнера, который олицетворяется как человек по сравнению с тем же партнером, который описывается как женщина

В исследовании приняли участие студенты из большого исследовательского университета, расположенного в Средней Атлантике. Эти участники выполнили одну и ту же компьютерную задачу в частных комнатах, используя ту же модель компьютера с сенсорным экраном (Hewlett Packard Touch-Smart 320 PC). В инструкциях по обучению участникам рассказано, что они получат до 20 долларов за их участие. В инструкциях по обучению указывалось, что участники были оплачены в зависимости от их работы по задаче о понимании.

Участники дали свое согласие, ответили на стандартную демографическую анкету, заполнили 10 вопросов из теста смысловой проницательности и ответили на ряд вопросов об их впечатлениях от этого компьютера. В этом эксперименте участвовали 63 участника (46 женщин и 17 мужчин). В этой статье был исключен один участник, который неправильно идентифицировал пол своего компьютеризованного партнера. Из оставшихся 62 участников 31 работал с компьютером по имени Джеймс, а другой 31 работал с машиной с именем Джули.

4.2. Процедура

Исследователи в этом эксперименте разместили участников в частных комнатах, оснащенных настольными компьютерами с сенсорным экраном. Эти компьютеры отображали инструкции исследования с использованием программного обеспечения для сбора данных. Участники использовали интерфейс сенсорного экрана при выполнении каждой части этого эксперимента. В инструкциях по исследованию говорится, что этот эксперимент тестировал новую компьютерную программу, которая оценивает ответы учащихся на экзаменационные вопросы.

В этих инструкциях говорилось, что в середине Атлантического университета планируется использовать это программное обеспечение для сдачи экзаменов в ближайшем будущем. Модератор исследования сказал участникам, что это программное обеспечение представляет собой новое продвижение в обработке естественного языка компьютерами. Он сказал, что это программное обеспечение способно применять технические аналитические веса для оценки человеческих ответов на основе соответствующей информации. В инструкциях говорилось участникам, что это программное обеспечение может извлечь уроки из предыдущих взаимодействий с людьми, чтобы повысить его точность при оценке ответов в будущем.

Участники заполнили 10 вопросов из теста понимания смысла и инструкций по обучению, заявив, что они получат 2 доллара за каждый вопрос, на который они ответили правильно. В этом тесте участники выбрали из четырех слов из словаря на иностранном языке, который имеет то же значение, что и английское слово, отображаемое на экране. Все варианты ответа были получены от аборигенного языка, который является родным для Австралии. Выбор ответа не имел общего значения с отображаемыми английскими словами.

Выбрав ответ, компьютеризированный партнер сказал участникам, если он считает, что их ответ был верным или неправильным. Компьютер также показал процент, представляющий уверенность машины в этой оценке. Увидев эту оценку, участники оценили, насколько они уверены в своем первоначальном ответе и могут изменить этот ответ, прежде чем перейти к следующему вопросу. Эксперимент никогда не говорил участникам, если их окончательные ответы были правильными или неправильными.

Чтобы проиллюстрировать, один из вопросов спросил участников: «Какое из этих слов означает APPLE?». Участники выбирают слово из этого списка: jabalng, wagalmiyan, gadamalga или birndi. После того как участники выбрали одно из этих слов, появился новый экран, в котором говорилось: «[Джули / Джеймс] не согласен с вами. [Он / он] на 50% уверен, что ваш ответ правильный ». Ниже этого заявления участники увидели два вопроса, которые попросили их оценить свою уверенность в ответе, который они только что выбрали, используя скользящую шкалу от 0% до 100%. Другой вопрос появился ниже того масштаба, который попросил участников, если они хотели бы изменить свой ответ, отобразить предыдущий вопрос и ответить на их ответ на перевод английского языка «яблоко».

Участники заполнили 10 из этих вопросов из теста на понимание. Для каждого вопроса в обоих условиях компьютер дал 25% -ный уровень уверенности для тех же трех ответов на вопрос; 50% доверия для тех же пяти ответов на вопросы; И 75% -ный уровень достоверности ответов на два вопроса. Порядок экспериментов не менялся между условиями эксперимента.

После завершения анализа смысла исследования, исследование попросило участников оценить свои впечатления от Джеймса или Джули. Эксперимент показал серию прилагательных, используемых для характеристики людей в целом. Рядом с каждым из этих прилагательных участники оценивали каждого с использованием 5-балльной шкалы, где высшая категория (5) представляет «Characteristic», средняя категория (3) была «N / A» и самая низкая Категория (1) представляет «Не характерный».

Ожидаемые результаты. Участники заполнили 10 вопросов из теста на понимание смысла. В обоих экспериментальных условиях компьютеризированный партнер дал тот же результат, сообщив участникам, был ли их ответ верным или неправильным, и уровень доверия к компьютеру в этом определении. Когда участники увидели этот ответ, исследование попросило их оценить свою уверенность в первоначальном ответе, используя скользящую шкалу, которая варьировалась от 0% до 100%. Я объединил эти 10 оценок в один индекс (Cronbach a = 0.90), M = 26.40; SD = 14,32. Затем я суммировал уровни достоверности, заданные компьютером, которые были одинаковыми в разных условиях, M = 47,5. Первым показателем ожидаемых результатов является абсолютная разница между средним уровнем достоверности ответа компьютера и средним уровнем достоверности, полученным участником, M = 21,56; SD = 13,60.

Второй мерой ожиданий эффективности является влияние, определяемое здесь как социально вызванные изменения в верованиях или поведении. Влияние является предлагаемым теоретическим следствием ожидаемых результатов, которые, согласно теории статусных характеристик, могут варьироваться в группах, когда члены имеют разные статусные характеристики. Чтобы измерить влияние, в исследовании наблюдался процент случаев, когда участники меняли свои ответы после того, как компьютерный партнер дал им оценку точности их первоначального ответа.

Участники выбрали ответ, просмотрев оценку своего компьютера о том, был ли этот ответ верным или неправильным, и могли бы изменить исходный выбор ответа, прежде чем переходить к следующему вопросу.

Гипотеза 1 предсказывала, что люди ожидают, что компьютерный партнер, персонифицированный как человек, будет лучше выполнять гендерно-нейтральную задачу, чем человек, описанный как женщина. Не было существенной разницы в уровнях доверия для участников, работающих с компьютером по имени Джеймс (M = 19.02; SD = 12.00) или Джулия (M = 24,1; SD = 14,80). Общая модель также была несущественной, F (4, 57) = 0,63; p <.65.

Гипотеза 2 предсказывала, что люди оценивали бы эффективность компьютеризированного партнера, персонифицированного как мужчина выше, чем женщина. Это исследование оценило эти оценки эффективности двумя способами. Первый способ измерил впечатление людей о поведении их компьютерного партнера. Чтобы измерить эти впечатления, в исследовании использовался индекс из пяти вопросов, которые просят участников оценить личные качества своего компьютера. Результаты в таблице 1 не поддерживают гипотезу 2 при сравнении Джеймса (M = 3,17; SD = 0,96) и Джулии (M = 3,05; SD = 0,69).

Гипотеза 3 предсказала, что люди оценят более высокую стоимость для компьютера под именем Джеймс по сравнению с одним по имени Джули. После завершения задачи по пониманию смысла с помощью компьютеризированного партнера эксперимент попросил участников оценить стоимость покупки одного блока этой компьютерной системы. Результаты в Таблице 3 подтверждают гипотезу 3. Существовали значительные различия в оценках затрат, при этом участники прогнозировали более высокую среднюю стоимость для Джеймса (M = 6,61, SD = 2,80) по сравнению с Джули (M = 5,65, SD = 2,58) (p <.05, двухсторонний).

Каждая категория представляет собой увеличение на 1000 долларов, где самая низкая категория (1) представляет «ниже 1000 долларов США», а наивысший выбор ответа (11) представляет «более 10 000 долларов США». Значительное различие по полу в модели ANCOVA от Таблица 3 показывает, что в среднем участники оценивали, что Джеймс стоил приблизительно 5870 долларов США (где категория 6 представляет диапазон от 5000 до 5999 долларов США), а стоимость Джули составляла 4380 долларов США (где категория 5 представляет диапазон от 4000 до 4999 долларов США). Это различие составляет $ 1490 ($ 5874 - $ 4384 =

$ 1490) .

Гендер и человеко-машинное взаимодействие

Report Page