Модерируемые и немодерируемые тестирования
Модери́руемые и немодери́руемые тести́рования (англ. moderated/unmoderated usability test), разновидности юзабилити-тестирования, отличающиеся ролью ведущего (модератора). Модерация юзабилити-тестирования – процесс, в котором ведущий специалист (модератор) сопровождает респондента при работе с интерфейсом, фасилитирует его активность через постановку задач в соответствии со сценарием тестирования и задаёт вопросы для получения данных о пользовательском опыте (впечатлениях, причинах ошибок, предпочтениях и прочем).
По критерию модерации юзабилити-тестирования делятся на модерируемые и немодерируемые.
В ходе модерируемого тестирования модератор напрямую взаимодействует с пользователем в лабораторных условиях или удалённо через Интернет. Модератор устанавливает контакт с респондентом, уточняет его предшествующий и релевантный исследованию опыт, а далее формулирует задания. В процессе тестирования модератор не вмешивается в само выполнение заданий – он может лишь задавать дополнительные вопросы к поведению респондента либо давать финальную подсказку на решение в случае, если респондент не способен самостоятельно справиться с заданием. Преимущество данного метода заключается в возможности получить полные и глубинные данные о поведении пользователя за счёт уточнения, дополнительных вопросов об опыте и впечатлениях, а также за счёт фасилитации процессов решения опытным модератором.
Немодерируемое тестирование предполагает, что респондент проходит юзабилити-тестирование самостоятельно, без участия модератора. Респондент получает задания, которые необходимо выполнить в интерфейсе, и делает их в удобное для него время. Поведение респондента чаще всего записывается на видео самим респондентом или с использованием специальных приложений для удалённых тестирований. В исследование могут включаться дополнительные вопросы для уточнения обнаруженных проблем, сбора обратной связи о качестве опыта и впечатлениях и проверки гипотез, выдвинутых исследователями (Let your users do the testing ... 2009). Данные впоследствии обрабатываются автоматически или вручную, в зависимости от потребностей исследования и используемых инструментов. Преимущество этого метода заключается в том, что экспериментаторам не нужно индивидуально отслеживать каждого пользователя и респонденты могут участвовать в исследовании в любом месте, где есть подключение к Интернету. Это позволяет собирать данные из различных географических регионов или получать данные от особых групп, недоступных для лабораторного тестирования. Однако глубина подобных данных обычно меньше, чем при модерируемом тесте из-за отсутствия возможности напрямую пообщаться с пользователем в процессе прохождения теста. Также в таких тестированиях важно составление понятных и точных сценариев и инструкций, т. к. у респондента отсутствует возможность уточнить формулировку задания у модератора.
Один из важных вопросов, стоящих перед исследователями при выборе модерируемого или немодерируемого метода, – надёжность и валидность получаемых данных. Так, Ди Лиу (2012) предупреждает, что количество ответов от участника при немодерируемом тестировании в среднем ниже, чем при модерации исследования, а Э. Нельсон и А. Ставру (2011) считают, что немодерируемый метод применим только для тестирования простейших задач в интерфейсе. Исследование А. Бруун (2009) показывает, что при немодерируемых тестах обнаруживается только 40–60 % ошибок по сравнению с лабораторным модерируемым тестом.
Однако сравнительные исследования (Thompson. 2004; Hertzum. 2014) не обнаруживают разницы в общем количестве выявленных проблем по результатам модерируемого и немодерируемого теста одного и того же интерфейса. Помимо этого М. Хертсум и его коллеги выявили несколько интересных особенностей. Во-первых, поведение респондентов в ходе модерируемых и немодерируемых сессий тестирования сходно: респонденты показывают сопоставимый объём «мыслей вслух» (размышлений пользователя о его действиях и возникающих проблемах или вопросах) при работе с интерфейсом. Однако было замечено, что при модерируемом тестировании большее количество вербализаций связано с отвлечёнными темами, которые в большей степени направлены на установление и поддержание контакта с модератором, а не на обсуждение получаемого опыта (Hertzum. 2015). Во-вторых, исследователи обнаружили, что специалисты, которые анализировали модерируемые тестовые сессии, выявляли больше проблем, которые были оценены как проблемы высокой критичности (значительно влияющие на пользовательский опыт и препятствующие выполнению задачи), чем оценщики, которые анализировали немодерируемые сессии (Hertzum. 2014).
Противоречивые результаты исследований сравнительной эффективности модерируемых и немодерируемых тестирований свидетельствуют о необходимости дальнейшей проверки и сопоставления валидности получаемых результатов. Однако, несмотря на данное ограничение, исследователи и юзабилити-специалисты считают метод немодерируемых тестирований многообещающим и прогнозируют его развитие с ростом рынка юзабилити-исследований.