Транскрипционные системы
Транскрипцио́нные систе́мы, наборы конвенций, с помощью которых записанные на аудио или видео эпизоды социального взаимодействия переводятся в письменную форму для последующей работы с ними. Такие системы используются для подготовки данных к анализу в области этнометодологии и конверсационного анализа (EMCA). В отличие от простых вербальных транскриптов, в конверс-аналитических учитываются не только слова, но и детали производства высказываний, такие как паузы, заминки, осечки, придыхания, интонации, изменение тона и громкости голоса и т. д.
Повышенное внимание к деталям производства речи и невербальных социальных действий связано с постулируемым в EMCA фундаментальным значением этих элементов для социального взаимодействия. Во-первых, высказывания и действия имеют сложную организацию, требующую детального анализа. Во-вторых, смысл высказываний не содержится в них самих, а понимается участниками взаимодействия контекстуально – с помощью ориентации на их позицию в последовательности действий. В связи с этим расположение элементов взаимодействия относительно друг друга играет первостепенную роль в анализе данных. Например, в зависимости от того, в какой момент происходит наложение речи двух говорящих, участники понимают, является ли оно «естественным» или происходит перебивание (Schegloff. 2000).
Чтобы обеспечить требуемую детализацию транскрипта, для анализа обычно используются короткие (от нескольких секунд до нескольких минут) фрагменты взаимодействия. Релевантные детали, например длина пауз в речи, фиксируются в десятых долях секунды. Для облегчения процесса транскрипции, в частности для точного определения позиции того или иного элемента взаимодействия относительно других, были разработаны компьютерные программы, такие как Clan, Elan или Transana.
Первую и самую известную транскрипционную систему для аудио разработала американский социолог Г. Джефферсон. Она представляет разговор как последовательность «черёдов», в рамках которых говорящие произносят реплики или их части. Каждый черёд размещается на отдельной строке транскрипта; строки нумеруются для удобства работы с материалом. В системе Джефферсон не действуют правила стандартной орфографии; слова пишутся, как слышатся, поскольку особенности их произнесения могут быть аналитически значимыми. Также не используется стандартная пунктуация, поскольку знаки препинания (точки, запятые, двоеточия) применяются для фиксации деталей произнесения высказываний. Например, двоеточие используется, чтобы показать протяжённость звука. Помимо стандартных знаков препинания, в систему Джефферсон добавлены другие символы, например стрелки «вверх» и «вниз» для обозначения восходящей и нисходящей интонации. Список основных символов транскрипции приведён в конце этой статьи и в работе Г. Джефферсон (Jefferson. 2004). Все использующиеся ныне транскрипционные системы являются модификациями системы Джефферсон.
Помимо аудиозаписей, конверс-аналитики работают с видеоматериалами, что влияет на конвенции транскрипции. Ранние исследовательские работы учитывали неречевые действия, добавляя их к речи с помощью вербальных описаний (например, «указывает рукой вправо») в конце черёда говорящего. Однако такой способ транскрипции был скоро признан недостаточным, поскольку собеседники не являются пассивными «слушателями», которые терпеливо ждут своей очереди. Они кивают, отводят глаза, жестикулируют, у них меняется выражение лица, они занимают или меняют место в физическом пространстве, указывают на что-либо, подмигивают друг другу, переключают своё внимание на другие действия, например на написание текстового сообщения. При анализе видео становится сложнее связывать действие с конкретным говорящим в данный момент времени, т. к. участники формируют его сообща. Более того, модальности участия не являются синхронными: например, жест не обязательно совершается в момент произнесения фразы или изменения позы.
При работе с видео аналитический фокус смещается с последовательного на одновременное взаимодействие людей, т. к. выражения лица, жесты и другие телесные движения могут производиться одновременно с речью. Пионеры видеоанализа, такие как К. Хит (Heath. 2010), Л. Мондада (Mondada. 2018; Contemporary issues ... 2019) и Ч. Гудвин (Goodwin. 2017), предложили свои модификации системы Джефферсон, учитывающие мультимодальность социального взаимодействия – одновременное использование различных коммуникативных ресурсов.
Наиболее распространённый в исследованиях EMCA способ транскрибирования видеозаписей был предложен швейцарским лингвистом Л. Мондада. Он заключается в том, чтобы начать с подробной транскрипции вокальной части взаимодействия по системе Джефферсон, а затем добавить вербальные описания и изображения (обычно скриншоты из видео) визуальных действий, таких как взгляды, жесты и позы, к временной шкале транскрипта под каждой строкой. Этот способ транскрибирования позволяет читателю увидеть временную координацию модальностей (Mondada. Conventions ...).
Транскрипционная система Мондада имеет важное следствие: точность соотнесения по времени речи и телесных действий достигается ценой уподобления последних тексту. Изображения частично исправляют «вербальность» описания, но они остаются для этой системы вторичными. Американский социолингвист и антрополог Ч. Гудвин предложил использовать другой подход к транскрибированию, в котором невербальные модальности отражены с помощью графических изображений и трейсинга – обведения контуров видео (англ. tracing – копировка, калькирование). В этой транскрипционной системе стандартизация приносится в жертву возможности представить телесные ресурсы в форме, отличной от вербальной. Ещё одно из возможных решений проблемы текстоцентричности при представлении мультимодальности взаимодействия – включение в научную публикацию мультимедийных ресурсов (Mondada. Transcribing silent actions ... 2019).
Необходимость отразить в транскрипте протекающее взаимодействие связана с тем, что любая транскрипционная система с неизбежностью селективна и не может заменить собой аудио- или видеозапись. Такие системы являются полезным исследовательским инструментом, однако анализ в EMCA всегда осуществляется на основании работы с транскриптом в соединении с аудио- или видеоданными.
Список основных символов системы Джефферсон
[ | Момент начала наложения |
] | Момент конца наложения |
(1.7) | Пауза в целых и десятых долях секунд |
(.) | Небольшая пауза (± одна десятая секунды) |
= | Отсутствие паузы |
- | Обрыв черёда или слова |
: | Растягивание предшествующего звука |
.,_? | Направление интонации: вниз (.), вверх (,), ровная интонация (_), резко вверх (?) |
↓↑ | Заметное повышение или понижение голоса в последующем фрагменте |
:__ | Интонационное подчёркивание. Положение двоеточия используется для описания формы интонационного контура |
>слово< | Фрагмент, произнесённый быстрее окружающих его фрагментов |
<слово> | Фрагмент, произнесённый медленнее окружающих его фрагментов |
СЛОВО | Фрагмент, произнесённый громче окружающих его фрагментов |
°слово° | Фрагмент, произнесённый тише окружающих его фрагментов |
.hhh | Вдох |
hhh | Выдох |
(слово) | Неразборчивая речь |
((комментарий)) | Комментарии расшифровщика |