10 декабря 2021 года.
Во время пандемии видеозвонки стали для меня способом общения с тетей в доме престарелых и с дальними родственниками во время праздников. С помощью Zoom я проводил вечера тривиальных игр, счастливые часы и живые выступления. Будучи университетским профессором, я проводил с помощью Zoom все свои рабочие встречи, наставничество и преподавание.
Но я часто чувствовал себя истощенным после сеансов Zoom, даже тех, которые я запланировал для развлечения. Несколько хорошо известных факторов — интенсивный зрительный контакт, слегка неправильный зрительный контакт, нахождение перед камерой, ограниченность движений тела, отсутствие невербальной коммуникации — способствуют усталости от Zoom. Но мне было интересно узнать, почему разговор через Zoom и другие программы для видеоконференций кажется более трудоемким и неловким по сравнению с личным общением.
Будучи исследователем, изучающим психологию и лингвистику, я решил изучить влияние видеоконференций на разговор. Вместе с тремя студентами я провела два эксперимента.
Первый эксперимент показал, что время ответа на заранее записанные вопросы «да/нет» увеличивалось более чем в три раза, когда вопросы воспроизводились через Zoom, а не с собственного компьютера участника.
Во втором эксперименте результаты были воспроизведены в естественном, спонтанном разговоре между друзьями. В этом эксперименте время перехода от одного говорящего к другому составляло в среднем 135 миллисекунд при личном общении, но 487 миллисекунд при общении той же пары через Zoom. Хотя менее половины секунды кажется довольно быстрой, эта разница — целая вечность с точки зрения естественных ритмов разговора.
Мы также обнаружили, что во время разговора по Zoom люди дольше держат слово, поэтому переходы между собеседниками происходят реже. Эти эксперименты свидетельствуют о том, что естественный ритм разговора нарушается приложениями для видеоконференций, такими как Zoom.
Когнитивная анатомия разговора
У меня уже был определенный опыт в изучении разговоров. До пандемии я провел несколько экспериментов, изучая, как смена тем и нагрузка на рабочую память влияют на время, когда собеседники говорят по очереди.
В ходе этого исследования я обнаружил, что паузы между говорящими были длиннее, если собеседники говорили о разных вещах или если во время разговора собеседник отвлекался на другую задачу. Изначально я заинтересовался временем перехода от одного поворота к другому, потому что планирование ответа во время разговора — сложный процесс, который люди выполняют с молниеносной скоростью.
Средняя пауза между говорящими в двухстороннем разговоре составляет около одной пятой секунды. Для сравнения, чтобы переместить ногу с педали газа на тормоз во время движения, требуется более полусекунды — более чем в два раза дольше.
Скорость перехода от одного поворота к другому указывает на то, что слушатели не ждут окончания речи говорящего, чтобы начать планировать ответ. Скорее, слушатели одновременно воспринимают речь говорящего, планируют ответ и прогнозируют подходящее время для начала ответа. Вся эта многозадачность должна была бы сделать разговор довольно трудоемким, но это не так.
Синхронизация
Мозговые волны — это ритмичные колебания нейронов в вашем мозге. Эти колебания могут быть одним из факторов, который помогает сделать разговор непринужденным. Ряд исследователей предположили, что нейронный колебательный механизм автоматически синхронизирует скорость стрельбы группы нейронов с темпом речи вашего собеседника. Этот осцилляторный механизм синхронизации позволил бы снять часть умственных усилий по планированию момента начала разговора, особенно если бы он сочетался с прогнозами относительно оставшейся части речи вашего собеседника.
Хотя остается много открытых вопросов о том, как осцилляторные механизмы влияют на восприятие и поведение, есть прямые доказательства существования нейронных осцилляторов, отслеживающих темп произнесения слогов, когда слоги предъявляются через регулярные интервалы. Например, когда вы слышите слоги четыре раза в секунду, электрическая активность в вашем мозге достигает пика с той же частотой.
Есть также свидетельства того, что осцилляторы могут учитывать некоторую изменчивость частоты слогов. Это делает правдоподобной идею о том, что автоматический нейронный осциллятор может отслеживать нечеткие ритмы речи. Например, осциллятор с периодом 100 миллисекунд мог бы синхронизироваться с речью, которая варьируется от 80 до 120 миллисекунд на короткий слог. Более длинные слоги не являются проблемой, если их длительность кратна длительности коротких слогов.
Отставание от интернета — это гаечный ключ в умственных механизмах
Я догадывался, что предложенный колебательный механизм не сможет хорошо функционировать в Zoom из-за переменных задержек передачи данных. При видеозвонке аудио- и видеосигналы разделяются на пакеты, которые передаются по Интернету. В наших исследованиях каждый пакет проходил путь от отправителя до получателя за 30-70 миллисекунд, включая разборку и сборку.
Хотя это и очень быстро, но для автоматической синхронизации мозговых волн с темпом речи это слишком большая дополнительная вариативность, и приходится прибегать к более сложным умственным операциям. Это может помочь объяснить мое ощущение, что разговоры в Zoom были более утомительными, чем при личной встрече.
Наши эксперименты показали, что при использовании Zoom нарушается естественный ритм переходов от одного говорящего к другому. Это нарушение соответствует тому, что могло бы произойти, если бы нейронный ансамбль, который, по мнению исследователей, обычно синхронизируется с речью, разладился из-за задержек электронной передачи.
Наши доказательства, подтверждающие это объяснение, являются косвенными. Мы не измеряли осцилляции коры головного мозга и не манипулировали задержками электронной передачи данных. Исследования связи между нейронными осцилляторными механизмами синхронизации и речью в целом являются многообещающими, но не окончательными.
Исследователям в этой области необходимо выявить колебательный механизм естественной речи. Отсюда методы отслеживания коры головного мозга могли бы показать, является ли такой механизм более стабильным при разговоре лицом к лицу, чем при разговоре по видеоконференции, и насколько сильное запаздывание и насколько сильная изменчивость приводят к сбоям.
Может ли осциллятор, отслеживающий слоги, переносить относительно короткие, но реалистичные электронные задержки менее 40 миллисекунд, даже если они динамически изменяются от 15 до 39 миллисекунд? Сможет ли он выдержать относительно длинные задержки в 100 миллисекунд, если задержка передачи будет постоянной, а не переменной?
Знания, полученные в результате таких исследований, могут открыть путь к технологическим усовершенствованиям, которые помогут людям синхронизироваться и сделают общение по видеоконференцсвязи менее утомительным.
Автор — Джули Боланд, профессор психологии и лингвистики Мичиганского университета.