Тембр звучания музыкальных инструментов

Рис 1.2 Временная диаграмма сигнала музыкального инструмента (увеличен масштаб по оси времени).

 

 

У ударных и щипковых инструментов, например гитары, короткий временной отрезок стационарной фазы и атаки и длинный по времени - фазы затухания. Если представить отрезок стационарной части звучания более растянутым во времени (рис. 1.1), то можно отчетливо видеть периодическую структуру звука (рис. 1.2). Эта периодичность является принципиально важной для определения музыкальной высоты тона, поскольку слуховая система только для периодических сигналов может определить высоту, а непериодические сигналы воспринимаются ею как шумовые.

 

Как утверждает классическая теория, развиваемая, начиная с Гельмгольца почти все последующие сто лет, восприятие тембра зависит от спектральной структуры звука, то есть от состава обертонов и соотношения их амплитуд.

 

Рис. 1.3. Спектр колебания гитарной струны.

 

Для построения спектра на рис. 1.3, в стационарной части осциллограммы выделяется некоторый временной отрезок, и проводится расчет усредненного спектра по данному отрезку. Чем больше этот отрезок, тем точнее получается разрешающая способность по частоте, но при этом могут теряться (сглаживаться) отдельные детали временной структуры сигнала. Такие стационарные спектры обладают индивидуальными чертами, характерными для каждого музыкального инструмента, и зависят от механизма звукообразования в нем.

 

Тембр, безусловно, существенно зависит от усредненного спектрального состава звука: количества обертонов, их относительного расположения на частотной шкале, от соотношения их амплитуд, то есть формы спектральной огибающей (АЧХ), а точнее, от спектрального распределения энергии по частоте. Однако когда в 60-х годах начались первые опыты синтеза звуков музыкальных инструментов, попытки воссоздать звучание, в частности, трубы по известному составу её усредненного спектра оказались неудачными - тембр был совершенно не похож на звук медных духовых инструментов. То же относится и к первым попыткам синтеза голоса. Именно в это период, опираясь на возможности, который предоставили компьютерные технологии, началось развитие другого направления - установление связи восприятия тембра с временной структурой сигнала.

 

Довольно широко распространено мнение, что при работе со звуковыми сигналами достаточно получить информацию об их спектральном составе, поскольку перейти к их временной форме всегда можно с помощью преобразования Фурье, и наоборот. Однако однозначная связь между временным и спектральным представлениями сигнала существует только в линейных системах, а слуховая система является принципиально нелинейной системой, как при больших, так и при малых уровнях сигнала. Поэтому обработка информации в слуховой системе происходит параллельно как в спектральной, так и во временной области.

 

Разработчики высококачественной акустической аппаратуры сталкиваются с этой проблемой постоянно, когда искажения АЧХ акустической системы (то есть неравномерность спектральной огибающей) доведены почти до слуховых порогов (неравномерность 2 дБ, ширина полосы 20 Гц…20 кГц и т. д.), а эксперты или звукорежиссеры говорят: «скрипка звучит холодно» или «голос с металлом» и т.п. Таким образом, информации, полученной из спектральной области, для слуховой системы недостаточно, нужна информация о временной структуре. Неудивительно, что методы измерений и оценки акустической аппаратуры существенно изменились за последние годы появилась новая цифровая метрология, позволяющая определить до 30 параметров, как во временной, так и в спектральной областях.

Следовательно, информацию о тембре музыкального и речевого сигнала слуховая система должна получать как из временной, так и из спектральной структуры сигнала. Все полученные выше результаты в классической теории тембра (теории Гельмгольца) базируются на анализе стационарных спектров, полученных из стационарной части сигнала с определенным усреднением, однако принципиально важным является то обстоятельство, что в реальных музыкальных и речевых сигналах практически нет постоянных, стационарных частей.

 

Живая музыка - это непрерывная динамика, постоянное изменение, и это связано с глубинными свойствами слуховой системы. Эксперименты различных учёных показали, что, если удалить часть временной структуры, соответствующей атаке звука, или поменять местами атаку и спад (проиграть в обратном направлении), или атаку от одного инструмента заменить атакой от другого, то опознать тембр данного инструмента становится практически невозможным. Следовательно, для распознавания тембра не только стационарная часть (усредненный спектр которой служит основой классической теории тембра), но и период формирования временной структуры, как и период затухания (спада) являются жизненно важными элементами.

 

 Итак, существенное влияние на восприятие тембра музыкального инструмента или голоса оказывает структура его стационарного (усредненного) спектра: состав обертонов, их расположение на частотной шкале, их частотные соотношения, распределения амплитуд и форма огибающей спектра, наличие и форма формантных областей и т.д., что полностью подтверждает положения классической теории тембра, изложенные еще в трудах Гельмгольца. Однако экспериментальные материалы, полученные за последние десятилетия, показали, что не менее существенную, а, может быть, и гораздо более существенную роль в распознавании тембра играет нестационарное изменение структуры звука и, соответственно, процесс развертывания во времени его спектра, в первую очередь, на начальном этапе атаки звука.

 

Процесс изменения спектра во времени особенно наглядно можно проанализировать с помощью спектрограмм или трехмерных спектров (они могут быть построены с помощью большинства музыкальных редакторов Sound Forge, SpectroLab, Wave Lab и др.). Их анализ для звуков различных инструментов позволяет выявить характерные особенности процессов «развертывания» спектров. Трехмерный спектр представляет собой график, где по одной оси отложена частота в Гц, по другой время в секундах; по третьей амплитуда в дБ. На нём отчетливо видно, как происходит процесс нарастания, установления и спада во времени спектральной огибающей.

 

 Процесс атаки у большинства музыкальных инструментов и голоса продолжается несколько десятков миллисекунд. За этот период времени (иногда с переходом на стационарную часть) слух воспринимает постепенное расширение спектра во времени, поскольку вступают все новые обертоны с различной скоростью и амплитудой, и распознает тембр данного инструмента. На этот процесс распознавания оказывают влияние также многочисленные другие признаки: начальный удар медиатора или пальца о струны, щипок с захватом стуны, небольшая негармоничность обертонов и т.д. все это создает живые акустические признаки идентификации инструмента. Как известно, процесс атаки особенно важен для распознавания тембра также ещё и потому, что он является устойчивой характеристикой звучания данного инструмента, менее всего подверженной «окрашиванию» со стороны помещения, в котором данное произведение исполняется, поскольку первые отражения поступают к слушателю с определенным запаздыванием, после того, как фаза атаки звука уже завершена и поступила к слушателю неокрашенной в виде прямого звука. Если бы этого не было, то распознать тембр инструмента при исполнении в различных помещениях было бы практически невозможно. Эксперименты показали, что слушатели не могут распознать инструмент, если фаза атаки удалена или изменена.

 

Характер поведения каждого обертона во времени также несет важнейшую информацию о тембре. Например, в звучании колоколов особенно чётко видна динамика изменения, как по составу спектра, так и по характеру изменения во времени амплитуд его отдельных обертонов: если в первый момент после удара в спектре отчетливо видно несколько десятков спектральных составляющих, что создает шумовой характер тембра, то через несколько секунд в спектре остаются несколько основных обертонов (основной тон, октава, дуодецима и минорная терция через две октавы), остальные затухают, и это создает особый тонально окрашенный тембр звучания.

 

Интересно отметить, что еще более десяти лет назад для измерения акустической аппаратуры был предложен новый параметр, а именно трехмерный спектр распределения энергии по частоте и по времени, так называемое распределение Вигнера, которое достаточно активно используется различными фирмами для оценки аппаратуры, поскольку, как показывает опыт, позволяет установить наилучшее соответствие с ее качеством звучания. Учитывая изложенное выше свойство слуховой системы использовать динамику изменения энергетических признаков звукового сигнала для определения тембра, можно предположить, что этот параметр распределение Вигнера может быть полезен и для оценки музыкальных инструментов.

Оценка тембров различных инструментов всегда носит субъективный характер, но если при оценке высоты и громкости можно на основе субъективных оценок расположить звуки по определенной шкале (и даже ввести специальные единицы измерения сон для громкости и мел для высоты), то оценка тембра значительно более трудная задача. Обычно для субъективной оценки тембра слушателям предъявляются пары звуков, одинаковых по высоте и громкости, и их просят расположить эти звуки по разным шкалам между различными противоположными описательными признаками: «яркий»/ «темный», «звонкий»/ «глухой» и т.д.

Существенное влияние на определение таких параметров звука, как высота, тембр и др., оказывает поведение во времени первых пяти-семи гармоник, а также ряда «неразвернутых» гармоник до 15…17-ой. Однако, как известно из общих законов психологии, кратковременная память человека может одновременно оперировать не более чем семью-восьмью символами. Поэтому очевидно, что и при распознавании и оценке тембра используется не более семи-восьми существенных признаков.

 

 Таким образом, полученные результаты показывают, что, если в первый период изучения восприятия тембра (на основе классической теории Гельмгольца) была установлена четкая связь изменения тембра с изменением спектрального состава стационарной части звучания (составом обертонов, соотношением их частот и амплитуд и др.), то второй период этих исследований (с начала 60-х годов) позволил установить принципиальную важность спектрально-временных характеристик. В настоящее время начался третий период изучения проблемы тембра центр исследований переместился в сторону изучения влияния фазового спектра, а также к использованию психофизических критериев в распознавании тембров, лежащих в основе общего механизма распознавания звукового образа (группировка в потоки, оценка синхронности и др.).

 

 Это изменение структуры временной огибающей на всех этапах развития звука: атаки (что особенно важно для распознавания тембров различных источников), стационарной части и спада. Это и динамическое изменение во времени спектральной огибающей, в т.ч. смещение центроида спектра, т.е. смещение максимума спектральной энергии во времени, а также развитие во времени амплитуд спектральных составляющих, особенно первых пяти-семи «неразвернутых» гармоник спектра.