Звук в двоичном коде

Звук, который мы слышим – это продольная волна в воздухе. Чтобы представить звук в двоичном коде, читаемом компьютером, нужно сделать некоторые преобразования. Сначала звуковой сигнал с помощью микрофона преобразовывают в электрический аналог звука. Электрический аналог получается в непрерывной форме и не пригоден для обработки на компьютере. Чтобы получить сигнал в двоичном коде, надо пропустить его через аналого-цифровой преобразователь (АЦП). При воспроизведении звука в двоичном коде происходит обратное преобразование – цифро-аналоговое (через ЦАП). АЦП и ЦАП находятся в звуковой карте компьютера.

Чтобы представить звук в двоичном коде, читаемом компьютером, нужно сделать некоторые преобразования

Чтобы представить звук в двоичном коде непрерывный сигнал дискретизируется по времени и по уровню. При дискретизации по времени весь период времени Т разбивается на малые интервалы Δt, точками: t1, t2...tn. Считается, что в течение интервала Δt уровень сигнала изменяется незначительно и с некоторым допущением постоянный. Величину V = 1/Δt называют частотой дискретизации, которая измеряется в герцах (Гц) – количество измерений в течение секунды.

Дискретизация по уровню непрерывного сигнала называется квантованием и выполняется так: область изменения сигнала от самого малого значения Xmin до самого большого значения Xmax разбивается на N равных квантов, промежутков величиной:

ΔХ = (Хmax – Хmin)/N,

точками Х1, Х2, ... Хn. Хi = Хmin + ΔХ*(i-1).

Каждый квант связывается с его порядковым номером, т.е. целым числом, легко переводимым в двоичную систему счисления. Если сигнал после дискретизации по времени попадает в промежуток Xі-1 ≤ X ≤ Xі, то ему в соответствие ставится код і.

Но на практике при преобразовании звука в двоичный код, возникают два вопроса: как часто по времени и с какой точностью надо измерять сигнал, чтобы получить при воспроизведении звук удовлетворительного качества.

На первый вопрос дает ответ теорема Найквиста, которая утверждает, что, если сигнал оцифрован с частотой V, то высшая "слышимая" частота будет не более V/2. Второй вопрос решается подбором числа уровней так, чтобы звук не имел высокого уровня шума. При этом число уровней берется как 2n, где n = 8 или n = 16, т.е. каждое измерение занимает один или два байта.

Для аудиодиска высокое качество воспроизведения звука в двоичном коде получается при следующих параметрах оцифровки: частота дискретизации – 44,1 КГц, квантование – 16 бит, т. е. ΔХ = (Хmax – Хmin)/216. Таким образом, 1 с стереозвука займет 2 байт*44100 байт/с * 2 кан * 1 с = 176 400 байт дисковой памяти. Качество воспроизведения звука в двоичном коде при этом получается очень высоким.

Инструменты