Звук в двоичном коде
Звук, который мы слышим – это продольная волна в воздухе. Чтобы представить звук в двоичном коде, читаемом компьютером, нужно сделать некоторые преобразования. Сначала звуковой сигнал с помощью микрофона преобразовывают в электрический аналог звука. Электрический аналог получается в непрерывной форме и не пригоден для обработки на компьютере. Чтобы получить сигнал в двоичном коде, надо пропустить его через аналого-цифровой преобразователь (АЦП). При воспроизведении звука в двоичном коде происходит обратное преобразование – цифро-аналоговое (через ЦАП). АЦП и ЦАП находятся в звуковой карте компьютера.
Чтобы представить звук в двоичном коде непрерывный сигнал дискретизируется по времени и по уровню. При дискретизации по времени весь период времени Т разбивается на малые интервалы Δt, точками: t1, t2...tn. Считается, что в течение интервала Δt уровень сигнала изменяется незначительно и с некоторым допущением постоянный. Величину V = 1/Δt называют частотой дискретизации, которая измеряется в герцах (Гц) – количество измерений в течение секунды.
Дискретизация по уровню непрерывного сигнала называется квантованием и выполняется так: область изменения сигнала от самого малого значения Xmin до самого большого значения Xmax разбивается на N равных квантов, промежутков величиной:
точками Х1, Х2, ... Хn. Хi = Хmin + ΔХ*(i-1).
Каждый квант связывается с его порядковым номером, т.е. целым числом, легко переводимым в двоичную систему счисления. Если сигнал после дискретизации по времени попадает в промежуток Xі-1 ≤ X ≤ Xі, то ему в соответствие ставится код і.
Но на практике при преобразовании звука в двоичный код, возникают два вопроса: как часто по времени и с какой точностью надо измерять сигнал, чтобы получить при воспроизведении звук удовлетворительного качества.
На первый вопрос дает ответ теорема Найквиста, которая утверждает, что, если сигнал оцифрован с частотой V, то высшая "слышимая" частота будет не более V/2. Второй вопрос решается подбором числа уровней так, чтобы звук не имел высокого уровня шума. При этом число уровней берется как 2n, где n = 8 или n = 16, т.е. каждое измерение занимает один или два байта.
Для аудиодиска высокое качество воспроизведения звука в двоичном коде получается при следующих параметрах оцифровки: частота дискретизации – 44,1 КГц, квантование – 16 бит, т. е. ΔХ = (Хmax – Хmin)/216. Таким образом, 1 с стереозвука займет 2 байт*44100 байт/с * 2 кан * 1 с = 176 400 байт дисковой памяти. Качество воспроизведения звука в двоичном коде при этом получается очень высоким.