Начнем с поисков различий между аналоговым и цифровым звуком. Что есть звук? Правильно, колебания звуковых волн в пространстве. Для обработки и усиления звуковые колебания сначала преобразовываются в электрические, обрабатываются, а затем преобразовываются обратно в звуковые. Как выглядит обычный звуковой сигнал, показано на рисунке ниже. В английской литературе осциллограмма звукового сигнала часто называется waveform. На русский язык иногда переводят дословно – волновая форма, что не совсем правильно.
Будем применять непосредственный универсальный термин – сигнал. Ваш голос, записанный с микрофона, песня со старой грампластинки, дорожка компакт-диска, синтезированная композиция – все это для компьютера сигналы, с которыми вы будете работать.
На рисунке показана только часть композиции. Можно увеличивать масштаб до бесконечности, форма сигнала остается, меняется только масштаб.
Чтобы звук перевести в цифровую форму, его надо оцифровать. Оцифровывают аналоговый сигнал путем измерения мгновенных уровней сигнала и последовательной записи этих значений в файл. На рисунке измеряемые значения на исходной кривой отмечены точками.
Между измерениями существуют интервалы, длительность которых определяется частотой дискретизации. Чем больше частота дискретизации, тем меньше интервал, тем точнее повторится форма исходного сигнала. То есть частота дискретизации определяет допустимый частотный диапазон входного сигнала. По теореме Котельникова она должна быть в два раза выше максимальной частоты измеряемого сигнала. Вот откуда взялась частота дискретизации 44 кГц. Это удвоенная частота слышимого человеком звука, теоретически.
Посмотрим еще раз на рисунок. Есть что-то неправильное. Ведь сигнал от одного замера до другого может измениться несколько раз, а это значит, что частота дискретизации выбрана гораздо ниже необходимой и в результате сигнал оцифруется с большими искажениями. Сигнал с необходимой частотой дискретизации будет выглядеть, как показано на следующем рисунке. Как видим, в этом случае разницей в замерах действительно можно пренебречь.
Другой важный параметр – разрядность преобразования. Он определяет точность замера мгновенной величины сигнала. Сигнал измеряется с шагом, соответствующим одному интервалу из максимального количества интервалов, на которые условно делится сигнал при измерении. Следовательно, точность преобразования составляет + 1 интервал. Обыкновенно применяют 8-, 16– и 20-битные преобразования. Разрядность преобразования определяется звуковой картой, а именно АЦП, с помощью которого оцифровывают сигнал. Например, при преобразовании входного сигнала с максимальным значением 100 % 8-битным преобразователем погрешность сигнала будет составлять 100/2>8 = +0, 4 %, а для 16-битного преобразования 100/2>16 = +0, 0015 %. Чтобы разъяснить эти сухие цифры, рассмотрим процесс «оцифровки» на рисунке. Для наглядности будем считать, что АЦП звуковой карты у нас трехбитовый (ужас какой!). Пунктирной линией показан результат преобразования входного сигнала.
Соответственно погрешность в этом случае громадная – 100/2>3 = ±12, 5 %. Итак, мы видим, что чем выше разрядность преобразования, тем точнее повторяется форма исходного сигнала. Естественно, как при увеличении частоты дискретизации, так и при увеличении разрядности преобразования геометрически увеличивается объем конечного файла. Стандартным для современных звуковых карт являются значения 44 кГц частоты дискретизации и 16 бит разрядности преобразования. При этих параметрах объем файла составляет около 10 Мб на 1 минуту звука. Это много, даже при современных объемах винчестеров, не говоря о переносных устройствах.