Страница 245 из 436

Интернет-журнал "Домашняя лаборатория", 2007 №8

Восемь входных отсчетов из временной области сначала разделяются (или прореживаются) на четыре группы 2-точечных ДПФ. Затем четыре 2-точечных ДПФ объединяются в два 4-точечных ДПФ. Затем два 4-точечных ДПФ объединяются для того, чтобы получить окончательный результат Х(k). Подробно процесс рассмотрен на рис. 5.15, где показаны все операции умножения и суммирования. Нетрудно заметить, что базовая операция «бабочки» 2-точечного ДПФ формирует основу для всего вычисления. Вычисление осуществляется в трех каскадах. После того, как заканчивается вычисление первого каскада, нет необходимости сохранять какие-либо предыдущие результаты.

Результаты вычисления первого каскада могут быть сохранены в тех же самых регистрах или ячейках памяти, которые первоначально хранили исходные отсчеты из временной области х(n). Точно так же, когда заканчивается вычисление второго каскада, результаты вычисления первого каскада могут быть удалены. Таким же образом осуществляется вычисление последнего каскада, заменяя в памяти промежуточный результат вычисления предыдущего каскада. Обратите внимание, что для того, чтобы алгоритм работал должным образом, входные отсчеты по времени х(n) должны быть упорядочены определенным образом с использованием алгоритма реверсирования битов.

Алгоритм реверсирования битов, используемый для реализации прореживания по времени, представлен на рис. 5.16. Десятичный индекс n преобразуется в его двоичный эквивалент. Затем двоичные разряды располагаются в обратном порядке и преобразуются обратно в десятичное число. Реверсирование битов часто выполняют аппаратурой ЦОС в генераторе адреса данных (DAG), упрощая таким образом программное обеспечение, сокращая количество дополнительных операций и ускоряя вычисления.

На рис. 5.17 и 5.18 представлено вычисление БПФ с использованием алгоритма с прореживанием по частоте (DIF).

Этот метод требует, чтобы алгоритм реверсирования был применен к адресам выходных отсчетов Х(k). Обратите внимание, что «бабочка» для алгоритма с прореживанием по частоте (DIF) слегка отличается от «бабочки» для алгоритма с прореживанием по времени, как это показано на рис. 5.19.

Использование алгоритмов с прореживанием по времени, по сравнению с алгоритмами с прореживанием по частоте, в значительной степени является вопросом предпочтения, так как оба алгоритма дают одинаковый результат. Определенные ограничения той или иной системы могут сделать одно из двух решений оптимальным.

Необходимо отметить, что алгоритмы, требуемые для вычисления обратного БПФ, почти идентичны тем, которые необходимы для вычисления прямого БПФ, если принять во внимание, что речь идет об использовании комплексного БПФ. В действительности, полезный метод проверки алгоритма комплексного БПФ состоит в осуществлении БПФ с отсчетами из временной области х(n), а затем — в вычислении обратного БПФ с отсчетами из частотной области Х(k). В конце этого процесса должны быть получены первоначальные отсчеты из временной области Re х(n), а мнимая часть Im х(n) должна быть нулевой (в пределах ошибки математического округления).

Обсуждавшиеся до сих пор БПФ представляют алгоритм БПФ по основанию 2, то есть их вычисление основано на 2-точечных базовых операциях типа «бабочка».

Подразумевается, что число точек в БПФ должно быть степенью числа 2. Если число точек в БПФ является степенью числа 4, то БПФ может быть разделено на множество 4-точечных ДПФ, показанное на рис. 5.20. Такое преобразование называется алгоритмом БПФ по основанию 4.

Базовая операция «бабочка» БПФ по основанию 4 с прореживанием по частоте представлена на рис. 5.21.

Алгоритм БПФ по основанию 4 требует меньшего количества умножений с комплексными числами, но большего количества операций суммирования, чем БПФ по основанию 2 для такого же количества точек. По сравнению с алгоритмом БПФ по основанию 2, алгоритм по основанию 4 использует более сложную адресацию и дополнительные коэффициенты поворота, но меньшее количество вычислений. Окончательная экономия времени вычисления различается для разных DSP, но алгоритм БПФ по основанию 4 может быть более чем вдвое быстрым, чем алгоритм по основанию 2 для DSP с оптимальной архитектурой.

Аппаратная реализация и время выполнения алгоритмов БПФ

В общем случае, требования по используемой памяти для N-точечного БПФ следующие:

N ячеек для вещественных данных, N ячеек для мнимых данных и N ячеек для синусоидальных базисных функций (иногда упоминаемых, как коэффициенты поворота). Дополнительные ячейки памяти будут требоваться в случае использования взвешивания с использованием оконных функций (windowing). Если принятые требования по памяти удовлетворены, DSP должен выполнить необходимые вычисления за требуемое время. Многие производители DSP либо проводят тест производительности для указанного размера БПФ, либо определяют время вычисления для базовой операции «бабочка». При сравнении характеристик БПФ важно удостовериться, что во всех случаях используется одинаковый тип БПФ. Например, тест 1024-точечного БПФ на одном DSP, полученном с помощью алгоритма БПФ по основанию 2, не должен сравниваться с тестом алгоритма БПФ по основанию 4 для другого DSP.

Другое соображение относительно БПФ заключается в выборе процессора с фиксированной или с плавающей точкой. Значения, соответствующие результатам вычисления «бабочки», могут быть больше, чем исходные данные при вычислении «бабочки». Это увеличение обрабатываемых числовых значений может создавать потенциальную проблему в DSP с фиксированным числом разрядов. Для предотвращения переполнения, данные следует масштабировать, заранее оставляя достаточное количество дополнительных разрядов для увеличения значений обрабатываемых данных. Альтернативный метод заключается в том, что данные могут масштабироваться после каждого каскада вычисления БПФ. Методика масштабирования данных после каждого прохода БПФ известна как блочная плавающая точка (block floating point). Он называется так, потому что полный массив данных масштабируется как единое целое, независимо от того, действительно ли каждый элемент в блоке требует масштабирования. Блок масштабируется таким образом, чтобы относительные соотношения между данными остались прежними. Например, если каждое слово данных сдвинуто вправо на один разряд (поделено на 2), абсолютные значения изменяются, но относительно друг друга соотношения данных остаются прежними.

В 16-разрядном DSP-процессоре с фиксированной точкой после умножения формируется 32-разрядное слово. Семейство цифровых сигнальных процессоров Analog Devices ADSP21xx характеризуется расширенным динамическим диапазоном, который реализуется в операциях умножения с накоплением посредством 40-разрядного внутреннего регистра аккумулятора.

Использование DSP-процессора с плавающей точкой устраняет потребность в масштабировании данных и поэтому приводит к более простой реализации алгоритма БПФ, но следствием этого упрощения является увеличение времени обработки, которое требуется для сложных арифметических вычислений с плавающей точкой. Кроме того, 32-разрядный DSP-процессор с плавающей точкой, очевидно, будет иметь меньший уровень шумов округления, чем 16-разрядный DSP-процессор с фиксированной точкой. На рис. 5.22 приведены данные по реализации БПФ для популярных DSP-процессоров Analog Devices. В частности, что DSP-процессор ADSP-TS001 TigerSHARC™ предлагает оба режима: и с плавающей, и с фиксированной точкой, обеспечивая, таким образом, исключительную гибкость программирования.