Добавить в цитаты Настройки чтения

Страница 5 из 11



Подсчитаем затраты памяти для хранения одной неподвижной картинки экрана. Экран (VGA) содержит 640×480=307200 пикселов. Если используется 256 цветов, то для хранения пиксела потребуется 8 бит. Значит, всего потребуется 0,29 Мбайт. А при высококачественной передаче цветовой палитры (24-битный цвет) потребуется в 3 раза больше – 0,87 Мбайт. Данные для мониторов с разным разрешением приведены в табл. 1.1.

Таблица 1.1

Телевизионный стандарт предполагает представление изображений последовательностью кадров, сменяющихся 25 раз в секунду. Для хранения секундного видеоролика в этом случае может потребоваться (из табл. 1) при 24 бит/пиксел скорость 21,75-93,75 Мбайт/с, а при 32 бит/пиксел – соответственно 29-125 Мбайт/с.

При этом видеофильм длительностью, например, 1 час 33 мин 50 с займет, как минимум, 119,58 Гбайт при 24 бит/пиксел и частоте 25 кадров/c или 191,33 Гбайт при 32 бит/пиксел и частоте 30 кадров/c. Столько не вместит и самый емкий цифровой многофункциональный диск (Digital Versatile Disk, DVD) [9, 10], а самые быстрые каналы Internet не обеспечат передачу таких объемов информации.

Скорость передачи неподвижного изображения объемом в 1 Мб из видеопамяти ПК на экран при частоте регенерации 60-100 Гц составляет 60-100 Мбайт/c, а объемом 3,75 Мбайт (24 бит/пиксел), как следует из табл. 1.1, – соответственно 225-375 Мбайт/с.

Такими объемами памяти, а также требуемыми для передачи изображений в режиме РВ высокоскоростными каналами современные ПК пока не обладают. На преодоление именно трудностей хранения и воспроизведения в режиме РВ звуковой и видеоинформации как раз и направлены в настоящее время усилия многих разработчиков средств ММ. Проанализируем типовые варианты решения этой проблемы.

Только увеличение скорости CD-ROM-дисковода в 48 раз до 7,03 Мбайт/с и даже в 96 раз до 14,06 Мбайт/с проблему не решает. Но есть еще несколько путей решения подобных проблем, когда можно попытаться уменьшить

◆ поток данных (26,4 Мбайт/с – из табл.1.1 для VGA, 24 бит/пиксел, 30 кадров/с). Например, уменьшить с 640×480 до 320×240, то есть в 4 раза. При этом скорость уменьшится (при скорости 30 кадров/с) до 6,6 Мбайт/с;

◆ скорость вывода видеокадров с 30 до 15 кадров/с. При этом скорость передачи составит уже 3,3 Мбайт/с;

◆ число цветов, а значит и битов на 1 пиксел с 24 до 8. Скорость передачи уменьшится до 1,1 Мбайт/с.

Но все эти пути связаны с существенным снижением качества изображения.

Осталось весьма эффективное средство – сжатие (компрессия) данных. Именно здесь и скрывается приемлемое решение проблемы. Методы сжатия аудио- и видеоинформации реализуются в настоящее время программным путем, хотя, в принципе, возможна и аппаратная реализация. К сожалению, сжатие также может привести к потерям в качестве различной степени в зависимости от степени и метода компрессии [3-8].

Полезными оказываются и программные методы редуцирования, которые позволяют разделить кадр на ряд фрагментов (подвижных и неподвижных) и для каждого фрагмента применить свой оптимальный метод кодирования. Позже мы обсудим такие подходы и методы.

Популярен и «пассивный» подход, когда видеокадры вообще не оцифровываются, а просто по мере необходимости показываются на мониторе ПК. Конечно, ни о какой обработке в данном случае говорить не приходится. Видеокадры подаются прямо на видеовход дисплея ПК, минуя процессорный блок. На экране дисплея для них выделяется некоторая зона. ПК не может управлять процессом такого вывода.

Такой подход вполне применим в ситуациях, когда необходимо показывать на экране последовательности кадров с видеомагнитофона (проигрывателя видеодисков, CD/DVD-плеера). ПК может управлять этим процессом через видеомагнитофон (плеер), выбирая нужные кадры. Соответствующие средства в виде относительно недорогих интерфейсных карт давно имеются в продаже (например, начиная с Screenmachine или David). Приобретая подобную аппаратуру, следует обращать внимание не только на возможности реализации сложных алгоритмов управления, но и на обеспечение необходимого качества воспроизведения аудио- и видеоинформации [4].

Возвращаясь к примеру с фильмом длительностью 1 час 33 мин 50 с, отметим, что его файл в формате оцифрованного видео (AVI) занимает 687 Мбайт, то есть помещается на CD, рассчитан на просмотр в окне 512×240, хотя может быть «растянут» во весь экран без особой потери качества.



1.1.4. Типы и форматы файлов мультимедиа

Рассмотрим основные ММ компоненты: текстовые и гипертекстовые, графические и гиперграфические, звуковые, видеокомпоненты и анимации, интерактивные трехмерные представления, а также соответствующие каждому из них типы и форматы файлов.

Набор правил, по которым сохраняются данные в файле, называется форматом файла. Различные типы файлов используют различные форматы. В общем случае для одного типа файлов может быть определено несколько разных форматов. Формат файла определяется по расширению имени файла. Как правило, форматы файлов создаются для использования в строго определенной прикладной программе, хотя бывают и универсальные форматы [4].

Текстовые файлы создаются в среде текстовых процессоров или специализированных приложений, в результате компьютерного сканирования и распознавания печатных документов или распознавания речи. Наиболее популярны следующие форматы текстовых файлов [4]:

◆ Американский стандартный код для информационного обмена (American Standard Code for Information Interchange, ASCII) (.txt) – формат текстовых файлов в DOS-кодировке;

◆ формат текстовых файлов Американского национального института стандартов (American National Standards Institute, ANSI) (.txt) для кодовой страницы Microsoft (MS) Windows;

◆ формат MS Word для Windows (.doc) – поддерживаемый всеми формат Microsoft;

◆ формат документов (Rich Text Format, RTF) (.rtf) – поддерживаемый всеми формат Microsoft. Сохраняет исходное форматирование, а также стили начертания символов. Файлы могут содержать графические картинки с различными параметрами. Поддерживает 256 цветов;

◆ формат передаваемого документа (Portable Document Format, PDF) (.pdf) – обеспечивает получение точной копии необходимого документа.

С фрагментами этих файлов можно работать, как с текстом. Заметим, что последний формат фактически обеспечивает представление изображения текста и иллюстраций документа. В этой связи необходимо также отметить близкие по назначению к тестовым новые форматы:

◆ графический формат DJVU (дежавю) (.djvu) – применяется для создания и размещения в Internet отсканированных книг (сканированных объемных документов) без распознавания текста. Обеспечивает компактное представление графического материала. Это лучший формат для электронного представления в Internet научной и технической литературы, стандарт де-факто для электронных библиотек;

◆ формат FictionBook2 (FB2) (.fb2) – для создания электронных книг. Он является открытым, основан на расширяемом языке разметки (eXtensible Markup Language, XML) [11].

Гипертекст. Важнейшим средством структурирования информации является гипертекст (ГТ) (Hypertext – нелинейный текст) – информационная структура, состоящая из дискретных узлов данных и семантических связей между ними, где узел – текст или ГТ, а связи могут быть локальными, глобальными и смешанными. То есть ГТ – это некоторая метаструктура текста, которая может быть и многоуровневой, со сложными семантическими сетевыми отношениями между различными фрагментами текста [12]. По сути, значение ГТ может быть приравнено к значению книгопечатания. История ГТ начинается с середины 40-х годов:

◆ 1945 г. – Ванневар Буш (советник президента США Франклина Делано Рузвельта) предложил саму идею ГТ;