On-Line Библиотека www.XServer.ru - учебники, книги, статьи, документация, нормативная литература.
       Главная         В избранное         Контакты        Карта сайта   
    Навигация XServer.ru








 

Введение

      Среди терминов и магических понятий, окружающих пользователей
телефонных коммуникационных устройств, непременно встречается обоз-
начение какого-либо протокола сжатия информации. Так сложилось, что
публичной информации об этих функциональных возможностях модемов
несколько меньше, чем о других аспектах их использования. В значи-
тельной степени отсутствие публичной информации о двух наиболее ши-
роко распространенных стандартах этого класса - международном стан-
дарте CCITT (ныне ITU-T) V.42bis и промышленном стандарте MNP5 фирмы
Microcom - может объясняться их лицензионным характером. Производи-
тели модемов обязаны были (по крайней мере до недавнего времени) по-
купать у Microcom лицензию на право использования MNP5 (и более
старших уровней этого семейства протоколов), а патенты на реализацию
V.42bis принадлежат IBM и Unisys, несмотря на то, что алгоритм явля-
ется международным стандартом и опубликован CCITT. Данный материал
был задуман как справочная статья об этих протоколах и их сравнении
для широкого круга потребителей, а также как описание реализации
V.42bis в модемах серии AnCom(R) компании "Аналитик ТелекомСистемы".
Материал статьи разделен на слои по интересам читателя. Если Вас ин-
тересует только информация о том, что из себя представляют протоколы
сжатия при модемной передаче, Вы можете ограничиться Введением и
последней главой о сравнении протоколов. Если Вас интересует сам ал-
горитм V.42bis, его популярное изложение приведено в главе Как уст-
роен V.42bis. Ну и, наконец, если Вы читатель энциклопедического
склада и Вас интересуют тонкости мироустройства, то специально для
Вас глава Описание Реализации.


         История вопроса

      Во время работы над протоколом V.42, которая была завершена в
1988 году, исследовательская группа CCITT под экзотическим названием
XVII, пришла к выводу о необходимости включения процедуры сжатия в
модемы. Эта необходимость была обусловлена требованием увеличения
пропускной способности модема и предполагалось, что эта функциональ-
ная возможность будет расширением процедуры коррекции ошибок. Необ-
ходимо заметить, что разработка (или выбор существующего) алгоритма
сжатия для использования в модеме далеко не тривиальны. Дело в том,
что схема сжатия принципиально должна быть, во-первых, однопроходной
(где заканчивается сжимаемый поток просто неизвестно), во-вторых,
допускающей автоматическое поддержание идентичности управляющей ин-
формации на удаленном конце соединения (не передавать же словари,
индексы, таблицы частотности, либо что-то еще вместе со сжатым пото-
ком), и, наконец, в-третьих, эта схема должна быть алгоритмом реаль-
ного времени (реализация алгоритма должна успевать сжимать и расжи-
мать данные не медленнее, чем они передаются по каналу связи). Види-
мо, именно по этой причине было принято решение об использовании в
качестве базового варианта одного из существующих и использующихся в
модемах алгоритмов сжатия. Последовательно были исследованы алгорит-
мы BTLZ фирмы British Telecom, Hayes' System, MNP5 и MNP7 фирмы
Microcom, а также ACT Formula.
      В конечном итоге был выбран алгоритм BTLZ, подвергнут опреде-
ленной переработке, и, в конце концов, наречен V.42bis. V.42bis не
был опубликован в Blue Book от 1988 года, однако, в результате ин-
тенсивной деятельности CCITT, был обнародован в виде отдельного до-
кумента, подписанного 31 января 1990 года. Документ содержит, кроме
стандартного для CCITT бюрократического вступления, весьма формали-
зованное и корректное определение используемых терминов, параметров
и режимов работы алгоритма, достаточно полное, непротиворечивое и
формальное описание функционирования, логическое описание используе-
мых структур и необходимых преобразований данных. Документ снабжен
ссылками на идеологические источники и "рядом расположенные" стан-
дарты (что любопытно - нет ссылки на BTLZ), формальным описанием
структур данных, используемых при согласовании параметров в процессе
установлении соединения между модемами, диаграммами (почти блок-схе-
мами), иллюстрирующими функционирование Передатчика (Приемник остав-
лен в качестве домашнего задания) и рекомендациями разработчикам. С
точки зрения авторов документа место стандарта (видимо, топологичес-
кое) в существующей идеологии взимодействия компонент модема может
быть проиллюстрировано диаграммой, изображенной на рис. 1.
      В завершение необходимо заметить, что качество документа как
исходных спецификаций на разработку очень высоко.


         Несколько слов о физической сущности сжатия
         при модемной передаче

      Практически все носители информации (знаки, символы), исполь-
зуемые компьютерами, представляют из себя фиксированное количество
бит, кодирующих этот знак. Кодовые таблицы (например, ASCII) разра-
ботаны в расчете на фиксированную битовую длину, так как это повыша-
ет машинную эффективность обработки данных. Во многих машинах ис-
пользуются коды, выравненные на границу октета (8 бит). Фиксирован-
ная длина символов означает, что все передаваемые символы - одинако-
вой длины, даже если частота их передачи различна. Например, при пе-
редаче этого текста существенно более часто будут встречаться симво-
лы, представляющие строчные кириллические буквы, нежели чем символы
прописных латинских букв. Такого рода практика приводит к значитель-
ным потенциальным потерям при передаче информации.
      Один из наиболее часто применяемых подходов к решению этой
проблемы заключается в использовании кодов переменной длины для
представления символов постоянной длины. В таком случае наиболее
часто встречающиеся символы сжимаются - они представляются набором
бит, который короче, чем их традиционное битовое представление. Та-
кого рода технология может привести к значительному увеличению про-
пускной способности канала связи. Широко известный представитель ал-
горитмов этого типа - MNP5 фирмы Microcom.
      V.42bis не заменяет конкретные, наиболее часто встречающиеся
символы на более короткие кодовые слова, а делает это для последова-
тельностей символов (строк). Алгоритм использует словарь для сохра-
нения наиболее часто встречающихся строк вместе с кодовыми словами,
которые их представляют. Словарь строится и модифицируется динами-
чески.
      Размер словаря может быть различным, стандартизировано только
минимальное значение - 512 элементов (строк). Конкретное значение
выбирается обоими модемами при установлении соединения. Кроме того,
согласовывается максимальная длина строки, которая может быть сохра-
нена в словаре, в диапазоне от 6 до 250 символов. Пользователь дол-
жен представлять, что изменение этих параметров влияет на эффектив-
ность сжатия, причем это влияние и его направление зависит от харак-
тера передаваемых или принимаемых данных. Квазиоптимальные значения
этих параметров, рекомендации по результатам исследований этого ал-
горитма и способы влияния пользователя на функционирование V.42bis
будут кратко обсуждаться позже.
Содержание       Вперёд