Система экономических
классификаций, как и любая система, должна
представлять некую структуру, каждый из
элементов которой, в свою очередь, имеет
внутреннюю структуру (элементы внутренней
структуры и их связи) и взаимодействует с
внешней средой. Если перевести это на язык
классификаций, то внутренняя структура -
это группировки объектов классификации,
связи внутренней структуры - это взаимное
соотношение группировок объектов
классификации, а взаимодействие с внешней
средой - это взаимосвязи между
классификационными группировками
различных классификаций. Последнее
называют переходными ключами или
переходными таблицами. Во взаимосвязях же
есть два аспекта взаимосвязи группировок
на структурном уровне по входимости в них
объектов классификации и взаимосвязи на
лексико-семантическом уровне. Практически
задача создания системы взаимоувязанных
классификаций сводится к совмещению
классификаций на структурном и лексико-семантическом
уровнях.
Прежде чем рассматривать
состояние системы экономических
классификаций в России, хотелось бы
обратить внимание с системных позиций на
типовые ошибки, которые имеют место в
работах по классификациям.
Первая и наиболее
распространенная ошибка. Ставится задача
разработать переходной ключ между
классификациями, имеющими различные
объекты классификации, структуру
построения и не имеющими четко
обозначенных границ группировок, иными
словами, с отсутствующими описаниями
группировок и без толковых словарей.
Например, переходной ключ между
МСОК и ОКОНХ - в строгой постановке полная
бессмыслица. Если между ОКОНХ и МСОК вообще
нет ничего общего, то между ОКП и ТН ВЭД
общим является объект классификации -продукция.
Но поскольку ОКП и ТН ВЭД созданы для
различных задач и, как следствие, имеют
различную структуру построения, а ОКП не
имеет ни описания группировок, ни
толкования используемой терминологии,
переходной ключ между ними получился
многозначным с широкими границами
эквивалентности взаимного соответствия
группировок.
Для подобных случаев речь может
идти о поиске соответствия группировок
двух классификаций лишь на уровне
приближенного соответствия предметных
областей. Переходные ключи здесь выполняют
функцию навигации в базах данных
классификаторов, облегчая поиск зон этого
соответствия. Использование же для целей
статистики переходных ключей между
несовместимыми на структурном и лексико-семантическом
уровнях классификациями неизбежно
приводит к грубым искажениям в подготовке
исходных данных, не говоря уже о трудностях
и больших затратах на выполнение этой
задачи.
Вторая ошибка связана с первой и
состоит в том, что при разработке
классификации ставится изолированная
задача ее создания без учета последующего
использования для решения практических
задач и совмещения с другими
классификациями. Здесь опять делается
ставка на переходные ключи. К трудностям,
рассмотренным выше, в этом случае
добавляется еще и то, что эти ключи
необходимо поддерживать. Учитывая же, что
взаимосвязи классификаций сложные, в чем
нетрудно убедиться, ключей оказывается
много и не понимать, к чему это приводит,
было бы непростительно.
В качестве примера можно
привести разработку проекта
классификатора видов экономической
деятельности Статкомитета СНГ-ОКЭД. Вопрос
о том, как этот классификатор будет
совмещаться с международными и
национальными классификациями продукции и
услуг стран СНГ, авторы ОКЭД даже не
рассматривают, ограничиваясь тем, что
предлагают странам этот вопрос решать
самостоятельно. И если классификаторы
видов экономической деятельности
относительно небольшие по объему (содержат
порядка 500 группировок), то национальные
классификаторы продукции содержат до 50000
группировок. Сколько же нужно будет иметь
переходных ключей и какова трудоемкость их
поддержания между международными и
национальными классификациями видов
экономической деятельности, продукции и
услуг, в том числе между классификациями
бывшего Союза ССР, чтобы реализовать идею
единого информационного пространства
стран СНГ и в перспективе со странами ЕС?
Ведь до сих пор каждая из суверенных стран
СНГ идет в этом вопросе своим путем.
Третья ошибка связана с тем, что
до последнего времени не удавалось
совместить работы по экономическим
классификациям с их терминологическим
обеспечением. Исторически в бывшем Союзе
ССР и сейчас в России эти два
взаимосвязанных направления работ
существовали практически изолированно.
Необеспеченность же совместимости
классификаций на лексико-семантическом
уровне приводит к дополнительным
погрешностям в подготовке исходных данных
для статистики. Ни один из разработанных
пока в России классификаторов, кроме ОКДП,
не имеет толковых словарей, а описания
группировок содержатся только в ТН ВЭД и
ОКЗ.
Проблемы же с семантикой
начинаются еще с перевода международных
классификаций на русский язык, что делается
без какой-либо терминологической
экспертизы и системы. Наносимый таким
образом ущерб национальной системе
экономических классификаций очевиден.
Четвертая ошибка связана с
непониманием функций классификаторов как
единого языка представления и описания
данных в информационных системах. Этот
формализованный язык. язык кодов, как и
любой естественный язык для
формализованного описания данных, должен
быть однозначным. Наиболее важным является
обеспечение его устойчивости во времени (по
возможности мало изменять, корректировать
по четким правилам и с периодичностью не
чаще одного раза в год). Кроме того, он
интернационален, поскольку не имеет таких
границ как естественный язык, и позволяет
компактно представлять большие массивы
данных, что особенно важно для глобальных
информационных систем, каковой является
система Госкомстата России. В
отечественной же практике не сложилось
такого взгляда на функции классификаторов,
более того, установился порядок внесения
частых и неупорядоченных во времени
изменений в классификации с плохой
организацией доведения этих изменений до
всех пользователей. Это обстоятельство
также отрицательно влияет на качество
первичной информации для статистики и
статистической информационной системы в
целом.
Вообще вопрос качества
подготовки исходных данных для статистики
заслуживает самостоятельного рассмотрения.
Пятая ошибка состоит в
недостаточности внимания к представлению
классификаций в виде программных продуктов
с развитым сервисом для пользователей,
работающих в локальных сетях и в сетях с
телекоммуникационным доступом.
Необходимо обратить внимание еще
на один момент, являющийся часто предметом
горячих споров между разработчиками
классификаторов. Обсуждают вопрос, чей
классификатор лучше, забывая об основном
критерии его оценки: обеспечивает ли он и с
каким качеством перегруппировку данных из
своей классификационной структуры в
базовую, например, для национальных
классификаторов видов экономической
деятельности в МСОК или КДЕС. Основное же
внимание в споре уделяется системе
кодирования. Если обратиться к
рекомендациям Статистической Комиссии ООН
и Евростата, то в них указывается, что этот
вопрос является не принципиальным. Может
быть использована любая система
кодирования, что и подтверждает практика
создания национальных классификаций.
Другое дело, если речь идет о системе
взаимоувязанных классификаций, то в этом
случае к системе кодирования необходимо
относиться уже с несколько иных позиций,
поскольку она связана более жестко со
структурой группировок объектов
взаимоувязанных классификаций. Например, в
странах Европейского Союза рекомендована
для применения система сквозного
кодирования NACE - СРА PRODCOM. В этом случае NACE
целесообразно развивать на национальном
уровне в пределах четырех разрядов кода.
Однако и здесь возможны другие варианты
системы кодирования, но они значительно
усложняют взаимную увязку классификаций и,
как следствие, ухудшают качество
перегруппировки данных их национальной
структуры в базовую международную.
Код всегда был и остается только
идентификатором выбранной содержательной
классификационной структуры. Критериями же
соответствия двух классификаций является
соответствие по входимости в выделенные
группировки объектов классификации с
учетом семантики по их наименованиям. Так,
детальный анализ проекта классификатора
видов экономической деятельности (ОКЭД)
Статкомитета СНГ с простой системой
кодирования показал, что для значительного
числа группировок имеет место
неудовлетворительное их соответствие на
структурном и лексико-семантическом
уровнях исходной базовой структуре МСОК.
|