Разработка и внедрение классификаторов, стандартов и регистров на примере классификации вто (всемирной туристской организации) по статистическим данным - Характерные недостатки при разработке классификаций

On-Line Библиотека www.XServer.ru - учебники, книги, статьи, документация, нормативная литература.


Главная	В избранное	Контакты	Карта сайта

Навигация XServer.ru

Компьютеры

Кулинария

Медицина

Нормативная лит.

Типовые договора

Общие темы

Рецепты

3. Характерные недостатки при разработке классификаций

Система экономических классификаций, как и любая система, должна представлять некую структуру, каждый из элементов которой, в свою очередь, имеет внутреннюю структуру (элементы внутренней структуры и их связи) и взаимодействует с внешней средой. Если перевести это на язык классификаций, то внутренняя структура - это группировки объектов классификации, связи внутренней структуры - это взаимное соотношение группировок объектов классификации, а взаимодействие с внешней средой - это взаимосвязи между классификационными группировками различных классификаций. Последнее называют переходными ключами или переходными таблицами. Во взаимосвязях же есть два аспекта взаимосвязи группировок на структурном уровне по входимости в них объектов классификации и взаимосвязи на лексико-семантическом уровне. Практически задача создания системы взаимоувязанных классификаций сводится к совмещению классификаций на структурном и лексико-семантическом уровнях.

Прежде чем рассматривать состояние системы экономических классификаций в России, хотелось бы обратить внимание с системных позиций на типовые ошибки, которые имеют место в работах по классификациям.

Первая и наиболее распространенная ошибка. Ставится задача разработать переходной ключ между классификациями, имеющими различные объекты классификации, структуру построения и не имеющими четко обозначенных границ группировок, иными словами, с отсутствующими описаниями группировок и без толковых словарей.

Например, переходной ключ между МСОК и ОКОНХ - в строгой постановке полная бессмыслица. Если между ОКОНХ и МСОК вообще нет ничего общего, то между ОКП и ТН ВЭД общим является объект классификации -продукция. Но поскольку ОКП и ТН ВЭД созданы для различных задач и, как следствие, имеют различную структуру построения, а ОКП не имеет ни описания группировок, ни толкования используемой терминологии, переходной ключ между ними получился многозначным с широкими границами эквивалентности взаимного соответствия группировок.

Для подобных случаев речь может идти о поиске соответствия группировок двух классификаций лишь на уровне приближенного соответствия предметных областей. Переходные ключи здесь выполняют функцию навигации в базах данных классификаторов, облегчая поиск зон этого соответствия. Использование же для целей статистики переходных ключей между несовместимыми на структурном и лексико-семантическом уровнях классификациями неизбежно приводит к грубым искажениям в подготовке исходных данных, не говоря уже о трудностях и больших затратах на выполнение этой задачи.

Вторая ошибка связана с первой и состоит в том, что при разработке классификации ставится изолированная задача ее создания без учета последующего использования для решения практических задач и совмещения с другими классификациями. Здесь опять делается ставка на переходные ключи. К трудностям, рассмотренным выше, в этом случае добавляется еще и то, что эти ключи необходимо поддерживать. Учитывая же, что взаимосвязи классификаций сложные, в чем нетрудно убедиться, ключей оказывается много и не понимать, к чему это приводит, было бы непростительно.

В качестве примера можно привести разработку проекта классификатора видов экономической деятельности Статкомитета СНГ-ОКЭД. Вопрос о том, как этот классификатор будет совмещаться с международными и национальными классификациями продукции и услуг стран СНГ, авторы ОКЭД даже не рассматривают, ограничиваясь тем, что предлагают странам этот вопрос решать самостоятельно. И если классификаторы видов экономической деятельности относительно небольшие по объему (содержат порядка 500 группировок), то национальные классификаторы продукции содержат до 50000 группировок. Сколько же нужно будет иметь переходных ключей и какова трудоемкость их поддержания между международными и национальными классификациями видов экономической деятельности, продукции и услуг, в том числе между классификациями бывшего Союза ССР, чтобы реализовать идею единого информационного пространства стран СНГ и в перспективе со странами ЕС? Ведь до сих пор каждая из суверенных стран СНГ идет в этом вопросе своим путем.

Третья ошибка связана с тем, что до последнего времени не удавалось совместить работы по экономическим классификациям с их терминологическим обеспечением. Исторически в бывшем Союзе ССР и сейчас в России эти два взаимосвязанных направления работ существовали практически изолированно. Необеспеченность же совместимости классификаций на лексико-семантическом уровне приводит к дополнительным погрешностям в подготовке исходных данных для статистики. Ни один из разработанных пока в России классификаторов, кроме ОКДП, не имеет толковых словарей, а описания группировок содержатся только в ТН ВЭД и ОКЗ.

Проблемы же с семантикой начинаются еще с перевода международных классификаций на русский язык, что делается без какой-либо терминологической экспертизы и системы. Наносимый таким образом ущерб национальной системе экономических классификаций очевиден.

Четвертая ошибка связана с непониманием функций классификаторов как единого языка представления и описания данных в информационных системах. Этот формализованный язык. язык кодов, как и любой естественный язык для формализованного описания данных, должен быть однозначным. Наиболее важным является обеспечение его устойчивости во времени (по возможности мало изменять, корректировать по четким правилам и с периодичностью не чаще одного раза в год). Кроме того, он интернационален, поскольку не имеет таких границ как естественный язык, и позволяет компактно представлять большие массивы данных, что особенно важно для глобальных информационных систем, каковой является система Госкомстата России. В отечественной же практике не сложилось такого взгляда на функции классификаторов, более того, установился порядок внесения частых и неупорядоченных во времени изменений в классификации с плохой организацией доведения этих изменений до всех пользователей. Это обстоятельство также отрицательно влияет на качество первичной информации для статистики и статистической информационной системы в целом.

Вообще вопрос качества подготовки исходных данных для статистики заслуживает самостоятельного рассмотрения.

Пятая ошибка состоит в недостаточности внимания к представлению классификаций в виде программных продуктов с развитым сервисом для пользователей, работающих в локальных сетях и в сетях с телекоммуникационным доступом.

Необходимо обратить внимание еще на один момент, являющийся часто предметом горячих споров между разработчиками классификаторов. Обсуждают вопрос, чей классификатор лучше, забывая об основном критерии его оценки: обеспечивает ли он и с каким качеством перегруппировку данных из своей классификационной структуры в базовую, например, для национальных классификаторов видов экономической деятельности в МСОК или КДЕС. Основное же внимание в споре уделяется системе кодирования. Если обратиться к рекомендациям Статистической Комиссии ООН и Евростата, то в них указывается, что этот вопрос является не принципиальным. Может быть использована любая система кодирования, что и подтверждает практика создания национальных классификаций. Другое дело, если речь идет о системе взаимоувязанных классификаций, то в этом случае к системе кодирования необходимо относиться уже с несколько иных позиций, поскольку она связана более жестко со структурой группировок объектов взаимоувязанных классификаций. Например, в странах Европейского Союза рекомендована для применения система сквозного кодирования NACE - СРА PRODCOM. В этом случае NACE целесообразно развивать на национальном уровне в пределах четырех разрядов кода. Однако и здесь возможны другие варианты системы кодирования, но они значительно усложняют взаимную увязку классификаций и, как следствие, ухудшают качество перегруппировки данных их национальной структуры в базовую международную.

Код всегда был и остается только идентификатором выбранной содержательной классификационной структуры. Критериями же соответствия двух классификаций является соответствие по входимости в выделенные группировки объектов классификации с учетом семантики по их наименованиям. Так, детальный анализ проекта классификатора видов экономической деятельности (ОКЭД) Статкомитета СНГ с простой системой кодирования показал, что для значительного числа группировок имеет место неудовлетворительное их соответствие на структурном и лексико-семантическом уровнях исходной базовой структуре МСОК.

Назад Главная Вперёд

Главная | Контакты | Карта сайта