Страница 9 из 19
Рассмотрим основные системы классификации знаний: иерархическую, морфологическую, древовидную, реляционную.
Классификация как метод научной систематики играет важную роль в формировании ядра знаний того или иного научного направления. Классификационные системы такого типа имеют выраженную иерархическую структуру, в которой все объекты (понятия, факты) разделены на уровни, связанные между собой отношением «старший – младший».
Классификация может проявить себя не только как инструмент организации научных знаний, но и как фактор социального порядка, способствующий активизации социальных отношений. Так, существующие системы тарифов и ставок, ученых степеней и званий, структура должностей и служебных постов в гражданской службе и армии играют не только организующую, но и стимулирующую роль. Подобная модель классификации знаний получила в науке и практике название иерархической.
Достоинства данной системы классификации заключаются в том, что она проста в освоении, легко обновляется и эффективно решает задачу разнесения новых понятий по иерархическим уровням.
Недостатки иерархической модели знаний: прямые связи между понятиями соседних уровней обозначены слабо, или вовсе отсутствуют; иерархическая классификация наиболее эффективна, когда при переходе от уровня к уровню работает один и тот же тип отношений, например, родовидовой.
Систематика, лежащая в основе классификации, может применяться как сильное средство исследования. Так, иногда оказывается полезным при рассмотрении группы объектов выделить несколько характерных для них признаков в качестве определяющих и ввести меру степени их проявления. Подобный подход называется морфологическим, так как использует идею разложения объекта на его части (признаки). Часто подобная группировка приводит к выявлению неизвестных закономерностей, связывающих объекты каждой группы.
Упомянутые выше недостатки иерархической модели классификации свойственны и морфологическим моделям. Их удается устранить, используя так называемые ветвящиеся (древовидные) структуры (модели) представления знаний, которые, в частности, лежат в основе актуальных в контексте развития Интернет гипертекстовых технологий. В последнее время исследователи активно разрабатывают способы автоматического построения гипертекстов. Идея динамического гипертекста состоит в том, что вместо разбивки текста на фиксированные узлы, текст связывается большим количеством связей между входящими в текст одноименными поисковыми единицами: словами, терминами, текстовыми константами и т. д. Разработанная в ИПИ РАН по концепции динамического гипертекста система ТЕРМИН-3[51] обеспечивает построение гипертекстовых сред в автоматическом режиме. Система предназначена для разработки конкретных гипертекстов, информационно-поисковых систем фактографического типа, электронных книг и тезаурусов, частотных словарей и т. п.
Отдельные понятия, факты, знания, связаны между собой отношениями, выражающими суть имеющихся между ними связей. Как и в иерархической модели, это могут быть родовидовые отношения, но также и другие типы отношений: «быть представителем», «иметь», «наследовать» и т. п. Однозначность связей в древовидной структуре и разнообразие охватываемых ею отношений позволяет повысить «динамизм» системы знаний. Действительно, система знаний, представленной иерархической или морфологической моделями, статична (декларативна).
В древовидной структуре можно прослеживать восходящие и нисходящие ветви связей, делая как индуктивные (от частного к общему) и дедуктивные (от общего к частному), так и индуктивно-дедуктивного выводы.
Благодаря такой организации представленные знания получают как дополнение к декларативности процедуральность, т. е. способность к выводу общих знаний из структуры отношений и понятий. Древовидная структура знаний, несмотря на ее простоту и распространенность в информационном обмене, все-таки специфична. В ней, как и в предыдущей модели знаний, заложена парадигма иерархичности. В то же время некоторая система знаний может не соответствовать этой парадигме.
Например, совокупность знаний, описывающих конкретный трудовой коллектив, многоаспектна, и часто не удается установить отношения иерархии (род-вид), хотя связь между ними имеет место. Вот один из возможных аспектов: все представители трудового коллектива могут быть включены в алфавитный список с указанием табельного номера, года рождения, специальности и т. п. – «Список 1». Другой аспект: все члены коллектива работают на условиях сдельной оплаты, и величина их заработка определяется единой тарифной сеткой. Поэтому список специальностей и разрядов с указанием стоимости часа рабочего времени дает представление о системе оплаты труда. Назовем этот список – «Список 2». Третий аспект: при начислении зарплаты необходимо учитывать фактическую выработку работника на протяжении некоторого периода. Поэтому список, состоящий из табельных номеров и фактически проработанного каждым времени, – это «Список 3».
Все три списка содержат необходимый объем знаний о трудовом коллективе в контексте начисления заработной платы. Подобные модели представления знаний, состоящие из связанных списочных структур, получили название реляционных[52].
В реляционных моделях удается представить более сложные области знаний. В них каждый из аспектов может рассматриваться как автономный блок, внутри которого допускаются изменения. Удобным средством является комбинация устойчивых и изменяемых знаний. Так, знания Списка 2 длительно устойчивы. В Списке 1 представлены знания, которые могут меняться с течением времени – текучесть кадров, изменение квалификации и т. п. Список 3 обновляется каждый раз по мере необходимости. Не вызывает трудностей задача пополнения реляционной модели новыми знаниями путем расширения уже имеющихся списков и добавления новых списочных структур.
Существуют и другие способы формализации знаний. Например, промежуточным между древовидной и реляционной моделями классификации являются так называемые семантические сети. С их помощью между понятиями, фактами, знаниями устанавливаются связи – отношения. Они как бы являются обобщением древовидных моделей, так как отличаются от последних снятием требований иерархичности. В то же время семантические сети могут считаться частным случаем реляционных моделей, так как именно из них могут быть построены связанные списочные структуры, когда понятие, являющееся узлом семантической сети, расширяется в список, а соответствующее отношение с другим списком из единичного становится групповым.
Все описанные приемы формализации знаний направлены на создание некоторого устойчивого каркаса, на который может быть надета оболочка системы конкретных знаний. В случае если между отправителем и получателем знаний достигнута взаимная договоренность относительно этого каркаса, то информационный обмен приобретает необходимую регламентирующую основу, что повышает его эффективность.
Традиционные и новые информационные технологии. Под традиционной информационной технологией, как правило, понимается информационная технология на базе «жестких алгоритмов». На таких технологиях построена практически вся так называемая офисная информатизация (текстовые и табличные редакторы, программы бухгалтерских расчетов, статистические программы и т. д.). Реализация данных технологий стандартна и практически не зависит от пользователя.
Под новой информационной технологией, как правило, понимается информационная технология на базе «мягких алгоритмов» с использованием достижений искусственного интеллекта. Именно за данным видом информационных технологий – будущее социокультурного варианта информатизации, ибо новые информационные технологии учитывают специфику, максимально «подстраиваются» при своей реализации под конкретного пользователя.
51
Соловьева Н.С., Сомин Н.В. Термин-3 – система динамического гипертекста // Системы и средства информатики. 1995. № 5. С. 95.
52
Англ, relation – связь.