Понедельник, Июль 5th, 2010

Лабораторный практикум по интеллектуальным информационным системам

Рисунок 61. Выход на режим генерации справочников
на основе текстовых файлов

На рисунке 62 приведена экранная форма, отображающая ход процесса генерации описательных шкал и градаций и TXT-файлов, содержащих примеры текстов с разбиением по строкам.

Рисунок 62. Генерация описательных шкал и градаций
на основе TXT-файлов

В результате получаем классификационные и описательные шкалы и градации, приведенные в таблицах 40 и 41.

Таблица 9 – КЛАССИФИКАЦИОННЫЕ
ШКАЛЫ И ГРАДАЦИИ

Код
Наименование
1
Достоевский
2
Гоголь
3
Грибоедов
4
Лермонтов
5
Пушкин
6
Толстой
7
Тургенев

Приводится лишь фрагмент описательных шкал и градаций, т.к. размерность справочника составляет 3522 градации (т.е. слова).
3. Сформировать обучающую выборку
Обучающая выборка представляет собой фрагменты текстов различных авторов, используемые в качестве примеров для формирования семантической информационной модели. На основе анализа этих примеров выявляются взаимосвязи между теми или иными словами и принадлежностью текстов разным авторам.
Для генерации обучающей выборки используется 1-й режим 2-й подсистемы, функция F7InpTXT – F6Ввод из всех файлов. При этом в качестве признаков, также как при формировании описательных шкал и градаций, выбираются слова (рисунок 63).

Рисунок 63. Генерация обучающей выборки из TXT-файлов

В результате формируется обучающая выборка, состоящая из 151 примера фрагментов текстов различных авторов. Остается лишь проставить в каждом примере (анкете) код писателя, о котором данный текст, т.е. код класса (в левом окне).
4. Осуществить синтез семантической информационной модели
Синтез модели осуществляется во 2-й подсистеме, 4-м режиме, 5-й функции (рисунок 64).

Рисунок 64. Запуск режима:
«Синтез семантической информационной модели»

Стадия процесса синтеза отображается в ряде экранных форм, одна из которых приводится на рисунке 65.

Рисунок 65. Экранная форма, отображающая одну из стадий процесса синтеза семантической информационной модели
5. Оптимизировать семантическую информационную модель
Оптимизация модели представляет собой исключение из нее малозначащих признаков без потери адекватности модели. Эта операция осуществляется во 2-м режиме 3-й подсистемы (рисунок 66).

Рисунок 66. Выход на режимы оптимизации модели

При том имеется возможность вывести график ценности признаков «нарастающим итогом», т.е. Паретто-диаграмму признаков (рисунок 67).

Рисунок 67. Паретто-диаграмма признаков
Видно, что в системе признаков нет имеющих очень малую или нулевую ценность. Это связано с тем, что все слова являются практически уникальными для фрагментов текстов, т.е. встречаются во всех текстах в основном от 1 до 5 раз (рисунок 68).

Рисунок 68. Частотное распределение частот признаков

6. Проверить семантическую информационную модель на адекватность, измерить внутреннюю и внешнюю, дифференциальную и интегральную валидность
6.1. Внутренняя дифференциальная и интегральная валидность

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121

2 комментария

14.05.2013
muhammadali

plese you can help me if you know односвязный кольцевой список java if you know plese send me program


26.10.2016
Anara Saipbekova

Dear Sir/Madam,

I need contact with person who create these LabWorks

best regards

Professor
Anara Saipbekova
Osh State University
Kyrgyz Republic