moglobi.ru Другие Правовые Компьютерные Экономические Астрономические Географические Про туризм Биологические Исторические Медицинские Математические Физические Философские Химические Литературные Бухгалтерские Спортивные Психологичексиедобавить свой файл
страница 1 страница 2 ... страница 11 страница 12
А.А. Красилов

ИНФОРМАТИКА

В СЕМИ ТОМАХ



Том 5. Основания информатики

(Теоретические основы)


*** Автор приносит свои извинения за неполную публикацию тома

Москва


1997 - 2004

ИНФОРМАТИКА


Том 1. Основы информатики

(Введение в информатику)
Том 2. Информатика смысла

(Машинная лингвистика)
Том 3. Концептуальная информатика

(Толковый словарь по информатике)
Том 4. Представление знаний

(Структуры данных)
Том 5. Основания информатики

(Теоретические основы)
Том 6. Методы информатики

(Изобретание, проектирование,

разработка и сопровождение)
Том 7. Интеллектуальные системы

(Системы решения проблем)

 Альберт Александрович Красилов

УДК ....................


Аннотация
Логика является наукой о мышлении. Информатическая логика - раздел логики, который связан с мышлением Интеллсист, и является основанием информатики в соответствии с определением информатики. Настоящие том представляет описание информатической логики, определяющий методы решения логических уравнений. Определяются логические лексемы, фундаментальные операции, правила преобразования логических уравнений, а также металогика для обоснования логики Интеллсист. Информатическая логика представляет собой встроенное в Интеллсист знание.
The logic is science about thinking. Informatical logic - sections of logic, which is connected to thinking Intellsyst, and is the foundation of Informatics according to the Informatics definition. The present volume represents the description informatical logic determining methods of the logic equation decision. The logic lexemes, fundamental operations, rule of the logic equation transformation, and also metalogic for a substantiation of Intellsyst logic are defined. Informatical logic represents built-in Intellsyst knowledge.

(www.translate.ru)


ОГЛАВЛЕНИЕ
Введение

Глава 1. Знания

1.1. Понятие о знании

1.2. Новые знания

1.3. Факты и утверждения

1.4. Знания в данной области и БД

1.5. Формальное представление знаний в Интеллсист

1.5.1. Общие соображения

1.5.2. Некоторые правила формализации

1.5.3. О точности передачи знаний

1.5.4. Вопросы пользователю от Интеллсист

1.5.5. О плохо формализуемых знаниях

1.5.6. Представление знаний аксиомами

1.5.7. Что такое истина

1.6. Проблемы, вопросы, запросы и задачи. Общий подход к решению проблем

1.7. Методы приобретения знаний

Глава 2. Отношения - взаимосвязь данных

2.1. Определения понятия отношение

2.2. Операции с отношениями и их свойства

2.3. Свойства отношений

2.4. Предикаты - обобщение отношений

2.5. Логика отношений

2.6. Многомерные отношения

2.7. Система встроенных в Интеллсист отношений

Глава 3. Логические уравнения

3.1. Определение понятия логического уравнения

3.2. Исчисление проблем

3.3. Общий подход к решению проблем

3.4. Классификация проблем

3.5. Классификация уравнений

3.6. Высказывательные и предикатные уравнения

3.6.1. Смысл высказываний

3.6.2. Бинарные операции

3.6.3. Поиск смысла высказываний

3.6.4. Примеры высказываний

3.6.5. Некоторые проблемы для исследований

3.7. Функциональные уравнения

Глава 4. Решение логических уравнений

4.1. Решение высказывательного уравнения

4.2. Правила вывода решения

4.3. Природа правил вывода решений

4.4. Множество решений

4.5. Исчисления в информатике

4.5.1. Разделы определения операций и констант

4.5.2. Логическая дедукция

4.5.3. Логическая индукция

4.5.4. Роль исходных и искомых величин

4.5.5. Совокупность правил вывода решений логических уравнений

4.5.6. Алгебраическая дедукция

4.5.7. Метаправила вывода

4.6. Аксиомы математической логики

4.7. Система аксиом для решения логических уравнений

Глава 5. Информатическая логика

Введение. О логиках

5.1. Разделы информатической логики

5.1.1. Логика одинаковости и атрибутов

5.1.2. Логика бинарных истин

5.1.3. Логика конъюнкций (совместности)

5.1.4. Логика дизъюнкций (альтернативы)

5.1.5. Логика конъюнкций-дизъюнкций (уровней интеллекта)

5.1.6. Логика предикатов первого порядка

5.1.7. Логика отношений

5.1.8. Логика предикатов высших порядков

5.1.9. Логика арифметики

5.1.10. Логика множеств (операция принадлежности in)

5.1.11. Логика ссылок

5.1.12. Логика индексирования.

5.1.13. Логика именования.

5.1.14. Логика образования последовательности.

5.1.15. Логика операций над строками

5.1.16. Многозначные, модальные и др. логики. К-значная дискретная размытая логика

5.1.17. Логика фактов или исчисление фактов

5.1.18. Логика программ

5.1.19. Математические и многоместные операции

5.1.20. Логика рекурсивных определений

5.1.21. Логика алгебры

5.2. Логика преобразований и атрибутов

5.3. Общий процесс вывода решений

5.4. Классы конечных результатов решения. Примеры логических задач

5.5. Другие дедукции

5.5.1. Физическая дедукция.

5.5.2. Алгебраическая дедукция.

5.5.3. Геометрическая дедукция.

5.5.4. Аналитическая дедукция.

5.5.5. Логическая дедукция

5.5.6. Программная дедукция

5.5.7.Тригонометрическая дедукция.

5.6. Применение информатической логики

5.7. Значение информатической логики

Глава 6. Алгоритмы логического вывода

6.1. Правила вывода

6.2. Классы правил вывода

6.2.1. Правила исчисления

6.2.2. Частный случай правила исчисления - подстановка значений (придание смысла) вместо терминов

6.2.3. Правила из аксиоматики ИЛ

6.2.4. Правила замены терминов операций

6.2.5. Правила замены терминов терминами

6.2.6. Правила замены связных терминов на уникальные термины

6.2.7. Правила именования формул уникальными терминами

6.2.8. Правила применения подстановок

6.2.9. Правила применения пользовательских подстановок

6.2.10. Правила применения масштабирования

6.2.11. Правила интерпретации операций

6.2.12. Правила унификации

6.2.13. Правила оптимизации в БЗ

6.2.14. Правила оформления результатов

6.2.15. Правила повышения уровня интеллекта

6.3. Пользовательские правила вывода

6.4. Аксиомы и правила вывода

6.5. Определение унификации. Уточнение алгоритмов на примерах

6.6 Общая структура алгоритма работы с инструментарием Интеллсист

6.7. Алгоритмы машины логического и алгебраического вывода

Глава 7. Информатическая металогика

7.1. Метатеория, логика доказательств

7.2. Библиотеки баз знаний

7.3. Интеллект системы

7.4. Сравнение логик

7.5. Исчисление баз знаний и теорий

7.6. Логика доказательств, логический вывод

7.7. Сравнение исчислений и некоторые теории

Литература

Сокращения для терминов
АП - алгоритм порождения

АР - алгоритм распознавания

БД - база данных

БЗ - база знаний

ВМ - вычислительная машина

ВУ - высказывательное уравнение

ГЯ - граф языка

ЕЯ - естественный язык

ИИ - искусственный интеллект

ИИС - инструментарий интеллектуальной системы

ИЛ - информатическая логика

ИМГР - интерпретатор машины грамматического разбора

ИН - интуиционистская логика

Интеллсист - интеллектуальная система

ИП - интеллектуальное программирование

КС - контекстно-свободный

ЛИПС - число шагов логического вывода в секунду

ЛУ - логические уравнения

МГР - машина грамматического разбора

МГР1 - машина грамматического разбора первого типа

МГР2 - машина грамматического разбора второго типа

МГР3 - машина грамматического разбора третьего типа

МГР4 - машина грамматического разбора четвертого типа

МЛ - математическая логика

МЛВ - машина логического вывода

(решения логического уравнения)



ММ - математическая машина

МТ - машина Тьюринга

НЛ - модальная (неклассическая) логика

ПЛ - пользовательская логика

ПП - процедурное программирование

ППП - пакет прикладных программ

ПС - прологовая система

САПР - система автоматизации проектирования

СВТ - средства вычислительной техники

СеГ - семантическая грамматика

СиГ - синтаксическая грамматика

СП - синтезированная программа

СУБД - система управления базой данных

СУБЗ - система управления базой знаний

Т - том

ФРАК - формульный автокод

ФУ - функциональное уравнение

ФЯ - формальный язык

ЭС - экспертная система

ЯЛ - язык Лейбниц

ЯПП - язык профессиональной прозы

ASCII - American Standard Code Information Interchange

Введение
Пять десятилетий применения ВМ были связаны с утверждением, анализом и синтезом алгоритмического знания. Конечно, другие виды знаний также были частью внимания разработчиков и пользователей программ. Другие виды знаний служили исходными данными или результатами вычислений. Теперь проблема состоит в том, чтобы уровнять в некотором смысле роль различных видов знаний. Все они должны использоваться как для ввода-обработки-вывода, так и для представления действий над другими видами знаний. Эту проблему попробуем рассмотреть со всех сторон.
Исторически применение ВМ связано с переработкой (при построении программ) главным образом алгоритмического знания. Основной технологией переработки алгоритмического знания были сами знания и интуиция программиста, а также подсказка ему со стороны пользователя ВМ о сущности исходного знания по проблеме. Разрыв между деятельностью пользователя (постановщика проблем) и деятельностью программиста (реализатора проблем) накладывал свой отпечаток на логическую точность передачи знания и на уменьшение реального времени получения результатов применения ВМ. Эти обстоятельства порождали и порождают новые методы анализа и синтеза алгоритмического знания.
Как было отчасти подмечено, алгоритмические знания используются для исследования других видов знаний, в том числе и самих алгоритмических знаний. В этом проявляется проблема знания о знаниях и является главным в подходе к нашей проблеме: уравнять все виды знаний при использовании ВМ. Напомним, что различными видами знаний являются: описательные, семантические, концептуальные, фактографические, теоретические, алгоритмические и кибернетические. Основным видом знаний в этом томе будут теоретические знания. Ими воспользуемся для осмысления фундаментальных основ информатики (оснований информатики) и теории построения Интеллсист.
Для начала воспользуемся высказыванием С.М. Адяна в [Гильберт79]: «Брауэр (1908) выступил против применения классической логики к бесконечным множествам. В выдвинутой им интуиционистской программе предлагалось отказаться от рассмотрения актуальной бесконечности, т.е. бесконечных множеств как завершенных совокупностей...». Против нападок Брауэра и его требований перестройки всей математики решительно выступил Гильберт. Его новый «путь, основанный на применении аксиоматического метода, рассмотрении формальных моделей содержательной математики и исследовании вопросов непротиворечивости таких моделей надежными финитными средствами, получил в математике название финитизма Гильберта». Это высказывание для нас представляет интерес, поскольку оно выражает два главных направления в математике. Попробуем отклониться от этих направлений для поиска именно машинных подходов в математике. А точнее, сформулируем логику, которая учитывает имеющиеся два направления. Спор об актуальности направлений в математике разрешается так: ВМ должна усваивать ту логику, которой располагает и применяет пользователь ВМ для решения своих задач. Поясним смысл высказанных положений.
1. Аксиоматический метод служит для описания действительности во всех ее проявлениях. Этот метод обслуживает и мыслительные действия человека, что представляет несомненную ценность возможностей метода. Это положение об аксиомах будет главным и в наших рассмотрениях. Аксиомы, как безапелляционные высказывания о предметах, явлениях, процессах или их свойствах, будут играть основную роль в вопросах представления знаний. Здесь важно отметить, что в информатике понятие аксиомы расширено и снято табу математики с этого понятия. Пользователь сам определяет состав естественных для него аксиом и применяет их в решениях своих задач.
2. Проблема математических моделей важна изначально как возможность терминального представления всякого знания, знания любого вида. Мимо этой проблемы не пройти никоим образом при использовании ВМ и при математическом обосновании информатики. Заметим, что формальная теория также для нас представляет математическую модель, которая подчас будет способствовать решению формальных проблем. Такой взгляд позволяет объединить все логики и использовать их объединение для решения формальных и неформальных (не формализованных) задач и проблем с помощью ВМ и Интеллсист.
3. Непротиворечивость описаний, как фундаментальная проблема исследования формальных, а подчас и неформальных, знаний, была конечной целью оснований математики. Для информатики обеспечение непротиворечивости описаний является начальной целью, а точнее - рабочей целью. Это важное обстоятельство должно быть взято также на вооружение любого исследования, связанного с применением ВМ. Проблема непротиворечивости приобретает новое свойство, расширяется и выступает под названием отладка знаний, когда непротиворечивость описаний предшествует основной работе со знаниями. Важно обнаружить противоречия в описаниях до решения первой же задачи.
4. Главная техническая проблема - получение доказательства - остается в математике основной при проявлении логики мышления, математического мышления. Вот тут-то будет обнаружено расхождение с общепринятым в математике подходом к средствам изучения реального или мыслимого мира. Попробуем принять проблему выявления условий, при которых становится истинным некоторое высказывание. Другими словами, не теорема является главным предметом изучения информатики (хотя она совершенно не пренебрегает и рассмотрением теорем), а любое высказывание, которое интересует пользователя с точки зрения определения условий истинности. Это главная практическая задача информатики.
5. Информатическая логика - основания информатики - делает возможным решение проблем с помощью ВМ, ставящихся классической, интуиционистской и другой математикой и с учетом возможности применения актуальной бесконечности (как видно из приведенной цитаты имеются проблемы относительно актуальной бесконечности, их надо решать так, как это делает человек) и других принятых или не принятых объектов исследования. ИЛ здесь занимает центральное место.
6. Пользовательская логика составляет сущность БЗ и запросов, разработанных конкретным человеком. Классические логики заложены во встроенную БЗ Интеллсист. Для классика не обязательно строить новую БЗ, если он не вводит новые константы, величины или операции. Пользовательская логика состоит из базовых суждений, своего лексикона и утверждений о проблеме (задаче), которая подвергается анализу или разрешению. Она станет достоянием других, если БЗ, лексикон и проблемы пользователя станут понятными и общими.
7. Если человек берется решать любые проблемы классики или интуиционизма, то целесообразно ставить вопрос о применении ВМ для этих же целей. При этом надо помнить, что человек и ВМ для решения проблем должны ставиться в одинаковые условия по используемым знаниям. Нельзя производить сравнение возможностей человека и машины, снабдив их различными объемами знаний. Аналогично, сравнения способностей людей различных специальностей не делают, если они имеют не совпадающие образование, язык или опыт.
Любознательность любого человека сводится к постановке вопроса или формированию запроса (проблемы, требования, затруднения, осложнения, вопроса и др. синонимов для данного смысла) с получением или поиском ответа. Иногда вопрос уже содержит ответ, что установить подчас бывает весьма сложно. Иногда ответ невозможно найти принципиально (из-за недостатка знаний). Наконец, иногда имеется большое число ответов, и все они удовлетворительны. Последняя ситуация может оказаться неприемлемой ни математиками, ни практиками, поскольку переданное ВМ знание не позволяет выяснить категорического ответа. Кто знает, может быть эта ситуация является самой лучшей. Спросите пользователя, который может сказать, что для него это важно, так как только человек способен дать окончательный ответ. Здесь возникает важное обстоятельство. В практике отпадает требование единственности решения, ВМ должна автоматически разрешать проблему единственности, если она действительно разрешима в конкретных условиях. Таков ассортимент реакции любой Интеллсист при постановке вопросов или запросов. Большинство алгоритмов и программ, исключая Интеллсист, разработаны так, что число ответов (решений задачи) на запрос не фиксировано. Число ответов должно определяться объемом знания, участвующего в решении проблемы, структурой и полнотой запроса и методом поиска нового знания - ответа на запрос.
Работа математика чаще всего состоит в построении теорем. Метод и кухня (технология) построения (конструирования) теорем чаще скрыты за железными дверями мыслей математика. Читатель (или анализатор результатов поиска математика) занимается логическими упражнениями при чтении логических выкладок математика. Едва ли разрешима проблема расшифровки метода и кухни математического мышления. Рассмотрим проблему другого сорта. Теорема - это логическое высказывание, которое доказано математиком. Любое логическое высказывание - это утверждение о предметах, явлениях, процессах или их свойствах. Чтобы оно стало теоремой необходимо проделать логические выкладки. Чаще всего эти выкладки будут связаны с выявлением новых условий, при которых исходное высказывание будет истинным. Общая проблема построения доказательства и состоит в поиске условий такого сорта. Эта работа должна быть поручена ВМ.
Теперь можно высказать то главное, что характеризует новую информатику. Фундаментальная проблема оснований информатики может быть сформулирована так:

Создать процедуру поиска условий, при которых логическое высказывание становится истинным, или установить, что таких условий не существует (поиск относительной истины).

Классической МЛ ставит вопрос о том, как найти доказательство утверждения (поиск абсолютной истины), а интуиционистская логика - как построить объект по доказанному утверждению (поиск алгоритма для достижения абсолютной истины).


При этом на объекты исследования, относительно которых строятся утверждения (в том числе и теоремы), не будет накладываться какие-либо ограничения (финитности, синтаксической эквивалентности, семантической неясности и др.), поскольку сами ограничения могут содержаться в имеющемся знании (например, для исследования самих ограничений), которое сообщается для ВМ. Если знаний будет недостаточно, то ВМ должна сообщить об этом, в противном случае ответ будет неполным и не соответствовать ответу классика или интуициониста. Знание об объекте исследования определяет качество ответа, о чем было упомянуто выше.
Главное возражение против нового подхода к рассмотрению логических выражений состоит в том, что этим целям якобы уже служит МЛ. Однако ее недостаточность можно объяснить следующим образом. Выделим те сложности аппарата МЛ, которые препятствуют успешному внедрению информатики в практику решения задач или применения ВМ в различных сферах деятельности человека. Рассмотрим некоторые сложности МЛ.
В МЛ выработалось огромное число разнообразных исчислений (систем аксиом), которые ориентировали пользователя на ту или иную фиксированную область ее использования. Информатика должна ориентировать пользователя на эффективное использование ВМ без вмешательства специалистов, понимающих математику или информатику, но не представляющих всех особенностей области конкретных исследований пользователя (к пользователям относится и математик). Необходимо так ориентировать информатические средства, чтобы далекий от информатики пользователь был максимально приближен к ВМ. Понимание МЛ пользователем почти невозможно без специалиста или предварительного изучения. Полное понимание даже собственных фраз с позиции пользователя весьма затруднительно. Необходимо обеспечить пользователю те возможности, при которых он не соприкасался бы с понятиями логики, а находился в своей области знания. Необходимо одно исчисление (исчисление ИЛ), которое бы обеспечило всех простыми средствами доступа к ресурсам ВМ для решения его проблем в его постановке и понимании. Главная задача в этом контексте состоит в устранении для пользователя каких-либо формальных средств разрешения его проблем или в сведении к минимуму знаний о формализме, оставаясь, например, на уровне грамматики родного языка. Аналогичная ситуация может быть замечена относительно большого числа совокупностей правил вывода истин в многочисленных исчисленьях, которые чаще всего бывают избыточными. Программирование всех совокупностей привело бы к построению емких файловых систем для их хранения. Заполнение памяти ВМ избыточной информацией приводит к возникновению информационного взрыва. Такими свойствами обладают ЭС.
МЛ не предлагает средств и методов для реализации операций композиции пары исчислений с тем, чтобы для данных классов задач можно было бы построить конкретное исчисление. Причем ИЛ в противовес этому избегает предлагать пользователю явные средства построения композиций исчислений, а используются доступные и естественные средства формирования знаний из различных источников. Сами знания выступают как собственные исчисления, необходимые только для данной области исследований и решения задач.
Эффективность и надежность важны были всегда. ИП должно обеспечить такие свойства применения ВМ. Имеется суждение, в соответствии с которым всякая интеллектуальность обязана сжатию информации, повышению эффективности и надежности. Сжатие информации в Интеллсист выполняется многими процедурами. Одной из важных процедур является процедура оптимизации. Работа МЛВ в Интеллсист выполняет именно такую процедуру исключения «избыточных» констант, величин и операций. Другая процедура анализирует текст и переводит лексемы в код, составляя при этом таблицы соответствия имеющихся лексем их кодам. Третья процедура свертывает выражения (формулы) в деревья или таблицу «веточек» с исключением повторов. Процедура интерпретации (или реализации смешанных вычислений) исключает статические выражения, сокращая объем знаний и запросов. Процедуры применения правил также ориентированы на сжатие информации. Имеются и другие процедуры минимизации. Вот таков примерный перечень процедур, осуществляющих автоматическое сжатие информации в рамках ИП.
МЛ не включает в качестве операции такие, как действия с выражениями, аппарат аналитических выкладок, а ведь ручная работа реализуется по наитию и создает условия для появления ошибок. Обычно такой аппарат на ВМ представляется автономно и реализуется он автономно от уже имеющихся средств решения задач. Аналитические выкладки находятся вне МЛ. Это приводит к тому, что сам аппарат выкладок не сопряжен явно с аксиоматикой. Все следствия этого должны сказываться на результатах самих аналитических выкладках, которые становятся в связи с этим искусством инженера-математика или ученого-аналитика. Скорее здесь действуют методы теории изобретательства, а не строгая логика и теория построения новых математических объектов. При реализации аналитических выкладок обычно отсутствуют какие бы то ни были указания об условиях выводимости новых формульных аналитических зависимостей. Автоматическое получение условий выводимости должно обеспечиваться автоматическим контролем над процессом аналитических преобразований.
При рассмотрении процедур доказательства теорем методом дедукции можно заметить, что они работают с деревом вывода, размеры которого бывают огромными или бесконечными. Сам процесс построения доказательства в МЛ сталкивается со сложностями анализа тупиковых ситуаций при анализе дерева вывода или поиска самого вывода. В связи с этим построение доказательства в математике связано с пустыми (не результативными) шагами. Имеется необходимость построения аппарата без тупикового и эффективного вывода решений для известных и новых задач.
Аналогичный вопрос возникает в связи с автоматизацией отладки процессов аналитических выкладок, вычислений и поиском новых фактов. Автоматический поиск ошибок важен для построения технологии решения любой проблемы. Поскольку МЛ никоим образом не связана с аналитическими выкладками, то она не может помочь делу поиска решений логических уравнений.
Критика сложностей МЛ является формулировкой требований для построения ИЛ, реализация которых расширяет возможности самой МЛ. Работы по основаниям информатики проводятся здесь по следующим направлениям:

  • раскрепощение аксиоматической математики от устоявшихся форм идеального мышления к практическому мышлению, а также реализация существенного поворота к запросам практики использования ВМ;

  • все исследования направлены на обоснование понятий знание, обработка и отладка знания и синтез нового знания с помощью ВМ;

  • современный период применения ВМ характеризуется требованиями глубокого обоснования процессов использования возможностей и ресурсов ВМ для решения каждой конкретной задачи;

  • аксиоматический метод математики имеет дело с фиксированным набором абстрактных объектов, а практика применения ВМ привлекает все новые и новые практически полезные объекты для исследования;

  • обобщение логик и привлечение любой логики необходимы для использования ВМ в решении любых проблем, для получения точных или «приближенных» разрешений любых запросов пользователей в пределах «компетенции» ВМ или БЗ;

  • построенная ИЛ, относительно которой пойдет речь в этом томе, служит средством практического обоснования машинных алгоритмов, что обеспечивает надежность в получении результатов и надежность самого результата применения ВМ;

  • процессы моделирования мышления или интерпретации интеллекта (как одно из направлений информатики) становятся привлекательными по мере развития информатики;

  • учет любых стандартных или пользовательских моделей должен быть обязательным для всеобщего охвата проблем пользователя.

Основания информатики рассматриваются доказательно и подробно с помощью математического аппарата. Так, например все законы и правила для получения решения вопросов, проблем и заданий на основе знаний представляются внешне с помощью математических средств, введенных и проконтролированных в Интеллсист. Центральная часть исследований - аксиоматика ИЛ - является предметом настоящего тома. Все остальное служит достижению этой цели.


Критерием истины является опыт.

Т. Кампанелла

Знание - дело наживное

Глава 1. Знания
Цель главы - провести подготовительные рассуждения о понятии знание для дальнейшего построения представлений конкретных или абстрактных знаний при вводе их, обработке и выводе нового знания. Без четкого определения представлений знаний невозможно построить программы их обработки.
Знания - предмет информатики (но не только информатики, а всех наук). Знания интересуют информатику с точки зрения технологии обработки и получения нового знания с помощью ВМ. Знания в философском толковании или роль знаний в социологии здесь не изучаются. Эти общие проблемы исследуют многие гуманитарные науки. К этому следует добавить два замечания. Первое - понятия знание часто используется здесь вместо понятия представление знания, второе - толкование или исследование знаний в смысле философии или социологии возможно с помощью Интеллсист. Подобные замечания важны для правильного восприятия последующего материала. Будем ограничиваться рассмотрением методов представления знаний (или знаний) для подключения алгоритмов преобразования таких представлений, а также частично будем касаться вопросов перехода от машинных представлений к известным человеку представлениям знаний.
Самыми общими, распространенными и известными формами представлениями знаний являются символьные, графические или предметные (образные) представления. Символьные представления знания предполагают использование простых графических изображений знаков в ограниченном количестве и пространстве. Их общее количество невелико (26, 33, 59 или 5000). Графические представления знания (рисунки, чертежи, живописные картины или фотографии) предполагают использование неограниченного (или, по крайней мере, большого) объема технических средств для хранения и воспроизведения. Еще более мощным средством представления знаний является предметное (видовое, звуковое, вкусовое и др. примеры). Ограничимся применением символьного представления знаний, которые могут использоваться в настоящее время для обработки знаний. В последнее время начинает развиваться совокупность методов обработки видео или графических представлений. Почти все проблемы информатики обработки знаний, представленных в графическом виде здесь не рассматриваются. Быстрая обработка телевизионного изображения по смыслу (пример предметного представления знаний) пока имеет технические сложности, которые тоже не рассматриваются. Здесь используется закон информатики о возможности представления графических и предметных представлений через символьные (имена, величины и файлы).
Символьный метод представления знаний предполагает частичную или полную формализацию знаний, без которой с одной стороны человек не может заниматься обработкой знаний, с другой стороны он может воспринимать и понимать знания. К символьной формализации человек обучен со дня рождения. Другие известные методы представления знаний (рисунками или предметами) полезны для общения человека с природой, они предоставляют человеку широкие горизонты для информатических исследований. Рассматривались и будут рассматриваться дальнейшие формализации представлений знаний, изучая при этом места потери частичного знания.
То, что мы знаем - ограничено, а что не знаем - бесконечно.

Апулей

1.1. Понятие о знании
Общечеловеческое определение понятий «знание» и «информация» подробно рассмотрено в т.1. Теперь бросим взгляд на знания как на средства передачи полезных сведений в память ВМ для успешного решения проблем. Проведем некоторые рассуждения. Интересен вопрос о том, что информатика занимается только представлениями знаний, которые после ввода их в память ВМ становятся ее знаниями. Со временем будут считать именно так, что введенные в память ВМ знания являются ее знаниями.
Определение знания можно заимствовать из энциклопедии или даже представить его читателю самому, воспользовавшись своей интуицией или своими знаниями. В определении знаний и их представлений необходимо каким-либо образом отобразить возможности ВМ для ввода, хранения и обработки различных представлений знаний. Наша привычка состоит в том, что знания обычно связываются только с человеком. Знания, мол, можно передавать только от человека к человеку, а ВМ является своеобразным промежуточным звеном. Только человек может обладать знаниями, учиться и обучать других. Но поскольку знания фиксируются на бумаге, значит они могут быть введены в память ВМ и обработаны, а результаты обработки могут быть выведены на печать или в память другого сорта. В результате обработки знаний получается новый материал. В связи с последней фразой возникает несколько вопросов. Рассмотрим такие вопросы:

  • что такое новый материал, упомянутый выше,

  • представляет ли он знания,

  • что делает человек для получения нового знания,

  • как формализовать получение нового знания,

  • можно ли считать, что полученный от ВМ ответ на вопрос или запрос представляет собой новое знание?

Для построения ответов на эти вопросы необходимо исследовать следующие проблемы:

  • что такое предметные и проблемные области,

  • каким образом связаны понятия (которые определены в т.2) между собой,

  • как определяются понятия,

  • какие способы представления знаний имеются,

  • с какими формальными моделями будем связаны при изучении представлений знаний,

  • какие методы решения задач по поиску нового знания существуют,

  • наконец, как воспользоваться системой человек-ВМ для получения нового знания.

Перечисленные проблемы составляют основу для данных ниже исследований.
В качестве исходных понятий примем следующие понятия:

  • факт,

  • утверждение о фактах,

  • правило вывода новых фактов из имеющихся,

  • метаправило вывода новых правил из имеющихся правил (и далее можно понимать рекурсивное применение понятия правила).

Постепенно эти понятия связываются с понятием знание. Именно так будут построены ответы на поставленные вопросы. Ответы не являются окончательными, в этом просматривается проблема для постоянных исследований, в этом можно усмотреть развитие понятия знания в информатике.
Понятие предметной области связано с описанием знаний о множествах тех значений (данных), которые используются или будут использоваться в процессе поиска ответов на запросы, и с именами этих множеств. Потенциальная оценка возможных значений обеспечивает надежность процесса обработки знаний и результатов поиска. Например, отрезок натурального ряда 1..100 определяет предметную область индекса некоторой величины. Понятие проблемной области связано с наборами тех операций (процедур), которые будут использованы в представлении знаний и процессах поиска ответов на запросы. Потенциальный набор операций, характеризующий проблемную область, обеспечивает получение ответов на класс запросов пользователей. Например, с величинами из предметной области «отрезок натурального ряда» можно оперировать с помощью арифметических операций. Предметная и проблемная области очерчивают круг данных и операций, в пределах которого в память ВМ закладываются знания, ставятся вопросы и находятся ответы. Иногда эти области именуют миром поиска или исследования.
Данные выше интуитивные определения предметной и проблемной области распространяются на все семь фундаментальных видов представления знаний, они и данные интуитивные понятия подробно изложены и определены в т.1. А опыт конструирования Интеллсист показывает, что этих видов представлений достаточно для ввода любых знаний в память ВМ. При этом будет использовано формальное средство для внутримашинного представления знаний о предметной и проблемной области. Этим средством является формализм логических формул языка Лейбниц (также см. т.2). Формальные средства для представления знаний (как правило) используются только для внутрисистемных операций. Имеется одно исключение из этого общего правила: формальные средства используются вне системы, если этого желает пользователь, если они являются средствами языка профессионала в своей области знания.
Существует огромное множество методов решения самых разнообразных проблем средствами, которыми располагает человек. При решении проблем человек опирается на имеющиеся знания. Такой общий подход принят и в информатике при формировании методов поиска решений различных проблем. ВМ с помощью программы, именуемой Интеллсист, окончательно решает только те проблемы, которые разрешимы в среде имеющихся знаний. В противном случае ВМ может запросить дополнительные знания или постановщик проблемы может воспользоваться промежуточными решениями, также представленными в заданных предметной и проблемной областях.
В качестве технического средства будет использована система человек-ВМ, хотя методология информатики может быть использована человеком вручную. Понятия предметной и проблемной областей при этом сохраняют свои значения. Например, все приводимые примеры решения конкретных проблем будут решены именно вручную для наглядного сопоставления работы ВМ и человека. При этом Интеллсист может использоваться для рассмотрения примеров только в качестве тестов или проверки правильности работ вручную.
Данные выше предварительные ответы на вопросы являются вводными, они необходимы для пояснения принципов и средств, которые будут использоваться в процессе построения оснований информатики. Следует помнить, что окончательные ответы на указанные выше вопросы можно получить только к концу т.7.
Рассмотрим кратко проблему классификации знаний. Первая и фундаментальная классификация рассмотрена в т.1. Семь видов представлений знания там рассмотрены достаточно широко. Представления знаний в реальных условиях, исключая специальные методы формализации типа шифрования, что является специальным вопросом для информатики, проявляются при классификации видов представления знаний в прикладном смысле следующим образом:

  • символьные последовательности, например иероглифы, знаки Морзе, или Брайля, каждый знак может передавать знания;

  • тексты на некотором языке в некотором алфавите символов служат языковым средством представления знаний;

  • словари определений являются наиболее ярким примером представления знаний;

  • массивы, записи и таблицы (если они связаны с именами) представляют средство скрытого изображения фактических знаний;

  • формулы в самом общем понимании и их последовательности, которые, вообще говоря, позволяют формализовать знания так, что с их помощью можно осуществлять обработку знаний;

  • программы на некотором языке в информатике являются ныне главным средством представления алгоритмического знания при использовании ВМ, но это средство в эффективном использовании доступно только программистам;

  • символьные системы обработки представлений и описаний знаний являются универсальным средством для выработки нового знания.

Такова неформальная классификация способов или методов символьного представления знаний, она вводит нас в исследование потребительских методов.
Знания обычно, а в Интеллсист в особенности, собираются в БЗ, элементы которой являют некий способ классификации знаний. Можно рассматривать такие сорта элементов БЗ на примерах:

1. записи фактов, декларативная форма;

2. семантические сети или описание языка;

3. фреймы или определения понятий;

4. массивы пар имя-значение и таблицы со столбцами;

5. исчисления формальных систем или аксиоматика;

6. процедуры как форма представления алгоритмического знания;

7. метазнания или правила вывода нового знания.



Такая классификация напоминает первые две, но она используется при построении ЭС и ПС. Все приводимые классификации не касаются графов и геометрии, которые могут быть сведены к указанным способам представления. Будем считать, что имеется договоренность о том, что их надо рассматривать обособленно. Скорее всего, таким перечислением не ограничиваются способы классификации знаний и их представлений. Естественным образом знания классифицируются по отраслям знаний и наукам. Подобная классификация пригодна для упорядочивания БЗ. Скорее всего, здесь используются свойства и признаки предметных и проблемных областей. Классификацию БЗ обычно осуществляют пользователи Интеллсист.
Основной классификацией знаний является научная прагматика. Она возникла естественным образом в процессе развития науки. Вся совокупность знания подразделяется на профессиональные области деятельности человека. Если число наук имеет порядок 300, то и число позиций в классификации оценивается так же. На самом деле число областей деятельности человека больше указанного числа (примерно на порядок). Приведенная арифметика дает только приблизительное понимание прагматической классификации знаний, но она важна для сопоставления с другими классификациями. Для решения задач с помощью Интеллсист необходимыми являются БЗ. Их число сопоставимо не только с числом наук, но и с числом областей деятельности человека.
Совокупность знания в данной области деятельности человека определяет БЗ. Если БЗ будет передана Интеллсист, то можно получать ответы на запросы пользователя этими знаниями. Область знания, представленная в БЗ, обладает такими свойствами: полная смена БЗ приводит к решению нового класса проблем, дополнение БЗ приводит к получению более точного решения проблемы, использование данной БЗ обеспечивает решение конкретных проблем данной области знания.
Человек умеет разрешать проблемы, используя то, что ему известно, после изучения источников знаний, в результате поиска требуемых знаний или реализации логического вывода по известным знаниям. Интеллсист является ориентированной на человека системой, поэтому о ней можно судить как о человеке: Интеллсист умеет разрешать проблемы, используя то, что ей известно, после обработки источников знаний, в результате поиска требуемых знаний или реализации логического вывода по известным знаниям, ориентации на память ВМ, сохраняющую БЗ.

1.2. Новые знания
Будем использовать посылку, что все знают или имеют представление о понятии «новое». Обычно под новыми знаниями понимают знания, которые нигде и никогда не использовались и не фиксировались данным человеком (знания для индивидуума) или группой людей (знания для группы лиц). При таком подходе можно обнаружить, что новых знаний не бывает, в соответствии с поговоркой «Новое - это хорошо забытое старое». Это одна крайность. На другом полюсе стоит высказывание: «Вот это да!». Как обычно оба полярных высказывания не приемлемы абсолютно. Для школьника все сообщения учителя являются новыми знаниями. Такое или подобное ему обстоятельство ближе всего показывает на то, что такое новое знание. Даже напечатанный текст в книге является новым знанием для читателя, который впервые видит подобные книги.
Вначале память ВМ пуста. Процессор ВМ имеет потенциальные возможности выполнения операций. Всякая введенная информация в память ВМ является относительно ВМ новой. В результате работы программы ВМ получаются новые сведения независимо от того, какой раз запускается программа на выполнение. Это важно для понимания того, с чем будем иметь дело, что хотим получить в результате этого дела. Постепенно память ВМ заполняется сведениями, на основе которых она может конструировать новые сведения.
Конечно, главным фактором или критерием того, что в результате работы ВМ получаем новое знание, является оценка (скорее всего человеком) знания, его важности для дальнейшего применения, роли полученного знания для человека и для принятия им решений. Будем оставлять в стороне эти и подобные им вопросы, когда рассматриваем применение ВМ для обработки знания. По мере необходимости будем возвращаться к таким вопросам, специально оговаривая такие рассмотрения заранее. Точнее всего новое знаний связано с ответами на вопросы, начинающимися со слов: «найти», «существует», «какой», «сколько» и др. Такие слова относятся к величинам некоторого типа, значения которых неизвестно. Ликвидация неизвестности приводит к новому знанию, когда будут определены значения для неизвестных величин.
Заметим, что нас будут интересовать сообщаемые человеком знания. Они могут касаться предметов, явлений или процессов, они могут относиться к свойствам, характеристикам или признакам предметов, явлений или процессов, они могут формировать отношения, соотношения или зависимости указанной атрибутики. Исходными средствами для отображения знаний в памяти ВМ являются данные или имена данных. (Понятия данных и имени раскрыты раньше, поэтому не будем возвращаться к определению этих понятий.) Из исходных средств будем строить составные конструкции - данные или имена этих данных более сложной структуры. В конечном счете, подойдем к понятию представления знаний из данных и имен. В частности, а может быть и в общем случае, имеем дело с фразами ЕЯ, со знаниями человека, который хорошо или не очень хорошо умеет представлять свои знания на своем профессиональном языке. (ЕЯ членится на части, именуемые ЯПП.) Два понятия - ЕЯ и ЯПП - будут в поле зрения всех исследований системы человек-ВМ.
Итак, при выводе некоторых данных из ВМ получается материал, который можно именовать новым. А новый материал - это и есть новое знание. Человек достиг этого путем запуска программы с его данными. Следовательно, для того, чтобы получить новое знание необходимо составить программу (которая может иметь смысл в общечеловеческом понимании в любой его деятельности) и выполнить ее на ВМ. Работа по составлению программы связана с определенной долей формализации (абстракцией от конкретного знания). При этом человек ставит проблему получения на ВМ требуемого результата, который и представляет собой новое знание. Человеку нет смысла запускать программу, если он не получает чего-либо нового.
В последнее время большое внимание уделяется проблеме обнаружения нового знания из данных. Проблема не нова, но с появлением и развитием рынка товаров, а также с внедрением ВМ на фирмах, стали накапливаться большие объемы данных, из которых можно добыть новое знание. Проблема не нова в силу того, что практика применения ВМ выработала большое число методов, алгоритмов и программ статистической обработки данных и моделирования. Только анализ данных позволяет увеличивать прибыли фирм на основе обоснованного анализа. Направление по реанимации алгоритмов обработки данных теперь именуется технологией добычи данных (data mining, см. [Красилов05б]). Достаточно упомянуть такие реанимируемые методы как регрессионный анализ, прогнозирование временных последовательностей, кластеризация данных, избирательный анализ, формирование ассоциаций данных и комбинированные методы. Средствами реализации анализа являются методы: дерево решений, индукция, аналогия, логическая регрессия и визуализация. Кроме этого находят применение новые методы программирования: нейронные сети, нечеткие логики, генетические и эволюционные алгоритмы. Процессы добычи нового знания включают сбор данных, их подготовку для обработки, оценку и интерпретации данных, построение и использование моделей с исследованием результатов моделирования. Реализация методов и моделей позволяют получать новое знание. Наше рассмотрение методов получения нового знания основано на сборе известного знания и логическом выводе нового. Применение указанных методов и моделей добычи данных может использоваться для формирования БЗ или запросов.
Интеллсист (как программа) логически выводит всякий раз новое знание после разрешения запроса пользователя на основе знаний, сообщенных ей в процессе обучения. Ее новые знания являются действительно новыми относительно заложенной в нее БЗ. Ее новые знания могут оказаться новыми и для пользователя. Новым знанием будут сведения даже в том случае, если введенный запрос пользователя не был разрешен из-за отсутствия знаний. Если это так, то цель применения Интеллсист считается достигнутой.
страница 1 страница 2 ... страница 11 страница 12
скачать файл


Смотрите также:
В семи томах
3997.42kb. 12 стр.

В семи томах
6255.58kb. 25 стр.

-
9092.68kb. 40 стр.