Реферат: Теория фреймов
Теория фреймов
- это парадигма для представления знаний с целью использования этих
знаний компьютером . Впервые была представлена Минским как попытка
построить фреймовую сеть , или парадигму с целью достижения большего
эффекта понимания . С одной стороны Минский пытался сконструировать
базу данных , содержащую энциклопедические знания , но с другой стороны
, он хотел создать наиболее описывающую базу , содержащую информацию в
структурированной и упорядоченной форме . Эта структура позволила бы
компьютеру вводить информацию в более гибкой форме , имея доступ к тому
разделу , который требуется в данный момент . Минский разработал такую
схему , в которой информация содержится в специальных ячейках ,
называемых фреймами , объединенными в сеть , называемую системой фреймов
. Новый фрейм активизируется с наступлением новой ситуации .
Отличительной его чертой является то , что он одновременно содержит
большой объем знаний и в то же время является достаточно гибким для того
, чтобы быть использованным как отдельный элемент БД . Термин «фрейм»
был наиболее популярен в середине семидесятых годов , когда существовало
много его толкований , отличных от интерпретации Минского .
Чтобы лучше понять эту теорию , рассмотрим один из примеров Минского ,
основанный на связи между ожиданием , ощущением и чувством человека ,
когда он открывает дверь и входит в комнату . Предположим , что вы
собираетесь открыть дверь и зайти в комнату незнакомого вам дома .
Находясь в доме , перед тем как открыть дверь , у вас имеются
определенные представления о том , что вы увидите , войдя в комнату .
Например , если вы увидите к-л пейзаж или морской берег , поначалу вы с
трудом узнаете их . Затем вы будете удивлены , и в конце концов
дезориентированы , так как вы не сможете объяснить поступившую
информацию и связать ее с теми представлениями , которые у вас имелись
до того . Также у вас возникнут затруднения с тем , чтобы предсказать
дальнейший ход событий. С аналитической точки зрения это можно объяснить
как активизацию фрейма комнаты в момент открывания двери и его ведущую
роль в интерпретации поступающей информации . Если бы вы увидели за
дверью кровать , то фрейм комнаты приобрел бы более узкую форму и
превратился бы во фрей кровати . Другими словами , вы бы имели доступ к
наиболее специфичному фрейму из всех доступных .Возможно ,б что вы
используете информацию , содержащуюся в вашем фрейме комнаты для того
чтобы распознать мебель , что называется процессом сверху-вниз , или в
контексте теории фреймов фреймодвижущим распознаванием . Если бы вы
увидели пожарный гидрант , то ваши ощущения были бы аналогичны первому
случаю. Психологи подметили , что распознавание объектов легче проходит
в обычном контексте, чем в нестандартной обстановке . Из этого примера
мы видим , что фрейм - это модель знаний , которая активизируется в
определенной ситуации и служит для ее объяснения и предсказания . У
Минского имелись достаточно расплывчатые идеи о самой структуре такой БД
, которая могла бы выполнять подобные вещи . Он предложил систему ,
состоящую из связанных между собой фреймов , многие из которых состоят
из одинаковых подкомпонентов , объединенных в сеть . Таким образом , в
случае , когда к-л входит в дом , его ожидания контролируются
операциями , входящими в сеть системы фреймов . В рассмотренном выше
случае мы имеем дело с фреймовой системой для дома , и с подсистемами
для двери и комнаты . Активизированные фреймы с дополнительной
информацией в БД о том , что вы открываете дверь , будут служить
переходом от активизированного фрейма двери к фрейму комнаты . При этом
фреймы двери и комнаты будут иметь одинаковую подструктуру . Минский
назвал это явление разделом терминалов и считал его важной частью
теории фреймов .
Минский также ввел терминологию , которая могла бы использоваться при
изучении этой теории ( фреймы , слоты , терминалы и т. д.) . Хотя
примеры этой теории были разделены на языковые и перцептуальные , и
Минский рассматривал их как имеющих общую природу , в языке имеется
более широкая сфера ее применения . В основном большинство исследований
было сделано в контексте общеупотребительной лексики и литературного
языка .
Как наиболее доступную иллюстрацию распознаванию , интерпретации и
предположению можно рассмотреть две последовательности предложений ,
взятых из Шранка и Абельсона . На глобальном уровне последовательность А
явно отличается от В .
A John went to a restaurant
He asked the waitress for a hamburger
He paid the tip & left
B John went to a park
He asked the midget for a mouse
He picked up the box & left
Хотя все эти предложения имеют одинаковую синтаксическую структуру и
тип семантической информации , понимание их кардинально различается .
Последовательность А имеет доступ к некоторому виду структуры знаний
высшего уровня , а В не имеет . Если бы А не имело такой доступ , то ее
понимание сводилось бы к уровню В и характеризовалось бы как
дезориентированное . Этот контраст является наглядным примером
мгновенной работы высшего уровня структуры знаний .
Была предложена программа под названием SAM , которая отвечает на
вопросы и выдает содержание таких рассказов . Например , SAM может
ответить на следующие вопросы , ответы на которые не даны в тексте , с
помощью доступа к записи предполагаемых событий , предшествующих обеду
в ресторане .
Did John sit down in the restaurant ?
Did John eat the hamburger ?
Таким образом , SAM может распознать описанную ситуацию как обед в
ресторане и затем предсказать оптимальное развитие событий . В нашем
случае распознавание не представляло трудностей , но в большинстве
случаев оно довольно непростое и является самой важной частью теории .
Рассмотрим другой пример :
C He plunked down $5 at the window .
She tried to give him $ 2.50 , but he wouldn’t take it .
So when they got inside , she bought him a large bag of
popcorn .
Он интересен тем , что у большинства людей он вызывает цикл
повторяющихся неправильных или незаконченных распознаваний и
реинтерпретаций .
В случаях с многозначными словами многозначность разрешается с помощью
активизированного ранее фрейма . Для этих целей необходимо создать
лексикон к каждому фрейму . Когда фрейм активизируется ,
соответствующему лексикону отдается предпочтение при поиске
соответствующего значения слова . В контексте ТФ это распознавание
процессов , контролируемых фреймами , которые , в свою очередь ,
контролируют распознавание входящей информации . Иногда это называется
процессом сверху - вниз фреймодвижущего распознавания .
Применение этих процессов нашло свое отражение в программе FRAMP ,
которая может суммировать газетные сводки и классифицировать их в
соответствие с классом событий , например терроризм или землетрясения .
Эта программа хранит набор объектов , которые должны быть описаны в
каждой разновидности текстов , и этот набор помогает процессу
распознавания описываемых событий .
Манипуляция фреймами
Детали спецификации Ф и их репрезентации могут быть опущены , так же
как и алгоритмы их манипуляции , потому что они не играют большой роли в
ТФ .
Такие вопросы , как размер Ф или доступ к нему , связаны с
организацией памяти и не требуют специального рассмотрения .
Распознавание
В литературе имеется много рассуждений по поводу процессов , касающихся
распознавания фреймов и доступа к структуре знаний высшего уровня .
Несмотря на то , что люди могут распознать фрейм без особых усилий ,
для компьютера в большинстве случаев это довольно сложная задача .
Поэтому вопросы распознавания фреймов остаются открытыми и трудными для
решения с помощью ИИ .
Размер фрейма
Размер фрейма гораздо более тесно связан с организацией памяти , чем
это кажется на первый взгляд . Это происходит потому , что в понимании
человека размер фрейма определяется не столько семантическим контекстом
, но и многими другими факторами . Рассмотрим фрейм визита к доктору ,
который складывается из подфреймов , одним из которых является комната
ожидания . Таким образом мы можем сказать , что размер фрейма не
зависит от семантического содержания представленного фрейма / такого ,
как , например , визит к врачу / , но зависит от того , какие
компоненты описывающей информации во фрейме / таком , как комната
ожидания / используются в памяти . Это означает , что когда определенный
набор знаний используется памятью более чем в одной ситуации , система
памяти определяет это , затем модифицирует эту информацию во фрейм , и
реструктурирует исходный фрейм так , чтобы новый фрей использовался как
его подкомпонент .
Вышеперечисленные операции также остаются открытыми вопросами в ТФ .
Инициализационные категории
Рош предложил три уровня категорий представления знаний : базовую ,
субординатную и суперординационную . Например в сфере меблировки
концепция кресла является примером категории основного уровня , а
концепция мебели - это пример суперординационной категории . Язык
представления знаний подвержен влиянию этой таксономии и включает их как
различные типы данных . В сфере человеческого общения категории
основного уровня являются первейшими категориями , которые узнают
человек , другие же категории вытекают из них . То есть
суперординационная категория - это обобщение базовой , а субординатная
- это подраздел базовой категории .
пример
суперординатная идеи
события
базовая события действия
субординатная действия
прогулка
Каждый фрейм имеет свой определенный так называемый слот . Так , для
фрейма действие слот может быть заполнен только к-л исполнителем этого
действия , а соседние фреймы могут наследовать этот слот .
Некоторые исследователи предположили , что случаи грамматики падежей
совпадают со слотами в ТФ , и эта теория была названа теорией
идентичности слота и падежа . Было предложено число таких падежей , от 8
до 20 , но точное число не определено . Но если агентив полностью
совпадает со своим слотом , то остальные падежи вызвали споры . И до
сих пор точно не установлено , сколько всего существует падежей .
Также вызвал трудность тот факт , что слоты не всегда могут быть
переходными . Например , в соответствие с ТФ можно сказать , что фрейм
одушевленный предмет может иметь слот живой , фрейм человек может
иметь слот честный , а фрейм блоха не может иметь такой слот , и он к
нему никогда не перейдет .
Другими словами , связи между слотами в ТФ не являются исследованными до
конца . Слоты могут передаваться , могут быть многофункциональны , но в
то же время не рассматриваются как функции .
Гибридные системы
СФ иногда адаптируются для построения описаний или определений . Был
создан смешанный язык , названный KRYPTON , состоящий из фреймовых
компонентов и компонентов предикатных исчислений , помогающих делать
к-л выводы с помощью терминов и предикатов . Когда активизируется фрейм
, факты становятся доступными пользователю . Также существует язык Loops
, который объединяет объекты , логическое программирование и процедуры .
Существуют также фреймоподобные языки , которые за исходную позицию
принимают один тип данных в памяти , к-л концепцию , а не две / напр
фрейм и слот / , и представление этой концепции в памяти должно быть
цельным .
Объектно - ориентированные языки
Параллельно с языками фреймов существуют объектно - ориентированные
программные языки , которые используются для составления программ , но
имеют некоторые св-ва языков фреймов , такие , как использование слотов
для детальной , доскональной классификации объектов . Отличие их от
языков фреймов в том , что фреймовые языки направлены на более
обобщенное представление информации об объекте .
Одной из трудностей представления знаний и языка
фреймов является отсутствие формальной семантики . Это затрудняет
сравнение свойств представления знаний различных языков фреймов , а
также полное логическое объяснение языка фреймов .
|