Informatics Point

Информатика и проектирование

Назначение баз данных

Синтагматические отношения представляют собой отношения лексических единиц в тексте, т.е. они выражают семантику контекста.

При переводе основного смыслового содержания документов и запросов с естественного языка на дескрипторный информационно - поисковый язык существуют определенные правила, называемые системой индексирования. Результатом перевода документа является поисковый образ документа, а запроса - поисковый образ запроса.

Из перечисленных информационно - поисковых языков именно дескрипторные языки наилучшим образом приспособлены для описания документов и запросов при автоматизированном поиске в текстовых БД. Языки эти обладают таким преимуществом, как гибкость, открытость, близость к естественному языку; это языки двухуровневые (уровень ключевых слов и уровень дескрипторов). Дескрипторные информационно - поисковые языки позволяют формулировать документы и запросы в разных терминах. К основным недостаткам языков данного класса можно отнести недостаточную полноту описания смыслового содержания документов и запросов.

Системы, контролируемые тезаурусом, содержат процедуры как морфологического, так и синтаксического анализа текстов. Однако при проектировании ряда БД возникает необходимость в добавлении еще одного этапа анализа текста на естественном языке - анализа его семантической структуры. Примером таких баз могут быть БД, ориентированные на поиск по образцам. В подобных семантических системах пытаются моделировать процесс понимания законченных описаний фрагментов действительности, например патентов, рассказов, эпизодов и др., выраженных в виде текстов. Как правило, понимание текста трактуется как процесс извлечения из него существенной с точки зрения системы информации. Извлеченная информация вводится в базу знаний, представляющую собой динамическую информационную модель реального мира. Затем система способна отвечать на запросы относительно событий, фактов, явлений, изложенных в текстах.

Пакеты прикладных программ, предназначенные для ввода, обработки, поиска и обновления текстов, называют информационно-поисковой системой (ИПС).

Перейти на страницу: 1 2 

Лучшие статьи по информатике

Разработка интегрированной системы управления отделением разваривания на спиртзаводе на основе программируемого логического контроллера Modicon TSX Momentum
Автоматизация технологических процессов - этап комплексной механизации, характеризуемый освобождением человека от непосредственного выполнения функций управ ...

Трехмерные транзисторы
Один из аспектов повышения процессов обработки информации - получение конструкции трехмерного транзистора. Рассматриваются вопросы одного из наиболее прог ...

Разработка плана реконструкции с заменой аналоговой АТС на цифровую АТС Алмаз-1
В последние годы на телефонных сетях Российской Федерации внедряются новые системы АТС и узлы коммутации, которые обеспечивают качественную и надежную связь ...

Меню сайта