Informatics Point

Информатика и проектирование

Назначение баз данных

Синтагматические отношения представляют собой отношения лексических единиц в тексте, т.е. они выражают семантику контекста.

При переводе основного смыслового содержания документов и запросов с естественного языка на дескрипторный информационно - поисковый язык существуют определенные правила, называемые системой индексирования. Результатом перевода документа является поисковый образ документа, а запроса - поисковый образ запроса.

Из перечисленных информационно - поисковых языков именно дескрипторные языки наилучшим образом приспособлены для описания документов и запросов при автоматизированном поиске в текстовых БД. Языки эти обладают таким преимуществом, как гибкость, открытость, близость к естественному языку; это языки двухуровневые (уровень ключевых слов и уровень дескрипторов). Дескрипторные информационно - поисковые языки позволяют формулировать документы и запросы в разных терминах. К основным недостаткам языков данного класса можно отнести недостаточную полноту описания смыслового содержания документов и запросов.

Системы, контролируемые тезаурусом, содержат процедуры как морфологического, так и синтаксического анализа текстов. Однако при проектировании ряда БД возникает необходимость в добавлении еще одного этапа анализа текста на естественном языке - анализа его семантической структуры. Примером таких баз могут быть БД, ориентированные на поиск по образцам. В подобных семантических системах пытаются моделировать процесс понимания законченных описаний фрагментов действительности, например патентов, рассказов, эпизодов и др., выраженных в виде текстов. Как правило, понимание текста трактуется как процесс извлечения из него существенной с точки зрения системы информации. Извлеченная информация вводится в базу знаний, представляющую собой динамическую информационную модель реального мира. Затем система способна отвечать на запросы относительно событий, фактов, явлений, изложенных в текстах.

Пакеты прикладных программ, предназначенные для ввода, обработки, поиска и обновления текстов, называют информационно-поисковой системой (ИПС).

Перейти на страницу: 1 2 

Лучшие статьи по информатике

Расчёт параметров настройки ПИ и ПИД регуляторов
Автоматизация производства является на современном этапе важнейшим фактором научно-технического прогресса во всех отраслях промышленности, в том числе ...

Оборудование Среда-1
Автоматизация технологического процесса - совокупность методов и средств, предназначенная для реализации системы или систем, позволяющих осуществлят ...

Разработка сети мониторинга поездной радиосвязи ОАО РЖД
Радиосвязь занимает одно из ведущих мест в общей системе экономического обеспечения страны. Она довольно проста в построении, оперативна в организации, экон ...

Меню сайта