Неверно что относится к основным требованиям предъявляемым к информационно поисковому языку
Информационно-поисковый язык
Информационно-поисковый язык (ИПЯ) — искусственный язык, представляющий совокупность средств для описания формальной и содержательной структуры для поиска (путем индексирования) по запросу пользователя.
Содержание
Структура
Для упорядочения лексических единиц при построении лексики служат парадигматические отношения, то есть смысловые отношения между лексическими единицами. Эти отношения устанавливаются и фиксируются в словаре языка, исходя из потребностей информационного поиска.
Типы и виды ИПЯ
Способ задания лексических единиц
Порядок записи лексических единиц
Ссылки
Полезное
Смотреть что такое «Информационно-поисковый язык» в других словарях:
информационно-поисковый язык — ИПЯ Формализованный искусственный язык, предназначенный для индексирования документов, информационных запросов и описания фактов с целью последующего хранения и поиска. [ГОСТ 7.74 96] информационно поисковый язык Искусственный язык,… … Справочник технического переводчика
Информационно-поисковый язык — формализованный искусственный язык, предназначенный для индексирования документов, информационных запросов и описания фактов с целью последующего хранения и поиска. По английски: Information retrieval language Синонимы: ИПЯ См. также:… … Финансовый словарь
информационно-поисковый язык — 3.10 информационно поисковый язык: По ГОСТ 7.74. Источник … Словарь-справочник терминов нормативно-технической документации
информационно-поисковый язык, — 2.1 информационно поисковый язык, ИПЯ: Формализованный искусственный язык, предназначенный для индексирования документов, информационных запросов и описания фактов с целью последующего хранения и поиска Источник … Словарь-справочник терминов нормативно-технической документации
информационно-поисковый язык — Rus: информационно поисковый язык (сокр. ИПЯ) Deu: Informationsrecherchesprache Eng: information retrieval language Формализованный искусственный язык, предназначенный для индексирования документов, информационных запросов и описания фактов с… … Словарь по информации, библиотечному и издательскому делу
Информационно-поисковый язык — знаковая система, предназначенная для описания (путём индексирования (См. Индексирование)) основного смыслового содержания текстов (документов) или их частей, а также для выражения смыслового содержания информационных запросов с целью… … Большая советская энциклопедия
информационно-поисковый язык — искусственный язык, предназначенный для описания и поиска документальной информации (документов или их фрагментов, понятий и … Толковый переводоведческий словарь
Информационно-поисковый язык (ИПЯ) — [retrieval language, indexing language] искусственный язык, предназначенный для записи и поиска информации в информационно поисковой системе. Он обычно состоит из словаря (тезауруса) и грамматики различной сложности. Есть языки без грамматики… … Экономико-математический словарь
язык предметных рубрик, предметизационный информационно-поисковый язык — 2.4 язык предметных рубрик, предметизационный информационно поисковый язык: Информационно поисковый язык, предназначенный для индексирования документов (частей документов) и информационных запросов посредством предметных рубрик Источник … Словарь-справочник терминов нормативно-технической документации
ИНФОРМАЦИОННО-ПОИСКОВЫЙ ЯЗЫК (ИПЯ) — язык, предназначенный для формализованного описания смыслового содержания документов или запросов, или описания фактов с целью их последующего поиска. Как и естественный язык, состоит из набора алфавитных символов (буквенных, цифровых или… … Профессиональное образование. Словарь
Информационно-поисковые языки
Искусственный язык, предназначенный для формализованного описания смыслового содержания документов, данных, отдельных понятий или терминов и обеспечения последующего их поиска в информационно-поисковых массивах. Формализация лексики и создание различных ИПЯ вызвано необходимостью устранения «избыточности» и «недостаточности» естественного языка для целей информационного поиска, а также ликвидации присутствующий в нем синонимии и омонимии, для реализации «однозначности» информационного поиска[1].
Информационно-поисковый язык (ИПЯ) — искусственный язык, представляющий совокупность средств для описания формальной и содержательной структуры для поиска (путем индексирования) по запросу пользователя.
Содержание
Структура
В качестве лексических единиц ИПЯ могут быть использованы:
Для упорядочения лексических единиц при построении лексики служат парадигматические отношения, то есть смысловые отношения между лексическими единицами. Эти отношения устанавливаются и фиксируются в словаре языка, исходя из потребностей информационного поиска.
Типы и виды ИПЯ
Способы задания лексических единиц
III Фасетная классификация (классификация двоеточием или классификация Ранганатана)[5]
Это совокупность нескольких независимых классификаций, осуществляемых одновременно по различным основаниям, в которой:
Этот способ построения разработан индийским учёным и библиотековедом Ш. Р. Ранганатаном («Классификация двоеточием», 1933). Основой классификации является привычное человеку отнесение объекта к разным категориям (задание множества и его элементов).
Порядок записи лексических единиц
Типы ИПЯ по сфере (области) применения
Виды отношений в ИПЯ [8]
Сфера информационно-поисковых систем в филологии. Информационно-исследовательская база данных «Русский Шекспир»[10]
«Информационные проекты в области филологии должны быть направлены на создание инновационного продукта, научных информационно-телекоммуникационных систем и сетей, унифицированной системы научных знаний и технологий, на создание некоторых элементов искусственного интеллекта при построении экспертных систем и баз знаний, информационных сетей коллективного пользования с уникальными научными ресурсами»[11].
Научные задачи: «Информационно-исследовательской базы данных «Русский Шекспир»
«Мир Шекспира» имеет 3 основных направления
Основное значение базы данных
Апробация информационно-исследовательской базы данных «Русский Шекспир»
Информационно-исследовательская база «Русский Шекспир» представляет собой своеобразный информационный центр об Уильяме Шекспире, его произведениях, проблемах изучения его творчества. С одной стороны, база предоставляет посетителю возможность просмотреть собранные в одном месте произведения, пожалуй, самого известного английского писателя, а с другой, предлагает относительно широкий охват работ разных направлений, так или иначе связанных с творчеством У. Шекспира. На ресурсе представлены, в основном, тексты отечественных исследователей и авторов (что, в принципе, логично соотносится с названием базы).
Произведения У. Шекспира расположены здесь в различной форме (раздел: «В русских переводах») в зависимости от размера часть из них расположена непосредственно на сайте (например, сонеты, перевод которых представлен в сопровождении оригинала. Таким образом, оба текста располагаются в максимальной доступности), часть (некоторые пьесы) представлена в формате pdf. Представленные переводы принадлежат разным авторам и времени. Самые ранние переводные тексты произведений на ресурсе датируются 1899 годом (например, «Гамлет» в пер. А. Кронеберга, «Ромео и Джульетта» в пер. Д. Михаловского, «Ричард III» в пер. А. Дружинина и др.), и в них сохранен оригинальный дореволюционный стиль.
В другом разделе – «В научной и театральной критике», представлены перечни научных монографий исследователей творчества У. Шекспира, научных сборников, предисловия и вступительных статей к изданиям разного времени, рецензий на книги о писателе и его произведениях, спектакли (причем как центральных театров России, так и малых, провинциальных), аннотации на выходящие издания.
На ресурсе можно найти творческие работы на темы шекспировских произведений, а также отражающие восприятие личности самого автора (Раздел: «В оригинальном творчестве»). Это различные работы вдохновленных читателей, поклонников и просто неравнодушных: стихотворения, рисунки, фото, произведения прикладного искусства. Здесь также представлено творчество современников У. Шекспира и цитаты его/из него/о нем.
Одним из самых полезных для научных исследователей творчества У. Шекспира является раздел «Bibliographia», в котором представлен перечень работ и произведений по следующим направлениям: переводы и переделки произведений на русский язык с 1748 года, история шекспироведения (в том числе переводы и оценка драматурга в разные периоды (Просвещение) и в разных странах (США, Западная Европа, Германия), русская критика У. Шекспира XVIII-XIX вв., проблема авторства, влияние У. Шекспира на литературу других стран, У. Шекспир и А. Пушкин, а также художественная литература и публицистика (пародии, фельетоны, юморески по мотивам произведений, рецензии на художественные произведения о писателе). Еще одним полезными разделами окажутся: «Personalia», который не даст запутаться в многочисленных фамилиях современников У. Шекспира и тех, кто изучал и изучает его творчество задолго после его жизни. И «Шекспир в Интернете», где представлены ссылки на русскоязычные, украиноязычные и англоязычные ресурсы.
Необходимо отметить, что все перечни литературы снабжены выходными данными, что значительно облегчает поиск нужной информации.Стоит также упомянуть, что, не смотря на значительный объем информации, интерфейс ресурса сделан достаточно удобным и логичным, что также облегчает работу с данными, содержащимися в базе.
Разработчики ставили перед собой задачи создания обширной библиографии по теме «Русский Шекспир» и внедрение базы в преподавание в различных сферах. Конечно, ресурс получился так или иначе в большей степени направлен на филологов и литературоведов. Однако, если информация, скажем об оценке выходящих спектакля и фильмах, будет пополняться, то ресурс (как источник информации) станет более полезен и другим направлениям, в данном случае театроведам и представителям творческих специальностей: режиссерам, сценаристам и актерам.
Информационно-поисковые языки
ЛЕКЦИЯ 3
1) Информационно-поисковые языки (ИПЯ): понятие и структура.
2) Упорядочения лексических единиц ИПЯ.
3) Требования к ИПЯ
Вопрос 1. Информационно-поисковые языки: структура и требования. Наряду с многочисленными естественными языками в человеческом обществе получили большое распространение и различные искусственные языки. Они создаются людьми для решения каких-либо задач в области науки и техники (машинные языки), для общения между людьми (эсперанто, профессиональные диалекты). Среди искусственных языков особое значение занимают информационные языки.
Необходимость создания и использования информационных языков для обработки информации возникла и продолжает углубляться по мере совершенствования информационной технологии в обществе. Машинный язык — это искусственный, формальный язык, предназначенный для записи информации, хранящейся в запоминающем устройстве вычислительных машин, для описания программ (алгоритмов), указывающих очередность и последовательность выполнения команд по вводу данных из запоминающего устройства, переработке и преобразованию поступающей в машину информации.
Для поиска информации разрабатываются и широко применяются такие искусственные языки, как информационно-поисковые. Информационно—поисковый язык (ИПЯ) — искусственная знаковая система, предназначенная для описания (путём индексирования) основного смыслового содержания текстов (документов) или их частей, а также для выражения смыслового содержания информационных запросов с целью реализации.
Структура ИПЯ однотипна с формальной структурой информации и предполагает выделение следующих уровней:
Элементы каждого уровня объединяются в синтагмы и парадигмы.
Фонетический уровень — это алфавит (списка элементарных символов). В ИПЯ для этого применяют символы естественного языка: кириллица, латинский алфавит, арабские и римские цифры, знаки пунктуации.
Лексический уровеньили словарный запас — совокупность всех употребляемых в ИПЯ лексических единиц. Лексическая единица — наименьшая осмысленная последовательность знаков, задаваемая при конструировании отдельных слов языка. Лексические единицы и образуют лексику языка.
Вопрос 2. Упорядочение лексических единиц ИПЯ. Для упорядочения лексических единиц ИПЯ служат парадигматические отношения, которые фактически определяют и задают структуру языка.
Парадигматические отношения (аналитические) — это внетекстовые, объективно существующие смысловые отношения между лексическими единицами, которые устанавливаются и фиксируются в словаре языка, исходя из потребностей информационного поиска. Парадигматические отношения учитывают сходство или различие в объеме и содержании лексических единиц (понятий). Отношения делятся на: сильные (логические) и слабые (ассоциативные).
Объем понятия — множество предметов, отображенных в данном понятии. Например, «периодические издания» включает газеты, журналы. Количество предметов, входящих в объем, может быть конечным (части света), бесконечным (число), существуют единичные понятия (Луна).
Содержание понятия — это отраженная в сознании совокупность свойств, присущих каждому предмету, входящему в объем понятия.
К сильным (логическим) парадигматическим отношениям относятся:
· Эквивалентности (равнозначности) — отношения между понятиями, объемы которых совпадают, но в содержании имеются различия. Например, документ печатный — документ опубликованный; документ рукописный — документ неопубликованный.
· Подчинения — отношения между понятиями, когда объем одного или нескольких понятий входит в объем другого. Например, вторичные документы (род) включают аннотации, рефераты (виды).
· Соподчинения — между видовыми понятиями, в равной степени подчиненными одному родовому. Например, книга, брошюра, листовка — виды непериодических изданий.
· Перекрещивания — между понятиями, содержание которых различно, но объемы частично совпадают. Например, студенты и туристы, писатели и ученые.
· Противоположности — между соподчиненными понятиями, которые в своем содержании имеют несовместимые признаки, обуславливающие несовпадение объемов. Например, документы текстовые и документы машиночитаемые.
· Противоречия (контрадикторности) — между двумя соподчиненными понятиями, видовые признаки которых несовместимы, что обуславливает несовпадение объемов этих понятий. Эти понятия исключают друг друга. Например, документы первичные и документы вторичные.
Слабые (ассоциативные) парадигматические отношения выражают связи не между понятиями, а между самими предметами (технологические, причинно-следственные, системно-элементные). При создании ИПЯ целесообразно фиксировать следующие ассоциативные отношения:
· Целое — часть (Справочно-поисковый аппарат и каталоги, картотеки).
· Система — элемент (Архивная отрасль Беларуси и Национальный исторический архив).
· Отношения детерминации: причина — следствие (Старение публикаций и снижение спроса).
· Процесс — оборудование (Ксерокопирование и ксерокс).
· Процесс — материал (Ксерокопирование и бумага).
· Материал — изделие (Древесина и бумага).
· Изделие — процесс изготовления (Документ и документирование).
· Предмет — назначение (Магнитные диски и запись информации).
· Наука — объекты изучения (Информатика и информация).
· Наука — представители (Философия и Сократ).
Парадигматические отношения позволяют объединять лексические единицы ИПЯ в семантические группы — парадигмы, элементы которых обладают свойством взаимозаменяемости.
Кроме парадигматических отношений существуют синтагматические (синтаксические, грамматические, текстуальные) отношения, служащие для установления семантических связей между лексическими единицами. Речь идет о правилах образования и правилах интерпретации ИПЯ. Правила образования устанавливают, какие комбинации элементарных символов допускаются при построении слов и выражений, а правила интерпретации — как надлежит понимать эти слова и выражения.
Средства выражения синтагматических отношений называют грамматикой ИПЯ. ИПЯ должен располагать лексико-грамматическими средствами, необходимыми для выражения основного смыслового содержания любого текста и смысла любого информационного запроса по данной отрасли или предмету, быть недвусмысленным (допускать одно истолкование каждой записи), удобным для алгоритмического сопоставления и отождествления (полного или частичного) записей основного смыслового содержания текстов и смыслового содержания информационных запросов.
Одной из основных характеристик ИПЯ является семантическая сила — возможность передавать полно и точно содержание сообщений.
Вопрос 3. Требования к ИПЯ. При разработке конкретного ИПЯ учитываются:
— специфика отрасли или предмета, для которой этот язык создаётся,
— особенности текстов, образующих поисковый массив,
— характер информационных потребностей, для удовлетворения которых создается язык.
В большинстве ИПЯ основной словарный состав (лексика) задаётся его перечислением и представляет собой фрагмент лексики того или иного естественного языка. Отобранные из естественного языка слова и словосочетания, в совокупности образующие основной словарный состав, служат как бы алфавитом данного ИПЯ. Правила образования в таких языках выполняют функцию синтаксиса. В некоторых ИПЯ основной словарный состав задаётся (полностью или частично) методом порождения, который заключается в том, что для таких ИПЯ правила образования устанавливают, как из данного алфавита строить слова ИПЯ, а из этих слов — выражения (фразы) и какие из них будут правильно построенными. ИПЯ отличается от информационного языка и от машинного. В середине 20 в. в качестве ИПЯ широко применялись библиотечно-библиографические классификации и классификации дескрипторного типа).
Главная отличительная особенность ИПЯ — простота лексики и грамматики по сравнению с теми же элементами естественного языка. Требования, предъявляемые к ИПЯ: однозначность, точность и недвусмысленность семантики (каждая запись ИПЯ должна иметь точно определенное и одно-единственное значение); большая семантическая сила (словарь должен включать все термины, необходимые для индексирования документов и запросов); удобство для пользования; простота и немногочисленность грамматических средств.
КЛАССИФИКАЦИЯ ИНФОРМАЦИОННО-ПОИСКОВЫХ ЯЗЫКОВ
2) ИПЯ дескрипторного типа.
3) Методика построения и грамматика ИПЯ дескрипторного типа.
Вопрос 1. Типы и виды ИПЯ. В настоящее время существует множество типов и видов ИПЯ. Наиболее распространенными подходами к классификации ИПЯ являются: классификация Ф.Ланкастера, классификация ВИНИТИ, классификация ЛГИК им. Н.К.Крупской. Последняя классификация представляется наиболее логичной. В ее основу положены три видообразующих признака, учитывающих основные структурные элементы языка: лексику, парадигматику и синтагматику. К этим признакам относятся способ задания лексических единиц, способ кодирования (сочетания) лексических единиц и способ учета парадигматических отношений. Принимается во внимание и возможность автоматизированного поиска.
1) По способу задания лексических единиц: контролируемые и неконтролируемые. Контролируемые ИПЯ — языки, лексика которых задается заранее с помощью словарей и таблиц (УДК, ББК). Неконтролируемые ИПЯ — языки, лексика которых не задается словарем, а строится на основе выбора неограниченного множества терминов естественного языка из индексируемых сообщений.
2) По координации лексических единиц (способу записи): некоординируемые и координируемые. Некоординируемые ИПЯ — языки, не допускающие координации своих лексических единиц ни в процессе индексирования, ни в процессе поиска. Координируемые ИПЯ — языки, в которых лексические единицы координируются между собой или в процессе индексирования, или в процессе поиска. Различают Предкоординируемые и посткоординируемые ИПЯ. Предкоординируемые языки устанавливают порядок записи лексических единиц в процессе индексирования по заранее определенным правилам и предусматривается их жесткая последовательность. Как правило, используются в ручном поиске. Посткоординируемые ИПЯ — языки, в которых лексические единицы задаются в процессе индексирования и сочетаются между собой только в процессе поиска.
3) С учетом и без учета парадигматических отношений: иерархические, фасетные и неиерархические. Языки иерархической структуры представляют собой иерархическую классификацию — систему классов, по которым распределяются понятия на основании наиболее существенных признаков, присущих этим понятиям и отличающих их друг от друга. Класс — совокупность объектов, имеющих один или несколько общих содержательных признаков. Недостаток — невозможность организации внеиерархических связей (иерархическая модель данных — невозможность перекрестных запросов).
Пример иерархической классификации:
1.3.1. 2 Опубликованные
Языки фасетной структуры представляют собой фасетную классификацию — совокупность фасетов, следующих друг за другом в определенной последовательности. В основе построения такой классификации лежит индуктивный метод, который предполагает исследование отдельных предметов множества, нахождение в них общих существенных признаков и группировку на основе последних терминов, обозначающих эти понятия.
Пример фасетной классификации:
1 Документы по знаковой форме представления информации
2 Документы по способу распространения
3 Документы по периодичности изданий
Языки неиерархической структуры являются продуктом эмпирического подхода к построению ИПЯ. Такой подход предполагает создание языка на основе индексирования реальных текстов. Из содержания документа выбираются ключевые слова, которые преобразуются в лексические единицы ИПЯ (ТАСТ, алфавитно-предметная классификация).
К специальным неиерархическим ИПЯ с учетом сильных и слабых прардигматических отношений относится дескрипторный язык.
Вопрос 2. ИПЯ дескрипторного типа. Дескрипторные ИПЯ — искусственные информационные языки, появившиеся 1950-ых годах. Возможность и необходимость их создания были вызваны рядом объективных причин. В эти годы были разработаны первые механизированные системы поиска информации и предпринята попытка использования ЭВМ для решения разнообразных информационно-поисковых задач. Традиционные языки предкоординатного тиап не соответствовали требованиям механизированного, а в дальнейшем автоматизированного поиска информации. Интенсивный поиск новых семантических средств привел к созданию принципиально новых ИПЯ посткоординатного типа. Основы индексирования данных языков были заложены в работах М.Тауба и К.Муерса за рубежом и В.П.Черенина в СССР.
М.Тауб в 1951 году разработал ИПЯ унитермов, т.е. неформализованных единичных терминов, перечнем которых можно достаточно полно и точно передать содержание документа и запроса. Координация унитермов происходит в момент поиска сообщения после получения запроса. Однако этот язык не отвечал требованию однозначности. И нуждался в совершенствовании. В своем первоначальном виде ИПЯ унитермов не применяются. Зато широко распространился ИПЯ унитермов с искусственной грамматикой, который принято называть дескрипторным.
Понятие о дескрипторе ввел в информатику К.Муерс. (Дескриптор — позднелат. descriptor, от лат. describо — описываю). Он предложил уитывать синонимию в языке унитермов и применять лексикографический контроль за используемыми ключевыми словами, который заключался в их нормализации и полном устранении неоднозначности и многозначности. К.Муерс считал, что для контроля лексики должен составляться специальный дескрипторный словарь
Таким образом, дескрипторный язык — искусственный язык посткоординатного типа, построенный на безе формализованной лексики естественного языка. Для контроля лексики создается информационно-поисковый тезаурус (ИПТ) — контролируемый словарь лексических единиц дескрипторного языка, основанный на лексике одного естественного языка, отображающий семантические отношения между лексическими единицами и предназначенный для организации поиска информации путем индексирования документов и/или запросов. Каждый конкретный ИПЯ отражает систему понятий предметной области знания в виде структурированной совокупности терминов и является результатом серьезной и трудоемкой работы.
Вопрос 3. Методика построения и грамматика ИПЯ дескрипторного типа.Разработка ИПТ осуществляется на основе следующих этапов:
1) Определение тематического профиля ИПТ. Тематический профиль определяется путем анализа информационных потребностей специалистов отрасли.
2) Сбор лексики и формирование словника ключевых слов. Словник — исходный массив терминов, который потом подвергается семантической обработке в процессе дескрипторизации. Массив формируется путем извлечения первичных, а чаще вторичных документов и ключевых слов. Иногда используются справочная литература, опрос специалистов. Основная проблема на этом этапе формулировка ключевых слов. Служебные слова (предлоги, союзы, частицы) следует считать неключевыми; общие термины (метод, способ и т.п.) необходимо употреблять только в сочетании с другими словами, конкретизирующими их значение. Ключевыми словами могут быть словосочетания.
3) Построение словарных статей и формирование лексико-семантического указателя. Осуществляется дескрипторизация ключевых слов (для составления дескрипторного словаря) и установление прадигматических отношений между дескрипторами (для увеличения семантической силы языка). Устраняется неоднозначность ключевых слов путем снабжения соответствующими пояснениями — реляторами (ЗАПИСЬ – процесс, ЗАПИСЬ – предмет) Все слова группируются в классы эквивалентности: Безусловноэквивалентные (ОПУБЛИКОВАННЫЕ ДОКУМЕНТЫ = ПЕЧАТНАЯ ПРОДУКЦИЯ) и условно-эквивалентные (ТЕХНИЧЕСКИЕ СРЕДСТВА=АППАРАТУРА)
После этого производится выбор одного из слов в качестве дескриптора. Таким образом, дескриптор — лексическая единица ИПТ, под которой принято понимать нормализованное слово или словосочетание, выбранное из множества условно-эквивалентных ключевых слов для его обозначения. Свойства дескриптора:
§ Полнота выражения смыслового значения данного класса.
§ Краткость и понятность.
§ Частота встречаемости термина в текстах документов и запросов.
Аскриптор — лексическая единица ИПТ, входящая в класс эквивалентности данного дескриптора, которая при индексировании документов и запросов подлежит замене на дескриптор. Результат дескрипторизации: дескрипторный словарь – алфавитный перечень дескрипторов и аскрипторов. Например:
Статьи аскрипторов снабжаются отсылками на заменяющие их дескрипторы. Стандарт предлагает три типа отсылок:
1. Аскриптор – синоним дескриптора:
см ПЕРВИЧНЫЕ ДОКУМЕНТЫ
2. Аскриптор, заменяемый комбинацией дескрипторов (используй комбинацию):
исп к РУССКИЙ ЯЗЫК
3. Аскрипторы, заменяемые несовместимыми дескрипторами (используй альтернативу):
Далее устанавливаются парадигматические отношения. Данный процесс включает:
Логический анализ – сопоставление объемов понятий, представленных дескрипторами:
вр ОРГАНИЗАЦИОННО_РАСПОРЯДИТЕЛЬНАЯ ДОКУМЕНТАЦИЯ (выше род)
нв ПРИКАЗЫ ПО ЛИЧНОМУ СОСТАВУ (ниже вид)
Ассоциативный анализ – сопоставление признаков предметов, входящих в определенные понятия, представленные дескрипторами.
вц НАУНО-СПРАВОЧНЫЙ АППАРАТ (выше целое)
нч ОТДЕЛ (ниже часть)
Прагматический анализ – упорядочение структуры и состава словарной статьи дескриптора. Учитывает: область ИПТ, терминологические особенности отрасли знания
Структура дескрипторной статьи имеет вид:
Д – заглавный дескриптор;
Мс – множество аскрипторов, входящих в класс эквивалентности дескриптора;
Мв – множество вышестоящих дескрпиторов;
Мн – множество нижестоящих аскрипторов;
Ма – множество ассоциативных дескрпиторов.
Например для дескриптора:
в ИНФОРМАЦИОННЫЕ СЛУЖБЫ
н НАЦИОНАЛЬНЫЙ АРХИВ
а СИСТЕМА АРХИВНОГО ОБСЛУЖИВАНИЯ
4) Разработка вспомогательных указателей. Наиболее распространены три типа указателей: систематический указатель дескрипторов тезауруса, указатель иерархических отношений и пермутационный указатель дескрипторов. Систематический указатель – алфавитный список дескрипторов (тематический, категориальный, смешанный). Указатель иерархических отношений — свод классификационных деревьев. Каждый дескриптор может входить при этом более чем в одно дерево. Пермутационный указатель — перечень списков, каждый их которых соответствует одному из знаменательных слов в составе лексической единицы. Предназначен для поиска лексической единицы по отдельным словам.
6) Экспертиза и регистрация ИПТ.
Основным способом уменьшения информационного шума является введение в ИПЯ грамматических средств, которые позволяют точно и полно выражать синтагматические отношения. Грамматические средства делятся на:
— фрагментирующие. Для разделения поискового образа на части. К ним относятся указатели связи (буквы, цифры, знаки);
— смыслоразличительные. Для указания смысловой роли различительных слов внутри фрагмента поискового образа. К ним относятся указатели роли.
Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет