Что такое предметная рубрика
Язык предметных заголовков (рубрик)
Содержание
Лексика языка предметных рубрик
В основе лексики предметных рубрик лежит лексическая единица (ЛЕ) – обозначение отдельного понятия, принятого в данном информационно поисковом языке и неделимое в этой функции. В языковой форме понятия выражаются через:
В языке предметных рубрик лексические единицы называются заголовками. Следовательно, лексика языка предметных рубрик делится на две части:
Предметные заголовки (заголовки предметных рубрик), которые включают наименование основного предмета. Им может быть конкретное или абстрактное понятие, как единичное, так и общее.[4]
В зависимости от содержания различают следующие виды заголовков[5]:
Подзаголовки (подрубрики). Они отражают тот или иной аспект рассмотрения предмета, выраженного заголовком предметной рубрики. Лексику подзаголовков можно подразделить на следующие виды[6]:
— специфические подзаголовки служат для выделения аспектов, характерных только для определённого класса предметов. Например, “Гашение (извести) ”, “Пошив (одежды) ”.
— к подзаголовкам социальной среды можно отнести такие термины, как физические и биологические системы и др.
Предметные рубрики
Виды предметных рубрик [9]
I. В зависимости от состава и структуры
II. В зависимости от объема отражения темы документа
Метод автоматической классификации (рубрикации) на основе динамического анализа семантической структуры текста
Суть этого метода заключается в том, что на вход некоей информационной системы (модуля) поступает классификатор и документ. Система подвергает тексты рубрик классификатора семантико-лингвистическому анализу, выделяя лингвистические конструкции, характеризующие каждую рубрику.
Подобной процедуре подвергается и полный текст документа. После этого производится сравнение полученных конструкций и вычисление коэффициентов соответствия каждой рубрики. Автоматическая рубрикация заключается в указании рубрик с наибольшим значением коэффициента соответствия.
Очевидно, что процесс автоматической классификации в чём-то обратен процессу полнотекстового поиска: при поиске один короткий текст запроса сопоставляется с множеством документов, а при классификации один документ сопоставляется с множеством коротких текстов рубрик классификатора.
Поскольку система извлекает информацию из текста рубрик, фактически обучаясь на ней, то эти тексты должны быть, с одной стороны, корректно заданы, а с другой, достаточно ёмко описывать свою область. Предполагается, то дочерние рубрики разбивают (конкретизируют) ту предметную область, которую описывает родительская рубрика. Можно считать, что тексты дочерних и нижележащих рубрик относятся к предметной области рубрики, поэтому эти тексты неявным образом добавляются к тексту рубрики.
Классифицируемый текст должен содержать те же конструкции, что и тексты рубрик классификатора, или похожие конструкции с точностью до морфологии и перестановки.
Чем больше суммарный объём текста всех рубрик классификатора, тем качественнее будет происходить классификация. Качество повышается либо большим числом рубрик и их уровней, либо более детальным описанием рубрик.
Тексты рубрик и документов подвергаются семантико-лингвистическому анализу, который состоит в выделении лингвистических конструкций.
Лингвистическая конструкция (ЛК) – это существительное единственного числа именительного падежа и, возможно, одно или несколько прилагательных или причастий мужского рода единственного числа именительного падежа (частный случай именной группы). При анализе учитывается неявное вхождение одних элементов в другие при использовании в тексте запятых и союзов.
Классификация состоит в вычислении коэффициентов для каждой рубрики на основе близости ЛК текста классифицируемого документа ЛК этой рубрики. В ЛК рубрики входят все ЛК заголовка и комментария этой рубрики, плюс все ЛК дочерних и нижележащих рубрик, минус ЛК родительской и других вышележащих рубрик. Сначала производится вычисление коэффициентов для рубрик первого уровня. Если ЛК текста входит в N рубрик, то коэффициент вклада этого ЛК будет в N раз меньше в коэффициент каждой рубрики. Затем берётся некоторый пороговый уровень относительно наибольшего коэффициента, и рубрики с меньшими коэффициентами исключаются из дальнейшего рассмотрения. Далее аналогичная процедура повторяется до достижения максимального уровня вложенности. В конце коэффициенты оставшихся рубрик суммируются с коэффициентами родительских рубрик, происходит упорядочивание рубрик по этим суммарным коэффициентам, и рубрики с меньшим коэффициентом относительно некоторого порогового уровня исключаются. Оставшиеся рубрики и есть результат автоматической классификации документа по данному рубрикатору. [10]
предметная рубрика
Смотреть что такое «предметная рубрика» в других словарях:
Предметная рубрика — элемент информационно поискового языка, представляющий собой краткую формулировку темы на естественном языке. См. также: Предметные рубрики Информационно поисковые языки Финансовый словарь Финам … Финансовый словарь
предметная рубрика — Элемент информационно поискового языка, представляющий собой краткую формулировку темы на естественном языке. [ГОСТ 7.74 96] Тематики информационно поисковые языки EN subject heading DE Schlagwort FR vedette matière … Справочник технического переводчика
Предметная рубрика — в библиогр. записи краткая формулировка предмета (факта, события, аспекта и т. п.), рассматриваемого в документе (в частности, издании), на который составляется библиогр. запись … Издательский словарь-справочник
предметная рубрика — 5.1 предметная рубрика: Элемент информационно поискового языка, представляющий собой краткую формулировку темы на естественном языке Источник … Словарь-справочник терминов нормативно-технической документации
ПРЕДМЕТНАЯ РУБРИКА — краткая формулировка предмета (факта, события, аспекта и т. п.), рассматриваемого в документе … Профессиональное образование. Словарь
комбинированная предметная рубрика — 3.16 комбинированная предметная рубрика: По ГОСТ 7.74. Источник … Словарь-справочник терминов нормативно-технической документации
многочленная предметная рубрика — 3.19 многочленная предметная рубрика: Сложная предметная рубрика, в которой лексические единицы отделены друг от друга разделительным знаком. Первый элемент многочленной предметной рубрики, называется заголовком, а каждый последующий, отделяемый… … Словарь-справочник терминов нормативно-технической документации
адекватная предметная рубрика — 3.2 адекватная предметная рубрика: По ГОСТ 7.74. Источник … Словарь-справочник терминов нормативно-технической документации
обобщающая предметная рубрика — 3.20 обобщающая предметная рубрика: По ГОСТ 7.74. Источник … Словарь-справочник терминов нормативно-технической документации
описательная предметная рубрика — 3.21 описательная предметная рубрика: По ГОСТ 7.74. Источник … Словарь-справочник терминов нормативно-технической документации
ТЕМА: ПРЕДМЕТНЫЕ РУБРИКИ: ФУНКЦИИ, ВИДЫ, СПОСОБЫ СОСТАВЛЕНИЯ
Предметная рубрика – элемент ИПЯ, представляющий собой краткую формулировку темы на естественном языке.
Предметная рубрика – результат процесса предметизации, краткая формулировка факта, события, аспекта и т.п., рассматриваемого в документе, созданная на основе принципов и правил специально разработанного предметизационного ИПЯ.
Предметная рубрика выполняет следующие функции:
1. информационную – ПР в сокращенной форме дает сведения о содержании каждого документа.
2. эвристическую – ПР обеспечивает быстрое разыскание нужной литературы (этому способствует правильная формулировка ПР, а также алфавитное расположение предметных рубрик).
3. комплексирующую – документы (или ПОД), посвященные одному предмету и рассматривающие его с любых точек зрения, группируются (комплексируются) за одной предметной рубрикой.
4. терминологическую– ПР, отражая предмет документа знакомит читателя с терминами, принятыми в науке или практике.
Виды предметных рубрик.В зависимости от степени конкретизации представления предмета и его аспектов различают адекватные и обобщающие ПР. При окончательном выборе ЛЕ в процессе оформленияПРследует обозначать предмет и его аспекты с необходимой и достаточной для данной ИПС степенью адекватности.
Адекватная ПР – ПР, формулировка которой выражает объем понятия, наиболее точно соответствующего объему понятия о предмете документа.
Обобщающая ПР –ПР, выражающая объем понятий существенно более широкий, чем объем понятия о предмете документа. Примеры:
· Предмет – «кактусы». Обобщающая ПР: Декоративные цветы; адекватная ПР: Кактусы.
· Тема документа – «обработка металлов на фрезерных станках». Обобщающая ПР: Металлорежущие станки – Обработка металлов; адекватная ПР: Фрезерные станки – Обработка металлов.
В зависимости от структуры ПР могут быть простыми и сложными. Простые ПР содержат один предметный заголовок и предназначены для документов, в которых предмет рассматривается в целом и всесторонне (сравнить с индексами КС), могут состоять из одного или нескольких слов:
Вторая мировая война, 1939 – 1945
При формулировке заголовка ПР, состоящего из нескольких слов, особое значение имеет правильный выбор его первого слова. Его называют «ударным», «ведущим». Оно определяет местонахождение данной рубрики в словаре предметных рубрик, каталоге, списке, указателе. От того, насколько удачно выбрано первое слово заголовка рубрики, во многом зависит оперативность поиска нужных документов. В этом состоит эвристическая функция первого слова ПР.
Первым в заголовке должно быть слово, обозначающее или сущность предмета документа, или его специфические особенности, или начальное слово установившегося термина, не допускающего перестановки слов в нем. Например: Великая Отечественная война; Детские сады; Черное море.
С помощью первого слова заголовка в одном месте объединяются тематически близкие рубрики. Следовательно, оно выполняет и функцию комплексирования. Например:
С выбором ведущего слова в заголовке рубрики связан вопрос об инверсии прилагательного или другой части речи. Инверсия в ПР – методический прием изменения порядка слов для придания термину, несущему максимальную смысловую нагрузку, статуса ведущего слова ПР. Чаще всего применяется инверсия имен прилагательных, указывающих на второстепенные признаки, присущие многим предметам: величину, объем, форму, цвет, физические свойства, состояния и т.д.:
Существительное, обозначающее общие понятия: закон, теорему, реакцию и др. также инверсируются. Если эти понятия входят в состав названия предмета в сочетании с именем собственным, на первое место следует ставить имя собственное в родительном падеже:
Бойля – Мариотта закон; Вассермана реакция
Порядковые числительные инверсируются, когда они обозначают очередность события или явления: Олимпийские игры, 26-е
Не инверсируются устойчивые словосочетания: названия научных дисциплин (Художественная литература), профессиональные термины (Теоретическая механика), исторические события (Сталинградская битва), географические названия (Нижний Новгород),когда на прилагательное падает логическое ударение (Холодная война, Математическая логика), если числительное составляет единое целое со следующим за ним существительным (Девятое мая).
Сложные ПР– состоят из заголовка и подзаголовка (подзаголовков) и используются для детализации предмета. Могут состоять из одного и более подзаголовков (в АПУ – они называются гнездовыми и имеют структуру, отличающуюся от ПР словаря предметных рубрик, предметного каталога, каталожной карточки): Пшеница – Возделывание; Ткацкие станки – Ремонт – Челноки.
Форма сложной ПР определяет структуру комплекса документов, которая отражает их содержание.
Описательные ПР –не расчленяются на заголовок и подзаголовки, близки к естественному языку. Могут применяться в основном при оформлении разделителей предметных каталогов и картотек. Например: «Статистические методы в общественных науках», «Трудовое воспитание в школах».
Комбинированные ПР –разновидность сложных ПР, включающие заголовок и описательный подзаголовок. Например: «Швейные машины – Приспособление для измерения затяжки стежков».
СамостоятельнаяПР состоит из одной лексической единицы, т.е. из заголоавка рубрики (простая ПР). Если под рубрикой расположен алфавитный список подчиненных заголовку подзаголовков, то такая совокупность лексических единиц представляет собой комплекс рубрик. Например:
подзаголовки первой ступени могут иметь свои подзаголовки, перед которыми ставится два тире. Они тоже расположены в алфавитном порядке. Например:
Комплексы рубрик представляют совокупность ЛЕ, соединенных определенной тематикой. Они создаются для всестороннего раскрытия предмета и его связей с другими предметами. Каждый подзаголовок позволяет раскрыть аспект рассмотрения предмета, выраженного заголовком. Существует узкие и широкие комплексы ПР.
Узкий комплекс ПР – комплекс, в котором рубрики об одном предмете собраны в одном месте каталога, словаря, указателя. Заголовок комплекса – название самого предмета, аспекты рассмотрения предмета раскрываются подзаголовками. Например:
Узкий комплекс может быть образован и от заголовка, в котором ведущее слово – прилагательное. Например:
В этом примере узкий комплекс состоит только из заголовков.
Широкий комплекс ПР –комплекс, в котором собраны ПР о многих тематически взаимосвязанных предметах, расположенных в различных местах ЯПР. При организации широкого комплекса рубрики связывают с помощью ССА. Например:
1. Общие ссылки (отсылки), которые выражаются словом «смотри» (см.) даются от не принятых в данном ЯПР терминов к принятым, «рабочим» рубрикам, за которым в предметном каталоге, списке, указателе объединяются библиографические записи: Чешуйчатый лишай
2. Связующие ссылки («см. также») связывают тематически близкие рубрики, размещенные в разных местах алфавитного ряда ЯПР. Связующие ссылки связывают рубрики в двух направлениях – прямом и обратном. Например:
Пожарные лестницы Механические лестницы
Механические лестницы Пожарные лестницы
3. Перекрестные ссылки –способ связывать смежные по содержанию рубрики, применяются те же слова, что и связующие ссылки. Например:
4. Для организации предметных каталогов и картотек используются справочные карточки, поясняющие, какая литература собирается в ПР. Например: ПР «Империалистические войны». За разделителем ставится справочная карточка: «Здесь собирается теоретическая литература об империалистических войнах, раскрывается их сущность и т.д. литературу об отдельных войнах см. в ПР под их наименованием.
Для возможно полного раскрытия содержания определенной предметной области крупнейшие отраслевые библиотеки и информационные центры (ИНИОН, Гос. центр. науч. мед. б-ка, РНБ и др.) выпускают списки ПР, называемые словниками.
Трудности, с которыми сталкивается предметизатор:
1.Когда заглавие документа не содержит «ключевых слов», раскрывающих его содержание, например, «Актуальные проблемы современности». В данном случае формулировка ПР возможна лишь после знакомства с текстом документа;
2.При отсутствии в текстах указание на связи между родственными терминами. Например, в тексте могут быть использованы термины «индексирование», «систематизация», «предметизация», но только логический анализ и знание отрасли позволяют установить между ними отношения соподчинения. (Известно, что понятие «индексирование – родовое по отношению к двум видовым – «систематизация» и «предметизация». Без знания терминосистемы определенной отрасли невозможно организовать эффективное функционирование предметизационной ИПС);
3. К особенности естественного языка относится возможность перефразирования, когда изменение синтаксической конструкции не влечет изменения смысла выражения («Любимый город мой, Москва» или «Москва, город мой любимый») В ПР любая инверсия влечет за собой серьезные последствия, поскольку влияет на выбор ведущего слова комплекса предметных рубрик;
4. Для естественного языка характерна эллипсоидность, т.е. пропуск в тексте слов, которые подразумеваются из контекста. Например, использование словосочетания «операция под наркозом» позволяет ликвидировать многозначность слова «операция», которая может быть не только хирургической, но и военной, мы употребляем термин «предметная рубрика» или просто «рубрика», подразумевая то же самое.
Предметизация документов. Предметные рубрики: функции, виды, способы составления
Национальная библиотека РД им. Р. Гамзатова
Отдел обработки литературы и организации каталогов
функции, виды, способы составления
(Памятка в помощь отделам, формирующим ЭК на подсобный фонд)
Составитель: редактор СК
функции, виды, способы составления
Предметизация документов определяет предмет рубрики для документа в соответствии с его содержанием.
Объектом предметизации является его составная часть или совокупность документов.
Процесс предметизации состоит из нескольких операций:
1) Отбор документов, библиографические записи которых будут включены в предметный каталог.
2) Анализ содержания и формы документа с целью определения предмета, аспектов его рассмотрения и выявления связи между ними в тексте.
3) Выбор смысловых компонентов (терминов) и формулировка из них рубрик, отражающих выявление связи.
4) Стандартизация формулировки рубрик с помощью словарей предметных рубрик (или других пособий).
5) Редактирование рубрик, т. е. проверка их соответствия правилам предметизации и нормативным документам.
6) Написание рубрик на каталожных карточках или их ввод в базу данных.
Структурной единицей Языка Предметных Рубрик являются предметные рубрики, которые включают в свой состав лексические единицы, слова или словосочетания, выражающие понятия для описания содержательных признаков документов или запросов.
Предметная рубрика – элемент информационно-поискового языка, представляющий собой краткую формулировку, 5–7 слов, от одной до трёх рубрик, не более трёх подзаголовков для одного документа.
Слова формулируются во множественном числе, например:
1) Автомобили; комбайны.
Чтобы информационно-поисковый язык мог в полной мере осуществить свою поисково-информационную функцию, предметная рубрика, являясь его основным документом, должна соответствовать определённым требованиям и формулироваться по правилам. Предметная рубрика должна быть:
а) Грамотной – не содержать научных и политических ошибок.
б) Адекватной – полно и точно передавать информацию.
в) Однозначной – не допускать двусмысленных толкований, исключать омонимию и полисемию (многозначность).
г) Комплексирующей – собирать все сведения о предмете.
Предметная рубрика составляется из нескольких лексических единиц – заголовка и подзаголовков.
Заголовок Предметной Рубрики – обязательный элемент, слово или словосочетание, выражающее общее понятие обрабатываемого документа. Это первый или единственный элемент предметной рубрики. Заголовок рубрики – обязательный документ.
В качестве заголовка предметной рубрики могут выступать:
– форма, жанр, физические характеристики документа.
Подзаголовок Предметной Рубрики – это второй и каждый следующий элемент сложной предметной рубрики, отделяемый от других разделительным знаком. Подзаголовки ограничивают понятия о предмете, заключенном в заголовке Предметной Рубрики.
Подзаголовки предметной рубрики в зависимости от содержания могут быть:
– формальными, отражающими форму и назначение документа. Предметная Рубрика выполняет следующие функции:
1. Информационную – Предметная рубрика в сокращенной форме дает сведения для содержания каждого документа.
2. Эвристическую – Предметная Рубрика обеспечивает быстрое разыскание нужной литературы (этому способствует правильная формулировка Предметной рубрики, а также алфавитное расположение предметной рубрики).
3. Комплексирующую – документы, посвященные одному предмету и рассматривающие его с любых точек зрения, группируются (комплексируются ) за одной предметной рубрикой.
4. Терминологическую – Предметная Рубрика, отражая предмет документа, знакомит читателя с терминами, принятыми в науке или практике.
В зависимости от структуры Предметные Рубрики могут быть простыми и сложными.
1) Простая Предметная Рубрика – предметная рубрика, состоящая из одной лексической единицы.
2) Сложная Предметная Рубрика – предметная рубрика, состоящая из нескольких лексических единиц.
Сложная Предметная Рубрика применяется в нескольких формах:
а) Многочисленная Предметная Рубрика – это сложная предметная рубрика, в которой лексические единицы отделены друг от друга разделительным знаком (тире), например:
б) Описательная Предметная Рубрика – это сложная предметная рубрика, в которой комбинация лексических единиц, чаще всего отделённых друг от друга предлогами и союзами, представлены в виде единого словосочетания. Описательную предметную рубрику разрешается использовать в тех случаях, когда их формулировки являются устоявшимися терминами. Например:
Железнодорожная сигнализация, централизация и блокировка.
в) Комбинированная Предметная Рубрика – это многочисленная Предметная Рубрика, включающая элементы, построенные, как описательные предметные рубрики. Например:
Дети в изобразительном искусстве—Альбомы.
Виды предметных рубрик. В зависимости от степени конкретизации представления предмета и его аспектов различают адекватные и обобщающие Предметные Рубрики.
1. Адекватная Предметная Рубрика — предметная рубрика, формулировка которой выражает объем понятия, наиболее точно соответствующего объему понятия о предмете документа.
2. Обобщающая Предметная Рубрика – предметная рубрика, выражающая объем понятий существенно более широкий, чем объем понятия о предмете документа. Примеры:
Предмет – «кактусы». Обобщающая Предметная Рубрика: «Декоративные цветы»; Адекватная Предметная Рубрика: «Кактусы».
Тема документа – «Обработка металлов на фрезерных станках». Обобщающая ПР:: «Металлорежущие станки—Обработка металлов»; Адекватная ПР: « Фрезерные станки—Обработка металлов».
Примеры занесения в Ирбис
Нат Пинкертон – король сыщиков; Воскресший покойник: новеллы: [перевод с английского]. – Москва: Престиж бук, 2015. – 461 с.; 21 см. – (Ретро библиотека приключений и научной фантастики). – ISBN 976-5-371-00451-2 (в пер.): 590 р.
Художественная литература (произведение) – (поле 606, подполе Предметный заголовок)
– новеллы – (поле 606, подполе 1-й подзаголовок)
– приключенческие и детективные романы – (поле 606, подполе 2-й подзаголовок)
– США – (поле 606, подполе Географический подзаголовок)
Сухов, Евгений Евгеньевич.
Я – вор в законе. Мафия и власть/ Евгений Сухов. – Москва: АСТ-пресс, 2001. – 429 с., [1]c.; 21 см. – ISBN 5-7805-0543-8 (в пер. ): 150р.
Художественная литература (произведение) – (поле 606, подполе Предметный заголовок)
– проза – (поле 606, подполе 1-й подзаголовок)
Россия – (поле 606, подполе Географический подзаголовок)
Еремеев, Петр Васильевич.
Арзамасские мастера. – Нижний Новгород: Волгоградское книжное издательство,1992. – 254, [1] c., [8 ] л. ил., 17см. – (Рассказы о народном искусстве).
Художественные промыслы – (первое повторение поля 606, подполе Предметный заголовок)
История – (поле 606, подполе 1-й подзаголовок)
Арзамас – (поле 606, подполе Географический подзаголовок)
Русское декоративно-прикладное искусство – (второе повторение поля 606, подполе Предметный заголовок)
Игарский музей вечной мерзлоты. – М.: Типография Эй Би Ти групп; 2014. – 22 с.: ил. – ISBN 978-5-91151-90-6: 100р.
Музеи России – (поле 606, подполе Предметный заголовок)
Искусство – (поле 606, подполе 1-й подзаголовок)
Игарка – (поле 606, подполе Географический подзаголовок)
Путеводители – (поля 606, подполе Формальный подзаголовок)
Энциклопедия архитектурных стилей/ В. Кох. – 7-е издание, исправленное. – Москва: «Бертельсманн Медиа Москвау АО», 2014. – 528 с.: ил. – ISBN 978-5-88353-597-9:1500р.
Архитектурные стили – (поле 606, подполе Предметный заголовок)
Искусство – (поле 606, подполе 1-й подзаголовок)
Энциклопедии – (поле 606, подполе Формальный подзаголовок)
Карл Брюллов / Г. Леонтьева. – 2-е издание, дополненное. – Ленинград: Искусство, 1983. – 336 с.: цв. ил.; 21 см. – (Жизнь в искусстве). – 1000экз. – (в пер.): 210р.
1. (1799- 1852 ) – художник – (первое повторение поля 606, подполе Предметный заголовок)
2. Живопись – 1-я пол. ХIХ в. – (второе повторение поля 606, подполе Хронологический подзаголовок)
1. Акушинский район – (первое повторение поля 606, подполе Предметный заголовок)
История Дагестана – (поле 606, подполе 1-й подзаголовок)
2. Телефонные справочники – (второе повторение поля 606, подполе Предметный заголовок)
Раненое счастье: Повесть/ М. Абдуллаев. – Махачкала: Эпоха, 2016. – 92 с.; 21 см. – 1000 экз. – (в пер.): 100р.
Дагестанская литература – (поле 606, подполе Предметный заголовок)
повесть – (поле 606, подполе 1-й подзаголовок)
Ганиева, Фаида Абубакаровна
Азербайджанский язык – (поле 606, подполе Предметный заголовок)
Лексика хиналугского языка – (поле 606, подполе 1-й подзаголовок)
Языкознание – (второе повторение поля 606, подполе Предметный заголовок)
Александров, Александр Гаврилович и др.
Сварочное оборудование – (поле 606, подполе Предметный заголовок)
Эксплуатация – (поле 606, подполе 1-й подзаголовок)
Справочники – (поле 606, подполе Формальный подзаголовок)
Жданович, Владимир Михайлович и др.
Вычислительные машины электронные – (поле 606, подполе Предметный заголовок)
Технические средства – (поле 606, подполе 1-й подзаголовок)
Справочники – (поле 606, подполе Формальный подзаголовок)