02检索语言

第2章 检索语言

2. 1 检索语言概述

信息检索过程中涉及的人工语言和自然语言。狭义的检索语言指根据信息检索的需要,按照一定的规则对自然语言进行规范,并专门用于信息标引和用户检索的人工语言。

2.1.2检索语言的功能(06华南师范简答)

1. 标引信息内容特征及某些外表特征,保证不同标引人员表达信息的一致性

2. 对内容相同及相关的文献信息加以集中或揭示其相关性

3. 使信息的存储集中化、系统化、组织化,便于检索人员按照一定的排列次序进行有序化

检索

4. 便于将标引用语和检索用语进行相符性比较

2.1.3检索语言的分类

1. 按描述文献的特征:描述文献外表特征(题名、组织、文献编号、引文等)的检索语言

和描述文献内容(分类语言、主题语言、代码语言)特征的检索语言

2. 按结构或原理:分类语言、主题语言、代码语言和引文语言

3. 按信息标识的组合使用方法:先组式语言、后组式语言和散组式语言

4. 按语言的规范化程度:人工语言和自然语言

2. 2 检索语言的理论基础

检索语言以概念逻辑为基础,知识分类是概念逻辑的基础,检索语言的创制以术语学的研究成果为基础。

1.

是一种科学思维方法,

通过明确各自概念及其相互关系而揭示事物的本质属性及各种事物之间的联系与区别。

2.

① 概念的内涵是概念所反映的对象的本质属性的总和。

② 概念的外延是概念所反映对象的范围。

2.21.1概念间的关系

1. 相容关系:指两个概念的外延至少一部分是重合的。

相容关系主要有以下类型:A. 属种关系(包含关系);B. 同一关系;C. 交叉关系;D. 整体与部分关系;E. 全面与某一方面关系;F. 不相排斥的并列关系

2. 不相容关系:不相容关系指两个概念的外延是互相排斥的。

不相容关系主要有三种类型:A. 对立关系(反对关系);B. 矛盾关系;C. 并列关系

是根据各门学科的研究对象的区别与联系,

对科学进行区分和组织,确定每门学科在科学整体中的位置,揭示科学的内部结构,建立符合科学发展规律的分类体系。

是指根据事物属性的异同将事物划分成类,构成事物分类体系,

以便按事物分类体系组织知识体系。

术语学

2. 3 分类检索语言

1. (分类号)来代表各级类目和固定其先后次序的分类体系。分类检索语言主要包括体系分类法和组配分类法两种。

2. (补充)分类检索语言的特点与作用

(1) 分类检索语言的特点主要表现在:

① 它是一部类目的汇编,对表达事物概念的类目起登录作用,只有分类检索语言中有的类目或能够组配而成的类目,才能用于类分文献。

② 它是一个类目的体系,有关角度提示类目之间的关系。

③ 它是一部目的“词典”,对类目起定义作用,限定和说明类目的内涵和外延。 ④ 它是一种类目的排列表,通过线性排列,明确各个类目在分类体系中的位置和次序。

(2) 分类检索语言的作用主要表现在:

① 这是进行分类标引和组织分类检索工具的规范。

② 它能作为对文献资料进行分类排架的依据。但在档案机构一般要采用另一种类型的分类体系来组织分类排架。

③ 它是检索者从分类途径检索文献资料的指南。

它是文献工作者工作中常用的参考手册。

2.3.1.1也称等级列举式分类法,是以科学分类为基础,依据概念的划分与概括,把概括文献内

2.3.1.2又称分面分类法或分面组配式分类法,是依据概念的分析与综合原理,将概括文献内容与事物的主题概念组成“分面-亚面-类目”的结构体系,通过分面内类目之间的组配来表达文献主题的一种文献分类法。

2.3.2体系分类法

2.3.2.1体系分类法的结构

1. 微观结构:分类法中类目的构成结构(分类号、类名、类级、类目注释和参照)

1)

类目体系:

按照类目之间的关系建立起来的类目集合

2) ①

也称组配次序,是指组配表达主题概念的多个语词组合成串时,确定各词序先后位置所依据的主题因素组合次序。

② 引用次序的功能:当某一类事物连续划分需要采用集中分类标准时,分类标准的使用次序是否合理,直接影响分类体系,决定着类目体系展开的方式。(引用次序决定着类目体系以何种方式集中资源,以及提供什么样的检索途径问题,是与分类体系适用性密切联系的。)合理的引用次序应该满足逻辑性原则、符合就是需要的原则和表达性原则。编制分类

表的要求:优先使用该学科、该事物的主要分类标准;优先使用具有科学认识意义的分类标准;优先使用具有较高检索意义的属性作为分类标准。

3) ① 排斥,处于同等地位;

② 同位类的排列方法(03武大简答):按逻辑排列、按客观事物发展的顺序排列、按时间顺序排列、按空间顺序排列,按依存次序、惯用次序、实用次序和字顺次序等其他顺序排列。

4) 类目的确定

① 确切性。即所用的语或词组要能准确地、恰当地反映类目的实际内容范围。

② 科学性。即采用比较通行的科学名词术语作类目名称,而不要采用不通行的表达方式。

③ 简洁性。即所用的类名要概括、精炼、简短,并做到规范化。

5)

又称隶属关系,指类目体系中母类与其子类的关系,体现为上位类与下位类的关系。从

属关系又分为属种关系、整部关系和方面关系。

又称同位关系,在分类体系中体现为同位类的关系。

指交替类目与相应类目之间形成的关系。

又称参见类目或参照类目,指类目之间虽不存在等级关系,但内容上相互关联。

2. 宏观结构

1) 类目体系

2) 标记系统

① 标记符号(10华南师范简答),即分类号,用于标记某一分类体系各类目的序数系统。

理想的分类标记应符合(1)简短性(号码简短);(2)容纳性;(3)灵活性;(4)表达性;

a.

又称扩九法,即当某类列的同位类类号标记到8,且尚有若干同位类待标记时,

则9本身不用,扩展为91、92、93„„98、99,为第

9个以后的同位类配号。

b. 双位法也称(百分法),便不用00_09以及10\20\90等号码,所以实际上只能标识(81个)子目。(转载自无忧考网:http://www.51test.net)

3)

4)

表明相应分类号的索引;

排列外,还集中反映在分类表中被分散了的相关事项;

③ 分类法的类号,以便从主题词字顺查找相应分类号的索引。

2.3.2.2体系分类法的特点

1. 特点:

1) 按学科、专业属性构建类目体系,形成按学科、专业集中信息的知识概念系统,能满足

用户从学科和专业检索的需求,达到较高的查全率;

2) 采用等级列举的概念标识系统来揭示概念间关系,偏于用户把握使用;

3) 采用分类号作为主题的标识,不受语种限制。

2. 不足:

1) 揭示专门主题能力差,难以揭示细小的主题概念

2) 修订不便,难以和科学发展保持同步;

3) 先组定组式标识,检索途径单一,不能多角度组配检索,检索效率不高;

4) 采用分类号作为主体的标志,缺乏直观性;

5) 线性体系,难以处理学科间交叉综合而成的新领域,难以反映多维的知识空间结构

2.3.2.3主要体系分类法介绍

1. 国内主要:

《中国人民大学图书馆图书分类法》、《中国科学院图书馆图书分类法》、《中国图书馆分类法》

2. 国外主要:

2.3.3组配分类法

2.3.3.2组配分类法的特点

1. 特点:

1) 类表篇幅小,标引专指,能充分揭示复合和专深主题以及主题之间的相互关系

2) 对信息的主题进行多方面标引,可进行多途径检索

3) 可及时增补新概念,修订灵活方便,对学科发展适应性强

2. 不足:

1) 类目体系不如体系分类法直观

2) 标引和检索难度较大,使用不便,分专业人员使用难度较大

3) 不适合组织文献排架

3. (补充)主题词组配的主要作用

1)可以控制词汇量;

2)可以对同一项情报进行多途径检索;

3)可以自由扩大,缩小或改变检索范围;

4)可以及时地反映新事物,新学科。

2. 4 主题检索语言

途径,并主要采用参照系统揭示词间关系的标引和检索文献的方法。

2.4.1.1主题检索语言的类型:

标题~、单元~、叙词~、关键词~

1. 主题法的特征:

1) 专指性高:以规范化的名词术语为基础;

2) 直观性好:直接以语词作为检索标识,以字顺作为检索途径;

3) 灵活性强:可根据需要对主题词进行灵活组配

4) (以特定的主题为中心集中信息资源,常通过参照系统等方式揭示主题词间的关系)

5) 按字顺排列,族性检索不及分类语言,只用于建立各种检索工具

2. (补充)主题检索语言的主要性能:

1) 控制主题检索系统所用的语词标识,以保证其具有较高的较索系统;

2) 引导使用者周密选用检索词,以便准确,全面地标引和检索文献;

3) 方便标引人员检索人员查找所需检索词,主题检索语言除了具有严密参照系统的字顺表

以外,往往还编有各种索引,这样,就有了多种查词途径。

3. 概念组配与字面组配的区别(07华南师范简答)

1)概念组配与字面组配在形式上有时相同,有时不同;从性质上说,两者有着原则性的区别;

2)字面组配,其实质是词的分析与组合(即拆词);概念组配其实质是词义的分析一综合(即拆义)。两者检索效果有很大差异。

4. 主题词组配的主要作用(补充)

1)可以控制词汇量;

2)可以对同一项情报进行多途径检索;

3)可以自由扩大,缩小或改变检索范围;

4)可以及时地反映新事物,新学科。

2.4.2.1标题词语言

1

是一种先组定组式语言,它以标题词作为文学内容的标识和检索依据。

2短语。标题词按字顺排列,词间语义关系用参照系统显示,并以标题词表的形式体现。

3

排列,并用参照系统显示标题之间关系的一种主题法。

2.4.2.21

以自然语言为基础,以概念组配为基本原理,并经过规范化处理,表达主题的最小概念单元,作为信息存储和检索依据的一种检索语言。

2uniterm

):是指从自然语言中选取,经过规范化处理,表达主题概念最小的、最基本的、字面上不能再分解的名词术语。

3

通过单元词的字面组配来表达主题概念的一种主题法。

2.4.3

1性自然语词作为关键词进行标引的一种检索语言。

2

理的自然语言词汇。

3

2.4.4

1献进行描述的后组式检索语言。

2

功能并可以显示词间关系和动态性的词或词组。

在我国又称主题词法,它是以规范化的自然语词为叙词,作为文献主题的标识,通过叙词的概念组配来表达主题概念的一种主题法。

4.叙词的特点:

1) 直观性。标识直观,按字顺排列,序列明确。

2)

规范性。叙词进行来规范化处理

3) 组配性。叙词可灵活自由组配,表达复杂概念,较适合计算机检索

09华南师范简答、10华南师范名解)

1. 是我国第一部大型的综合性叙词表,是国内广泛使用的综合性主题标引工具。由中国科

技信息研究所北京图书馆负责主持,1975年开始编制,1980年正式出版。分为社会科学、自然科学和附表3卷。

2.

① 主表:社会科学和自然科学

② 附表:世界各国政区名称、自然地理区划名称、组织机构和人物,4个专有名词表。 ③ 范畴索引:

又称分类索引,是按叙词表全部叙词和非正式叙词所属学科或范畴编制的分类索引。 ④ 词族索引:

又称等级索引,是将主表中具有属分关系的正式主题词集中在一起,显示词间从属关系的索引系统。

⑤ 英汉对照索引:通过英文名使用词表的辅助工具。

3. 字顺表的作用(补充)

1)提供从字顺查词的途径;

2)可通过参照系统,获知与所查词有密切联系的词,有助于在检索中扩大、缩小,改变检索范围;

3)、可以通过其标注的范畴类号和族首词,比较容易地进入范畴索引和词族索引;

4)还可获得主题词的其它信息。

4. 评价:

(1)特点:

① 结构完备:构成。词汇控制严格,整体功能完备,是传统词表编制的一种典型模式 ② 词汇丰富:范围广,专指度深

(2)不足:

① 结构上,印刷版篇幅巨大,组成分散,编排不紧凑,整体性差

② 词汇上,个别专业收词过多,不同专业之间收词数量不平衡

③ 词间关系处理上,等同率低于其他同期专业词表平均值、基本上不设与组代词的等同关系项、无关联词数量,影响易用性。

2. 5 分类主题一体化检索语言

1.

又称分类主题一体化,指在一个检索语言系统中,对它们的分类表部分和叙词表部分的术语、参照、标识及索引实施统一的控制,使两者有机地融合为一体,从而能同时满足分类和主题标引、检索的需要,发挥其最佳的整体效应。

2. (补充)体系分类检索语言和主题检索语言的特点。

1) 等级体系分类检索语言的主要特点是:按照不同的学科、专业、职能等集中文献、用等级结构直接显示主题概念之间的关系,用分类符合作为标引和检索的依据,因此,它具有较好系统性。

2) 叙词型主题检索语言的主要特点是:按文献所论述的事物主题集中文献,用参照系统显示主题概念之间的关系,用规范化的词语作为文献主题概念的标识,可以按事物的名称进行标引和检索。因此,这具有较好的直接性和专指性。

3. 分类主题一体化检索语言的功能:

(分类检索语言和主题检索语言一体化的可行性09华南师范论述)

2.5.3《中国分类主题词表》(09华南师范简答)

1. 是在《中图法》和《汉表》基础上编制的我国第一部分类检索语言和主题检索语言相互兼容对照索引式的一体化词表。包括《分类号—主题词对应表》和《主题词分类号对应表》两部分。

2. 《分类号—主题词对应表》的结构是以《中图法》的类目体系为基础,把《汉表》主题词及主题词组配形式,对应于各级类目之下编制而成的、从分类角度进行分类主题一体化标引的工具。

3. 《主题词分类号对应表》是以主题词的字顺排列为基础,把分类号对应于各个主题词或主题词之下编制而成的,是从主题词角度查找主题词和分类号,进行分类主题一体化标引的工具。

4. 《中国分类主题词表》的评价:

1) 优点:通过将《中图法》类目与《汉表》主题词的对应,建立起了一个分类语言与主题

语言结合的一体化工具,可以利用它,同时进行分类主题的标引和检索,简化操作程序,降低标引难度,改进标引和检索的质量

2) 不足:没有编制主题词轮排索引和英汉对照索引,标引组配不够灵活,在分类号与主题

词的对应过程中男做的完全科学准确。

2. 6 网络信息检索语言

2.6.1检索语言面临的网络环境

1. 信息类型的变化:文献资料→→电子文献、联机数据库、软件、博客、论坛、Email 等,电子文本

型和图形、图像、音频、视频等形式;

2. 信息数量和质量的变化:内容范围极其广泛,涵盖人类所有社会生活领域。自由发表,未规范和

控制,质量参差不齐;

3. 信息检索就技术的变化:目录、所以、工具书、年鉴、书目卡片→→全文检索技术、多媒体检索

技术、超文本和超媒体检索技术、可视化检索技术、联机检索技术

4. 信息用户的变化:专业人员扩大为广大普通用户,不受时空、age 、statue 、education 的限制;

用户需求多样化、个性化。

2.6.2网络环境下的分类检索语言(如何调整和发展07华南师范简答)

2.6.2.1在形式上,实现了电子化和体系结构的多维化

1. 分类法的电子化:是实现信息组织和就是自动化的基础;

2. 分类体系结构的多维化:超文本技术为多角度、多途径浏览与检索提供了技术支持,使分类体系

多维化有了可能。新型的网络分类目录在类目划分、横向关系揭示和类目设置方面表现出明显的多维化趋势;

2.6.2.2在内容上,编制方法做了很大调整,主要表现为聚类标准的主题化、类目划分的随意性、类目排列的非逻辑性和类名的通俗化等

1. 聚类标准的主题化:信息的学科属性做标准→→主题做标准,更符合普通用户使用习惯;

2. 类目划分的随意性:按照严格的逻辑划分,从上而下,层层划分的科学严密的等级分类体系→→

根据用户习惯和需求划分,注重开放性和可变性;

3. 类目排列的非逻辑性:同位类排列主要采用按逻辑、事物发展顺序、时间顺序、空间顺序排列等

→→同位类排列不局限于逻辑排列法,常使用安字顺或重要性等方法排列;

4. 类名的通俗化:较严格的规范,类目稳定性高→→从用户角度,简单易懂,类名稳定性不强。

2.6. 2.3分类语言在网络环境下的发展方向:

1. 积极调整传统分类法自身:电子版、网络版、网络资源组织整理

2. 重新建立新的分类体系,即网络分类目录。

2.6.3网络环境下的主题检索语言

2.6.3.1传统主题检索语言在网路信息检索系统中的应用

主要表现在标题语言、叙词语言(专业网站:书目信息检索系统、网络联机数据库检索系统等)和关键词语言(搜索引擎的关键词检索)的应用。

2.6.3.2辅助词表的应用

1.

1)

选词、精确检索、改变检索范围、进行相关检索提供了捷径。

2)

也称停用词表、禁用词典、禁用单元词表等,是将一些单独使用时无检索意义,或者出现频率过高的词作为检索系统的非检索词,一般分为普通禁用词表和条件禁用词表。 3)

为了把同义词、近义词、反义词等检索标识转换成规范叙词,或者扩展出所有可能出现的同义词、近义词、反义词而编制的词典,是基于主题语言,显示概念间等同关系原理而产生的。

2.6.4自然语言在信息检索中的应用(09、10华南师范简答)

1.

1

是直接从原始信息中抽取出来的未经规范化处理,用以揭示信息主题概念的检索语言。

2)自然语言的优势与不足(01北大、07华南师范简答)

① 检索方便,不经加工和规范

② 直接从文献中抽词,避免了人工标引的失真现象

③ 非常容易吸纳新词、新概念

2. 自然语言检索与受控语言检索(01北大、06华南师范比较)

1) 受控语言信息检索系统是在文献信息和用户需求输入系统之前进行控制,控制的工具是

人工编制的词表或分类表,且需对检索的课题进行主观的思考和分析,检索结果的优劣在很大程度上取决于用户对规范化词表的掌握程度及经验技巧。文献信息的输入(前控)和检索提问的输入(后控)都采用同一词表,前控和后控程度相等。

2) 自然语言检索系统主要是在输入系统后,在系统内部进行控制,文献信息输入时基本上

做处理,而主要依赖后控,即将自然语言转换为系统的提问,并对同义、近义、相关等关系的词进行组织。同时,自然语言检索系统与计算机自动标引和自动分词等技术紧密联系。

3. 自然语言在文献检索中的应用途径(补充)

1) 作为检索语言中入口词运用检索;

2) 作为检索语言专用的入口词表运用于检索;

3) 作为自由词与主题词相结合运用于检索。自由词即主题词有以外的,未经规范化处理的自然语

言词;

4) 采用自然语言的关键词法运用于检索;

5)

4.

1) 含义:不经过任何标引,直接通过计算机以自然语言的形式在文本中进行匹配查找。

2) 优势:直观性、详尽性和广泛的适应性的特点

① 方便使用:无需学习培训

② 查全率高:任意字符进行匹配,不受标引限制

③ 检索功能强大:布尔逻辑、截词检索、位置检索、相关检索等,满足不同需求

3)代表:

① 国外:ProQuest 系列数据库、EBSCO 数据库、SpringerLink 全文数据库、AltaVista 全文检索引擎

② 国内:《中国期刊全文数据库》、《中文科技期刊数据库》、万方数据资源系统


相关文章

  • 文献检索作业答案
  • <文献检索>作业讲评 1.文献检索 知识点:名词解释 参考答案:是将文献按照一定方式集中组织和存储起来,并按照文献用户需求查找出有关文献或文献中包含的信息内容的过程. 广义的文献检索包括文献的存储和文献的检索两个过程. 狭义的文献检索就是找出自己所需的文献. 2.检索语言 知识点:名词解 ...

  • 中医药文献检索笔记
  • 中医药文献检索 第一章 文献概论 一.文献的概念 文献是记录有知识的一切载体.当知识范畴属于中医药时,称为中医药文献. 具体地说,文献是将知识.信息用文字.符号.图像.音频等记录在一定的物质载体上的结合体. 二.文献的三要素 1.知识性--文献的实质内容是知识 2.物质载体性--文献必须依附于物质载 ...

  • 电大文献检索期末复习题
  • <文献检索期末复习题> 一.选择题 1. ( C )年,国内检索刊物编辑出版工作走上有领导.有组织.有计划的发展道路. C.1956 2. 国际联机信息检索是在20世纪的哪个年代发展起来的? C.80年代 3. <科学引文索引>的检索途径包括A 引文途径 来源途径 团体途径 ...

  • [信息检索]课程教学大纲
  • <信息检索>课程教学大纲 一.<信息检索>课程说明 (一)课程代码:14132032 (二)课程英文名称:The retrieval of the information resources (三)开课对象:信息管理与信息系统专业 (四)课程性质: 网络和计算机带给我们带来全 ...

  • 信息检索_理论与方法
  • 信息检索:理论与方法 第一部分 信息检索理论 一.掌握和熟悉 1. 信息检索的基本原理:即对信息集合与需求集合的匹配与选择.* ......... 2. 信息检索常用技术:* ........ · 布尔检索:逻辑与:如,A*B ,表明一篇文献中A和B必须同时存在. 例:郭沫若*语言学 (同时满足两个 ...

  • 化学类文献检索考试题
  • 1. 什么是文献?按载体.类型可分为? 答:记录有知识的一切载体.按载体:印刷型.缩微型.电子型.声像型.按出版形式区分为十类:图书.期刊.报纸.会议文献.政府出版物.学位论文.档案.专利文献.标准文献.产品资料.按加工深度:零次文献.一次文献.二次文献.三次文献 2. 什么是信息?信息的特征是什么 ...

  • 文献检索和利用20**年01
  • 文献检索 宋天华 TEL:86281175 [email protected] 哈工大图书馆信息咨询部 414室 文献检索与利用 什么是 为什么 怎么学 什么是 文献检索与利用 文献:古代产生,现代的解释 定义 文献是记录有知识或信息的一切载体. ● ● ● ● ● ● ● 检索:是根据特定的学习或 ...

  • 文献检索课程实习报告20**年-20**年-2
  • 2011-2012学年第2学期 <科技文献检索>课实习报告 专业:__水土保持___________ 年级:____09_________ 姓名:____许立宝_________ 学号:___[1**********]_____ A实习目的: 1. 通过本次检索实习,掌握现代网络型中文参 ...

  • 信息检索与利用
  • <信息检索与利用> 一.单选题 (共15题,30分) 1.就信息与物质.能量的关系而言 D A信息是一种物质 B信息是一种物质,同时具有一定的能量 C信息是一种能量 D信息既非物质,也非能量 2.是以下哪一种称谓的简称 C A清华同方 B重庆维普 C中国知识基础设施 D中国期刊全文数据库 ...

© 2024 范文中心 | 联系我们 webmaster# onjobs.com.cn