时间:2023-08-12 08:25:21
引言:寻求写作上的突破?我们特意为您精选了4篇信息分类标准范文,希望这些范文能够成为您写作时的参考,帮助您的文章更加丰富和深入。
1.1 学科大类设置不全,知识体系不完整
以中文雅虎(Yahoo)为例,它将网络信息分为14个宽泛的类目,每个大类又分出若干二级类,二级类目下细分出三级类目,可根据需要细分出四、五级类目。可以说,Yahoo采取的是一种逐层扩充的方法,以使知识的覆盖面越来越全。但是,从Yahoo分类每年都发生的明显变化和迅速增长的网络信息资源我们可以看到,仅仅设置这14个大类是难以涵盖人类社会生产生活的各个方面的。又如搜狐(sohu),将网络信息分为18个大类,网易(WWW.163.com)将网络信息分为19个大类,都有类似情况。总之,由于各种原因,现在的网站分类设置还不完善。知识覆盖不全,体系过于简单。几乎所有的中文搜索引擎的分类体系都存在着知识残缺不全、体系设计不完整的通病。
1.2 类目划分标准不够合理
信息资源在同一层次下划分的标准不够统一,有时出现两个或两个以上划分标准的现象。具体来讲,同一层次类目在选择上存在的问题有:一方面,网站为了突出当今的热门和主流信息,将一些下级类目提升到大类中,如大多数中文网站把“电脑网络”或“计算机与网络技术”与“科学技术”并列为大类;又如网易将“体育竞技”和“少儿乐园”放在大类中。另一方面,子类的设置的标准问题,如Yahoo的“科学”这一大类下设有“电脑与信息技术”、“活动”、“教育”、“科普”、“酷站”、“能源”、“字典”、“组织”等等的二级类目。此外,在大类的展开中常出现整体不包含局部的违反逻辑规则的现象。
1.3 各网站采用的分类标准不同,各行其是,导致了用户在使用时无所适从
以网络信息资源为基础建立类目体系,虽有较好的实用性,但类目划分的规律性不强,从而造成了各搜索引擎的分类不一致,体系也不太严密、科学,类名不规范,各个搜索引擎设立分类目录时力图突出的是自己的特色。
如新浪设立了“少儿搜索”大类,搜狐把“公司企业”单独列为一个大类,这就使得用户在使用时必须对某个搜索引擎的类目比较熟悉,否则当人工的分类有时与某些用户的习惯不一致时,会造成这些用户无法在正常的路径中找到资料。
1.4 类目名称设置不够规范合理,不能全面反映类目的内容,给用户查找易造成误解
类名有时不能确切地概括类目的内涵,有时只有象征意义。此外,由于类目的下位类范围较宽,上位类有时很难有效限定其含义,再加上网络自编分类体系一般不使用注释揭示类目内涵,容易使一些类目的含义和范围难以确定。
设置好类目名称关键是选好类日用词。很多网络分类体系中采用一些含义模糊的语词,而且没有注释,这就使用户很难判断该类目的外延。如“网易”的“另类科学”,“搜狐”的“生活情趣”等类名,如果没有注释,根本就无法明白该类的内容包括什么。
1.5 类目排列缺乏逻辑性
目前,中文网站总的来讲类目排列比较随意,外延常常有交叉重叠。几乎所有的中文搜索引擎的分类体系都存在着类目排列混乱的通病。如新浪、网易、搜狐、中华网在线等,都把“文学”与“艺术”、“电脑网络”与“科学技术”、“经济”与“文化”及“政治”等原本密切的大类,却人为地分割开来。又如网易对“文学”大类之下15个二级类目的排列,逻辑性不是很强。再如新浪对”文学”大类之下30个二级类目的排列,即便是按类目的使用频率或访问量序列排列,也使人感到排列次序不规律,不易查找。
1.6 从事网络信息分类组织的人员都大多是非专业的分类人员,缺乏专业知识
随着网络信息资源的迅速增长以及信息需求的不断加大,网站业务量也快速攀升,而建立一个优秀的中文搜索引擎是一项庞大复杂的系统工程,在技术、设备、人力、财力的投入上都有比较高的要求。因此,许多网站扩大了工作人员的招收数量和范围,与此同时,许多网站却忽视了引进有信息处理专业知识的人才,因此造成了许多诸如以上提到的网络信息分类组织方面的问题。
面对海量网络信息,其分类体系的诸多弊端为用户充分利用网络信息、开发共享网络资源带来严重困难。因此,构建规范合理的网络信息分类体系,实现网络信息分类组织标准化已是大势所趋。
2 国内有关学者的研究观点
从1998年开始,国内对网络信息分类组织的研究此起彼伏。其中,有许多学者表达了网络信息组织“标准化”的思想。如黄如花在文献1中指出要“信息描述标准化”;又如郑福根在文献2中认为网络信息组织的原则之一就是“标准化原则”;再如张林龙在文献3中指出“建立统一的网络信息分类标准成为网络信息分类组织的迫切需要”等等。此外,从近几年的研究成果来看,要编制一部适用于网络信息分类组织的分类法已具备了一定的理论基础,此说法可从刘延章、余义芳在文献4中对1998年~2002年这5年间160余篇有关网络信息分类组织研究的一些结果中略见一二。下面是文献4中的部分观点:
(1)关于网络信息、网络信息用户、网络信息技术环境特点方面的研究成果极大地提高了我们对网络信息分类检索工具的标引对象、使用对象、所处环境的认识,为编制高质量的网络信息分类法打下了认识基础。
(2)关于网络信息分类法与传统文献分类法方面的比较研究为我们借鉴二者各自的特点、编表的理论、方法和技术提供了便利,从而为编制高质量的网络信息分类法打下了理论基础。
(3)关于传统分类法应用于网络信息分类组织方面的研究虽然有助于传统分类法特别是《中图法》自身的调整和改造,使之适应于网络信息分类组织的需要,但也为更好地编制网络信息分类法打下了方法基础。
(4)关于现代技术应用于网络信息分类组织方面的研究为编制高质量的网络信息分类法奠定了坚实的技术基础。
(5)关于中文网络信息分类体系的特点、问题及其改进方面的研究对于编制高质量的网络信息分类法具有现实的借鉴意义。
(6)关于统一的中文网络信息分类法编制方面的研究对编制高质量的网络信息分类法奠定了扎实的基础。
从上述研究结果可以看出,我国编制一部高质量的网络信息分类法具备了一定的理论研究基础和技术实现条件,为实现网络信息分类组织标准化提供了强有力的保障。
3 对网络信息组织标准化的构想
通过以上分析,要实现网络信息组织标准化,编制一部适于网络信息组织的《分类法》是非常紧迫,也是切实可行的。但网络环境下的信息分类体系与传统文献分类体系相比存在着许多差异:①网络分类是以事物为中心,而不是以学科为中心列类;②网络信息分类是以网络资源为分类的基本对象,类目收录对象的范围更广;③采用了更多的信息技术;④直接采用语词进行信息标引;⑤传统分类是以线性方式展开类目,而网络分类是以网状方式进行超文本链接;⑥更新速度快。因此,编制网络信息分类法应考虑以下两大方面。
3.1 宏观构想
编制网络信息分类法,实现网络信息组织标准化,应体现以下主要原则:
(1)科学性原则。网络信息分类法应结合网络信息资源的特点,在充分揭示各学科之间内在联系和相互关系的基础上,将学科分类与事物分类相结合,构建一套科学合理的网络分类体系。
(2)继承性原则。网络信息分类法应吸收传统分类法的精华,吸收目前各中文网站分类体系的优点,结合现代信息技术来共同建造。对传统的东西不能全盘抛弃,也不能全盘吸收,应在吸收借鉴的基础上有所创新,有所发展。
(3)动态性原则。由于互联网是一个多元、开放的信息系统,因此,网络信息资源具有范围广、数量大、动态性强的特点。这就要求网络信息分类也要随着互联网内容的变化及时调整,使各种类型的网络信息资源都能在分类法中找到自己的位置。
(4)实用性原则。网络信息分类法应考虑网络环境下用户需求的特点。在类目的设置上,既要体现分类体系的相对稳定性,又要方便用户快速查询。类目数量控制在20~25个,类目层次展开至3~4级为宜。
(5)多维性原则。传统分类法以线性方式揭示文献信息内容,而网络信息分类法要尽可能全面而深入地揭示网络信息的内容和形式,多层次、多途径、全方位、多角度地进行信息揭示和描述,用超文本链接技术,变线性方式为网状方式,构建新型网络信息分类体系。
(6)开放性原则。网络信息分类体系具有相对的稳定性,但网络信息资源的开放性和动态性决定了网络分类体系也要随时增添新的内容。同时,不断吸收新思想、新技术,进一步满足和适应社会以及科技发展的需要。
3.2 微观构想
根据上述对网络信息分类法宏观构想原则,结合传统分类法和现有网络信息分类体系的研究成果,笔者针对网络信息资源中的一类资源——综合性网站的框架构建了5大板块,对其中内容相对稳定的休闲娱乐、社会科学、自然科学和综合信息四大板快设计了22个一级类目。该分类体系以主题为主要聚类标准,充分体现网络信息组织分类——主题一体化思想。具体如下:
一级类目
热门追踪板块:考研 聊天室 游戏 同学录 人物 明星 下载专区 招聘 彩票 动漫 flash......
休闲娱乐板块:新闻与媒体 娱乐与休闲 体育与健康 旅游与交通 生活与服务
社会科学板块:社会文化 哲学与宗教 政治与法律 军事与战争 经济与金融 教育与就业 人文与艺术 历史与地理
自然科学板块:自然科学 医疗与卫生 农业科学 计算机与网络 工程技术 环境科学
综合信息板块:国家与地区 参考资料 综合网站
上述各板块中,热门追踪板块内容不固定,根据网上热点话题的变化而变化,其余四个板块的内容相对稳定,即休闲娱乐板块包括5个一级类目;社会科学板块包括8个一级类目;自然科学板块包括6个一级类目;综合信息板块包括3个一级类目。
Internet是一个开放、动态的网络体系,对其分类体系的构建,实现网络信息分类组织标准化是一个逐步完善的过程。本文所探讨的分类体系也需要进一步细化和发展,相信经过不断的努力和实践,实现网络信息分类组织标准化的这一天不会太晚。
参考文献
1 黄如花.网络信息组织的发展趋势.中国图书馆学报,2003(4)
2 郑福根.网络信息组织的理论与方法探讨.现代情报,2004(6)
3 张林龙.网络环境下的信息组织.情报杂志,2003(10)
4 刘延章,余义芳.近五年来网络信息分类组织研究的现状及其展望.情报学报,2004(4)
5 王知津,肖洪.网络信息组织对传统信息组织的借鉴.图书馆工作与研究,2003(4)
6 陈树年.搜索引擎及网络信息资源的分类组织.图书情报工作,2000(4)
7 董琳.网络信息分类组织的发展趋势与标准化.图书情报知识,2004(4)
8 王本欣.网络信息资源组织研究.图书馆学研究,2004(5).
9 宋剑祥.从国外分类法看《中图法》对网络信息资源的组织.图书与情报,2004(2)
1信息安全标准体系分类现状
1.1信息安全国际标准现状及分类体系
1.1.1美国国防部信息安全标准体系
美国国防部(DoD)将美军信息安全标准按安全部件与安全功能相结合的方法进行分类,其标准体系见图1,其中安全部件以信息流为主线贯穿始终,分为信息处理安全标准、信息传输安全标准、信息理解表示安全标准、安全管理标准和安全环境标准五类。安全功能从信息安全的基本要素(机密性、完整性、可用性、可控性、抗抵赖性)来进行划分,分为鉴别安全服务标准、访问控制安全服务标准、保密性安全服务标准、完整性安全服务标准、抗抵赖性安全服务标准和可用性安全服务标准六类。DoD的信息安全标准体系,虽然覆盖全面,但安全部件和安全功能之间的标准交叉重复比较多,层次不够清晰。
1.1.2联合技术参考模型(JTA 6.0)
JTA 6.0中的信息安全标准体系为实现对国防部信息系统的安全防护提供了支撑,包括(本地)计算环境、飞地边界、网络和基础设施、支撑性基础设施和安全评估五类标准。这种分类比较合理,但分类下面对应的标准大部分是国际标准和美国国家标准,因此,应在借鉴该分类的基础上,针对目前我国已有的国家标准,建立起合理的标准体系。
ISO信息安全工作组分类如图3所示。目前,ISO制定的信息安全标准按照工作组的分类分为信息安全管理体系(ISMS)标准、密码和安全机制、安全评价准则、安全控制与服务和身份管理与隐私技术五类。该分类方法比较粗糙,对于建立安全运行的信息系统,针对性不太强。
1.1.4国际电信联盟(ITU-T)标准
ITU-T SG17组负责研究网络安全标准,包括通信安全项目、安全架构和框架、计算安全、安全管理、用于安全的生物测定、安全通信服务,如图4所示该分类方法对信息安全技术分类比较粗糙,信息安全技术也只侧重于通信安全。
ITU-T颁布的比较有影响力的安全标准主要有:消息处理系统(X.400系列)、目录系统(X.500系列)、安全框架和模型(X.800系列)等,其中的X.509标准是PKI的重要基础标准,X.805是端到端通信安全的重要标准。
目前,ITU-T在安全标准化方面主要关注NGN安全、IPTV安全、身份管理(IDM)、数字版权管理(DRM)、生物认证、反垃圾信息等热点问题。
1.2国家信息安全标准体系
我国国家信息安全标准自1995年开始制定,至2002年共制定标准19项,全部由国际标准直接转化而来,主要是有关密码和评估的标准。在这19项中,2004年后已有12项进行了修订。自全国信息安全标准化技术委员会2004年成立以来至目前我国实际现存正式信息安全标准87项,这些标准中,既包括技术标准,如产品和系统(网络)标准,亦包括管理标准,如风险管理标准等,覆盖了当前信息安全主要需求领域。
由此可见,目前我国信息安全标准的制定工作已经取得了长足的进展,标准的数量和质量都有了很大的提升,本着“科学、合理、系统、适用”的原则,在充分借鉴和吸收国际先进信息安全技术标准化成果和认真梳理我国信息安全标准的基础上,经过全国信息安全标准化技术委员会各工作组的认真研究,初步形成了我国信息安全标准体系。该标准体系分类相对合理、全面,涵盖了体系结构、安全保密技术、安全管理和安全测评等方面的标准,但庞大繁杂的标准体系常常让开发人员无所适从,无法选取需要遵循的标准。因此,针对信息安全系统的开发工作要进一步精简标准体系,突出重点,尤其是影响系统集成方面的安全接口标准,进而增强各个安全组件之间的互操作和安全技术间的协作,提升整个信息系统的安全防护能力。
支撑性基础设施主要涉及到实现通信与网络、应用环境和数据安全所应用的支撑性技术,包括认证、授权、访问控制、公钥基础设施(PKI)和密码管理基础设施(KMI)。
通信与网络安全主要体现在网络方面的安全性,包括网络层身份认证、网络资源的访问控制、数据传输的保密与完整性、远程接入的安全、域名系统的安全、路由系统的安全、入侵检测的手段、网络设施防病毒等。
应用环境安全主要包括终端安全和应用系统安全。其中:
终端安全主要包括计算机和服务器的安全。其中服务器可以归结为广义上的终端,防火墙、IDS、服务器存储备份等技术可以为服务器提供安全服务。
应用系统的安全问题主要来自网络内使用的操作系统和数据库的安全,操作系统安全主要表现在三个方面:(1)操作系统本身的缺陷带来的不安全因素,主要包括身份认证、访问控制、系统漏洞等;(2)对操作系统的安全配置问题;(3)病毒对操作系统形成的威胁。数据库系统的威胁主要来自:非法访问数据库信息;恶意破坏数据库或未经授权非法修改数据库数据;用户通过网络进行数据库访问时受到各种攻击,如搭线窃听等。
系统中的数据是系统运行的核心,数据的安全性保障关系到整个系统能否正常运行和服务。数据安全通过数据容灾备份技术、网络隔离技术和加密技术保障数据的完整性、不受损坏、不被窃取。数据容灾备份主要通过对系统、数据、文件等进行快速、完整备份,保证数据的安全性,并支持快速恢复的机制。网络隔离技术主要通过隔离网络攻击来确保网间数据的安全交换。数据加密主要通过链路加密和节点加密来确保数据不被截获。
安全运维管理是在企业进行了一定的安全系统建设之后的工作,其目的是保证所应有的安全产品和技术能够真正、充分发挥其预期应有的效果和效率。安全运维管理包括安全设备的策略配置、安全测评、安全监控和审计、安全应急响应等方面的技术,主要完成安全风险的实时监控和安全问题的处理等系统安全保障工作。
3信息安全标准分类体系
信息安全技术参考模型是建立信息安全标准体系的基础和前提,只有在信息安全技术发展趋势的基础上建立起覆盖全面,分类合理的标准体系,才能科学地预见需要制/修订的标准,进一步明确信息安全标准化的研究方向,更好地支撑信息安全系统的开发和集成,确
保系统内部和系统之间形成安全可信的互连互通互操作。在前面提出的技术参考模型的基础上,进一步对信息安全标准体系进行了划分。 应用环境安全主要包括终端安全和应用系统安全。其中:
终端安全主要包括计算机和服务器的安全。其中服务器可以归结为广义上的终端,防火墙、IDS、服务器存储备份等技术可以为服务器提供安全服务。
应用系统的安全问题主要来自网络内使用的操作系统和数据库的安全,操作系统安全主要表现在三个方面:(1)操作系统本身的缺陷带来的不安全因素,主要包括身份认证、访问控制、系统漏洞等;(2)对操作系统的安全配置问题;(3)病毒对操作系统形成的威胁。数据库系统的威胁主要来自:非法访问数据库信息;恶意破坏数据库或未经授权非法修改数据库数据;用户通过网络进行数据库访问时受到各种攻击,如搭线窃听等。
系统中的数据是系统运行的核心,数据的安全性保障关系到整个系统能否正常运行和服务。数据安全通过数据容灾备份技术、网络隔离技术和加密技术保障数据的完整性、不受损坏、不被窃取。数据容灾备份主要通过对系统、数据、文件等进行快速、完整备份,保证数据的安全性,并支持快速恢复的机制。网络隔离技术主要通过隔离网络攻击来确保网间数据的安全交换。数据加密主要通过链路加密和节点加密来确保数据不被截获。
一、引言
XBRL自1998年由美国注册会计师Hoffman提出思想框架以来,XBRL在国际上已经获得了迅速发展,多个国家、机构及组织已经实施或正在推行XBRL的应用。分类标准的制定对于 XBRL 财务报告的披露起着规范与模板的作用,其质量直接影响着财务报告信息质量。关于分类标准中标准元素是否能满足上市公司披露需求和是否能有效率地表达财务信息一直是分类标准制定者、XBRL财务报告报送主体、信息披露监管者、信息披露中介乃至投资者都关注的问题,同时也是学术界关注的问题。基于上述的问题,本文主要从完备性和效率性方面对分类标准进行研究。
二、样本选择
本文采取了抽样研究的方法,抽样的总体是2011年上交所所有的A股上市公司。按照10%的抽样比例,以10为步长进行系统抽样。依据中国证监会《上市公司行业分类指引2001》所列的13个行业门类,剔除金融类企业,最终得到本文的93个样本。本文选取货币型财务信息,是因为货币型财务信息为财务报告最基本、最核心的信息,规范易于企业填报而较少出现歧义。并且,大多数企业按照统一规范表格填制财务报表正文,对于正文内容研究意义不大,因此本文仅选取财务报表附注中货币型财务信息作为研究对象。
通用分类标准采用财政部2010年的《企业会计准则通用分类标准》。该标准共计元素2984个,分为13种元素类型。在XBRL报表中表达货币型财务信息的元素是由货币型和Member型元素组成。在1464个货币类型元素和301个Member型元素中,剔除非报表附注元素、金融相关行业元素及首次执行会计准则企业元素。其余元素中,剔除单独列示在财务报表中的元素,得到本文研究对象元素,即非金融行业的附注货币型元素903个,Member型元素300个。
三、研究方法
本文采用人工翻阅公司年报,提取货币型财务信息并与分类标准元素逐一匹配的方法。本文收集了这93家样本公司2011年财务报告附注中的84个报告子项目的披露的货币型财务信息,根据财政部2010年的XBRL通用分类标准对具体披露内容进行判断匹配,匹配成功记为1分值。
四、研究结果
(一)效率性
分类标准的效率性即制定的元素冗余最小,是指分类标准应该在尽量满足企业对于财务信息披露需求的前提下,减少分类标准中的低使用率元素和关系(冗余元素),提高元素使用率。
研究结果表明,企业使用通用分类表中元素总数为1057个,其中Member型元素246个,占分类标准中元素的82%;货币型元素811个,占分类标准中的89.81%。通用分类标准元素制定在效率性方面较好,整体使用率为87.86%。
(二)完备性
分类标准的完备性是指标准体系中所含元素应尽量全面,能覆盖企业对于财务信息披露的所有需求。完备性不足体现在企业报表中披露的财务信息无法在分类标准中找到对应的元素,即分类标准中制定的元素存在不足。
企业因实际需要未能在通用分类标准中找到对应元素而进行元素扩展,共扩展标准未定义元素1145个。整体扩展率(扩展率=扩展元素/总元素集合)为48.76%,其中Member型元素扩展率为54.55%,货币型元素扩展率为46.50%。结果表明,通用分类标准的完备性方面还有很大的改善空间。
五、结论
通过实证研究方法,从通用分类标准元素完备性与效率性两方面,探究通用分类标准是否能满足企业信息披露需求。整体而言,现有通用分类标准元素制定效果在效率性方面较好,但在完备性方面较欠缺,存在本文提到的元素冗余与元素不足的问题。一方面,超过十分之一的元素从未被采用,另一方面,企业需要外扩展更多的通用分类标准未定义元素来满足自身信息披露的需求。通用分类表中在完善过程中应补充不足的元素以提高完备性,同时应剔除冗余元素从而提高效率性,更好地满足企业信息披露的需求。
参考文献
[1]张天西.网络财务报告:XBRL 标准的理论基础研究[J].会计研究,2006(9):56-63.
据不完全统计,目前已开发的中文网络信息分类法已有282种之多,而各种自编的网络信息分类法都存在着这样或那样的问题。分析存在的缺陷,提出完善的措施,是网络信息分类法标准化研究的重要内容。而研究网络信息分类法的标准化,对于提高各种自编网络信息分类法的质量,进而编制全国统一的网络信息分类法,优化网络信息分类组织,实现网络信息资源的共建共享,是会大有补益的。
一、网络信息分类法的缺陷
1.知识覆盖不全
几乎所有的网络信息分类法的分类体系都存在着知识残缺不全、体系设计粗略的通病。就拿全球百强中文网站前5名的新浪(省略)、Yahoo中文(cn.省略)、网易(省略)、搜狐(省略)、TOM・COM(search.省略)的分类体系来说,不是未列自然科学,就是未设社会科学。又如中华网(search.省略)、263在线(search.省略)名捕(省略)、搜星(省略)等的分类体系,也是既未列自然科学,也未列社会科学。
2.归类不够科学
许多网络信息分类法的分类体系,未能严格地按照类目的内涵和外延进行科学地归属类目。如搜狐的分类体系把“图书馆”归入“教育”大类,又在“文学”大类中作为交替类目列出,把“”归入“艺术”大类等。再如搜豹(省略)的分类体系把“农业”、“教育”、“地理学”、“历史”、“图书馆”、“理工院校”等归入“自然科学”。总之,归类不当的现象在网络信息分类法系统中比比皆是。
在网络信息分类体系中,划分失误的现象也是很多的,主要表现为:①划分过宽。如雅虎分类体系的“科学”大类,划分出的“地理学”、“教育”、“历史”、“图书馆”、“心理学”等。②划分过窄。如联合搜索(省略)“社会科学”大类,只列举了“哲学”、“政治学”和“法学”,未列“经济学”、“历史”、“地理”、“军事”等。③划分出子类的级别过高或过低。如智星酷搜(search.省略)的分类体系把“三个代表”、“周易”等与“哲学”等类并列,同属“社会科学”大类之下的二级类目,前两者则属级别过高之类。④划分出的子类相互包容。如上两例中的“哲学”包括“周易”、“三个代表”,“自然科学”包含“物理学”、“化学”和“数学”。
3.类目排列随意
几乎所有的网络信息分类法的分类体系都存在着类目排列混乱的通病。如新浪、网易、中华网、木子网(中文)、263在线等的分类体系,都把“文学”与“艺术”、“电脑网络”与“科学技术”、“经济”与“文化”及“政治”等原本密切的大类,却人为地分割开来。
有的网络信息分类法的分类类目之间界限模糊。如网易分类体系中新增的“行业分类”大类与原有的“公司企业”大类,外延多有交叉重叠,因为后者也是按行业划分的。
4.大纲缺乏稳定
有的网络信息分类法的分类大纲改变太大,使人难以把握。如亦凡搜索分类体系,原有大类10个,后又增补2个,共计12个;搜狐分类体系的大类数目及类名虽未改变,但首页与分类搜索界面上的大类排序却大相径庭;特别是木子网(中文)的分类体系,首页分类大纲的类名与点击后界面上的类名迥然不同;如把“娱乐与明星”改为“娱乐与影视”、把“艺术与表演”改为“艺术与建筑”、把“社会与历史”改为“社会与人物”、把“科学与技术”改为“科学与研究”、等。5.类名有失规范
网络信息分类法在其分类体系中采用了广大网民所喜闻乐见的俗称、简称、惯称等自然语言,诸如媒体、影视、环保、婚恋、高校、求职、、黑客、电脑、IT业等,这是无可厚非的。但有些类名缺乏范化处理,类下又无必要的注释,容易增加网民的知识负担,如名捕分类体系中的“说天说地”、“美眉写真”,天网搜索分类体系中的“嗜好”、“残障”、“讨论话题”,百度(ix.省略)分类体系中的“一见钟情”等。
二、网络信息分类法的完善
1.知识覆盖的全面性
知识覆盖面全是标准化的网络信息分类法的至关重要条件。它要求在其分类大纲及其层次展开的设计上都要体现出知识的全面性,其知识范围要涵盖所有的主题、学科、行业、产品等,即人类的全部知识领域和各种知识需求;其信息类型要包括所有的政府信息、事业信息、企业信息、社会信息等,即人类的全部活动所产生的文本、图形、图像、音频、视频等信息。一般来说,收集网站信息越多,概括出的类目就越多,分类体系的知识覆盖就越全面,所以说,尽可能地收集网站信息,是编制高质量的网络信息分类法的关键。目前的人工智能技术、自然语言理解技术、自动索引技术、数据库技术等,能够快速地把网络信息进行过滤、筛选、整序、建库,把新数据加入到自己的索引库中。
2.体系结构的完备性
标准化的网络信息分类法,体系结构应包括分类大纲、主类表、从类表、类目注释、类目索引、后控制词表、使用指南等。分类大纲是网络信息分类法进一步划分的基础,也是广大网民查询网上信息的起点,它直接影响着网络信息分类法的性能和质量,因此说,编制好分类大纲是至关重要的。分类大纲的一级类目以20-30个为宜。分类大纲中的类目数太少会造成覆盖不全,很多网站信息无类可归;太多会造成主题分散,也容易产生空头类目。主类目是由分类大纲展开的全部类目组成的网络信息分类法的主体。分类大纲展开的层次以4-6级为宜,如果太少会影响类目体系的清晰度,增加网民选择的负担;太多则会增加点击屏数,影响检索效率。目前多数自编的网络信息分类法都不设置类目注释、类目索引、后控制词表、使用指南等,但作为标准化的综合性的网络信息分类法而言,是不能缺无的。
3.类目组织的科学性
类目组织的是否科学是标准化的网络信息分类法一个重要标志。这就要求:在组织具有纵向关系的类目时,应尽可能体现出类目之间的从属等级关系,以便鸟瞰全貌,进行缩检和扩检;在组织具有横向关系的类目时,应尽可能体现出类目之间的并列相关关系,以便触类旁通,进行转向检索和相关检索。我们认为,不论是具有纵向关系还是具有横向关系的类目,应按类目之间固有的自然次序来组织,对于点击频率高、信息量大的热点类目和重点类目可越级提升,但必须在以不破坏原有的分类体系为条件。对于类目众多的同位类来说,可采取多重列类、分面列类及类组的形式来组织,在不适合采用上述方法组织时,也可按照汉语拼音顺序来排列。
4.基本类目的稳定性
基本类目是否稳定是衡量网络信息分类法是否成熟的一个重要标志。当然它不能像传统分类法那样体系僵化,很难适应科学技术和社会发展的需要。它需要及时维护,因为网络信息是以节点为中心的分布式的开放信息系统,不论是一个网站还是一个网页,每时每刻都处于变化之中,随时都要将产生的信息加进分类系统中去,把陈旧过时的信息剔除出去,删去无效的链接。标准化的网络信息分类法,要求基本类目(即分类法中一级类目和二级类目共同构成的类目体系)的数量、类名及其次序一旦确定,必须保持一定的稳定性,不能随意改动。但其基本类目以下的各级类目,可及时进行增、删、改,以适应组织动态信息的需要。
5.类目名称的通用性
类目是指具有某种共同属性的信息的集合性概念,而类名则是指表达类目这一概念的词语,因此类名规定着类目的内涵和外延,也因此类名就成为网民利用分类系统查询网络信息的入口词。因此,它必须作到通用、准确和精练,使网民能望名生义,不至于举棋不定,犹豫不决。目前各种自编的网络信息分类法使用的多是自然语言,如电脑网络、农工贸、科技、文教、家电等广大网民所喜闻乐见的俗称、简称、惯称等。但有些自然语言作类名使人费解,如精品世界、男左女右、黄页、酷站等,必须借助于类目注释、后控制词表等形式才能明确所涵盖的知识范围。总之,标准化的网络信息分类法,其类名必须达到上述要求,并使其规范化,是不能像目前有的网络信息分类法那样。
6.用户界面的友好性
标准化的网络信息分类法,对用户界面的要求主要是:①类目清晰。不同级别的类目应采取不同的版面形式,类目与其相关的网站信息也应采取不同的版面形式,使网民一目了然。②路径明确。网络信息分类法要在所有用户界面中设置路径指示标,用以指明网民查找的途径及其网站数,以明确网民自己所处的位置。③跳转便捷。网民可能从用户界面上所显示出的各种入口进行检索或转向检索,编制用户界面时应采用链接技术,使逆向检索或转向检索更方便。④帮助切实。网络信息分类法应在所有的用户界面中设置帮助系统。帮助系统不能只介绍一般的常识和检索方法,而应把检索中可能遇到的问题及其解决方法制成文件,以便切中要害,给予切实的帮助。
7.检索功能的齐全性
标准化的网络信息分类法,具有以下功能:
组织信息的功能:标准化的网络信息分类法应具有组织各学科知识、各种产品知识、各类型信息、各领域信息的功能。凡是通过ICP/IP协议在全世界计算机网络、网站、网页上的信息都能组织起来,从而提高网络信息分类法的检全率。
过滤信息的功能:网络信息分类法应具有过滤信息的功能,通过使用的分类体系并对上述信息进行标引,把一些无价值、质量不高、盲链接的信息摈除在要建的数据库之外,从而提高数据库的质量,也提高了网络信息分类法的检准率。检索信息的功能:标准化的网络信息分类法应具有多途径检索信息的功能,不但可以通过主分类体系检索,还可以通过从分类体系检索;不但可以通过正式类目进行检索,还可以通过交替类目、镜像类目、热门类目及相关链接进行检索;不但可以通过主题、专题、学科、专业进行检索,还可以通过地区、机构、人物、形态、时间、信息类型、网页等角度进行检索;不但可以通过菜单进行检索,还可通过在同一界面上的检索框内键入关键词进行检索等等。
作者单位:信阳师范学院图书馆
参考文献
[1]余义芳・中文搜索引擎分类体系存在的问题及对传统分类法的借鉴[J]・图书与情报,2004,(3):52-54.