简介
国家知识基础设施(National Knowledge Infrastructure,CNKI)的概念,由世界银行提出于1998年。在党和国家领导以及教育部、中宣部、科技部、新闻出版总署、国家版权局、国家计委的大力支持下,在全国学术界、教育界、出版界、图书情报界等社会各界的密切配合和清华大学的直接领导下,CNKI工程集团经过多年努力,采用自主开发并具有国际领先水平的数字图书馆技术,建成了世界上全文信息量规模最大的"CNKI数字图书馆",并正式启动建设《中国知识资源总库》及CNKI网格资源共享平台,通过产业化运作,为全社会知识资源高效共享提供最丰富的知识信息资源和最有效的知识传播与数字化学习平台。
CNKI工程的具体目标,一是大规模集成整合知识信息资源,整体提高资源的综合和增值利用价值;二是建设知识资源互联网传播扩散与增值服务平台,为全社会提供资源共享、数字化学习、知识创新信息化条件;三是建设知识资源的深度开发利用平台,为社会各方面提供知识管理与知识服务的信息化手段;四是为知识资源生产出版部门创造互联网出版发行的市场环境与商业机制,大力促进文化出版事业、产业的现代化建设与跨越式发展。
分类系统
以学科分类为基础,兼顾用户对文献的使用习惯,将数据库中的文献分为十个专辑,每个专辑下分为若干个专题,共计168个专题。
中文网站
CNKI 是全球信息量最大、最具价值的中文网站。据统计,CNKI 网站的内容数量大于目前全世界所有中文网页内容的数量总和,可谓世界第一中文网。CNKI 的信息内容是经过深度加工、编辑、整合、以数据库形式进行有序管理的,内容有明确的来源、出处,内容可信可靠,比如期刊杂志、报纸、博士硕士论文、会议论文、图书、专利等等。
互联网平台
CNKI 是一个互联网出版平台。未来学家预测,在不远的将来,人类将会把所有的知识资源放在互联网上共享。传统出版走向互联网出版已经成为必然。CNKI 是国家新闻出版总署首批批准的互联网出版平台,可以二次出版所有传统出版方式已经出版过的内容,也可以直接通过网络进行一次出版,出版形式多种多样,包括文本、图片、音频、视频、动画、软件、网络课程、科学数据等多种媒体方式。目前,CNKI 已集结了7000 多种期刊、近1000 种报纸、18 万本博士 / 硕士论文、16 万册会议论文、30 万册图书以及国内外1100 多个专业数据库。其中博士/ 硕士论文、会议论文及部分数据库为一次出版,期刊、图书、报纸等为二次出版。如此大的网络出版规模在世界上也是绝无仅有的。
知识搜索
随着互联网的发展和网上信息量的增加,搜索引擎逐渐表现出自身的缺陷和不足。一是搜索引擎对内容收录无法提出明确标准,信息质量良莠不齐,垃圾内容越来越多;二是搜索引擎主要是通过关键词匹配的简单方式查找网页,但是用户通常很难用几个孤立的关键词表达清楚自己的查询需求,而排序算法又主要基于网页的链接分析,因此,难以满足用户对内容准确检索的需求;三是用户更希望直接得到答案,而这只有深入理解文献内容后,才能实现。
针对用户的这些需求和搜索引擎的不足,CNKI推出了知识搜索平台。
文献搜索
基于对文献内容的详细标引,CNKI文献搜索提供了对标题、作者、关键词、摘要、全文等数据项的搜索功能;文献搜索还提供了多种智能排序算法。相关性排序考虑了文献引用关系、全文内容、文献来源等多种因素,使排序结果更合理。被引频次排序是根据文献的被引频次进行排序;期望被引排序通过分析文献过去被引用的情况,预测未来可能受到关注的程度;作者指数排序则是根据作者发文数量、文献被引用、发文影响因子等评价作者的学术影响力,并据此对文献进行排序。
CNKI文献搜索提供的知识聚类功能是一般搜索引擎没有的。基于快速聚类算法,对返回结果的知识点进行聚类,并将主要知识点显示给用户,帮助用户改善搜索表达式,扩展搜索意图。
学术定义搜索
概念的定义是描述知识的一种基本单元,被称为定义型知识元。CNKI学术定义搜索提供对学术定义的快速查询。CNKI定义型知识元库收录了从文献中自动抽取的学术定义120多万条。
由于这些定义来源于学术期刊等文献,是不同学者对该概念的认识和论述,因此具有更广泛的参考价值。通过阅读不同角度的解释,就可以全面了解其含义和发展状况,特别是对那些还没有形成明确定义或存在争议的学术概念。从任意定义出发,就可以深入地学习相关的知识。这些是工具书无法做到的。
数值知识元搜索
量化知识是极其重要的知识,如:人均GDP、失业率等,也是基本的知识单元,被称为数值型知识元。CNKI数值知识元搜索提供对这类数值的搜索。
CNKI数值型知识元库包含5000多万条知识元,对应于具有明确含意、至少含有一个以上数值的句子。它们有两个来源,一是CNKI数据库中的文献;二是国家统计局、商务部等发布数值内容的权威网站。数值搜索结果通常包含用户直接想要的答案,许多数值还能以图表方式显示,以帮助用户全面了解问题。
新概念搜索
学术研究的灵魂在于创新。创新成果通常以提出新的定理、概念、方法等形式发表出来。CNKI新概念搜索提供对学术新概念的浏览和查询。对学术新概念的抽取采用了多种知识挖掘方法,并由各学科领域的专家进行人工审核。
新概念搜索可以按年份浏览或搜索某一领域中的新概念,以帮助用户及时了解学科的发展状况,促进学者发表有创新性的研究成果。
翻译助手
CNKI翻译助手能实现对中英文词、短语、句子的辅助互译。CNKI中英文对齐语料库包含100多万中英文对齐词汇(大部分是学术词汇)和1000多万对中英文句子对。它们是从CNKI数据库中含有中英文对齐标题、关键词、摘要等数据项中采用多级对齐技术自动抽取的。
与一般电子词典相比,翻译助手具有以下优势:一是通过将句子拆分为词,能够对短语或句子进行辅助翻译;二是除了词汇翻译外,还提供了大量例句,并按句子结构相似性进行排序;三是能够翻译术语的英文缩略语。
图形、表格搜索
CNKI图表搜索能够实现对学术图形、表格基于内容的搜索。图表库分别包含500万以上从文献中自动抽取的图形、表格,以及它们对应的标题、所在文献、作者、文献中对图表内容的阐述等,以此实现基于内容的图表搜索。这是目前一般搜索引擎无法实现的。
基础
1.制定了“CNKI系列数据库产品标准”,涉及到从数据入编、加工到最后形成数据库产品的全过程,从数据源头、数据质量等方面为开展深入的知识挖掘提供了基础。
2.建设了“中国知识资源总库”,包括期刊、学位论文、会议论文、报纸、年鉴、工具书等源数据库,在资源数量和完备性上为建设各种知识搜索产品提供了保证。
3.建设了各种知识库资源,包括:CNKI知识词典、引文数据库、各种索引数据库、主题词词典等,对实现知识搜索、提高搜索性能起到了基础性作用。
郑重致歉
“中国知网”网站运营管理部向全体用户郑重致歉
尊敬的用户:
2013年4月8日9:10-10:50 , “中国知网”突然中断了域名服务,严重影响了用户使用,为此,“中国知网”网站运营管理部向所有用户表示郑重道歉。
这次事故是由“中国知网”网站运营管理中心未及时向网络域名服务机构北京盈科迅达科技有限公司缴纳域名管理服务费造成的,属于本公司内部责任事故,现已对有关责任人给予严肃处理。网站运营管理中心将引以为戒,加强管理,确保不再发生类似事故,并诚挚希望得到广大用户谅解。
再次郑重致歉!
“中国知网”网站运营管理部
2013年4月8日12:00