1 2 3
金信桥网络公司
 
解决方案
TBS统一检索整合平台解决方案
TBS云搜索解决方案
TBS全文检索引擎系统
TBS站内检索解决方案
TBS数字档案馆解决方案
TBS图书馆数字化解决方案
TBS政府门户网站解决方案
TBS企业门户网站解决方案
TBS办公自动化(OA)系统解决方案
TBS资源数字化解决方案
TBS知识管理系统解决方案
TBS数字化出版解决方案
   
中国城市林业政策信息网
中国林业政策信息网
中国林业信息网
水产科技信息网
北京经略信息咨询公司
中国党政信息网
中国残疾康复信息网
国家林业局科技司
中国兵工学会
中国现代国际关系研究院
国家农业科学数据共享中心
交通科学数据共享网
民航科学数据共享网
法规数据网
北京印刷学院数字图书馆
国电数字图书馆
北京农学院图书馆
煤炭数字图书馆
中国化工安全网
中国畜牧信息网
 
TBS全文检索引擎系统

一 需求场景

    二十世纪八十年代以来,全球信息技术飞速发展,尤其是因特网的出现和普及,使得信息技术得以迅速渗透到社会经济的各个领域,在这一过程中,信息化建设的重要性也凸显出来,信息化成为单位增强管理效率和核心竞争力的重要手段,也成为实现全面电子商务的基础。
    伴随着社会和科学技术的进步,信息量也呈几何级数递增增长。面对浩如烟海的信息,通过传统的手工查阅的手段来获取信息已远远不能满足人们对信息化的需求,全文检索引擎应运而生。
    金信桥TBS全文检索引擎系统定位于政府机关、行业协会、企业、出版社、图书馆和档案馆等单位信息化的全文检索应用支持平台——在此平台上,对海量数据提供全文检索以及丰富的其它方式的检索功能。以此平台为基础,还扩展出信息采集与发布、主页快速制作与发布、资源数字化加工和电子出版物制作与发布等服务。并且还具有强大的可扩展性和兼容能力,实现了单位信息化成熟度的全面提升。
    TBS全文检索引擎系统是金信桥公司对电子信息资源资料不断增多,单位内部各类数据库资源数据存放在不同的数据库中,或分布在不同的服务器上的需求而开发的一套高性能,高实用性的全文检索和信息管理工具软件。

二 TBS全文检索引擎给您带来的价值

    TBS 在信息检索和内容管理领域十几年的耕耘,在自然语言检索、分布式检索、内容的语义理解、智能化信息过滤、个性化信息推送、内容检索深加工等方面有着深厚的功力和技术积累。TBS全文检索引擎可以为企业现有的关系数据库提供高效、快捷的全文检索功能,提高整个系统的检索效率。
    TBS全文检索引擎系统是国内外技术领先的中英文全文检索引擎,它采用多种压缩算法、中文字词结合索引、中英文混合索引、动态多级索引等多项先进技术,它具有索引和检索速度快、空间膨胀率低、三层结构、分布式动态负载均衡、多机并行检索、支持多语种等特点。
    以TBS全文检索引擎技术为核心,针对用户需求,金信桥公司已经开发完成了一系列应用软件,如:信息发布、信息服务、文档管理、企业信息门户、数字图书馆、资源数字化工具、合同管理、教育资源管理、期刊文献检索、法律法规检索、报刊合订本等等,适用于党政机关、企事业单位、图书馆、科研、情报、教育等领域使用,提高信息利用率,让信息创造价值。

三 产品概述

    全文检索引擎的原理是计算机索引程序通过扫描文章中的每一个字或词,对每个字或词建立全文索引,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户。这个过程类似于通过字典中的检索字表查字典的过程。
    TBS全文检索引擎系统是金信桥公司对电子信息资源资料不断增多,单位内部各类数据库资源数据存放在不同的数据库中,或分布在不同的服务器上的需求而开发的一套高性能,高实用性的全文检索和信息管理工具软件。
    TBS全文检索引擎系统是国内外技术领先的中英文全文检索引擎,它采用多种压缩算法、中文字词结合索引、中英文混合索引、动态多级索引等多项先进技术,它具有索引和检索速度快、空间膨胀率低、三层结构、分布式动态负载均衡、多机并行检索、支持多语种等特点。
    以TBS全文检索引擎技术为核心,针对用户需求,金信桥公司已经开发完成了一系列应用软件,如:信息发布、信息服务、文档管理、企业信息门户、数字图书馆、资源数字化工具、合同管理、教育资源管理、期刊文献检索、法律法规检索、报刊合订本等等,适用于党政机关、企事业单位、图书馆、科研、情报、教育等领域使用,提高信息利用率,让信息创造价值。

四 产品功能

1 完善的非结构化数据管理

  • 系统支持包括TEXT、HTML、RTF、MS OFFICE(Word/Excel/Powerpoint)、PDF等多种格式文件的存储、索引和检索。
  • 支持结构化数据类型,如:日期型、字符串、数值型等。
  • 系统支持中文、英文、法文、德文、俄文、阿拉伯文等十多种语种的存储、索引和检索;系统核心支持GB2312/GBK/GB18030编码,BIG5编码,UTF8编码。

2 高效、智能的全文检索

    为了使检索结果更准确,系统提供了以下的检索功能:

  • 支持字、词、长句子的混合检索。
  • 中英文(全角/半角)混合检索、英文和数字的混合检索。
  • 布尔查询。具有多个检索词逻辑运算(与、或、非、差、优先、相临、异或)功能。
  • 高级检索。除了向用户提供基于全文的关键词句的检索外,系统还向用户默认提供按照标题,日期,作者,分类和文章关键词的综合检索。综合的检索方式使得检索的结果更为准确。综合检索的方式取决于文件信息模板提取器的定义。用户可以利用它实现其它扩展功能的检索。
  • 渐近检索。用户可以在检索结果中检索,不断缩小检索范围,提高检索精度。
  • 临近检索。用户即使无法回忆起整个句子,也可通过相邻或者相近关键词的查询找到准确的结果。
  • 模糊查询。支持使用通配符“*”的模糊匹配查询,并支持“?”号的单字符匹配查询。
  • 提供相关度排序。检索结果默认为按照时间排序,时间越近,在检索结果中越排在前面。用户也可以选择检索结果按照关键词的相关度进行排序。结果的相关度越高,记录排在越前面。

3 完善的索引策略

    TBS全文检索引擎采用采用了国际领先水平的信息检索技术和中文自然语言处理研究成果,内核支持GB18030(包括GB2312、GBK、Big5等)编码和Unicode编码。

  • 全面支持中文按词、按字索引,字词结合智能索引,独创双字索引,用户可自定义索引组合。
  • 内嵌汉语自动分词系统,有自学习、动态词索引功能;支持禁用词典的使用,具有停用词(Stop-list)处理功能。支持用户自定义分词词典。
  • 支持多种索引方法(字段索引、全文索引、层次索引、代码索引)。

4 支持各种数据库

    支持分布式大型数据库检索,如:ORACLE、SQL SERVER、DB2、Sybase、Informix、Dbase、Foxbase、Foxpro。无需将原有数据做任何导入或导出,利用全文检索技术直接对ORACLE、SQL SERVER关系型数据库中的数据建立全文索引,就可对数据进行全文检索。
    能够同时对多个异构网络数据库进行检索。可以指定对某一个数据库进行检索,也可以对多个数据库同时进行检索,一次检索可以跨至少1024个数据库。

5 安全的信息管理

    通过用户身份认证,不同的用户(用户组)对不同的资源(资源组)具有不同的操作权限(包括:检索、浏览、阅读、下载,添加、修改、删除等)。

五 产品架构

    金信桥TBS全文检索引擎系统是目前国内唯一具有三层结构、分布式动态负载均衡、多机并行检索、超大容量、多语种、多媒体、高可靠性的全文检索系统。
    所谓三层结构,就是指整套系统由数据库层、业务解释应用层和用户终端组成。在金信桥TBS全文检索引擎系统中,数据库层由全文检索数据库TBS/TBF(金信桥拥有独立知识产权)、全文检索引擎、索引服务和异构数据库整合平台(支持其它大多数主流数据库)组成;业务解释应用层由JSP/ASP/CBS编写的满足客户需求的业务响应、处理系统和Win/Unix/Linux WEB Server组成;用户终端,即客户端操作界面,采用我们上网时常用的IE浏览器。
    整个产品的架构图如下:

六 产品特点及优势

 1 超群的响应速度
    索引:使用自有高效索引结构,实现业界领先的索引速度。
          全文索引500M原始文本信息的时间在30分钟左右;对2G文本数据进行全文索引的总时间不超过2小时。
    检索:实现海量数据库毫秒级、亚秒级查询,在100多万条记录2G数据量上实际测试的平均时间为0.3秒。

 2 领先的压缩技术
    领先的数据压缩存储技术,在实现无损压缩的基础上,使数据膨胀率更低,索引占用光盘或磁盘空间更小,全文索引和检索速度更快,实现海量数据秒级响应。
    空间膨胀率在-0.1至0.3之间,可通过选项调节。
    支持字段内容加密/解密和压缩/解压缩。

 3 方便的应用平台
    金信桥参考标准的C、JavaScript、JSP等语言的语法,开发出了一套语法精练的CBScript(CBS)网页模板编写语言,它编译执行速度快,并且提供了大量的页面模板可供直接调用,该语言中内置了全文数据库管理、全文检索引擎、电子邮件收发、文件管理、远程文件传输、加密/解密、压缩/解压缩、身份验证、资源管理、动态调度等模块,藉此平台用户可快速进行极具个性化的应用开发。

  • 操作简便,界面友好,即使是信息编辑员或打字员也能够很好地管理TBS数据库,无需编写程序或HTML页面;
  • 采用模板技术,用户可调整各种界面,页面可定制,具有良好的灵活性,用户可以在不需编程的情况下能够对Web页面进行灵活修改;
  • 同时为专业开发人员提供开发接口,方便快捷地进行二次开发,可进行页面编程,具有强大的扩展能力;
  • 支持多种文档格式入库,如:WORD,EXCEL,PDF,RTF,WPS,HTML,S2,WPS。

    数据库按数据信息进行归类,形成二级菜单。

七 运行环境

    软件环境:windows 2000(SP4)/2003(SP1) 服务器版
    硬件配置:CPU:Intel Xeon 2.0 GHz以上,RAM:1 GB以上,硬盘:120G,网卡:100/1000M自适应

八 联系方式

    地址:北京市海淀区中关村东路66号世纪科贸大厦B座2306室
    邮编:100190
    总机:(010)62670903/62670700
    传真:(010)62670877
    客户服务:(010)62670903
    邮件支持:tbsinfo@sohu.com
    公司网站:http://www.tbs.com.cn

导航
Copyright © 1994-2018 北京金信桥信息技术有限公司
电话:010-62670903,62670700  传真:010-62670877 E-mail:tbsinfo@sohu.com
京ICP备15047523号