大数据是一个包括一切的术语,指的是数据集很大很复杂,他们需要特别设计的硬件和软件工具。数据集通常是 T 或者更大级别。这些数据集从各种各样的来源创建,包括传感器,收集气象信息,公开可用的信息,如杂志、报纸、文章。还包括购买交易记录、网络日志、医疗记录、军事侦察、视频和图像档案和大规模的电子商务等等。 JZSearch大数据搜索引擎是灵玖软件联合中科院与北理工的信息检索*,针对大数据搜索业务需求而打造的一套搜索引擎,具有专业精准、高扩展性和高通用性的特点。可支持文本、数字、日期、字符串等各种数据类型的高效索引,支持邻近搜索、负面搜索、语义关联搜索,可提供各类数据库的实时搜索服务,并支持少数民族语言。 JZSearch精准搜索引擎的优势与特色: 1. 智能语义精准搜索:系统不是简单的关键词匹配,会自动根据语义知识进行联想,搜索用户真正需要的信息;并能实现数字、字母的精准搜索,而不是模糊匹配(搜索100,而不会给出1001等不当结果)。 2. 与业务无缝衔接:JZSearch精准搜索引擎能够兼容现有的所有数据库,*开发,即可实现与现有业务数据库的无缝衔接,实现任意字段的搜索分析,为数据库提供毫秒级的搜索服务;而新增或者修改的数据在10秒内,JZSearch搜索引擎就能捕获并反映在搜索结果中。非常适合企业业务数据的垂直搜索过滤。 3. 更强搜索功能:JZSearch可以便利的搜索负面信息,对搜索结果自动统计分析,还可以实现*文字范围内的搜索,如:搜索招标公告中的公司名称附件的法人信息,而不是泛泛地搜索,可以实现信息的精准定位。 4. 系统自主维护:JZSearch搜索引擎可以处理TB级别的大数据业务,索引速度10MB/s,搜索响应1秒以内;整个过程*人工干预,系统部署后,自动索引、自动搜索、自动增量更新、自动优化、自动备份与恢复,实现7*24小时在线运行。 5.高效分区索引机制:可根据应用的查询特点,将数据自动分区索引,充分发挥现代PC多核服务器、大内存的优势,采用并行索引,多路合并的方式,变随机读写为顺序读写,实现高速的索引创建,适应海量数据的集中索引和快速索引的应用需求。同时,分区索引还可以减少检索时的索引匹配范围,缩短检索响应时间。 大数据管理系统的核心是大数据搜索引擎,搜索引擎是大数据高效管理和智能分析的基础,同时需要针对大数据特点(海量、数据异构多样性、应用需求多样性)进行设计,开发面向大数据的高效、可靠、智能的搜索引擎。