企业信息

    灵玖中科软件(北京)有限公司

  • 10
  • 公司认证: 营业执照已认证
  • 企业性质:外资企业
    成立时间:
  • 公司地址: 北京市 海淀区 北京市海淀区苏州街49-3号盈智大厦5层
  • 姓名: 张宝
  • 认证: 手机未认证 身份证未认证 微信未绑定

    供应分类

    中文分词nlpir发布lucene/solr分词支持包

  • 所属行业:商务服务 其他商务服务
  • 发布日期:2017-08-31
  • 阅读量:258
  • 价格:10000.00 元/套 起
  • 产品规格:不限
  • 产品数量:1.00 套
  • 包装说明:不限
  • 发货地址:北京海淀  
  • 关键词:中文分析,语义分析,汉语分词,信息过滤,语义挖掘

    中文分词nlpir发布lucene/solr分词支持包详细内容

      近日,在北京理工大学大数据搜索与挖掘实验室团队成员的不懈努力下,为了方便大家使用,NLPIR-ICTCLAS发布了lucene/solr的分词支持包功能。系统通过此次升级进一步提升了功能效果,为数据的提取提供了**。
      NLPIR-ICTCLAS分词系统前身为2000年发布的ICTCLAS词法分析系统,由张华平博士在多年研究工作积累的基础上研发出来,从2009年开始,为了和以前工作进行大的区隔,并推广NLPIR自然语言处理与信息检索共享平台,调整命名为NLPIR分词系统,主要功能包括中文分词;英文分词;词性标注;命名实体识别;新词识别;关键词提取;支持用户专业词典与微博分析。
      词法分析是自然语言处理的基础与关键。在中文自然语言处理中,词是较小的能够独立活动的有意义的语言成分。汉语是以字为基本书写单位,词语之间没有明显的区分标记,因此进行中文自然语言处理通常是先将汉语文本中的字符串切分成合理的词语序列,然后再在此基础上进行其它分析处理。中文分词是中文信息处理的一个基础环节,已被广泛应用于中文文本处理、信息提取、文本挖掘等应用中。
      NLPIR-ICTCLAS系统支持多种编码(GBK编码、UTF8编码、BIG5编码)、多种操作系统(Windows, Linux, FreeBSD等所有主流操作系统)、多种开发语言与平台(包括:C/C++/C#,Java,Python,Hadoop等。这次升级可以直接把lucene/solr支持包功能内嵌到分词系统里,增强了系统的搜索速度和分词的准确率,是为了适应系统需求,提高客户使用的效率。
      Lucene是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎.
      Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Solr Get操作提出查找请求,并得到XML格式的返回结果。
      NLPIR-ICTCLAS系统在长时间的实验和总结中,以满足客户的需求为基础,不断的提高系统的流畅性和准确率,为广大使用者提供一个安全、高效的使用环境。

    http://ljrj123.cn.b2b168.com
    欢迎来到灵玖中科软件(北京)有限公司网站, 具体地址是北京市海淀区北京市海淀区苏州街49-3号盈智大厦5层,联系人是张宝。 主要经营灵玖软件(LING-JOIN-微场景宣传片),专注于大数据语义搜索与挖掘的技术创新与服务,提供大数据搜索、大数据挖掘与大数据应用解决方案,以应对大数据的管理、处理、分析,并从大数据中获知识与智慧,将用户的大数据困境转变为大数据宝藏。灵玖软件大数据语义技术已经应用于**三十余万家机构,灵玖软件在大数据应用落地上有成熟的产品与解决方案,赢得了用户的一致口碑。。 单位注册资金单位注册资金人民币 1000 - 5000 万元。 你有什么需要?我们都可以帮你一一解决!我们公司主要的特色服务是:大数据开发,大数据搜索与挖掘,大数据中文分词等,“诚信”是我们立足之本,“创新”是我们生存之源,“便捷”是我们努力的方向,用户的满意是我们较大的收益、用户的信赖是我们较大的成果。