大数据搜索与挖掘平台

NLPIR大数据搜索与挖掘共享平台介绍

  NLPIR大数据搜索与挖掘共享平台(以下简称NLPIR),汇智语言理解掘金内容价值,让数据成为智慧,助力企业发展。

  云计算、智慧城市、移动互联网、大数据与物联网已经成为大数据时代的技术特征,实现了人、机器与实物的多维互联互通。大数据分为结构化大数据与非结构化大数据,非结构化大数据的生产、搜索、挖掘与分析已经成为了当前研究的热点与难点,并且大数据搜索、挖掘与可视化等落地的工程实践尚有较大距离,这也是当下的工程急需。

NLPIR大数据搜索与挖掘平台简介

  NLPIR能够全方位多角度满足应用者对大数据文本的处理需求,包括大数据完整的技术链条:网络抓取、正文提取、中英文分词、词性标注、实体抽取、词频统计、关键词提取、语义信息抽取、文本分类、情感分析、语义深度扩展、繁简编码转换、自动注音、文本聚类等。
  NLPIR所有功能模块全部备有对应的二次开发接口(动态链接库.dll,.so,及静态链接库等形式),平台的各个中间件API可以无缝地融合到客户的各类复杂应用系统之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD,麒麟等不同操作系统,开发者可使用Java,C/C++,C#, Python,Php, R等各类主流开发语言调用其所有功能。

NLPIR大数据搜索与挖掘在线平台功能介绍

  本演示平台支持Chrome、Firefox、IE(9+)、UC、360(极速模式)等主流浏览器。

  模块介绍请点击各个模块的右上角的文本图标链接。

网络信息实时采集与正文提取

  NLPIR演示平台根据新浪rss摘要,利用NLPIR的精准网络采集系统实时抓取新浪最新的新闻(每次刷新均会重新抓取)。NLPIR正文提取系统将网页中的导航、广告等内容去除,利用网络文本链接密度作为主要参数,采用深度神经网络模型,实现文本正文内容的自动提取。
  也可以直接在网页URL里粘贴任何网站的链接,点击抓取,则可以抓取到该URL网页的正文,然后点击分析,则可以对该篇文章经行分析。
  当然,也可由用户人工自由输入任意的文章。为了确保服务的速度,在线演示系统的文章字数限制在30——3000字。

NLPIR大数据搜索与挖掘平台主要优势

技术优势

  NLPIR由多名专注于大数据科学研究与工程应用融合领域的博士硕士,不断创新,倾力打造十余年。并分别荣获了2010年钱伟长中文信息处理科学技术奖一等奖,2002年国内973评测综合第一名,2003年国际SIGHAN分词大赛综合第一名。综合平衡了效果与效率,实现了 “又好又快”的技术追求。

普适优势

  NLPIR提供丰富的open API,可无缝地融合到客户的各类复杂操作系统之中,开发者可使用各类主流开发语言调用其所有功能。

经验优势

  十余年中,NLPIR先后服务了全球30万家机构,其中涵盖了中央网信办、中国证监会、中国人民银行、国家统计局、国家气象局等国家机构,中信信托、华为、人民网、中国移动、中国邮政等大型商业机构,以及中国科学院、清华大学、中国科技信息情报研究所等科研机构。

  你如果需要我们的组件,可免费下载,下载地址:https://github.com/NLPIR-team/NLPIR。

关于NLPIR
关于我们
微信扫一扫
NLPIR Big Data Search and Mining Platform Copyright | 2015(C) Big Data Search and Mining Lab | Beijing Institute of Technology All rights reserved.