中间件产品

线点CKM 文本挖掘套件
帮助用户从文本数据中获取有价值的信息和知识,

{ 语义分析 }


  • 中文分词


  • 词性标注


  • 词频统计


  • 词法分析


  • 句法分析

{ 文本挖掘 }

  • 相似度计算 通过计算不同文本之间的相似度关系,以文找文。

  • 自动分类 采用深度学习技术,自动分类训练,实现对于非结构化文本的自动分类。

  • 自动聚类 基于相似性算法的自动聚类技术,发现用户热点,知识迅速定位,为搜索提供线索等等。

{ 图片识别与分类 }

图片文本识别 基于OCR技术,可对于图片上的印刷体文字进行识别,识别后转换为文本存储,文本识别支持JPG、BMP、PNG、TIF等格式图片,也支持对于PDF里面的图片进行识别,识别率高达95%以上。

图片自动分类,采用深度学习算法,对不同类别的图片进行识别和训练,从而达到图片自动分类的目的。

{ 文本抽取 }


  • 关键词提取


  • 摘要提取


  • 命名实体识别


  • 特征词提取