欢迎访问广东工业大学数据挖掘与信息检索实验室!

KECVS:面向专业文献知识实体的类型标注及可视化系统

作者:DMIR    发表时间:2016-12-12    浏览量:338


项目负责人(教师):温雯、蔡瑞初、郝志峰、王丽娟

项目参与人员、主创人(学生):伍思杰

项目成果发明专利1项,软件著作权1项,论文1

系统演示地址:http://kecvs.dmirlab.com/


系统简介:面向专业文献知识实体的类型标注及可视化系统KECVS,提供对文献数据的定向爬取功能,同时还提供对文献数据进行预处理、实体识别、类型标签抽取、类型标注及知识实体关系图建模等功能,并通过Web数据可视化技术呈现给用户。通过KECVS系统可以简单便捷的获取到所关注知识点的层次树图、知识关系图及热点跟踪图等,从而为科研工作者在科研方向上提供有价值的参考和启发。


系统功能介绍:


图1 KECVS系统首页

      KECVS系统首页如图1所示,左侧主菜单包括5部分内容:类型抽取、层次图、关系图、热点图和实体识别。首页同时也是类型抽取页面,在右上角检索框输入实体关键词(或者直接点击检索框下的快捷提示词)后,类型抽取页面会生成类型结果说明,同时在说明下方生成该检索关键词的类型分布饼状图。例如我们输入“条件随机场”进行类型抽取,可以看到“条件随机场”的最符合类型标签是“模型”。


图2 基于类型分组的知识关系图可视化界面

      知识实体关系图分别包括层次树图、知识关系图及时序热点图三部分。其中,图2展示的是基于类型分组的知识关系图的可视化界面,从图中可以看到,用户输入关键词“条件随机场”检索后,获得以“条件随机场”为中心的不同类型分组下的知识关系图,包括有模型、方法、算法、协议、系统等多个类型下的知识点。例如,与“条件随机场”相关的“方法”有:“视频分割方法”、“中文词性标注方法”、“机器学习方法”等。

图3 知识实体识别及类型标注界面

      知识实体识别及类型标注的界面如图3所示,用户可以在上侧输入框输入想要进行识别的文本或者点击“随机获取摘要”按钮获取文献摘要进行测试。点击开始识别按钮后,在下侧可以看到知识实体的类型标注结果,结果中不同的颜色背景代表不同的类型,在最下方有对应颜色的类型图示。例如,从图5可以清晰的看到,“条件随机场”、“LDA”、“CRF”等都能识别出来并类型标注为“模型”,而“目标检测”、“机器学习”等标注为“方法”。
       目前,KECVS系统所有图表采用Echarts3实现可视化,均提供数据视图及图表下载功能。