PolyGPT 在线文献数据挖掘平台

PolyGPT 在线文献数据挖掘平台-免安装客户端

image001


文献数据挖掘是指从大量文献数据中获取实体及新的实体链接和新的关联规则等信息。主要的技术包含实体的链接与消歧、知识规则挖掘、知识图谱展示、文献主题挖掘等。通过文献数据挖掘可以在大量的文献中很短时间内挖掘出文献之间的关系,研究主题,学术方向,作者之间的关系,关键词之间的关系,期刊之间的关系等相应的知识图谱内容,通过大量直观的图表展示给用户,大大节约了研究人员的时间。

老师和同学在写论文做科研的时候,经常需要文献计量工具,通常是要安装客户端软件到电脑上,如CiteSpace、VosViewer等,这些软件的安装对一些师生来说比较麻烦,同时由于这些软件大都只支持英文WOS等数据,CNKI、CSSCI等中文数据需要经过复杂的格式转换才能生成图谱,这样给每以为师生带来了挑战,不熟悉操作的只好硬着头皮花时间研究这些软件,或求别人帮助。

功能强大的在线“知识图谱”和“主题挖掘”平台PolyGPT,彻底告别安装客户端的烦恼;一键生成知识图谱和主题挖掘结果。PolyGPT包含两个模块,分别是“知识图谱”和“主题挖掘”。

北京恒通博联科技有限公司推出的“PolyGPT 文献数据挖掘”平台,基于Web页面,在线的形式生成知识图谱和主题挖掘结果。同时中文CNKI支持通过在线检索,直接勾选文章,一键生成知识图谱。省去了下载数据和数据转换的麻烦。平台同时支持,WOS\CNKI\CSSCI\CSCD\EI\SCOUPUS\PUBMED等数据源上传文献列表,直接生成知识图谱,免去了安装客户端的麻烦。

在文本挖掘领域,大量的数据都是非结构化的,很难从信息中直接获取相关和期望的信息,一种文本挖掘的方法:主题模型(Topic Model)能够识别在文档里的主题,并且挖掘语料里隐藏信息,并且在主题聚合、从非结构化文本中提取信息、特征选择等场景有广泛的用途。通过LDA主题模型,可以很方便的发现大量文献的主题相识度,发现共同研究主题,研究方向,主题随时间的演化过程,大大节省的人力。

传统要做主题挖掘,需要具备Python知识,同时设置相应参数,确定主题数量,要分词,设置停用词、配置词典等非常麻烦,门槛比较高。使用我公司的“PolyGPT 文献数据挖掘”平台只需要上传文献列表,直接生成主题挖掘各种图表,用户在通过界面设置停用词,配置相应词典就可以得到更加精确的主题分析结果,不需要懂太多计算机和主题挖掘技术就可以得到自己想要的结果,大大降低了主题挖掘的门槛。

“PolyGPT 文献数据挖掘”支持SAAS访问或者本地安装部署,平台针对个人用户,用户需注册后才能使用,通过个人账号和密码登录系统后;开始使用本系统。


例图:

发文关键词共现

image002

合作机构

image003

合作作者

image004

桑基图

image005

作者发文变化

image006

期刊影响力

image007

词频分析


主题间距离图

image008

关键证书词云图

image009


微信二维码 关闭