1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!


年轻的时候

小E曾有个“梦”想

1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!

希望自己能有一天真打通任督二脉

七窍通了八窍

瞧啥都是一目了然

看啥都是一目十行

1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!

桌上那堆山一样的文献

终于不是天书

灵感,想法,论证什么的条例清晰

分门别类,那是清清楚楚

那个神清气爽啊~

1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!

当然

梦醒的时候

还是要靠黑眼圈和咖啡继续续命

deadline将近的没那么多时间感叹~

1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!

后来

我却发现了

虽然我是做不到

那么强的分析阅读能力

但是在大数据人工智能的发展的当下

1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!

强力的文本分析工具

可以提供非常强力的阅读辅助~

比如说

我们今天重点介绍的这款:

linguaKit

1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!

linguaKit 是由西班牙自然语言研究团队 Cilenis 研发的一套自然语言与文本分析工具包。

主要功能包括单词形式转换、文本情感分析以及文本关键字抽取,其基本功能主要面向西班牙文和葡萄牙文。

其中情感分析以及关键字抽取部分模块也支持英文,除此之外,该工具包也同时包含了词频统计、绘制词云图等辅助功能。

网址:https://linguakit.com/en/full-analysis

以某篇essay中的一段文字示例:

1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!

我们来看看具体分析的结果:

词法类分析、句法类分析

1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!

名词74,形容词26,动词48,句子20个,字数643,等等

全文摘要

1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!

Family Responsibility,这是一个危险的政策,可能会导致各种社会问题,不仅因为老年人往往不愿与他们生活在一起,而且大家庭也降低了年轻家庭成员的独立性和成长的可能性。

情绪,关键词分析

1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!

正面情绪,关键词包括family members,Jones,Responsibility,Dangerous Policy等都是多次被提及的词或者词组。标签主要关于人,与与组织还有形容词名词。

1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!

Linguakit可识别文本中提到的人员,地点,组织,日期,数量……

这类的关键词集中在2010,2009,2007等,

整体上而言

在没有细看文章的情况下

通过文本分析

我们知道了

这是一篇讲

“Family Responsibility”的论文

结论是

“老人不适合和大家庭生活在一起,这导致各种社会问题”

引用的文献时间可能集中在“2010,2009,2007”

凭借这些内容

就足以让我们简单判断这篇文章

值不值得继续研读

一两分钟就可以帮你做出判断

是不是很赞

1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!

旁边的侧边栏还有些其他功能

基本上是“Full analysis”所展现的补充

这里列出部分:

词频分析

点击边栏“Word frequency”能进一步分析词频并生成词云与数据表。

1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!
1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!

对每一个句子的情绪分析

选择“Sentiment analysis”并输入文本即可

呈现每一个句子所表现的“情绪”

1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!

消极否定的句子有10句

不带情绪的句子9个,正面肯定的句子有16句。

提取关键词

侧边栏选择“Keyword extractor”“Multiword extractor” 输入文本,即可查看关键词

1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!
1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!

这一点想必很有用,

一眼就可以知道文章的关键词是什么

Triples extractor

1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!

这个功能比较有意思

Linguakit将逐句搜索主题与对象之间的关系。

以便于读者能即可立即文本内容

但就结果上来说

还不如直接看原文

要说有什么遗憾的话

虽说不用注册即可使用

但是

需要注意

未注册,每天最多用5次

文本每次只能导入5000个字符

每个功能免费使用仅限20次

1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!

注册后每月可免费使用100次

总共1000次免费使用机会

1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!

虽说网站上注明了

在不知情的情况下不会收集任何个人数据,

也不会将其转移给第三方

但也不能完全保证

1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!

△ 此为隐私政策说明

https://linguakit.com/en/legal

同学们可以谨慎看待并选择

同类型的文本分析工具还有不少

但都是偏向中文

图悦

1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!

在线词频分析工具、词云制作工具,还可以自定义词云的形状。

网址http://www.picdata.cn/

新浪微舆情

1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!

全网事件分析(基于关键词设置,实时抓取全网跟关键词有关的信息)、基用户画像分析(在竞品分析和微博传播路径分析中基于用户兴趣标签和微博发言所得)。

网址:http://wyq.sina.com

腾讯文智

1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!

腾讯文智是基于并行计算系统和分布式爬虫构建的中文语义开放平台,词法类分析、句法类分析、篇章类分类(有内容分类、情感分析、关键字分析,以及对全文摘要的提取分析)

网址:http://nlp.qq.com/semantic.cgi

NLPIR大数据搜索与挖掘共享平台

1分钟1篇的文献分析神器,拯救懒散废宅看不动的夏天!

*主要支持中文分析,免费但一次不能超过3000字符。

NLPIR 能够多角度满足应用者对大数据文本的处理需求,包括大数据完整的技术链条:网络抓取、正文提取、词性标注、实体抽取、词频统计、关键词提取、语义信息抽取、文本分类、情感分析、语义深度扩展、繁简编码转换、自动注音、文本聚类等。

网址:http://ictclas.nlpir.org/nlpir/

最后

想要深度学习研究文本数据分析的同学

还可以参照