【DiVoMiner®】轻松通过个性化词云图,探索海量数据,辅助建构研究类目!
-
这一期给大家介绍一下,我们如何在DiVoMiner(me.divominer.cn)平台上通过个性化词云图,轻松探索海量数据,依据词云图中显示的关键信息辅助建构研究类目。
词云图是词频的一种可视化效果图,词的大小表示该词在文本中出现的频次大小。出现频次大的词语在词云图中的字体会越大,反之,出现频次小的词语在词云图中的字体会越小。词云图可以通过词语出现的情况,较直观地观察到文本中的关键信息。这样就可以探索海量数据了,进而辅助我们建构研究类目。一
探索海量数据,辅助建构研究类目
在DiVoMiner 平台上,只需您上传数据,即可自动生成词云图。这个自动生成的词云图显示在【探索】中,点击即可查看。我们选取了若干篇关于ofo共享单车相关的新闻报道为例,上传入平台后,立即生成了如下图所示的词云图:
图中显示了词频较多的词语分别是“押金”、“用户”、“退押”、“公司”、“退款”、“总部”、“申请”、“排队”等……表明研究内容中的关键信息是关于共享单车的退还押金的问题。具体的详细信息可以通过关键词的来源文本查看,以便做进一步了解数据内容。在传统的分析方法中,我们首先需要逐一阅读每一篇文本,找出关键词,标记好后进行统计分析,得出最终的分析结果,对于分析结果中每一个关键信息的来源也需要逐一翻阅汇整……
相比较传统的内容分析方法中无法快速找出关键词的来源文本,DiVoMiner平台除了快速探索海量数据的关键信息外,也提供了分析结果的追踪溯源功能,只需一键点击图中的任意关键词,即可直接显示该关键词的来源文本。
探索了海量的文本内容后,可针对共享单车退换押金事件的关键信息建构研究类目,例如词云图结果显示的研究面向涉及了退还押金涉及的支付渠道,共享单车企业的资金问题,创始人等等,因而,我们就可以围绕这几个方面来建构研究类目了。确定了研究类目的基本方向后,小编粗略的看了一些主要关键词的来源文本后,根据词云图结果和文本内容,初步建构以下研究类目:
退还押金的渠道
线上退还
现场退还资金问题来源
融资碰壁
内部腐败
单车质量问题
拒绝智能化转型偿还押金的举措
公司搬家
内部裁员
开展B2B广告业务
上线折扣商城更多研究类目欢迎各位留言补充~
二
如果您想自定义词云图,可以在【统计分析】中快速制作词云图DiVoMiner允许您自定义
不同变量和不同维度的词云图。将需要统计词频的变量拖拽至【维度】,
选择【统计方法】-【切词】。
选择图表类型中的词云图,点击【保存】即可完成词云图的制作。
注意:因抽样库中的数据混在其母体数据库中,因而在制作统计分析图表时,如存在抽样库,则需通过【筛选】特定数据库,设定需要进行统计分析的数据范围。DiVoMiner平台
还允许您对词云图进行更多的编辑操作点击【图表样式】中的【热词管理】。
1、
删除词云图中的个别词语可通过【停用】来直接删除显示在词云图中的个别词语,被停用的词语会显示在【停用词】一栏。
如果您想整理所有的停用词,点击【下载】即可将停用词列表的TXT档下载至本地。当然,您也可【上传】您已经准备好的停用词列表(TXT格式)。停用词一栏中的词语将不会显示在最终的词云图中。
如果您想恢复那些已经被停用的词语,点击【复用】即还原对该词语的停用,点击【清空】即清除停用词中的所有词语,该些词语将会再次显示在词云图中。
2、
让自定义的组合新词显示在词云图中通过组合新词整理同类词语,用以显示在词云图中。如“大湾区”和“粤港”可组合成“粤港澳大湾区”,点击【新建组合】,选择需要组合的词语,为该些词语命名。例如“大湾区”和“粤港”以及“粤港澳大湾区”将均以“粤港澳大湾区”一词的形式显示在词云图中。
点击【清空】即清除掉了所有的组合词。
编辑好热词后,点击【确定】,回到图表编辑界面,点击【保存】,将词云图保存至特定文件夹即可。
点击词云图中的关键词即可显示该词语的来源文章,方便您针对关键词进行进一步的深入解读。
快来DiVoMiner 平台上试一下您手里的文本可以制作出哪些有趣的词云图吧!
-
辛苦了~