导航

    DiVoMiner®知识库

    • 注册
    • 登录
    • 搜索
    • 版块
    • 最新
    • 话题
    • 热门
    1. 主页
    2. Admin
    A
    • 资料
    • 关注
    • 粉丝
    • 主题
    • 帖子
    • 最佳
    • 群组

    Admin

    @Admin

    10
    声望
    13
    帖子
    434
    资料浏览
    0
    粉丝
    0
    关注
    注册时间 最后登录

    Admin 关注

    Admin 发布的帖子

    • 陆续有老师发表了论文成果,你还不赶快注册试一试?

      小编语:自DiVoMiner文本数据挖掘与分析平台(平台旧名是DataMiner)面世以来,已有众多用户使用DiVoMiner获取、处理文本数据,高效地在线完成文本数据内容分析研究,最终发表高品质的论文成果。

      本期介绍的论文是武汉体育学院新闻传播学院万晓红教授团队所做的关于“中国体育形象”的研究,标题为**《“中国体育形象”的媒介呈现——基于国外主流媒体里约奥运会涉华报道文本分析》,论文发表在国家形象蓝皮书《中国国家形象传播报告(2017~2018)》**。

      研究发现,奥运会是塑造中国体育形象的重要平台,国外媒体在塑造中国体育形象时存在双重标准,国内媒体对中国体育形象的“自塑”影响着国外媒体的“他塑”。

      数据处理部分,研究团队抽取《纽约时报》、《华盛顿邮报》、《泰晤士报》和《联合早报》四家媒体在里约奥运会期间的涉华报道,检索文章标题和导语中同时出现了关键词“Olympic”“Rio”“Sport”
      “Athlete”之一和“China”“Chinese”
      “Beijing”之一,进一步筛选出与中国紧密相关、并有实质内容的报道,最终获取353篇符合研究要求的报道作为研究对象,分析指标包括报道数量、报道题材、报道倾向及报道主题等方面。
      本论文版权归属发表刊物及作者,本文仅用于学习用途。以下为论文基本信息及目录:
      论文摘要介绍截图.jpg
      小提示:DiVoMiner上的数据从哪里来?

      有用户提出疑问,想要在DiVoMiner平台上做数据研究,可是数据从哪里来呢?小编归纳一下,你可以上传自己准备好的数据(自行收集整理、其他电子数据库文档),也可以告诉我们你的需求,我们协助对接数据库。参见下图:
      数据来源截图.jpg

      发布在 DiVoMiner®交流
      A
      Admin
    • 【让研究更容易】上来DiVoMiner®轻松获取论文中常用的图表

      自动化分析是大数据研究中的必备技能,分析海量数据内容,快速生成一个词云图、趋势图、饼图、柱形图等等,来呈现数据的基本面貌。然而,在社会科学研究中,这些自动化分析结果不足以解决我们的研究问题,我们需要的是这些好看的图表背后究竟说明了哪些本质的问题,这些数据反映的差异和关系是什么。这也是社会科学研究中的两大核心问题。要回答这个问题,需要人机结合和严谨的研究方法来深入挖掘和探索数据背后的意义和洞察。

      社会研究问题图1.jpg

      DiVoMiner(me.divominer.cn)能够快速得出海量数据的统计分析结果和可视化图表,同时提供分析结果的追踪溯源功能,方便研究人员针对图表进行描述和深入解读,无论是您的研究数据“说了什么”,还是“怎么说的”,变量之间的差异和关系都可以在这里回答。

      小编介绍一下论文中常用的各类统计分析图表样式,柱状图、折线图、条形图、饼图、词云图、桑基图。我们以DiVoMiner®平台上的统计图表为例。

      柱状图
      柱状图一般用以反映数据的差异,包括每个变量的值和所占比重。除了基本的简单柱状图外,也有堆叠柱状图、百分比堆叠柱状图。小编以柱状图的延伸图表——百分比堆叠柱状图为例,图中显示了小米和华为的品牌特性分布中,小米偏重情感特性,超过六成,华为偏重功能特性,超过五成。

      柱状图1.jpg

      如果我们想知道具体的情感特性或功能特性涉及了哪些方面,我们可以将情感特性进一步分类,作为一个类目进行机器自动编码,快速读出文本中提及的具体情感特性或功能特性类别,强化数据分析的深度。以情感特性的分布为例,图中显示了小米品牌中情感特性占比最多的是创新感,其次是时尚感。华为品牌中占创新感和时尚感占比相近,此外,商务感占比超过两成。

      柱状图2.jpg

      通过人工主导,机器辅助的方式,文本大数据中“说了什么”就一览无遗,您的想法可以通过DiVoMiner轻松实现。

      折线图
      **折线统计图可以直接显示数据的变化规律,反映出数据随着时间的变化趋势。**如果我们想了解文本中对华为和小米在不同时间的讨论热度,DiVoMiner®能自动制作出一个基本的信息量趋势图,如图中清晰的显示了从2018年1月起,对华为和小米的讨论趋势有明显差异,小米的内容在4月后呈明显增长趋势,到7月达到一个高峰,而华为的相关讨论内容在整个时间段中始终保持平稳趋势。

      趋势图3.jpg

      条形图
      **条形图类似柱状图,用以显示变量之间的差异。**包括简单条形图、堆叠条形图、百分比堆叠条形图。以百分比堆叠条形图为例,如果想了解讨论的主要内容,可以通过设置相关主题的类目,进行编码,也可以为主题类别设定好关键词,让机器根据关键词进行自动编码,以快速挖掘文本中的主要内容的类别。图中显示华为的相关报道主题集中在产品性能方面,更重视产品性能。而小米的报道主题则集中在公司报道方面。

      报道主题图4.jpg

      饼图
      **饼图用以显示各项的大小和所占有的比例。**适合各种单一变量的分类展示,例如我们想了解一下手机广告中用了哪些方面的诉求和方式做宣传,那么分布结果如图所示,较多使用的是实证说明,通过一些数据报告、销量报告等来说明产品的受欢迎程度和市场占有率。其次是强调产品所应用的专门技术,例如芯片、系统等突出产品质量。
      拼图5.jpg

      词云图
      词云图是根据词频的多少,对应在图上显示词语的大小,可以直观地观察到文本中提及词汇的多寡,从而推断文本中主要谈及的内容。如图显示,手机相关的文本中,讨论最多的是之智能家居、电视、电脑、可穿戴设备等。尤其是以小米为主的线下体验店——小米之家,展示了各类小米的关联产品,供用户体验。

      词云图6.jpg

      桑基图
      桑基图通常用以展示数据的流动,“边”越宽,表示数值越大。不同的颜色区域表示不同的类别。如图所示,在合作领域方面,小米和华为均集中在物联网领域,在车载领域的合作较少。

      桑基图7.jpg

      💡温馨提示:

      在DiVoMiner上,这些统计分析图中的数据都可以追踪回溯至对应的原文,只需点击图中的某一个数据即可在图表下方显示出该数据来源的原文。供研究者进一步深入解读和挖掘。

      追溯图8.jpg

      除了这里介绍的几类常用的统计分析图外,还有热力图、雷达图、面积图、散点图等,欢迎大家来DiVoMiner上免费试用。同时,我们在DiVoMiner上为大家提供了案例,供大家查阅参考。

      发布在 DiVoMiner®交流
      A
      Admin
    • _半岛晨报_旅游广告内容分析_何芳

      链接: https://pan.baidu.com/s/1aRquUsyh772EE6C1KwqWxw 提取码: qmb2 复制这段内容后打开百度网盘手机App,操作更方便哦

      发布在 文献宝库
      A
      Admin
    • 我国广告学博士研究生教育的现状__省略_考_基于28所高等院校的统计分析_赵恒煜

      链接: https://pan.baidu.com/s/1j8PJKY7C6o-TEZeHR7nXLA 提取码: wq86 复制这段内容后打开百度网盘手机App,操作更方便哦

      发布在 文献宝库
      A
      Admin
    • 我国广告学理论研究的发展历程与趋势_卜煜

      链接: https://pan.baidu.com/s/1nbpFflC6LaYH-lzU7uFxfw 提取码: xzxr 复制这段内容后打开百度网盘手机App,操作更方便哦

      发布在 文献宝库
      A
      Admin
    • 发展广告学理论的成长轨迹及现状分析_基于期刊论文的文献计量学分析_宋玉玉

      链接: https://pan.baidu.com/s/1_uvt8MPObAFP0c4xuaEdAg 提取码: 626p 复制这段内容后打开百度网盘手机App,操作更方便哦

      发布在 文献宝库
      A
      Admin
    • 【让研究更容易】为什么要进行编码员信度测试,不直接打标签?

      什么是信度测试?

      信度是指在研究过程中,测量数据所独立于测量工具的程度。即不同的研究者对同一现象进行重复测试后,所产生结果的一致程度。[1]

      也就是说,如果测量过程要进行两次或多次,所得出的结论应该是类似的,这确保了内容分析的有效性或可靠性。

      信度的测试可以在科学抽样的基础上进一步防范研究者对数据产生的影响,编码员之间信度可保证对数据较为一致的处理,使研究结果更为客观。

      那么在内容分析过程中,
      什么是编码者间的信度呢?

      在内容分析中,我们需要两位或以上数目的编码员来进行编码工作,这些独立的编码员对一段信息或记录内容的特征(也就是记录单位)作出判断,并且达到一致的结论。这种一致性以量化方式呈现,称之为编码者间的信度[2]。

      既然内容分析的其中一个目标是相对客观地界定及记录信息的特征,那么信度就攸关重要。没有建立信度,内容分析的测量只是空谈[3]。

      为何信度如此重要?

      编码者间的信度是衡量研究质量的标准,编码者之间的高度差异性表示薄弱的研究方法,包括差劲的操作定义、类目和编码训练[4]。通常我们研究的信息有显性的内容(manifest content)和隐性的内容(latent content)。对于显性的内容,例如版面面积或者消息来源,很容易以客观的判断来达至高度一致性。但是,对于隐性的内容来说,例如报道态度或者价值观,编码员必须根据他们自己的思维系统作出主观的诠释。这样的话,编码员之间的相互主观判断变得更加重要,因为这些主观的判断结果要尽可能也让其他读者有相似的认知[5]。

      从现实的角度来看,编码员间的信度至为重要,因为高信度意味者决策者作出错误决策的机会相对减少[6]。编码员间的信度乃衡量一个内容分析研究效度的必要条件(虽然不是充分条件),没有信度,那么,该研究的结论便值得怀疑,甚至显得毫无意义。

      怎么做信度测试?

      可以利用必要的工具来计算信度指标,如手动(利用公式计算)或计算机程序。 我们以内容分析法中进行编码员之间信度评估为例,具体的操作步骤如下:

      第一,依据编码薄制作编码指引,编码指引需明确统一。帮助编码员熟悉议题,理解编码类目,保证所有编码员均理解类目所指代的含义。

      第二,进行编码测试。选取少量样本作为测试编码之用的样本,这部分样本的测试编码过程中,各编码员需独立编码,不能相互讨论或指导。若使用了机器编码,则直接执行机器编码的信测测试(DiVoMiner®上只需点击该按钮即可一键完成机器编码的信度测试)。

      第三,进行编码校正。测试编码结果如果未能达到理想信度,需重新测试编码。重新测试之前,对编码员再次进行培训和指导,尤其针对编码结果差异较大之类目,需再次给予说明。若有机器编码的部分,则需重新检查并修正编码簿各选项的关键词,尽可能完善类目的选项,再重新执行机器编码信度测试。

      第四,正式编码。当所有编码员达至理想信度,即可开始正式编码。

      编码员及机器编码信度测试流程
      信度测试流程.jpg

      一个完整的信度报告应该包括以下信息:
      ●
      信度分析的样本数及理由。
      ●
      信度样本与总样本的关系:是总样本的一部分还是额外样本。
      ●
      编码员资料:人数(须为2或更多)、背景,研究员是否也是编码员。
      ●
      每名编码员的编码数量。
      ●
      信度指标的选择和理由。
      ●
      每个变量的编码员间之信度。
      ●
      编码员的训练时间。
      ●
      在总样本的编码过程中遇到不同意见时的处理方式。
      ●
      读者可以在哪里得到详细的编码指引、程序和编码表。
      ●
      要报告每一个变量的信度水平,不要只报告所有变量的整体信度。

      小提示
      目前,大概有39种不同的同意度指标[7],传播学界常用的有Percent agreement,Holsti's Coefficient Reliability,Cohen's kappa(k),Scott's pi(π),Cohen's kappa(k),Krippendorff's alpha(α)。Holsti's Coefficient Reliability是当前最流行的指标。

      那么,怎么计算信度呢?

      根据公式手动计算或者运用工具计算,比如专门的信度结果计算软件或小程序(AGREE, PRAM, ReCal),或统计分析软件自带的一些信度结果计算功能(SPSS)。

      下一期,小编将介绍如何使用工具简单快捷地完成信度测试。大家可以先来DiVoMiner(me.divominer.cn)平台上体验一下哟!

      发布在 DiVoMiner®交流
      A
      Admin
    • 【DiVoMiner ®】不懂设置哪些编码类目?这里有现成的类目给你!

      前面我们介绍了如何设置研究类目,自定义研究面向的分析结果(点击回顾:建好编码类目,数据结果就完成一大半啦!)。我们要设置哪些编码类目,才能得出符合我们研究问题的分析结果呢?

      这一期篇为大家提供一些研究类目,供大家参考。

      首先带大家回顾一下
      类目(category)是什么?

      类目主要依据研究目的和研究问题来建构,使得文本材料的内容可按照某种框架进行分类,用于对文本内容进行赋值、编码,转化成可用于统计分析的数据,探索文本中的意义和洞察,回答研究问题。这个概念化框架和设置具体的类别的过程,就是类目的建构。设置编码类目就像是设计调查问卷,每一个类目相当于是一道问卷题目。

      在社会科学领域,类目建构的种类可以针对内容资料进行任意角度的分类和挖掘,这取决于研究内容和研究目的,以及研究领域。

      快来DiVoMiner平台选用编码类目!

      DiVoMiner 为大家准备了一些现有的类目,供大家直接使用,也允许大家基于自己的研究需求进行修正。

      在【类目管理】中点击【类目参考】,选择需要的题目点击即可。目前平台上提供有文学作品、危机公关、品牌研究、文献分析等领域的类目供参考,后续还会增加更多类型的类目。
      类目参考.jpg

      提醒大家要明确关键词的作用:

      在人工编码的场景下,可在编码文本中自动标注已经设置好的关键词,预选选项,辅助人工编码。

      在机器编码的场景下,关键词是机器自动判断的逻辑依据。即设置关键词后,在编码过程中就可以执行机器辅助编码和机器自动编码了。

      关键词的部分小编在这里仅截取部分选项,给大家作为参考。

      以大湾区城市的旅游资源中的人文资源题目为例:

      我们将大湾区城市的人文资源划分为历史文化、传统美食、民俗风情、地方特产、娱乐设施、宗教几个类别。

      接下来需要对每个选项以概念的形式来定义关键词,点击类目选项右侧的【关键词】,查看对应设置。例如大湾区城市的历史文化这个选项,综合大湾区城市的人文资源在历史文化方面的各个方面,总结了以下关键词组:

      关键词.jpg

      完成关键词内容后,点击【确定】,即完成了这一个选项的设置。

      类目完成后,可以在执行编码过程中,体会到机器预选选项的辅助效果了,也可以直接执行机器编码得出分析结果!

      我们也会继续丰富【类目参考】的题库,供大家使用!

      还有哪些常用的研究类目呢?欢迎大家留言补充!

      发布在 DiVoMiner®交流
      A
      Admin
    • 【让研究更容易】我们为什么用在线内容分析法能更快出论文?

      大数据技术辅助在线内容分析法是将传统内容分析的操作流程搬到“线上”,结合大数据技术,用网络挖掘、机器学习、自然语言文本处理等实现文本数据的在线处理,使得内容分析法的全部流程在线一站式完成,大大缩短研究时间,提升研究效率,快速产出研究论文。

      大数据技术辅助在线内容分析法为何能快速产出论文呢?这要从在线内容分析法本身的优势谈起。

      本文主要阐述在线内容分析法的优势,当我们运用大数据技术辅助在线内容分析法(回顾前文:如何结合机器与人工进行文本数据研究?)做研究时,可以在此基础上阐述大数据技术辅助在线内容分析法的优势。

      首先带大家回顾一下
      什么是在线内容分析法
      (online content analysis)?
      (请仔细阅读)
      在线内容分析法是分析文本内容的研究方法,是一个旨在识别和描述特定研究学科的总体趋势和研究成果评估系统。[1]包括书籍、章节、采访、讨论、报纸标题和文章、历史资料、演讲、谈话、广告、戏剧、非正式交谈或者任何交流性的语言。整个分析流程是线上完成。
      看不太明白再看下面这个概念

      (小编自认为这个概念讲得更清楚一些)
      在线内容分析法是社会科学研究方法中的一种对文本内容进行编码、分类、语义判断及形成可供统计分析之用的量化分析方法。它是指一种以系统、客观与量化的方式,来研究与分析传播内容,以测量及解读内容的研究方法。[2]

      在线内容分析法是一种研究方法,它是系统的、可重复使用的研究方法,用来把杂乱无章的非结构化文本内容转化成结构化的数据,也就是可视化图表,以对内容进行分析、解读,得出深入的推论、洞察,挖掘价值。

      贴吧-乱码.jpg
      可视化效果图 - 副本.jpg

      操作过程
      操作过程 - 副本.jpg

      在DiVoMiner®文本大数据挖掘及分析平台(me.divominer.cn)上进行,在确保研究流程科学、严谨方面,这个平台具有完备的质量控制机制,尤其是编码员间的信度计算程式清晰、自带学术界认可的四种信度计算方法,并具有编码追踪功能,可以随时定位编码结果,所有的数据分析结果也可以追踪回溯至原文。(没错,小编就是在强调这个工具的可靠性)

      点击文末“阅读原文”或扫描下方二维码快速注册帐号,永久免费使用学习版!
      注册二维码简易.png
      有何优势?

      下面内容是我选择在线内容分析法来做研究的原因(内容似乎有那么一些晦涩,如有疑惑欢迎留言和小编讨论沟通,以求甚解,欢迎来撩)

      一
      研究方法的非介入性
      在线内容分析法是社会科学研究方法中唯一一种不受时间和空间限制的方法。相比于其他社会科学研究方法,如控制实验、访谈、焦点小组、问卷调查等,这些测量行为会使得观察者影响研究主体,从而影响测量结果。而在线内容分析法作为一种非反应性或非介入性的研究方法,则避免了观察者对研究对象的影响。

      二
      保留数据来源的最初概念构想
      在线内容分析法可将非结构性资料转化成结构性的数据,因分析是建立在原有数据资料生成之后的,研究者无法完全预知数据来源所使用的类目,因此在线内容分析法可以保留数据来源的概念构想,这是问卷调查和结构性访谈等其他结构性方法所欠缺的。

      三
      对语境具有敏感性
      控制实验、问卷调查和结构性访谈等无法将数据还原至原有语境,而在线内容分析法则承认数据的文本性,对语境具有敏感性。允许研究者针对有意义的或具代表性的数据本身进行处理。

      四
      可靠且可复制
      与所有实证研究一样,在线内容分析法依靠系统和可复制的技术来生成数据进行分析研究,主要在于其可靠性和可复制性,换句话说,如果分析类别和编码方案设计合理,任何人都能够进行分析,[4]因而限制了研究者个人观点对研究结构的影响。

      五
      可处理大批量文本
      区别于民族志方法、历史编撰学方法和诠释研究,这类仅可以对小量文本进行分析研究的方法,而在线内容分析法则因其具明确性的程序和统一的操作性,则可以处理大批量的文本。对于大批量文本的研究分析,这是其他研究方法难以实现的。

      参考文献
      [1] Calik M, Sozbilir M (2014). İcerik Analizinin Parametreleri, Eğitim ve Bilim, 39(174), 33-38.
      [2] Kerlinger, F.N. (1973). Foundations of behavioral research (2nd ed.). New York: Holt, Rinehart & Winston.
      [3]张荣显,曹文鸳:《网络舆情研究新路径:大数据技术辅助网络内容挖掘与分析》,《汕头大学学报》(人文社会科学版)2016年,第8期,第111-121页
      [4] Neuendorf, K. (2004). Content analysis: A contrast and complement to discourse analysis. Qualitative Methods (newsletter of the APSA Organized Section on Qualitative Methods), 2(1). 33-36.

      发布在 DiVoMiner®交流
      A
      Admin
    • 【让研究更容易】有学者利用DiVoMiner®发表了核心期刊论文,你也可以哦!

      小编语:自DiVoMiner文本数据挖掘与分析平台(机构版)面世以来,已有众多用户使用DiVoMiner获取、处理文本数据,高效地在线完成(大)数据内容分析研究,最终发表高品质的论文成果。

      本期分享的论文是发表在《国际新闻界》上,由深圳大学传播学院王建磊副教授所做的关于“网络直播”的研究,以日常化网络直播的技术及内容为切入口,探究网络直播如何满足受众心理所需。

      文本数据方面,以2017年1月1日至2018年6月1日的相关报道,利用DiVoMiner进行开放式编码,归纳内容范畴及直播类型,对“日常化直播”价值进行理论依据的解读及总结,进而回答研究问题。

      本论文版权归属发表期刊及作者,本文仅用于学习用途。以下为论文基本信息及摘要(点击“阅读原文”获取论文全文):

      如何满足受众:
      日常化网络直播的技术与内容考察

      【作者】 王建磊;
      【机构】 深圳大学传播学院;

      【摘要】 已有研究表明网络视频直播在多个层面满足了受众心理所需,然而,这些满足是如何发生的?针对这一问题,本文以日常化直播作为研究对象,从技术和内容两个路径予以阐释:在技术视角下,网络直播意味着一个发达的传播与反馈系统,营造了"同步性、同一感"的独特体验;在文本样态上,研究通过数据挖掘工具搜集了相关报道文本,采用范畴化编码提炼出"生活流、猎奇、功用"三个主要类别,并从理论上赋予其满足受众的依据。最后,技术与内容的融合形成了具备"仪式感"、"既视感"和"同步记录"特征的场景系统,受众正是沉浸其中才获得了不同程度的满足感。

      【关键词】 视频直播;日常化;技术;场景系统;
      【基金】 国家社科基金项目“网络视频直播管理研究”(项目编号:17CXW020)的阶段性研究成果
      【文献引用格式】王建磊. (2018). 如何满足受众:日常化网络直播的技术与内容考察. 国际新闻界, 40(12), 21-33.

      DiVoMiner让研究更容易!
      马上扫码登入me.divominer.cn
      注册二维码简易.png
      *DiVoMiner是一个专业研究工具,考虑到产品特性,请在注册及分享推荐后,
      转至电脑端进行数据挖掘与分析操作。

      想要第一时间获取
      DiVoMiner优惠信息?
      请持续关注公众号☛文本数据挖掘与分析
      (ID:divominer,或见下图二维码)
      文本数据挖掘及分析平台.jpg

      发布在 DiVoMiner®交流
      A
      Admin