Stanford University, Human-Centered Artificial Intelligence (HAI). (2025). AI Index Report 2025. Stanford, CA: Author. https://hai.stanford.edu/ai-index
Wenny 发布的帖子
-
Stanford University - AI Index Report 2025
-
RE: LDA主题分析怎么确定主题数量
以下是问AI得到的答案。就我个人而言,通过经验观察比较多,分类好或不好,经常能从数据意义的解读上判断出来。
↓↓↓在进行LDA主题分析时,确定主题数量是一个关键步骤。以下是一些常用的方法:
1. 基于困惑度(Perplexity)的方法
- 原理:通过计算不同主题数量下的困惑度来确定最佳主题数。困惑度越低,模型越好地捕捉了数据的结构。
- 步骤:训练多个LDA模型,每个模型使用不同的主题数量,然后计算每个模型的困惑度。通常,困惑度曲线会出现一个拐点,此时的主题数量被认为是最佳的[6][8]。
2. 交叉验证法
- 原理:将数据分为训练集和测试集,分别使用不同主题数量训练模型,并在测试集上评估模型的表现。
- 步骤:选择表现最好的主题数量作为最佳值[2]。
3. 主题内词的丰富度
- 原理:每个主题中不同词的数量可以作为衡量标准。通常,词数较多的主题数量被认为是合适的。
- 步骤:计算每个主题中的词数,选择词数较多的主题数量[2]。
4. 主题分布的稳定性
- 原理:评估每篇文本所属主题的稳定性。稳定性高的主题数量被认为是合适的。
- 步骤:分析每个主题的文档分布,选择分布最稳定的主题数量[2]。
5. 基于密度的自适应方法
- 原理:通过计算主题之间的相似度来确定最佳主题数。当主题之间的相似度最小时,认为是最佳的主题数量。
- 步骤:不断调整主题数量,计算相似度,直到找到最优值[1]。
6. 肉眼观察法
- 原理:通过人工观察主题的关键词和文档分布来确定主题的合理性。
- 步骤:手动检查每个主题的关键词和文档分布,合并相似主题[1][3]。
7. 自动化方法(如HDP)
- 原理:使用层次Dirichlet过程(Hierarchical Dirichlet Process)等方法,可以自动确定主题数量。
- 步骤:使用支持HDP的工具或库来训练模型[1]。
这些方法可以根据具体的分析需求和数据特征进行选择和组合。
Citations:
[1] https://www.cnblogs.com/hellochennan/p/6647028.html
[2] https://blog.csdn.net/weixin_42609225/article/details/129612552
[3] https://www.weiciyun.com/blog/lda_perplexity02/index.html
[4] https://www.bilibili.com/read/cv30127943/
[5] https://spssau.com/helps/textanalysis/textlda.html
[6] https://www.weiciyun.com/blog/lda_perplexity01/index.html
[7] https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2016.09.05
[8] https://blog.csdn.net/sinat_25394043/article/details/104139715 -
公益直播课NO3:课程资料、作业打卡贴
-
作业打卡任务:
在评论区贴三张结果图表,截图找微信小助手 (divominer2023) 登记账号,领取1000点算法资源。仅限听课用户参与。
-
公益直播课NO2:课程资料(上传excel+论文pdf)、作业打卡贴
-
作业打卡任务:
在评论区贴三张以文献数据为分析对象的结果图表,截图找微信小助手 (divominer2023) 登记账号,领取1000点算法资源。仅限听课用户参与。
-
公益直播课NO1:作业打卡贴
在评论区贴三张以文献数据为分析对象的结果图表,截图找微信小助手 (divominer2023) 登记账号,领取1000点算法资源。仅限听课用户参与。
-
2022年新闻传播量化内容分析法下载量最高的十大论文(中文)
点击下载后请等待片刻,论文加载。
-
黄艳,王晓语 & 李卫东.(2022).高校共青团抖音短视频传播效果影响因素实证研究——基于全国100所高校共青团抖音号的内容分析. 中国青年社会科学.
点击下载 -
刘婵君 & 沈玥晨.(2022).共识兼顾与集体取向:中国主流媒体建设性新闻实践——关于人民日报微博官方账号新冠肺炎疫情报道的分析. 新闻与传播研究
点击下载 -
曾秀芹,何梦 & 柳莹.(2022).微博评论语境下的女性主义广告效果研究. 新闻与传播评论.
点击下载 -
徐剑 & 黄尤嘉.(2022).社交媒体之于新闻价值的发现与重构——基于奥运会热搜榜的分析. 现代传播(中国传媒大学学报)
点击下载. -
李蕾 & 宋航.(2022).自由表达与互动体验的幻象:受众弹幕文本的话语生产——基于《再见爱人》弹幕的内容分析. 新闻与写作.
点击下载 -
胡岑岑.(2022).个体视角下的短视频叙事与国家形象建构——以北京冬奥会中的短视频为例. 当代电视.
点击下载 -
晏青 & 刘钰.(2022).社交媒体平台抑郁群体的社会支持寻求研究——基于对微博“抑郁症超话”的考察. 新闻界.
点击下载 -
柯山,金博闻,林斌,颜逸静 & 潘辉.(2022).抖音短视频对厦门城市旅游形象的建构研究. 情报探索.
点击下载 -
李明德,张玥,张帆,杨帆 & 蒙胜军.(2022).疫情科学信息传播内容特征、模式、回应策略及优化路径——基于10名科学家相关热门微博的内容分析. 情报杂志.
点击下载 -
胡兵 & 冯采君.(2022).认知视角下科普短视频传播效果的影响因素. 科学学研究.
点击下载
-
-
RE: 怎么实现两个不同类目的交叉分析
@1623697030
你好,可以看看教程《如何制作多变量交叉图表(卡方检验、相关性分析)?》,谢谢
https://support.divominer.cn/knowledge-base/如何制作多变量交叉图表?/ -
大师走好!内容分析方法的创立者之一克劳斯.克里彭多夫辞世
““”““”
缅怀大师最好的方式莫过于温习其成果和著作,小编重新找出
出版于2018年的《Content analysis: An introduction to its methodology》点这里拜读,这已是出版的第四版,凝结了教授的心血。
““”““”克劳斯.克里彭多夫(Klaus Krippendorff)是社会科学领域研究方法的泰斗,作为内容分析方法的创立者之一,他的内容分析方法在社会科学领域几十年来影响巨大,成为各个社会科学研究的基础研究方法。教授仙逝于2022年10月10日,享年90岁。
克里彭多夫教授在传播学、语义学、设计学、控制论等多个领域都是学界翘楚并获多项殊荣。在传播学领域,他是传播学最高级别国际学会——“国际传播学会”(ICA)的会士,并曾当选学会主席。其内容分析方法著作曾获ICA的“会士图书奖”、 “研究方法创新奖”,被译为多国文字出版。
他在2012年获Linnaeus University in Kalmar/Växjö荣誉博士学位;1982年获选为美国科学促进会会士(American Association for the Advancement of Science,AAAS)。是美国顶尖的传播学院——宾夕法尼亚大学安纳伯格传播学院(Annenberg School for Communication)荣休教授。
克劳斯.克里彭多夫的主要作品:
- Krippendorff, K. (2018). Content analysis: An introduction to its methodology, 4th Edition. Sage publications.
- Krippendorff, K. (2013). Content analysis: An introduction to its methodology, 3rd Edition. Sage publications.. Sage.
- Krippendorff, K. (2012). Die semantische Wende. In Die semantische Wende. Birkhäuser.
- Krippendorff, K., & Bermejo, F. (2010). On communicating: Otherness, meaning, and information. Routledge.
- Krippendorff, K. (2009). The content analysis reader. Sage.
- Krippendorff, K. (2005). The semantic turn: A new foundation for design. crc Press.
- Krippendorff, K. (1997). Design in the age of information: A report to the National Science Foundation (NSF). Departmental Papers (ASC), 96.
- Krippendorff, K. (1994). Design: A Discourse on Meaning; A Work Book.
- Krippendorff, K. (1986). A dictionary of cybernetics.
- Krippendorff, K. (1986). Information theory: structural models for qualitative data (Vol. 62). Sage.
- Krippendorff, K. (1980). Content Analysis: An Introduction to its Methodology. Sage publications. Beverly Hills.
- Klaus, K., Borgatta, E. F., & Bohrnstedt, G. A. (1970). Bivariate Agreement Coefficients for the Reliability of Data. Sociological Methodology.
- Krippendorff, K. H. (1967). An examination of content analysis; a proposal for a general framework and an information calculus for message analytic situations. University of Illinois at Urbana-Champaign.
-
科技创新文献资料参考
-
王育晓, 邢丹宇, & 张茹瑜. (2022). 基于内容分析法的陕西省硬科技产业政策分析:政策工具与创新价值链双重视角. 中国科技资源导刊, 54(3), 11.
-
李响, & 殷林森. (2022). 财税金融政策如何驱动科技创新发展——基于上海1979—2020年政策文本的内容分析. 中国科技论坛(2), 9.
-
袁野,马彦超,陶于祥 & 万晓榆.(2021).基于内容分析法的中国人工智能产业政策分析——供给、需求、环境框架视角. 重庆大学学报(社会科学版)(02),109-121.
-
章小童、李月琳、樊振佳. (2020). 基于我国10项人工智能规划与政策的内容分析. 现代情报, 40(12), 10.
-
平霰.(2019).基于内容分析法的科技成果转化激励政策研究(硕士学位论文,华中科技大学).https://kns.cnki.net/KCMS/detail/detail.aspx?dbname=CMFD201902&filename=1019917643.nh
-
李良成, & 于超. (2018). 基于内容分析法的广东省科技创新人才开发政策研究. 科技管理研究, 38(5), 8.
-
彭辉. (2017). 基于内容分析法的上海市科技创新政策文本分析. 大连理工大学学报(社会科学版), 38(001), 157-163.
-
吴琨, & 刘凯. (2017). 我国高新技术产业科技政策的比较研究——基于北京、上海、江苏和浙江的政策文本分析. 南京工业大学学报:社会科学版, 16(1), 7.
-
-
RE: 编码结果应该怎么取?
你好。内容分析法的流程建议是,先让所有编码员分别完成信度编码(彼此独立完成),计算信度系数,达到理想水准后,继续做正式编码,正式编码是由所有编码员共同完成全部内容,不需要重复编码的,应该就是你所说的“合作完成全部编码”。谢谢。