导航

    DiVoMiner®知识库

    • 注册
    • 登录
    • 搜索
    • 版块
    • 最新
    • 话题
    • 热门
    1. 主页
    2. 最新
    登录
    • 全部版块
    • DiVoMiner®交流
    • 活动资讯
    • 文献宝库
    • 全部主题
    • 新建主题
    • 关注主题
    • 未回复主题

    • W

      Stanford University - AI Index Report 2025
      文献宝库 • • Wenny  

      1
      0
      赞同
      1
      帖子
      223
      浏览

      尚无回复

    • 3

      LDA主题分析怎么确定主题数量
      DiVoMiner®交流 • • 3294965775  

      2
      0
      赞同
      2
      帖子
      213
      浏览

      W

      以下是问AI得到的答案。就我个人而言,通过经验观察比较多,分类好或不好,经常能从数据意义的解读上判断出来。 ↓↓↓ 在进行LDA主题分析时,确定主题数量是一个关键步骤。以下是一些常用的方法: 1. 基于困惑度(Perplexity)的方法 原理:通过计算不同主题数量下的困惑度来确定最佳主题数。困惑度越低,模型越好地捕捉了数据的结构。 步骤:训练多个LDA模型,每个模型使用不同的主题数量,然后计算每个模型的困惑度。通常,困惑度曲线会出现一个拐点,此时的主题数量被认为是最佳的[6][8]。 2. 交叉验证法 原理:将数据分为训练集和测试集,分别使用不同主题数量训练模型,并在测试集上评估模型的表现。 步骤:选择表现最好的主题数量作为最佳值[2]。 3. 主题内词的丰富度 原理:每个主题中不同词的数量可以作为衡量标准。通常,词数较多的主题数量被认为是合适的。 步骤:计算每个主题中的词数,选择词数较多的主题数量[2]。 4. 主题分布的稳定性 原理:评估每篇文本所属主题的稳定性。稳定性高的主题数量被认为是合适的。 步骤:分析每个主题的文档分布,选择分布最稳定的主题数量[2]。 5. 基于密度的自适应方法 原理:通过计算主题之间的相似度来确定最佳主题数。当主题之间的相似度最小时,认为是最佳的主题数量。 步骤:不断调整主题数量,计算相似度,直到找到最优值[1]。 6. 肉眼观察法 原理:通过人工观察主题的关键词和文档分布来确定主题的合理性。 步骤:手动检查每个主题的关键词和文档分布,合并相似主题[1][3]。 7. 自动化方法(如HDP) 原理:使用层次Dirichlet过程(Hierarchical Dirichlet Process)等方法,可以自动确定主题数量。 步骤:使用支持HDP的工具或库来训练模型[1]。 这些方法可以根据具体的分析需求和数据特征进行选择和组合。 Citations: [1] https://www.cnblogs.com/hellochennan/p/6647028.html [2] https://blog.csdn.net/weixin_42609225/article/details/129612552 [3] https://www.weiciyun.com/blog/lda_perplexity02/index.html [4] https://www.bilibili.com/read/cv30127943/ [5] https://spssau.com/helps/textanalysis/textlda.html [6] https://www.weiciyun.com/blog/lda_perplexity01/index.html [7] https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2016.09.05 [8] https://blog.csdn.net/sinat_25394043/article/details/104139715
    • W

      公益直播课NO3:课程资料、作业打卡贴
      DiVoMiner®交流 • • Wenny  

      3
      0
      赞同
      3
      帖子
      2178
      浏览

      S

      ![替代文字]( 图片地址)
    • 在上传数据时可以直接上传微信公众号链接吗?
      DiVoMiner®交流 • • 2533343603  

      2
      0
      赞同
      2
      帖子
      1697
      浏览

      W

      @2533343603 需要整理数据后上传。上传网址,那么在平台上显示的就是网址。
    • W

      公益直播课NO2:课程资料(上传excel+论文pdf)、作业打卡贴
      DiVoMiner®交流 • • Wenny  

      4
      0
      赞同
      4
      帖子
      2320
      浏览

      Y

    • W

      2024.6.19 分享数据集
      活动资讯 • • Wenny  

      1
      0
      赞同
      1
      帖子
      1599
      浏览

      尚无回复

    • W

      公益直播课NO1:作业打卡贴
      DiVoMiner®交流 • • Wenny  

      6
      0
      赞同
      6
      帖子
      3104
      浏览

      W

      @Wenny !
    • 3

      实用工具里面的信度计算如何使用?
      DiVoMiner®交流 • • 3525926512  

      2
      0
      赞同
      2
      帖子
      1792
      浏览

      W

      @3525926512 按模版的格式来~ 信度计算上传模板1.xlsx 信度计算上传模板2.xlsx
    • 1

      高校思想政治理论课“学评教”研究
      文献宝库 • • 1121645819  

      2
      0
      赞同
      2
      帖子
      1942
      浏览

      W

      请问有论文分享吗?看上去很适合用内容分析法来做
    • 1

      记录片视频受众评论分析
      活动资讯 • • 15088690846  

      2
      0
      赞同
      2
      帖子
      1889
      浏览

      W

      请问是想要探讨什么呢?
    • S

      怎么把免费话题的数据库导入到研究话题内?
      DiVoMiner®交流 • • shengx7  

      2
      0
      赞同
      2
      帖子
      1283
      浏览

      W

      @shengx7 找微信小助手处理DiVoMiner2023
    • 1

      传播学研究方法
      DiVoMiner®交流 • • 1400297087  

      2
      0
      赞同
      2
      帖子
      1402
      浏览

      D

      @1400297087 啥意思?不太明白你的问题。
    • T

      2022.4.14专属资料
      活动资讯 • • testdivominer  

      3
      1
      赞同
      3
      帖子
      2095
      浏览

      W

      @cristinayu7 你好呀。平台右下角喊下qq客服,问他要我的微信,我发给你把。
    • 张

      酒店基层员工的满意度
      文献宝库 • • 张丽  

      1
      0
      赞同
      1
      帖子
      966
      浏览

      尚无回复

    • W

      2022年新闻传播量化内容分析法下载量最高的十大论文(中文)
      文献宝库 • • Wenny  

      1
      0
      赞同
      1
      帖子
      1297
      浏览

      尚无回复

    • 1

      怎么实现两个不同类目的交叉分析
      DiVoMiner®交流 • • 1623697030  

      2
      0
      赞同
      2
      帖子
      1457
      浏览

      W

      @1623697030 你好,可以看看教程《如何制作多变量交叉图表(卡方检验、相关性分析)?》,谢谢 https://support.divominer.cn/knowledge-base/如何制作多变量交叉图表?/
    • W

      【回放】澳门互联网研究学会工作坊:使用大数据技术辅助内容分析法协助出版健康传播领域的论文
      DiVoMiner®交流 • • Wenny  

      1
      -1
      赞同
      1
      帖子
      980
      浏览

      尚无回复

    • W

      2022.12.7 Z大数据
      活动资讯 • • Wenny  

      1
      0
      赞同
      1
      帖子
      1131
      浏览

      尚无回复

    • D

      Sample data for the Dec3 UNNC workshop participants
      DiVoMiner®交流 • • Demo 0  

      1
      0
      赞同
      1
      帖子
      835
      浏览

      尚无回复

    • W

      DiVoMiner公益直播课-课堂资料
      活动资讯 • • Wenny  

      1
      0
      赞同
      1
      帖子
      1152
      浏览

      尚无回复