课程名称:在线民宿 UGC 数据挖掘培训

4401 人关注
(78637/99817)
课程大纲:

在线民宿 UGC 数据挖掘培训

 

1 Pandas 数据聚合

2 TensorFlow 模型搭建

3 NLP 文本处理

4 Word2Vec 词向量训练

5 Gensim 下的 LDA 主题自动聚类

6 Stacking 集成情感分析

7 深度 GRU 情感分析

8 Flask API 搭建情感分析接口

9 百度 LBS 地理位置信息采集

10 Scikit-learn 模型搭建

11 Pyecharts 可视化

12 KMeans 下的词向量自动聚类

13 LDAvis 主题可视化

14 深度 CNN 情感分析

15 低代码下的 LitNlp 深度情感分析

16 Python 使用 POST 和 GET 进行接口请求

1
快速实现民宿整体的意见挖掘

1.Pandas数据聚合

2.数据EDA

3.贝叶斯情感分析建模

4.模型评测

5.情感极性可视化

2
利用 pyecharts 进行可视化分析

1.数据清洗

2.数据特征处理

3.数据聚合

4.pyecharts可视化

3
民宿地理位置可视化分析

1.Requests接口请求

2.基于百度LBS接口解析地理位置信息

3.地理数据聚合

4.pyecharts地理信息可视化

4
基于字典的评论主题挖掘

1.词性标注

2.主题句切分

3.TFIDF关键词挖掘

4.主题分布可视化

5
基于词向量的主题聚类挖掘

1.名词抽取

2.Word2Vec词向量训练

3.佳聚类个数选取

4.KMeans主题聚类

6
基于 LDA 模型的评论主题挖掘

1.评价数据清洗

2.LDA主题建模

3.佳主题数选取

4.LDAvis主题分布可视化

7
文本自动化标注和数据采样

1.特征工程

2.数据自动化标注

3.数据采样

4.采样结果评测

8
集成模型在情感分析中的应用

1.特征工程

2.情感建模

3.Stacking集成建模

4.主题情感可视化

9
深度模型在情感分析中的应用

1.数据预处理

2.词级和字符级的文本分词

3.深度情感分类模型

4.深度学习模型测试

10
部署深度情感推理模型

1.litNlp使用

2.FlaskAPI开发

3.模型部署

4.情感极性批量预测

基于 Pandas 和 pyecharts 的数据聚合和可视化分析。

主题建模实战,包括:词频排序模型下的主题词云分析、基于 Word2Vec 词向量下的 KMeans 名词聚类、LDA 主题建模。

针对数据集标签失衡问题,实验分析了不用数据采样方式对情感分析模型性能的影响。

介绍了基于 Stacking 的集成模型和深度情感分析模型在用户评论情感建模上的性能差异,

然后针对深度模型分别使用字符级和词语级进行建模来比较差异,深度模型具体有 TextCNN 和 GRU。

主要实现模型的部署,使用 Flask 框架对 litNlp 深度情感分析模型进行 RESTful API 部署,实现情感极性预测通过网络接口进行服务。


登录 后发表评论
新评论
全部 第1节 第2节 第3节 第4节 第5节 第6节 第7节 第8节 第9节 第10节 第11节 第12节 第13节 第14节 第15节 第16节 第17节
我的报告 / 所有报告