本课程致力于学习Python软件的数据分析方法，从海量的网络信息中获取与自己学习领域相关的信息，并且利用大数据、自然语言处理相关技术加工处理所获取的信息，从而用于自己的专业学习领域。该课程可以锻炼学生的动手能力，培养基本的网络大数据获取与处理方面的技术。通过该课程的学习，可以学习并掌握开的爬虫软件，从网络上获取并处理自己需要的信息；学习并掌握开源分词、TF-IDF、N-gram和word2Vec等文本分析模型（或软件系统），分析并处理所获取的信息。

计算广告学 2022-09-05

传媒大数据专业，大四上, 掌握基本的计算广告的技术和分析方法, 2022

课前推荐阅读材料：

TraeAI课程 2025-03-01

本科生课程, 智能媒体、计算广告等相关专业, 2025

TraeAI是一门前沿的人工智能课程，专注于大语言模型、生成式AI和智能系统的原理与应用。本课程旨在培养学生掌握AI技术的核心概念、最新进展和实践技能，能够将AI技术应用于传媒、广告、数据分析等领域。

第1讲：数据科学的发展历史与研究问题 2026-03-10

本讲围绕数据科学的发展脉络与研究问题展开，梳理统计学、数据挖掘、机器学习、大数据到数据科学的演进，说明数据科学如何围绕现实需求完成数据收集、清洗、建模、解释与决策支持。

第2讲：数据科学的基本方法 2026-03-17

本讲介绍数据科学的基本方法体系，围绕监督学习、无监督学习、半监督学习、强化学习、统计学习与机器学习的关系展开，并说明 R 与 Python 在数据分析实践中的作用。

第3讲：统计学习的基本框架与模型评估 2026-03-24

本讲围绕统计学习的基本框架与模型评估展开，介绍模型、策略、算法三要素，训练误差与测试误差、过拟合、正则化、交叉验证、泛化能力，以及生成模型与判别模型的区别。

第4讲：数据处理与清洗 2026-04-01

本讲围绕数据处理与清洗展开，介绍结构化与非结构化数据、数据类型、缺失值处理、噪声与异常值识别、数据变换和标准化等内容，说明高质量数据是后续分析建模的基础。

第5讲：数据可视化 2026-04-07

本讲围绕数据可视化展开，介绍图形在探索、发现、验证和表达中的作用，讲解基础作图参数、常见图形类型、图形选择原则，以及 ggplot2 的基本思想和应用提醒。

第6讲：回归分析 2026-04-14

本讲围绕回归分析展开，介绍一元与多元线性回归的建模思想、总体回归函数、最小二乘估计、模型假设、拟合优度、显著性检验、预测方法，以及 R 中的回归实现。

第7讲：分类方法 2026-04-21

本讲围绕分类方法展开，介绍二元分类问题、线性概率模型、Probit 与 Logistic 模型、判别分析、朴素贝叶斯、LDA、QDA，以及混淆矩阵、精确率、召回率、ROC 和 AUC 等评价指标。

第8讲：决策树与集成学习 2026-05-05

本讲围绕决策树与集成学习展开，介绍决策树的基本思想、分类树和回归树，以及 Bagging、随机森林、Boosting、GBDT、XGBoost 等组合学习方法。

第9讲：数据分析报告写作指南 2026-05-12

本讲围绕数据分析报告写作展开，介绍优秀数据分析报告的问题意识、数据依据、方法选择、结果解释、结论建议、图表规范与课堂作业写作要求。

第10讲：支持向量机与朴素贝叶斯、推荐算法 2026-05-19

本讲围绕支持向量机、朴素贝叶斯与推荐算法展开，介绍最大间隔分类器、软间隔、核函数、支持向量回归、贝叶斯分类器、条件独立假设，以及协同过滤、关联规则、内容推荐和深度学习推荐等方法。

第11讲：文本挖掘与社交网络分析 2026-06-12

本讲整理文本挖掘与社交网络分析两部分内容，介绍文本数据获取、分词、词袋模型、TF-IDF、特征选择、文本分类、文本聚类、LDA主题模型，以及网络基本概念、中心性、凝聚性、随机图模型、块模型和关联网络推断。

Xiaoning Wang

Sitemap

Pages

大数据分析软件 2022-09-05

数据科学导论 2022-02-22

新闻与舆情数据学 2021-09-01

贝叶斯统计 2022-09-01

传媒数据与统计分析 2022-09-01

R语言数据分析实战 2021-05-12

计算广告学 2022-09-05

TraeAI课程 2025-03-01

第1讲：数据科学的发展历史与研究问题 2026-03-10

第10讲：支持向量机与朴素贝叶斯、推荐算法 2026-05-19

第11讲：文本挖掘与社交网络分析 2026-06-12

第2讲：数据科学的基本方法 2026-03-17

第3讲：统计学习的基本框架与模型评估 2026-03-24

第4讲：数据处理与清洗 2026-04-01

第5讲：数据可视化 2026-04-07

第6讲：回归分析 2026-04-14

第7讲：分类方法 2026-04-21

第8讲：决策树与集成学习 2026-05-05

第9讲：数据分析报告写作指南 2026-05-12

Posts

市调大赛：国赛答辩现场有哪些问题需要注意？ 2025-05-21

市调大赛：现场答辩有哪些问题需要注意？ 2025-04-19

市调大赛：国赛答辩现场有哪些问题需要注意？ 2025-04-12

市调大赛：你的结论和建议写对了么？ 2025-04-07

市调大赛：现场答辩有哪些问题需要注意？ 2025-04-03

朋友圈社交网络数据分析 2024-12-13

市调大赛市场调查报告落选是不是因为存在了这些问题？ 2024-12-11

王小宁老师团队在《统计研究》发表论文：基于BP神经网络的伪设计样本融合研究 2024-12-04

近三年市调获奖作品有哪些特点-2024年 2024-11-03

近三年市调获奖作品有哪些特点-2023年 2024-10-31

近三年市调获奖作品有哪些特点-2022年 2024-10-26

市调大赛基础数据处理方法 2024-08-12

AI助手在市调大赛中的应用 2024-08-07

市调大赛市场调查报告撰写对照指南 2024-08-06

市调大赛你的结论和建议写对了么？ 2024-04-20

市调大赛：国赛答辩现场有哪些问题需要注意？ 2020-12-11

portfolio

publications

talks

teaching

R语言数据分析实战 2021-05-12

新闻与舆情数据学 2021-09-01

数据科学导论 2022-02-22

课程介绍

贝叶斯统计 2022-09-01

传媒数据与统计分析 2022-09-01

大数据分析软件 2022-09-05

计算广告学 2022-09-05

TraeAI课程 2025-03-01

第1讲：数据科学的发展历史与研究问题 2026-03-10

第2讲：数据科学的基本方法 2026-03-17

第3讲：统计学习的基本框架与模型评估 2026-03-24

第4讲：数据处理与清洗 2026-04-01

第5讲：数据可视化 2026-04-07

第6讲：回归分析 2026-04-14

第7讲：分类方法 2026-04-21

第8讲：决策树与集成学习 2026-05-05

第9讲：数据分析报告写作指南 2026-05-12

第10讲：支持向量机与朴素贝叶斯、推荐算法 2026-05-19

第11讲：文本挖掘与社交网络分析 2026-06-12