我校教师在第四届全国高校教师教学创新大赛中获一等奖

工大人, 11/20/2024

我校举行时空智能与可持续发展国际联合实验室建设研讨会

工大人, 11/20/2024

学校召开2025年国家自然科学基金申报动员大会

工大人, 11/20/2024

我校师生团队在第七届全国大学生工业设计竞赛中获佳绩

工大人, 11/20/2024

我校新增3个ESI全球前1%学科

工大人, 11/20/2024

学校举办第一届高水平论文发表与研究能力提升工作坊暨交叉学科视域下的高水平研究论坛

工大人, 11/20/2024

学校举行宣传思想文化队伍培训会

工大人, 11/20/2024

学校举办新提任中层正职任职专题培训班

工大人, 11/14/2024

资源共享

大数据时代，统计学方法有多大的效果？

工大人 — 05/28/2014 —

谢Y。
统计学习是一种方法，方法的好坏取决于人的使用。
数据挖掘是众多学科与统计学交叉产生的一门新兴学科。

数据挖掘与统计学的共同特征

共同的目标。两者都包含了大量的数学模型，都试图通过对数据的描述，建立模型找出数据之间的关系，从而解决商业问题。
共用模型。包括线性回归、logistic回归、聚类、时间序列、主成分分析等。

数据挖掘与统计学的不同之处

思想不一样。数据挖掘偏向计算机学科，所关注的某些领域和统计学家所关注的有很大不同。不一定要有精确的理论支撑，只要是有用的，能够解决问题的方式，都可以用来处理数据。而统计学是一门比较保守的学科，所沿用的模型一定要强调有理论依据（数学原理或经济学理论）。
处理数据量不一样。统计学通常使用样本数据，通过对样本数据的估计来估算总体变量。数据挖掘使用的往往是总体数据，这也在过去的年代生产力和技术限制所致。数据挖掘由于采用了数据库原理和计算机技术，它可以处理海量数据。
发现的知识方式不一样。数据挖掘的本质是很偶然的发现非预期但很有价值的知识和信息。这说明数据挖掘过程本质上是实验性的。而统计学强调确定性分析。确定性分析着眼于寻找一个最适合的模型——建立一个推荐模型，这个模型也许不能很好的解释观测到的数据。

以上。

— 完 —

本文作者：Han Hsiao

【知乎日报】
你都看到这啦，快来点我嘛 Σ(▼□▼メ)

此问题还有 10 个回答，查看全部。
延伸阅读：
国家统计部门公布的数据可信度有多高？
国内外有哪些比较权威的统计数据网站？