怎样入门大数据,数据挖掘怎么入门

首先数据挖掘还是需要一些理论基础。常见的算法如分类,回归,聚类等算法要熟悉,再深入了还有学习数学,尤其是线性代数(推荐国外翻译的《线性代数及其应用》第五版 [美] 戴维 C.雷 / [美] 史蒂文 R.雷 / [美] 朱迪 J.麦克唐纳 机械工业出版社,看过最好的线代书)。

理论基础知识之外,要有实际落地的能力,用什么软件。

建模的分为商业版和开源免费版

1-商业版软件

SPSS Moderler,

SAS EM挖掘模块,

2-开源的挖掘软件也有很多

1.Weka(需要java编程基础),

2.当今最火的Python scikit-learn建模模块(常3见算法都有)

3.RapidMiner

4.Knime(大而全的一个软件,做ETL和数据挖掘都可以,学过Python挖掘模块再看这个会感觉比较简单,反过来更容易理解python 挖掘算法)

从另外一个角度来说,分为编程,和图形化操作两种方式,图形化方式无需要编程逐一配置各个节点,连线即可搭建。

推荐你2个,Python scikit-learn建模模块(编程方式),以及Knime(图形化操作,非编程,下图为knime操作界面)。本人刚开通头条,准备逐步讲解如何快速入门knime该软件,欢迎关注和留言。

怎样入门大数据,数据挖掘怎么入门

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 xxx@163.com 举报,一经查实,本站将立刻删除。

发表评论

登录后才能评论