《机器学习实战》学习前言

  • 发布时间:2016年12月30日 13:02
  • 作者:杨仕航

这段时间在啃《机器学习实战》,准备通过这本书入门机器学习。

20161230/20161230114333120.png

(图片来源:亚马逊 https://www.amazon.cn/)


但这本书著作时间有些早,部分代码用法老旧,逻辑不够清晰,命名混乱。

例如,在本书中很多地方对numpy的引用如下:

from numpy import *

这种写法会导致代码中和numpy相关的方法关联性变弱,不利于学习和降低代码可读性。建议改成如下写法:

import numpy as np

本书中还有不少细节就不一一列举,在后面的博文会详细说明。

我打算在学习的过程中,吸收并用自己的方式写出来。加深印象和笔记记录,也方便想学习机器学习却入门无法的人。

之前对机器学习比较感兴趣,但不知道怎么入门。毕竟这个是比较高层次的开发领域。后来不断搜索,总结一下入门所需的东西。


1、至少掌握一门编程语言

目前有三大热门开发语言:Python、R语言、Matlab

早期是Matlab比较多,若你熟悉这个不妨可以看看Andrew Ng教授的视频。一共有两套,搜索一下就有。现在主流的用Python和R语言比较多。这本《机器学习实战》是用Python作为开发语言。

Python在机器学习上有着天然的优势,因为它更接近自然语言而且有大量数据科学计算库支持。

在学习过程中,发现还需要学Python相关的科学计算库和图形库等。这个不是问题,我一开始也是不懂。在学习的过程中,慢慢学会。


当然,机器学习需要大量数据作为基础。有时候需要自己收集数据,而数据一般来自互联网。那么你多少也要懂得一些正则表达式、html前端和爬虫网抓知识。

同样现在不会也没问题,需要用到的时候再学,只是后面会有点吃力。

学习时碰到困难就解决,要有这个勇气和信心


2、掌握一定的统计学知识

机器学习主要是收集数据,分析数据,建立机器学习模型,再使用模型。

其中分析数据就需要使用到统计学的知识。大学的高数差不多够用了。

有人问,不懂这些可以学吗?个人还是肯定的说至少要懂矩阵、线性回归等等。这些都是机器学习的基础和核心。若不懂这些,基本看不懂原理,很难学会。

网上还说了其他的,但这些就够了。说太多反而容易打击信心。其中大部分东西可以在学习的过程中学会。后面我会逐步发表我学习机器学习的学习笔记。

机器学习是多维度、高难度的领域,你有信心征服它不?


3、相关资源和文章

《机器学习实战》的源码和素材:

https://github.com/pbharrin/machinelearninginaction


该专题相关文章:

机器学习01:k-近邻算法简单分类

机器学习02:k-近邻算法综合使用

机器学习03:k-近邻算法拓展和总结

机器学习04:创建决策树

机器学习05:绘制决策树

机器学习06:朴素贝叶斯理论知识

机器学习07:朴素贝叶斯应用(词集模式)

机器学习08:朴素贝叶斯应用(词袋模式)

机器学习09:逻辑回归详解

机器学习10:逻辑回归优化


更多文章,持续更新中……

后记:这本书需要一定的高数基础以及理解能力。书中很多地方思路绕得太弯,没解释清楚。

上一篇:机器学习01:k-近邻算法简单分类

下一篇:我为什么不用Access了

相关专题: 机器学习实战   

评论列表

杨仕航

杨仕航

后面会更新该篇博文,把相关笔记的链接加入进来

2016-12-30 15:53 回复

新的评论

清空

猜你喜欢

  • 猜测中,请稍等...