关于本站
1、基于Django+Bootstrap开发
2、主要发表本人的技术原创博客
3、本站于 2015-12-01 开始建站
这段时间在啃《机器学习实战》,准备通过这本书入门机器学习。
(图片来源:亚马逊 https://www.amazon.cn/)
但这本书著作时间有些早,部分代码用法老旧,逻辑不够清晰,命名混乱。
例如,在本书中很多地方对numpy的引用如下:
from numpy import *
这种写法会导致代码中和numpy相关的方法关联性变弱,不利于学习和降低代码可读性。建议改成如下写法:
import numpy as np
本书中还有不少细节就不一一列举,在后面的博文会详细说明。
我打算在学习的过程中,吸收并用自己的方式写出来。加深印象和笔记记录,也方便想学习机器学习却入门无法的人。
之前对机器学习比较感兴趣,但不知道怎么入门。毕竟这个是比较高层次的开发领域。后来不断搜索,总结一下入门所需的东西。
目前有三大热门开发语言:Python、R语言、Matlab
早期是Matlab比较多,若你熟悉这个不妨可以看看Andrew Ng教授的视频。一共有两套,搜索一下就有。现在主流的用Python和R语言比较多。这本《机器学习实战》是用Python作为开发语言。
Python在机器学习上有着天然的优势,因为它更接近自然语言而且有大量数据科学计算库支持。
在学习过程中,发现还需要学Python相关的科学计算库和图形库等。这个不是问题,我一开始也是不懂。在学习的过程中,慢慢学会。
当然,机器学习需要大量数据作为基础。有时候需要自己收集数据,而数据一般来自互联网。那么你多少也要懂得一些正则表达式、html前端和爬虫网抓知识。
同样现在不会也没问题,需要用到的时候再学,只是后面会有点吃力。
学习时碰到困难就解决,要有这个勇气和信心!
机器学习主要是收集数据,分析数据,建立机器学习模型,再使用模型。
其中分析数据就需要使用到统计学的知识。大学的高数差不多够用了。
有人问,不懂这些可以学吗?个人还是肯定的说至少要懂矩阵、线性回归等等。这些都是机器学习的基础和核心。若不懂这些,基本看不懂原理,很难学会。
网上还说了其他的,但这些就够了。说太多反而容易打击信心。其中大部分东西可以在学习的过程中学会。后面我会逐步发表我学习机器学习的学习笔记。
机器学习是多维度、高难度的领域,你有信心征服它不?
《机器学习实战》的源码和素材:
https://github.com/pbharrin/machinelearninginaction
该专题相关文章:
更多文章,持续更新中……
后记:这本书需要一定的高数基础以及理解能力。书中很多地方思路绕得太弯,没解释清楚。
相关专题: 机器学习实战
杨仕航
后面会更新该篇博文,把相关笔记的链接加入进来
2016-12-30 15:53 回复