我的博客

可通过筛选器快速找到对应类别的博文

喜欢就收藏一下吧

  • 清除条件
上篇博文详细讲解什么是逻辑回归(Logistic回归):机器学习09:逻辑回归详解文中每次拟合的时候,使用全部训练集的数据。计算量大,有可能训练集的样本有成千上百万。而且可能出现拟合不足或拟合过度,因为其中迭代次数是我们直接...
《机器学习实战》书中第5章讲的是逻辑回归(Logistic回归)。满怀鸡冻放开书本,结果读了好几遍都没弄明白其原理。弄不懂逻辑回归实现代码为什么要那么写!至少我已经先学过斯坦福大学教授Andrew Ng讲所的机器学习中的线性...
看懂该篇需要先看如下博文,本文大部分知识和代码会使用到前面如下博文:1)机器学习06:朴素贝叶斯理论知识2)机器学习07:朴素贝叶斯应用(词集模式)在机器学习07:朴素贝叶斯应用(词集模式)中第2部分处理句子,将句子向量化的...
上一篇博文讲了朴素贝叶斯的理论知识。有了理论基础,就可以实践应用了。机器学习有个重要的应用是对文档自动分类。例如电子邮件、新闻报道、用户留言、博客文章等等各种文档。每一种文档类型都会出现各种的专有名词或常用名词等等。我们人眼...
这段时间忙于弄其他事,有一段时间没学习机器学习。捡起来继续。《机器学习实战》在决策树之后,讲基于概率论的分类方法:朴素贝叶斯。前面讲的算法基本都是针对问题给出明确答案。但有些模糊的分类难以明确,这时候可以用概率论的方法来猜测...
上一篇文章讲如何创建决策树,创建结果不够直观清晰。所以这次讲如何通过matplotlib绘制决策树。先给大家看看效果,调调胃口。可以更复杂些,根据决策树来绘图:《机器学习实战》书中,该部分的代码有些混乱。我重新构造了代码,创...
《机器学习实战》第2个算法是决策树。本来觉得该算法没什么,因为决策树原理很简单,实践也不复杂。仔细一看,原来它还包含自动构建较优的决策树,并绘制决策树。决策树同样是一个分类算法。其概念和原理都比较简单,看下图就明白了。根据不...
《机器学习实战》书中还讲了一个实例。该实例讲如何数字识别。k-近邻算法也不太适用运用到该场景(文章后面会总结说明)。不妨可以借鉴一下,拓展我们的思路。尤其是特殊的问题如何处理和计算等等。收集数据的步骤同样就先跳过。《机器学习...
上次写了一篇k-近邻算法的简单分类使用方法,包括什么是k-近邻算法以及基本的实现代码。这次看《机器学习实战》2.2的实例,讲解修正数据和如何计算错误率以及把数据图形化。该实例大致意思是从约会网站获取数据,通过下面3个维度的数...
这本《机器学习实战》第1个算法是k-近邻算法,也叫KNN。该算法简单容易理解,十分适合入门。k-近邻算法是用于分类。分类问题是监督学习算法的一个研究方向。既然是属于监督学习的,就需要1个训练数据集作为判断的基础。k-近邻算法...