Python机器学习实践:测试驱动的开发方法
(副标题):无 ;
(作者): Matthew Kirk ;
内容简介:
K最近邻算法简介
如果我们想出一个不那么优雅但效果也不错的方法呢?
假设我们只能看到随意数量的邻近房子,且这些邻近房子和我们估价的房子很相似。这个方法是否也可行?
答案令人惊讶:可行。这就是K最近邻(KNN,K-Nearest Neighbor)解决方案,它的效果非常好。它有两种形式:回归法(求一个值的时候)或分类法。为了将KNN应用于房价问题,我们只需要找到最近的K个邻居。
KNN算法最初是Drs.Evelyn Fix和J.L.Hodges Jr在为美国空军航空医学学院撰写的未发表的技术报告中提出的。在Fix和Hodges的原始研究集中他们将分类问题分成几个子问题:
·分布F和G是完全已知的。
·除了几个参数外,分布F和G是完全已知的。
·F和G是未知的,但可能已知它们的存在密度。
Fix和Hodges指出,如果你知道两个分类的分布,或者你知道分布减去一些参数,你可以轻松地回退出有用的解决方案。因此,他们将研究专注于更难的情况:在未知的分布中找到分类。他们的工作奠定了KNN算法的基础。
我们来看以下几个问题:
·什么是邻居?什么使他们靠近?
·如何选择邻居的数量K?
·用这些邻居做什么?
目录预览:
Python机器学习实践:测试驱动的开发方法
第1章 可能近似正确的软件
正确地编写软件
编写正确的软件
本书计划
第2章 快速介绍机器学习
什么是机器学习
有监督学习
无监督学习
强化学习
机器学习能完成什么
本书中使用的数学符号
结论
第3章 K最近邻算法
如何确定是否想购买一栋房子
房子的价格究竟几何
愉悦回归
什么是邻域
K最近邻算法简介
K先生最近的邻居
........