机器学习:从公理到算法
(副标题):无 ;
(作者): 于剑 ;
内容简介:
第1章 引言
好好学习,天天向上。
——毛泽东,1951年题词
大数据时代,人类收集、存储、传输、管理数据的能力日益提高,各行各业已经积累了大量的数据资源,如著名的Nature杂志于2008年9月出版了一期大数据专刊[1],列举了生物信息、交通运输、金融、互联网等领域的大数据应用。如何有效分析数据并得到有用信息甚至知识成为人们关注的焦点。人们寄希望于智能数据分析来完成该项任务。机器学习是智能数据分析技术的核心理论。Science杂志于2015年7月组织了一个人工智能专题[2],其中有关机器学习的内容依然占据了重要的部分。本章将讨论机器学习的基本目的、基本框架、思想发展以及未来走向。
1.1 机器学习的目的:从数据到知识
人类最重要的一项能力是能够从过去的经验中学习,并形成知识。千百年来,人类不断从学习中积累知识,为人类文明打下了坚实的基础。“学习”是人与生俱来的基本能力,是人类智能(human intelligence)形成的必要条件。自2000年以来,随着互联网技术的普及,积累的数据已经超过了人类个体处理的极限,以往人类自己亲自处理数据形成知识的模式已经到了必须改变的地步,人类必须借助于计算机才能处理大数据,更直白地说,我们希望计算机可以像人一样从数据中学到知识。
由此,如何利用计算机从大数据中学到知识成为人工智能研究的热点。“机器学习”(machine learning)是从数据中提取知识的关键技术。其初衷是让计算机具备与人类相似的学习能力。迄今为止,人们尚不知道如何使计算机具有与人类相媲美的学习能力。然而,每年都有大量新的针对特定任务的机器学习算法涌现,帮助人们发现完成这些特定任务的新知识(有时也许仅仅是隐性新知识)。对机器学习的研究不仅已经为人们提供了许多前所未有的应用服务(如信息搜索、机器翻译、语音识别、无人驾驶等),改善了人们的生活,而且也帮助人们开
目录预览:
机器学习:从公理到算法
第1章 引言
第2章 归类理论
第3章 密度估计
第4章 回归
第5章 单类数据降维
第6章 聚类理论
第7章 聚类算法
第8章 分类理论
第9章 基于单类的分类算法:神经网络
第10章 K近邻分类模型
第11章 线性分类模型
第12章 对数线性分类模型
第13章 贝叶斯决策
第14章 决策树
第15章 多类数据降维
第16章 多类数据升维:核方法
第17章 多源数据学习
后记
索引