本书展示了机器学习中核心的算法和理论,并阐明了算法的运行过程。本书综合了许多的研究成果,例如统计学、人工智能、哲学、信息论、生物学、认知科学、计算复杂性和控制论等,并以此来理解问题的背景、算法和其中的隐含假定。本书可作为计算机专业 本科生、研究生教材,也可作为相关领域研究人员、教师的参考书。
译者序
\r\n前言
\r\n第1章 引言
\r\n第2章 概念学习和一般到特殊序
\r\n第3章 决策树学习
\r\n第4章 人工神经网络
\r\n第5章 评估假设
\r\n第6章 贝叶斯学习
\r\n第7章 计算机学习理论
\r\n第8章 基于实例的学习
\r\n第9章 遗传算法
\r\n第11章 分析学习
\r\n第12章 归纳和分析学习的结合
\r\n第13章 增强学习
Tom M.Mitchell是卡内基梅隆大学的教授,讲授“机器学习”等多门课程;美国人工智能协会(AAAL)的主席;美国《Machine Learning》杂志、国际机器学习年度会议(ICML)的创始人;多种技术杂志的撰稿人,曾发表过许多文章,出版过多本专著,是机器学习领域的著名学者。
机器学习这门学科所关注的问题是:计算机程序如何随着经验积累自动提高性能. 近年来, 机器学习被成功地应用于很多领域, 从检测信用卡交易欺诈的数据挖掘程序, 到获取户阅读兴趣的信息过滤系统, 再到能在高速公路上自动行驶的汽车. 同时, 这个学科的基理论和算法也有了重大进展.
这本教材的目标是展现机器学习中核心的算法和理论. 机器学习从很多学科吸收了成果和概念, 包括统计学. 人工智能. 哲学. 信息论. 生物学. 认知科学. 计算复杂性和控制等. 笔者相信, 研究机器学习的最佳途径是从这些学科的观点看待机器学习, 并且以此来理解问题的背景. 算法以及其中隐含的假定. 这些在以往很难做到, 因为在这一领域缺少包容广泛的原始资料, 本书的主要目的就是提供这样的一份资料.
由于素材的多学科性, 本书不要求读者具有相应的知识背景, 而是在必要时介绍其他一些学科的基本概念, 如统计学. 人工智能. 信息论等. 介绍的重点是与机器学习关系最密切甲那些概念. 本书可以作为计算机科学与工程. 统计学和社会科学等专业的大学生或研究生的教材, 也可作为软件研究人员或从业人员的参考资料. 指导本书写作的两条原则为:第一, 它是在校大学生可以理解的, 第二, 它应该包含我希望我自己的博士生在开始他们的器学习研究前要掌握的内容.
指导本书写作的第三条原则是:它应该体现理论和实践间的均衡. 机器学习理论致力于回答这样的问题“学习性能是怎样随着给定的训练样例的数量而变化的?”和“对于各种同类型的学习任务:哪个学习算法最适合?”利用来自统计学. 计算复杂性和贝叶斯分析的理论成果, 这本书讨论了这一类理论问题. 同时本书也涵盖很多实践方面的内容:介绍了这一领域的主要算法, 阐明了算法的运行过程. 其中一些算法的实现和数据可以在因特网上通过网址http://www. cs. cmu. edu/-tom/mlbook. html得到, 包括用于人脸识别的神经网络的源代码和数据. 用于信贷分析的决策树学习的源代码和数据及分析文本文档的贝叶分类器的源代码和数据. 我很感谢那些帮助我创建这些在线资源的同事, 他们是:Jason Rennie. Paul Hsiung. Jeff Shufelt. Matt Glickman. Scott Davies. Joseph O’Sullivan. Ken Lang\Andrew McCallum和Thorsten Joachims.