本书主要介绍本书5个部分,共18章,较为全面地介绍了机器学习的基本概念,并讨论了数据挖掘和知识发现中的有关问题及多策略学习方法,具体地阐述了机器学习与数据挖掘在工程设计,文本、图像和音乐,网页分析、计算机病毒和计算机控制,医疗诊断、生物医疗信号分析与水质分析中的生物信号处理等方面的应用情况。本书收集众多不同领域中数据挖掘的实际案例,以此来说明数据挖掘的具体解决方法,以期为广大读者提供一个更为广阔的数据挖掘应用视角。
第1部分 基本概念
第1章 机器学习方法概述
1.1 导论
1.2 机器学习任务
1.3 泛化空间的搜索
1.4 学习经典任务
1.5 如何利用谓词逻辑
1.6 人工发现
1.7 如何处理搜索空间过大
1.8 机器学习的近邻
1.9 混合系统与多策略学习
1.10 展望
参考文献
第2章 数据挖掘与知识发现: 对问题和多策略方法的回顾
2.1 前言
2.2 机器学习与多策略数据分析
2.3 数据分析任务中的分类
2.4 INLEN中各操作的说明
2.5 聚类和学习操作的说明
2.6 数据与规则的可视化
2.7 结构属性的规则学习
2.8 从决策规则中学习决策结构
2.9 表示空间的自动改善
2.10 应用展示: 经济与人口统计数据中的发现
参考文献
第3章 机器学习在多个领域的应用
3.1 前言
3.2 规则归纳在多个领域中的应用
3.3 规则归纳的其他应用研究
3.4 若干策略和经验
参考文献
第4章 归纳逻辑编程的应用
4.1 前言
4.2 ILP方法与其他机器学习方法的比较
4.3 预测化合物的诱变性
4.4 放电机器中的技能重建
4.5 ILP的一些其他应用
4.6 总结
参考文献
第2部分 设计与工程
第5章 机器学习在有限元计算中的应用
5.1 简介
5.2 向FEM产生器添加一个专家系统
5.3 学习问题、实例和背景知识
5.4 以前的实验
5.5 选择一个合适的学习算法
5.6 根据CLAUDIEN学习
5.7 归纳的规则的后期处理
5.8 结果
5.9 总结
参考文献
第6章 归纳学习和基于事例的推理在工业机器故障检测方面的应用
6.1 简介
6.2 归纳学习与基于事例的推理
6.3 更好地利用经验
6.4 应用
参考文献
第7章 经验装配序列规划: 多策略构造学习方法
7.1 前言
7.2 NOMAD中的表示与规划
7.3 多策略构造学习
7.4 NOMAND的学习场景
7.5 与先前研究进行比较
7.6 结束语
参考文献
第8章 归纳学习设计入门: 关于防摩擦轴承系统的设计方法和实例研究
8.1 导论
8.2 一种学习设计规则的方法
8.3 一个示范问题的描述
8.4 归纳方法的应用
8.5 训练与事件测试
8.6 结果分析
8.7 总结
参考文献
第3部分 文本、图像和音乐模式的测定
第9章 找出文本之间的关联
9.1 介绍
9.2 FACT系统结构
9.3 关联
9.4 查询语言
9.5 查询操作
9.6 关系表达式
9.7 对新闻数据运用FACT系统
9.8 总结
参考文献
第10章 学习图像中的模式
10.1 导论
10.2 计算机视觉中机器学习的研究工作
10.3 室外场景彩色图像的语义解释
10.4 检查行李X光图像中的引爆雷管
10.5 视频图像序列中的动作识别
10.6 结论与未来的研究
参考文献
第11章 机器学习在音乐研究领域的应用: 深入音乐表达现象的经验调查
11.1 介绍
11.2 学习对象: 富有表现力的音乐演奏
11.3 背景知识的特性和价值
11.4 方法一: 在音乐符号的层次上学习
11.5 方法二: 在结构层次上学习
11.6 对真实艺术的演奏的一次机器学习分析
11.7 实验结果的讨论
11.8 总结
参考文献
第4部分 计算机系统和控制系统
第12章 网页哨兵: 万维网页学习者
12.1 概述
12.2 网页哨兵
12.3 学习
12.4 实验结果
12.5 总结
参考文献
第13章 计算机病毒的生物启发式防御
13.1 介绍
13.2 背景
13.3 病毒种类的检测
13.4 计算机免疫系统
13.5 结论与展望
参考文献
第14章 控制技术的行为复制
14.1 引言
14.2 行为复制
14.3 杆平衡
14.4 学习飞行
14.5 集装箱起重机
14.6 生产线调度
14.7 讨论
参考文献
第15章 空中交通控制一阶知识的获取
15.1 引言
15.2 基于知识的关系归纳
15.3 ATC的应用
15.4 总结
参考文献
第5部分 医学和生物学
第16章 机器学习在医学诊断中的应用
16.1 介绍
16.2 医学诊断
16.3 医生与机器学习诊断结果的比较
16.4 选择适当的机器学习系统
16.5 实践中的认同
16.6 总结
参考文献
第17章 学习对生物医学信号进行分类
17.1 介绍
17.2 两个医学领域
17.3 基于神经网络初始化的决策树方法
17.4 基于树的RBF网络初始化
17.5 试验
17.6 讨论
参考文献
第18章 机器学习在河流水质的生物分类中的应用
18.1 简介
18.2 英国河流生物分类中的规则学习
18.3 对斯洛文尼亚河流数据的分析
18.4 讨论
参考文献
本书的读者对象不一定是机器学习或数据挖掘方面的专家,而是对机器学习或数据挖掘的多种应用及其入门知识感兴趣的读者。机器学习是一个致力于有关学习过程中计算方法的开发和研究,以及应用计算机学习系统解决实际问题的领域。机器学习中一个重要的研究内容就是从样本中获取相应的概念描述的方法。样本表示可以采用多种形式,尤其是可以采用二维关系数据表形式来表示,因此许多机器学习方法可被直接应用于解决数据挖掘问题,并起着重要的作用。数据挖掘问题就是从大规模数据库中搜索出有趣模式和重要规律。而在数据挖掘问题中,具有挑战性且目前存在许多尚待解决问题的领域,则是有关从文本、图像或声音序列(音乐)之中抽取出模式或规则的问题。本书有一部分专门讨论这类问题的有关应用情况。
本书第1部分介绍了机器学习的基本概念,并讨论了数据挖掘和知识发现中的有关问题及多策略方法。这部分还介绍了机器学习与归纳逻辑编程的若干应用,其中后者是机器学习的当前一个分支领域。
随后各个章节是由若干应用主题组成的。这些主题包括:设计与工程,文本、图像和音乐中模式或规则的发现,计算机与控制系统及医药与生物。本书中所介绍的应用中有一些是已投入使用的,而另一些则是研究性应用。本书收集应用实例的指导性标准就是:机器学习方法必须应用于一个困难而有意义的现实世界问题中,并产生满意的或至少是真正有前景的结果。
本书是由一组国际科学家实际编写而成的。每个章节均有单独的作者,他们是机器学习或相关领域的主要专家,分别代表了来自11个国家的主要研究小组,这些国家分别是:澳大利亚、奥地利、比利时、加拿大、法国、以色列、韩国、波兰、斯洛文尼亚、英国和美国。然而编者有必要指出:由于现在有如此多的优秀研究人员在机器学习和数据挖掘领域工作,因此不可能挑选出特别“具有代表性”的作者。许多被邀请为本书撰稿的人士目前或以前就是本书编者的同事或合作者。然而被选中的作者都是杰出的科学家,他们的工作涵盖了本书主题的很大范围,因此编者为能够将他们所贡献的内容编入到本书中而感到非常荣幸。
编者借此机会希望感谢所有为本书工作的人们。特别要感谢George Mason大学机器学习和推理实验室的研究人员,他们在各种技术和文稿方面提供了无价的帮助,特别是ZoranDuric,KenKaufman,Seokwon Lee和QiZhang。我们还要感谢John Wiley & Sons公司的Roslyn Meredith和Gaynor Redvers-Mutton,他们在本项目中也提供了密切的合作。
最后,我们希望读者们将会从本书中得到有益的帮助和指导,并能够将它作为有关机器学习与数据挖掘及其无数实际应用的有价值的信息源。