本书的第1版《模式分类与场景分析》出版于1973年,是模式识别和场景分析领域奠基性的经曲名著。在第2版中,除了保留了第1版的关于统计模式识别和结构模式识别的主要内容以外,读者将会发现新增了许多近25年来的新理论和新方法,其中包括神经网络、机器学习、数据挖掘、进化计算、不变量理论、隐马尔可夫模型、统计学习理论和支持向量机等。作者还为未来25年的模式识别的发展指明了方向。书中包含许多实例,各种不同方法的对比,丰富的图表,以及大量的课后习题和计算机练习。
出版者的话\r\n专家指导委员会\r\n译者序\r\n前言\r\n第1章 绪论\r\n 1.1 机器感知\r\n 1.2 一个例子\r\n 1.3 模式识别系统\r\n 1.4 设计循环\r\n 1.5 学习和适应\r\n 1.6 本章小结\r\n 全书各章概要\r\n 文献和历史评述\r\n 参考文献\r\n第2章 贝叶斯决策论\r\n 2.1 引言\r\n 2.2 贝叶斯决策论——连续特征\r\n 2.3 最小误差率分类\r\n 2.4 分类器、判别函数及判定面\r\n 2.5 正态密度\r\n 2.6 正态分布的判别函数\r\n 2.7 误差概率和误差积分\r\n 2.8 正态密度的误差上界\r\n 2.9 贝叶斯决策论——离散特征\r\n 2.10 丢失特征和噪声特征\r\n 2.11 贝叶斯置信网\r\n 2.12 复合贝叶斯决策论及上下文\r\n 本章小结\r\n 文献和历史评述\r\n 习题\r\n 上机练习\r\n 参考文献\r\n第3章 最大似然估计和贝叶斯参数估计\r\n第4章 非参数技术\r\n第5章 线性判别函数\r\n第6章 多层神经网络\r\n第7章 随机方法\r\n第8章 非度量方法\r\n第9章 独立于算法的机器学习\r\n第10章 无监督学习和聚类\r\n附录A 数学基础\r\n参考文献\r\n索引
Richard O.Duda于麻省理工学院获得电气工程博士学位,是加州San Jose州立大学电气工程系名誉教授。他是美国人工智能学会会士、IEEE会士。
Peter E.Hart是加州Ricoh lnnovations公司的创始人、总裁和CEO,同时还是理光公司的高级副总裁,在此之前曾任理光加州研究中心的高级副总裁。他是美国人工智能学会会士、IEEE会士,曾获IEEE信息论协50周年论文奖。
本书第1版《模式分类与场景分析》(Pattern Classification and Scene Analysis)于1973年问世,在逾越四分之一世纪以后的今天我们重写了第2版。写作的初衷依然不变,即尽可能地对模式识别中的各个重要课题,尤其是对基本原理进行系统地介绍。我们相信这会为相当多有待解决的专门问题,诸如语音识别、光学字符识别或信号分类等,提供必需的基础。本书第1版的许多读者经常问我们为什么要把“模式分类”与“场景分析”结合在一本书里写。在当时,我们所能做的回答是,分类理论的确是模式识别学科中最重要的与领域无关的(domain-independent)理论,而场景分析是那个年代仅有的并且重要的应用领域。况且,根据1973年的研究水平,完全有可能把两个内容集中在一本书中阐述清楚而不显肤浅。在随后的这些年中,模式识别的理论和应用领域已经迅速扩展,使得上述观点再也站不住脚。因为必须要做出选择,所以我们决定在本版中只介绍分类理论,而把有关应用的课题留给其他专门书籍来解决。自1973年以来,对第1版中提出的许多问题开展了大量的研究,并且取得了长足的进步。仅仅是计算机硬件的发展已经大大超过了学习算法和模式识别的步伐。第1版中提出的一些突出问题目前已获圆满解决,然而另外一些却依然让人灰心。模式识别系统所显现的重大作用,使该领域的研究方兴末艾,并且激动人心。
当我们在撰写本书第1版时,模式识别还只是相当专门的学科。但从其目前丰富的应用领域来看,它已变得十分博大。这些应用包括:笔迹和手势的识别、唇语技术、地学分析、文件检索以及气泡室中的亚原子轨迹判读。它为大量人—机界面问题提供核心算法,比如笔输入计算。第2版的篇幅正说明了其现有理论的广博。虽然我们预计本书的绝大多数读者都对开发新的模式识别系统感兴趣,但也不排除有少部分人专注于深刻理解现有的模式识别系统。这当中最显著的莫过于人类和动物的神经认知系统。虽然研究模式识别的生物学起源已明显超出本书的范围,但是,由于对自然界中的模式识别能力感兴趣的神经生物学家和心理学家也越来越多地依赖于先进的数学和理论的帮助,从而也必将从本书中获益。
尽管已有很多优秀的书籍集中讨论某一部分技术,我们仍然强烈地感到需要像本书这样采取某种不同的讨论方法。也就是说,本书并非集中在某些专门技术如神经网络上,相反,我们对一类特定的问题——模式识别问题——开展研究。本书讨论了多种可行的技术。学生们和实践者常常需要知道某种技术是否适合于他们的特定需求或者开发目标,许多专门研究神经网络的书籍未必会讨论其他的技术(诸如判定树、最近邻方法或者其他分类器)以提供比较和选择不同方案的依据。为了避免出现这种问题,我们将在本书中对比讨论各种分类技术,并讨论各自的优势和缺点。
所有这些发展要求改写本书的第1版,以获得一个统一的更新的版本。我们不仅丰富了本书的内容,并且在以下几方面作了改进。
新的材料
书中包含有很多最近十几年才发展起来并被实践证明是有用的模式识别的新技术,比如神经网络、随机方法以及有关机器学习理论的问题,等等。虽然本书仍然以统计技术为主,但是为了保持完整性,我们也加进了句法(结构)模式识别的内容,还包含许多“经典”的技术,如隐马尔可夫模型(HMM)、模型选择机制、组合分类器等。
丰富的例题
本书中包含有许多例题,这些例题通常使用很简单的数据,避免冗长单调的计算,但是又足够复杂,使得能够清楚地解释关键知识点。例题的作用在于增加直观认识,帮助学生解决课后习题。
算法列表
藉助算法可以最清楚地解释所讲述的模式识别技术。本书中,我们提供了很多算法。算法只是相应的完整计算机程序的一个基本骨架。我们假定每位读者都熟悉算法中采用的伪码形式,或者可以通过上下文来理解。
加星号的节
有些节加了星号,表明有些专门化,通常是一些补充材料。但它们一般不影响对后续不带星号的节的理解,所以在初次阅读时可以跳过。
上机练习
这些练习并不限制采用哪种计算机语言或系统,学生可以根据情况选择适合自己的语言或系统。
课后习题
增加了一些课后的习题,并按提出问题的章节组织。本书的习题另有答案手册,可供教师选用。
每章小结
每章小结中含有本章重要的概念和知识点。
增强的图表
为了更好地展示概念,我们花了很大的力气来增强本书中的图表,以解释正文中的要点。部分图表的建立,经过了大量精心的计算和细致的参数设置。相关的AdobeAcrobat格式的文件可以登录ftp://ftp.wiley.com.public.sci_tech_med/Pattern/或http://WWW.wiley.com/products/subject/engineering/electrical/software_supplem_elee_eng.html获得。
数学附录
学生们未必拥有所必需的同样的数学基础,这一点也不令人奇怪。为此,在书后附录中补充了必要的数学基础知识。我们力求通篇使用清晰的表示法来解释关键特性,同时又保持可读性。附录中的符号列表能够帮助那些愿意仔细钻研预先使用符号的章节的读者。
本书包含足以适合两学期的高年级本科或研究生课程的材料,当然通过仔细挑选也可变成一学期的课程。一学期课程应当包括第1章到第6章,第9章和第10章(大部分来自第1版的内容,仅仅增加了神经网络和机器学习),加星号的各节可讲可不讲。
由于研究和发展速度如此之快,书中每章末尾的文献和历史评述就显得十分有必要,尽管有些简略。我们的目的无非是想帮助读者有重点地选择阅读参考文献,而并非是记录整个历史发展过程和感谢、赞美或表扬某些研究者。参考书目中有的重要文献可能未必在正文中提及,读者可根据标题自行选阅。
如果没有以下几个研究机构的帮助,我们是不可能完成本书的。第一个最重要的一个当属理光发明公司(Ricoh lnnovations,DGS&PEH)。在动荡和严酷的工业竞争环境中,以及对产品和创新的无休止的需求压力之下,该公司能够支持像本书这样长期和广泛的教育研究项目,反映出这里有了不起的环境和氛围,以及少有的和明智的领导集体。感谢理光有限公司研究发展部主任Morio Onoe在我们开始写作时给予的热情支持。同样要感谢圣何塞加州州立大学,斯坦福大学电气工程系、统计学和心理学系,加州大学伯克利分校,国际高等科学研究院,尼尔斯·玻尔研究所,圣塔·菲研究所,在写作本书时,他们为我们提供了临时寓所和帮助。
非常感谢斯坦福大学的研究生Regis Van Steenkiste,Chuck Lam和Chris Overton在图形准备方面提供的巨大帮助,Sudeshna Adak在解答习题中的帮助。感谢理光公司的同事Kathrin Berkner,Michael Gormish,Maya Gupta,Jonathan Hull和Greg Wolff的多方面帮助,图书馆员RowanFairgrove帮助找到很多难找的文献,并确认了许多文献作者的名字。本书很多内容来自在斯坦福大学和圣何塞加州州立大学的讲义,从研究生得到的反馈使本书受益匪浅。许多教员和科研同仁为本书提供很好的建议,并纠正了很多疏误。特别要感谢Leo Breiman,David Cooper,Lawrence Fogel,Gary Ford,Isabelle Guyon,Robert Jacobs,Dennis Kibler,Scott Kirkpatrick,Benny Lautrup,Nick Littlestone,Amir Najmi,Art Owen,Rosalind Picard,J.RossQuinlan,CullenSchaffer和DavidWolpert,他们对本书进行了评论。各领域的著名专家审阅了本书各个章,他们是Alex Pentland(1),Giovanni Parmigiani(2),Peter Cheeseman(3),Godfried Toussaint(4),Padhraic Smyth(5),Yann Le Cun(6),Emile Aarts(7),Horst Bunke(8),Tom Dietterich(9)和Anil Jain(10)和Rao Vemuri(Appendix),括号中数字是审阅的章号。他们富有洞察力的评语对本书多方面的改进都有帮助。不过,我们对仍然存在的错误负责。本书编辑GeorgeTelecki给了我们很大的鼓励和支持,而且没有对我们一拖再拖的进度抱怨。他和Wiley公司的其他员工都非常乐于帮助我们,并且都是专业性的支持。最后非常感谢Nancy,Alex和OliviaStork对我们沉迷写作的理解和忍耐。