《自然语言处理的形式模型》导读
首发地址:http://bbs.gxsd.com.cn/viewthread.php?tid=411674&extra=《自然语言处理的形式模型》导读
作者:王增才
邮箱:wangzengcai@126.com
该书将自然语言处理的方法分为两种:理性主义(基于规则的方法)方法与经验主义(基于统计的方法)。该书对自然语言处理中的很多种形式模型进行了系统的介绍。基于规则的形式模型,介绍了短语结构语法,递归转移网络等等;基于统计的形式模型,介绍了Markov链,概率语法,Bayes公式,HMM等等。
该书介绍了很多种主流的形式模型,在一定程度上反映了国内外自然语言处理方面的成果,可以作为一本入门书或者工具书来使用,有助于我们大体把握自然语言处理发展动向的。
该书是手册性的综合概述书籍,有如下优点:
介绍了很多种规则和统计的形式模型。
简练的论述了形式模型的优缺点。
该书各章写作风格一致,内容协调,特别适合对自然语言处理感兴趣和刚入门的朋友们阅读。
缺点:
数学公式较多,文科背景的朋友们阅读和理解起来可能会有一些困难。
没有论述基于模糊数学的自然语言处理的形式模型。不知道是冯老师不熟悉这块,还是有意回避。据我了解,冯老师本人是擅长于基于统计的形式模型研究的。我国的学者伍铁平(代表作《模糊语言学》)与张乔老师(代表作《模糊语义学》)等等对模糊语言学颇有研究。
据我所了解,该书是国内第一本综述基于规则与统计的自然语言处理方法的书籍,是值得一读的。
参考资料
1.《自然语言处理的形式模型》,冯志伟,中国科学技术大学出版社,2010年01月
页:
[1]