自然语言处理Python进阶
(副标题):无 ;
(作者): Krishna Bhavsar, Pratap Dangeti ;
内容简介:
Tip:NOCONT,图书简介暂无,请下载图书查阅详细内容:cont_err
目录预览:
自然语言处理Python进阶
第1章 语料库和WordNet
1.2 访问内置语料库
1.3 下载外部语料库,加载并访问
1.4 计算布朗语料库中三种不同类别的特殊疑问词
1.5 探讨网络文本和聊天文本的词频分布
1.6 使用WordNet进行词义消歧
1.7 选择两个不同的同义词集,使用WordNet探讨上位词和下位词的概念
1.8 基于WordNet计算名词、动词、形容词和副词的平均多义性
第2章 针对原始文本,获取源数据和规范化
2.2 字符串操作的重要性
2.3 深入实践字符串操作
2.4 在Python中读取PDF文件
2.5 在Python中读取Word文件
2.6 使用PDF、DOCX和纯文本文件,创建用户自定义的语料库
2.7 读取RSS信息源的内容
2.8 使用BeautifulSoup解析HTML
第3章 预处理
3.2 分词——学习使用NLTK内置的分词器
3.3 词干提取——学习使用NLTK内置的词干提取器
........