语料库语言学--理论工具与案例/语言计算与智能汉语教学刘华外语教学与研究出版社有限责任公司97875
- ISBN:9787521322835
- 作者:刘华
- 包装:平装
- 印次:1
- 品相:10成新
- 字数:252.0
- 开本:16开
- 版次:1
- 页数:252
- 主题词:语料库//应用//汉语//教学
- 出版社:外语教学与研究出版社有限责任公司
- 出版时间:2021-01-01
- 读者对象:普通大众
手机扫码免费下载
纠错留言#电子书截图
#电子书简介
商品基本信息,请以下列介绍为准 | |
商品名称: | 语料库语言学--理论工具与案例/语言计算与智能汉语教学 |
作者: | 刘华 |
定价: | 59.0 |
出版社: | 外语教学与研究出版社有限责任公司 |
出版日期: | 2021-01-01 |
ISBN: | 9787521322835 |
印次: | 1 |
版次: | 1 |
装帧: | |
开本: | 16开 |
内容简介 |
汉语助研\"是作者自主开发的,面向语言研究者,是汉语和汉语教学研究者的一款软件。软件力图帮助语言研究者比较轻松地建设语料库,使用语言大数行语言研究。汉语助研系统是国内外一个全面综合了语料库建设、检索和能的辅助汉语研究的软件系统,集成了基于语料库方法的汉语字、词、句、篇研究的各项能,系统能很好地贴合汉语研究各方面的统计需能针对性、实用性强。 汉语助研系统基于真实问卷调查数据分析,符合汉语研究的各项需求,是贴合了汉语研究者文科生的动手特点,软件架构、界面设计和编码清晰简洁,将复杂的统计、计算过程隐藏于后台,前端一键式、步骤式操作,简单易用。 |
目录 |
理论篇 1 语料库语言学概述 / 2 1.1 语料库语言学的学科基础 / 2 1.1.1 语料库语言学的产生原因 / 2 1.1.2 语料库语言学的理论基础 / 2 1.2 语料库的定义、特点与分类 / 3 1.2.1 语料库的定义 / 3 1.2.2 语料库的特点 / 4 1.2.3 语料库的分类 / 5 1.3 语料库语言学的定义 / 6 1.3.1 前人论述 / 6 1.3.2 语料库语言学定义 / 7 1.4 语料库语言学的研究内容与方法 / 8 1.4.1 语料库语言学的研究内容 / 8 1.4.2 语料库语言学的研究方法 / 8 2 语料库的建设 / 10 2.1 概述 / 10 2.1.1 语料库建设的基本过程 / 10 2.1.2 语料库建设面临的问题 / 10 2.2 语料库建设的原则和规范 / 11 2.2.1 语料的建设原则 / 11 2.2.2 语料库的不规范性 / 12 2.3 语料库建设衡性与代表性 / 13 2.3.1 规模、语体、时间与空间 / 13 2.3.2 流通度 / 15 2.4 语料库建设的元数据与信息字段 / 19 2.4.1 元数据 / 19 2.4.2 信息字段 / 23 2.4.3 元数据、信息字段举例 / 24 2.5 语料库建设方法 / 27 2.5.1体设计 / 27 2.5.2 具体实施 / 27 3 语料库的加工标注 / 31 3.1 中文自动分词 / 32 3.1.1 词与自动分词 / 32 3.1.2 中文分词的特点和难点 / 32 3.1.3 常见的中文分词方法 / 34 3.2 中文词性标注 / 35 3.2.1 词性、词类与词性标注 / 35 3.2.2 词性标注难点 / 35 3.2.3 常见词性标注方法 / 36 3.3 自动句法分析 / 37 3.3.1 概述 / 37 3.3.2 句法分析分类 / 38 3.3.3 依存句法分析 / 39 3.4 语义分析 / 41 3.4.1 词语级语义分析 / 41 3.4.2 句子级语义分析 / 43 3.4.3 篇章级语义分析 / 44 4 术语说明 / 46 4.1 频次 频率 文本数 / 46 4.1.1 频次 / 46 4.1.2 频率 / 46 4.1.3 文本数 / 46 4.2 累加频率 覆盖率 使用率 高频词语 / 47 4.2.1 累加频率 / 47 4.2.2 覆盖率 / 47 4.2.3 使用率 / 47 4.2.4 高频词语 / 48 4.3 频序 频序比 频率差 / 48 4.3.1 频序 / 48 4.3.2 频序比 / 48 4.3.3 频率差 / 49 4.4 字种 字种数 词种 词种数 / 49 4.4.1 字种 / 49 4.4.2 字种数 / 49 4.4.3 词种 / 49 4.4.4 词种数 / 49 4.5 用 / 50 4.5.1 共用 / 50 4.5.2 独用 / 50 工具篇 5 网页批量下载 / 52 5.1 具有数字序列规律的网页下载 / 52 5.1.1 搜索网页 / 52 5.1.2 批量生成网址 / 54 5.1.3 创建工程 / 55 5.1.4 运行工程 / 57 5.2 具有时间序列规律的网页下载 / 58 5.3 无数字、无日期序列的规律网页下载 / 59 5.4 无任何规律网页的批量下载 / 60 6 网页信息抽取建库 / 65 6.1 网页内容解析原理 / 65 6.2 程序操作图示 / 67 6.2.1 打开待处理html 文件夹 / 67 6.2.2 展示待处理html 文件的文本内容 / 68 6.2.3 选择抽取字段的起止标记 / 69 6.2.4 选择抽取结果保存的文件夹和文件名 / 70 6.2.5 检查所有网页的抽取起止标记是否正确 / 71 6.3 语料库结果展示 / 71 7 例句检索 / 73 7.1 程序操作图示 / 73 7.1.1 打开、保存文件夹 / 73 7.1.2 选择检索模式 / 73 7.1.3 单击运行程序 / 74 7.2 检索结果展示 / 74 8 例句分析 / 75 8.1 程序操作图示 / 75 8.1.1 检索语料例句 / 75 8.1.2 打开、保存文件夹 / 75 8.1.3 选择例句集来源、输入前后标记 / 76 8.1.4 单击运行程序 / 76 8.2 统计结果展示 / 77 9 用字统计分析 / 78 9.1 程序操作图示 / 78 9.1.1 打开语料库文件夹 / 78 9.1.2 设置保存结果文件夹及名称 / 79 9.1.3 运行能 / 80 9.2 统计结果展示 / 81 9.2.1的汉字使用的摘要报告 / 81 9.2.2 汉字分类使用情况 / 81 9.2.3 标点符号和汉字部件的使用情况 / 82 9.2.4 汉字字表的覆盖率情况 / 83 9.2.5 不同排序方式的字表 / 83 9.2.6 与其他字表对比的数据 / 85 10 用词用语统计分析 / 86 10.1 程序操作图示 / 86 10.2 统计结果展示 / 86 10.2.1 基本词语表 / 86 10.2.2 频次与词种数 / 87 10.2.3 高频词语用字统计 / 87 10.2.4 高频词语词长统计 / 88 10.2.5 覆盖率与词种数关系 / 88 10.2.6 词性及其频次的统计结果 / 89 10.2.7 词性及其词种数的统计结果 / 89 10.2.8 成语使用结果 / 89 10.2.9 与《汉语词汇与汉字等级大纲》(词汇大纲)对比 / 90 11 字词表对比分析 / 91 11.1 程序操作图示 / 91 11.1.1 选择对比项目和参数 / 91 11.1.2 打开、保存文件夹 / 91 11.1.3 单击运行程序 / 92 11.2 统计结果展示 / 92 11.2.1 频率差结果 / 92 11.2.2 频序比结果 / 93 11.2.3 用结果 / 94 12 字词表分布分析 / 95 12.1 程序操作图示 / 95 12.1.1 选择分布计算的大纲和项目 / 95 12.1.2 打开、保存文件夹 / 96 12.1.3 单击运行程序 / 96 12.2 统计结果展示 / 97 12.2.1 在《等级大纲》中的分布 / 97 12.2.2 在《新汉语考试大纲》中的分布 / 97 13 词语搭配抽取及分析 / 98 13.1 搭配抽取 / 99 13.1.1 程序操作图示 / 99 13.1.2 统计结果展示 / 99 13.2 搭配过滤 / 101 13.2.1 程序操作图示 / 101 13.3 搭配分析 / 102 13.3.1 程序操作图示 / 102 13.3.2 统计结果展示 / 102 14 词语按主题聚类 / 104 14.1 程序操作图示 / 104 14.1.1 打开、保存文件夹 / 104 14.1.2 选择聚类的底表和词语数 / 105 14.1.3 单击运行程序 / 105 14.2 统计结果展示 / 105 15 篇章风格统计分析 / 107 15.1 程序操作图示 / 108 15.1.1 打开、保存文件夹 / 108 15.1.2 输入特定字词 / 108 15.1.3 单击运行程序 / 108 15.2 统计结果展示 / 109 案例篇 16 国际汉语教学语料库建设 / 112 16.1 汉语口语教学语料库 / 112 16.1.1 话题库建设 / 112 16.1.2 话题分类、难度分级的常用会话资源库 / 113 16.2 商务汉语教材语料库 / 114 16.2.1 商务汉语教材语料库 / 114 16.2.2 商务能项目库 / 114 16.2.3 商务能项目分类语料库 / 115 16.3 中小学华文教材语料库 / 116 16.4 少儿汉语教材语料库 / 117 16.4.1 主题库 / 117 16.4.2 教材语料库 / 117 16.4.3 主题分类语料库 / 118 16.5 旅游汉语教材语料库 / 118 16.5.1 旅游汉语教材语料库 / 118 16.5.2 旅游汉语话题分类语料库 / 118 17 全球华语语料库建能研究 / 120 17.1 全球华语语料库建设的必要性和意义 / 120 17.2 全球华语语料库建设 / 122 17.2.1 语料库建设的基本原则 / 122 17.2.2 语料来源与获取方法 / 124 17.2.3 语料库构成及比例 / 125 17.2.4 语料库信息字段及存储格式 / 126 17.3 全球华语语料库深加工 / 127 17.3.1 选取核心库 / 127 17.3.2 分词标注词性、人工校对 / 128 17.3.3 基本字词信息统计 / 128 17.3.4 音资源标注处理 / 128 17.3.5 华裔学文和口语语料库偏误标注 / 129 17.4 全球华语语料库网络服台介绍 / 129 17.4.1 子语料库定制系统 / 129 17.4.2 网络版字词检索系统 / 129 17.4.3 网络版全文例句检索系统 / 129 17.4.4 音资源点播系统 / 130 17.5 结语 / 130 18 东南亚小学华文教材课文用字研究 / 132 18.1 语料和调查对象说明 / 132 18.2 各教材课文用字基本情况 / 133 18.2.1 字次与字种数 / 134 18.2.2 各教材前100 字用情况 / 134 18.2.3 各教材课文用字在《等级大纲》(汉字大纲)中的分布情况 / 136 18.2.4 两套教材课文用字对比 / 138 18.2.5 越南、泰国、印尼五套教材课文用字对比 / 139 18.3 各教材课文用字分年级情况 / 140 18.3.1 各教材分年级字次和字种数基本情况 / 140 18.3.2 分年级课文用字的《等级大纲》(汉字大纲)分布情况 / 142 18.3.3 课文用字字种数按年级增量情况 / 144 18.4 东南亚小学华文教材和中国小学语文教材课文用字对比 / 145 18.4.1 基本情况 / 146 18.4.2 分段的用调查 / 147 18.4.3 基于频序比的汉字使用对比分析 / 149 19 东南亚小学华文教材课文用词研究 / 151 19.1 马来西亚《华文》教材课文用词调查 / 151 19.1.1 基本情况 / 151 19.1.2 频次与词种数的关系 / 151 19.1.3 词语的覆盖率 / 152 19.1.4 高频词的词长分布 / 154 19.1.5 成语调查 / 155 19.1.6 课文用词与《等级划分》(词汇大纲)的比较 / 159 19.1.7 课文用词按年级统计情况 / 160 19.2 马来西亚《华文》教材课文用词与小学《语文》对比 / 161 19.2.1 基本情况 / 161 19.2.2 频次与词种数的关系对比 / 162 19.2.3 词语的覆盖率对比 / 163 19.2.4 高频词的词长分布 / 166 19.2.5 成语的对比分析 / 167 19.2.6 按年级对比马-《华文》与人教《语文》课文用词情况 / 168 19.2.7 高频词的频序比 / 170 19.3 东南亚不同层次小学华文教材对比 / 171 19.3.1 各层级教材课文用词基本情况对比 / 172 19.3.2 各层级教材课文用词按年级统计情况 / 178 19.3.3 各层级教材课文用词与《等级划分》(词汇大纲)的比较 / 187 19.4 结语 / 191 20 少儿汉语话题及话题词表构建 / 194 20.1 术语及语料库介绍 / 195 20.1.1 话题词表、话题种子词 / 195 20.1.2 词语聚类 / 195 20.1.3 话题词语、话题通用词、话题专类词 / 196 20.1.4 相关语料 / 196 20.2 少儿汉语话题与话题库的构建 / 199 20.3 少儿汉语话题词表的构建标准与方法 / 203 20.3.1 少儿汉语话题词表的构建理论 / 203 20.3.2 少儿汉语话题词表的选词标准 / 205 20.3.3 少儿汉语话题词表的分类 / 205 20.3.4 话题词表的构建方法 / 207 |
作者简介 |
刘华,男,1975年生,博士,英国谢菲尔德大学访问学者,暨南大学教授、暨南杰青、博士生导师、博士后合作导师,广东省\"千百十\"省级培养对象,国家语委语言文字应用研究优秀中青年学者,北京成像技术高精尖创新中心(首都师范大学)、北京语言资源高精尖创新中心(北京语言大学)研究员。 |
版权声明:本站提供的电子书下载/导购服务,如您发现侵犯了您的权益,请通过
举报侵权 进行处理 。
评论列表(0)