您当前的位置:首页>工业自动化>面向非结构化文本的知识发现:基于英汉双语平行语料库的句法级知识挖掘和抽取研究

面向非结构化文本的知识发现:基于英汉双语平行语料库的句法级知识挖掘和抽取研究

资料类别:工业自动化

文档格式:PDF电子版

文件大小:91.49 MB

资料语言:中文

更新时间:2021-02-02 08:56:35



推荐标签: 英汉 语料库 双语 文本 知识 结构化 基于 平行 抽取 句法 平行 基于

内容简介

面向非结构化文本的知识发现:基于英汉双语平行语料库的句法级知识挖掘和抽取研究
出版时间:2013年版
内容简介
《面向非结构化文本的知识发现:基于英汉双语平行语料库的句法级知识挖掘和抽取研究》从句法这一层面入手,基于面向网络获取的英汉双语平行语料这一非结构化数据,结合自然语言处理和文本挖掘的相应技术,在情报学、语言学方法和知识的基础上,针对词汇、简单短语、复杂短语这三个句法层级上的知识挖掘和抽取问题进行了探究,揭示了词汇句法组合的呈现规律,构建了简单短语结构抽取的模型,挖掘了面向复杂短语的类别知识。
目录
第一章 引言

一 课题提出

二 研究意义

三 研究方法

四 研究技术路线

五 研究创新点

六 本书结构和所用资源

第二章 相关研究综述

一 面向网络获取相关英汉双语平行语料的概述

二 词汇句法功能分布的相关研究概况

三 短语结构知识抽取的相关研究综述

四 类别知识挖掘的相关研究

第三章 面向网络的英汉双语平行语料库自动构建

一 确定获取语料网站和制定抓取词汇底表

二 网页的抓取和英汉双语平行语料的抽取

第四章 词汇句法功能分布复杂度呈现规律的知识挖掘

一 词汇句法功能分布复杂度统计数据源简介和句法结构调整

二 词汇句法功能分布复杂度的获取

三 词汇句法功能分布复杂度的洛特卡现象揭示

第五章 基于英汉双语平行语料库的短语结构知识抽取――以介宾短语结构为例

一 英汉双语介宾短语结构句法特征统计分析

二 有关介宾短语结构知识抽取模型构建的相关介绍和预处理

三 介宾短语结构知识抽取模型的确定和英汉双语介宾短语结构知识的抽取

第六章 基于英汉双语平行语料库的复杂短语级类别知识挖掘

一 面向英汉双语专门复杂短语平行语料的聚类和词干或词形算法确定

二 语料的预处理和相关统计

三 面向英汉双语复杂短语平行语料的词性选择

四 基于英汉双语复杂短语平行语料的类别知识挖掘

结语

参考文献

附录1 宾州大学英语树库的词性标记

附录2 宾州大学汉语树库的词性标记

附录3 清华大学树库词性标记

附录4 汉语自身特征模板

附录5 英语自身特征模板

附录6 汉语添加特征模板

附录7 英语添加特征模板

附录8 中国科学院和北京大学核心词性标注集

附录9 BNC统计语料样例

后记
上一章:精通MATLAB Simulink系统仿真 下一章:PLC快速入门

相关文章

面向教学的数学知识:基于数学发生发展的视角 GB/T 40035-2021 双语平行语料加工服务基本要求 数据挖掘与知识发现 第二版 基于知识的组合机床总体设计CAD系统的研究与开发 企业规模决定论-基于信息和知识的解释 中国近现代行业文化研究:技艺和专业知识的传承与功能 世界文化史知识 第三卷4:让历史的长河重新流淌--近代考古重大发现 电算化审计判断业绩研究:经历、知识、能力和电算化审计判断业绩的实