搜索结果: 31-45 共查到“知识库 计算语言学”相关记录1071条 . 查询时间(2.868 秒)
System design and evaluation methodologies receive significant attention in natural language
processing (NLP), with the systems typically being evaluated on a common task and against
shared data set...
Graph-Based Word Alignment for Clinical Language Evaluation
Graph-Based Word Alignment Clinical Language Evaluation
2016/2/23
Among the more recent applications for natural language processing algorithms has been the analysis of spoken language data for diagnostic and remedial purposes, fueled by the demand for simple, objec...
Effectively Integrating the Online Medium for Young Learners
Effectively Integrating Online Medium Young Learners
2016/1/27
Effectively Integrating the Online Medium for Young Learners.
基于超图的文本摘要与关键词协同抽取研究
超图 文本摘要 关键词抽取 协同抽取
2016/2/24
文本摘要和关键词抽取是自然语言处理领域的两个重要研究课题,它们均以生成描述文本主旨内容的精简信息为目标。尽管这两个任务目标相似,但它们通常被作为两个独立的问题分别研究,而较少考虑其彼此间的自然关联性。尽管已有学者提出了基于图模型的协同抽取方法,该方法同时考虑了句子与句子、词与词、句子与词之间的各种关系,以迭代强化的方式同时生成文本摘要和关键词,但现有模型大多仅限于表达句子与词之间的各种二元关系,而...
TIP-LAS是一个开源的藏文分词词性标注系统,提供藏文分词、词性标注功能。该系统基于条件随机场模型实现基于音节标注的藏文分词系统,采用最大熵模型,并融合音节特征,实现藏文词性标注系统。经过试验及对比分析,TIP-LAS藏文分词系统词性标注系统取得了较好的实验效果,系统的源代码可以从网上获取。希望该研究可以推动藏文分词、词性标注等基础工作的发展,提供一个可以比较、共享的研究平台。
文言信息的自动抽取:基于统计和规则的尝试
文言标注 文本分类 规则模型 统计模型
2016/2/24
文言信息的自动抽取有利于语言监测和语料库构建。同时本文的计算研究也验证了语言学界关于汉语文白系统连续性的自省结论。本文将从混合语料中标注文言文的问题视为短文本分类的问题进行处理。使用基于规则和基于统计的方法对文言文、白话文本进行分类。基于规则的方法中,本文考虑文言常用虚词和句式的影响。在基于统计的分类方法中,本文对N-gram、朴素贝叶斯、最大熵、决策树模型的性能进行了研究。结果表明监测虚词系统的...
基于知识话题模型的文本蕴涵识别
文本蕴涵识别 话题模型 蕴涵分类 推理知识
2016/2/24
本文分析了现有基于分类策略的文本蕴涵识别方法的问题,并提出了一种基于知识话题模型的文本蕴涵分类识别方法。其假设是:文本可看作是语义关系的组合,这些语义关系构成若干话题;若T→H,说明T和H具有相似的话题分布,反之说明T和H不具有相似的话题分布。基于此,我们将T和H的蕴涵识别问题转化为相关话题的生成过程,同时将文本推理知识融入到抽样过程,由此建立一个面向文本蕴涵识别的话题模型。实验结果表明基于知识话...
领域外话语的开放性、口语化以及表达多样性,使得现有的限定领域口语对话系统不能很好地处理超出领域话语。该文提出了一种限定领域口语对话系统协处理方案,基于人工智能标记语言AIML,设计一套理解开放语义用户话语的理解模板,并对未匹配话语基于话语相似度进行理解模板分类,进而采用扩展有限状态自动机处理模式,结合对话流程上下文的状态及信息,实现理解模板到应答模板的转换,改变了单纯模板匹配方法在对话流程控制方面...
基于卷积神经网络的微博情感倾向性分析
深度学习 情感倾向性分析 卷积神经网络 词向量
2016/2/24
微博情感倾向性分析旨在发现用户对热点事件的观点态度。由于微博噪声大、新词多、缩写频繁、有自己的固定搭配、上下文信息有限等原因,微博情感倾向性分析是一项有挑战性的工作。本文主要探讨利用卷积神经网络进行微博情感倾向性分析的可行性,分别将字级别词向量和词级别词向量作为原始特征,采用卷积神经网络来发现任务中的特征,在COAE2014任务4的语料上进行了实验。实验结果表明,利用字级别词向量及词级别词向量的卷...
基于语义依存图库的兼语句句模研究
句模 语义分析 语义依存图 兼语句
2016/2/24
句子语义分析是语言研究深入发展的客观要求,也是当前制约语言信息处理技术深度应用的主要因素。在探索深层语义分析方法的基础上,文章根据汉语的特点提出了语义依存图深层语义分析理论,并且根据这种理论,建立了一个包含30,000个句子的语义依存图库。以兼语句为重点研究对象,文章研究了语料库中所有纯粹的兼语句所对应的句模情况,进而试图构建基于语义依存图的句模系统,总结句型和句模的映射规则,从而为更好的建立语义...
基于SVM和泛化模板协作的藏语人物属性抽取
人物属性抽取 藏语语言处理 SVM 层次分类器
2016/2/24
该文提出了一种基于SVM和泛化模板协作的藏语人物属性抽取方法。该方法首先构建了基于藏语语言规则的模板系统,收集了包括格助词、特殊动词等具有明显语义信息的特征建设模板并泛化。针对规则方法的局限性,该文在模板的基础上,采用SVM机器学习方法,设计了一种处理多分类问题的层次分类器结构,同时对多样化的特征选取给予说明。最后,实验结果表明,基于SVM和模板相结合的方式可以对人物属性抽取的性能有较大提高。
话题内相关文本的内容计算
话题定义 文本表示 话题检测 文本内容计算
2016/2/24
信息的暴涨给文本处理带来了更多的挑战。话题检测能够把大量的信息以话题为单位有效地组织起来,然而最终用户有可能并不需要涉及某一话题的所有文本,而是仅仅关心该话题的具体内容。在我们根据相关文本智能表达话题内容推送给用户之前,自动从相关文本中挑选符合用户需求的文本是一个非常有意义的工作。本文致力于相同话题文本之间的内容比较,目的是有效地选出满足需求的文本。我们通过对话题进行重新定义,并根据此定义设定了话...
融合热点话题的微博转发预测研究
转发行为 转发预测 热点话题
2016/2/24
微博转发行为是实现信息传播的重要方式,微博转发预测对微博影响力分析、微博话题分析具有重要价值。现有微博转发预测研究大多围绕消息属性、用户属性等微博自身特征,本文提出融合热点话题的微博转发预测方法,对背景热点话题内容和传播趋势对用户转发行为的影响进行量化分析,提出融合背景热点信息的转发兴趣、转发活跃度、行为模式等特征,并基于分类算法建立了面向热点话题相关微博的转发预测模型,在真实数据上的实验结果表明...