一、受限领域中文文本内容主题概念识别研究(论文文献综述)
赵京胜,宋梦雪,高祥,朱巧明[1](2022)在《自然语言处理中的文本表示研究》文中指出自然语言处理是人工智能的核心技术,文本表示是自然语言处理的基础性和必要性工作,影响甚至决定着自然语言处理系统的质量和性能.探讨了文本表示的基本原理、自然语言的形式化、语言模型以及文本表示的内涵和外延.宏观上分析了文本表示的技术分类,对主流技术和方法,包括基于向量空间、基于主题模型、基于图、基于神经网络、基于表示学习的文本表示,进行了分析、归纳和总结,对基于事件、基于语义和基于知识的文本表示也进行了介绍.对文本表示技术的发展趋势和方向进行了预测和进一步讨论.以神经网络为基础的深度学习以及表示学习在文本表示中将发挥重要作用,预训练加调优的策略将逐渐成为主流,文本表示需要具体问题具体分析,技术和应用融合是推动力.
王颖[2](2021)在《学术资源挖掘方法研究综述》文中研究指明[目的/意义]全面系统地对学术资源挖掘方法进行梳理,对比和分析不同挖掘方法,探讨应用和未来发展方向。[方法/过程]通过国内外文献数据库获取学术资源挖掘相关文献,对研究主题进行分析,从研究对象、挖掘维度、采用技术等角度对学术资源挖掘方法进行分类对比和分析,将现有挖掘方法分为纵向挖掘和横向挖掘两个维度,并进一步,探讨学术资源挖掘在学术检索、学术推荐、科技前沿识别与预测等方面的应用情况。[结果/结论]目前学术资源挖掘的主要研究对象仍为学术论文和专利,有待于加强不同类型资源的综合挖掘和跨领域挖掘,并且知识图谱、深度学习、大数据等技术在学术资源挖掘的应用研究还需要进一步突破。
赵羚[3](2021)在《中文经济合同中“责任”表述的局部语法研究》文中提出商务汉语教学一直是专门用途汉语教学的热点领域。合同文本是规范和约束商务活动的书面契约,属于典型的商务领域受限语言。“责任”是合同文本重要的功能之一,针对规范的合同语言现象细致的分析与对比,有助于丰富和深化特定领域的专门用途汉语教学与研究。本研究选取标的物为房屋的租赁合同和买卖合同,自建包含312篇合同文本共计61万字的专题语料库,结合Swales(1981)的语步分析、Sinclair(2004)的扩展意义单位和局部语法分析方法,考察有关“责任”表述在合同文本的分布、具体的语言型式及在不同类型文本的差异问题,主要包括(1)租赁合同和买卖合同的“责任”表述主要分布在文本的哪些部分?(2)租赁合同和买卖合同的“责任”表述局部语法型式分别有哪些?(3)租赁合同和买卖合同中“责任”表述局部语法型式有什么异同?研究发现:(1)结合合同法规的要求和对语料文本的分析,租赁合同有9个语步,买卖合同有13个语步。两类合同语步存在不同程度的缺失和杂糅现象。“责任”表述在两类合同的各语步中分布不均。(2)有关“责任”表述的语言标记共有8个,包括实义动词“负责、承担、负担”,情态动词“应(应该、应当)、必须(须)、需、不得”,短语“是|有|负……责任”,分别传递不同的语义韵。从责任语言标记出发总结概括的局部语法型式,租赁合同有29个,买卖合同有27个。两类合同“责任”表述的功能范畴一致,共有12个,功能范畴可根据实际的责任表述省减。合同文本存在四种责任类型,包括费用支付、标的物及产权管理、后果补救以及事件申请。(3)两类合同局部语法型式的功能范畴和责任类型一致,但在责任标记和局部语法型式的使用上存在差异。整合总结出的33个“责任”局部语法型式,可应用于对同类购销合同的“责任”表述发现。本研究以Firth(1957)的受限语言思想为基础,从微观层面对商务领域的合同文本有关“责任”表述进行局部语法分析,有助于精细刻画功能与语言形式的对应关系研究,这一分析过程同样适用于数据驱动的商务汉语学习。
张柳[4](2021)在《社交网络舆情用户主题图谱构建及舆情引导策略研究》文中研究表明习近平总书记在党的十九大上向全党全国人民发出了“坚定文化自信,推动社会主义文化繁荣兴盛”的伟大号召。“总体国家安全观”也被列为新时代背景下建设有中国特色社会主义的基本方略。对社交网络舆情的有效监管,是在新形势下应对国家安全环境新变化、新发展的必然要求。但是,网络的虚拟性,给社交网络舆情的监管带来了极大的难度。社交网络以及舆情用户的特性对社交网络舆情信息生态平衡有着较大的影响,如若不加以正确的引导与管理,会导致社交网络舆情生态系统恶化,甚至威胁社会和谐和国家稳定。如何有效地利用知识图谱构建社交网络舆情用户主题图谱系统模型,挖掘用户的潜在社群,确定用户的身份特征,并分析出用户的情感倾向,是舆情监管工作的有效切入点。本文结合文献分析法、实证研究法、知识图谱和机器学习等方法,构建社交网络舆情用户主题图谱并提出舆情引导策略。具体来说,本研究主要包括六个部分。首先,第三章提出社交网络舆情用户主题图谱系统模型,是全文的理论核心框架,指出社交网络舆情用户主题图谱系统模型的四个关键要素为信息环境、信息人、信息和信息技术,并通过用户社群图谱、用户身份图谱和用户情感图谱构成多维度的主题图谱;之后,第四章至第六章分别基于信息环境、信息人和信息,以“埃航空难”作为典型话题案例,运用实证分析方法,通过构建用户社群图谱、用户身份图谱以及用户情感图谱,研究社交网络舆情用户社群发现、用户身份识别以及情感演化规律,为第七章和第八章提供理论支撑;随后,第七章提出社交网络舆情生态性评价,并基于第四、五、六章的分析内容提出社交网络舆情生态性评价指标,为第八章提出的舆情引导策略提供理论支撑;最后,第八章提出社交网络舆情引导策略,为本文实践层面的落脚点。下面予以详细阐述。第三章社交网络舆情用户主题图谱系统构建。首先,提出社交网络舆情用户主题图谱的信息生态要素为环境要素、主体要素、客体要素以及技术要素;其次,结合知识图谱的相关理论,提出社交网络舆情用户主题图谱的实体识别、关系抽取、属性抽取以及模型构建;然后,指出社交网络舆情用户主题图谱分别由用户社群图谱、用户身份图谱和用户情感图谱三个维度构成,并从信息环境角度对社群发现、信息人角度对身份识别以及信息角度对情感演化进行深度分析,并在此基础上对整个社交网络舆情进行生态性评价;最后,提出社交网络舆情用户主题图谱系统模型。第四章社交网络舆情用户社群图谱构建及关系发现。本章基于信息环境理论,结合JS散度的LDA主题模型构建社交网络舆情用户社群图谱,并进行社群关系发现。采用实证研究法,对“埃航空难”话题下的舆情文本进行主题建模,利用困惑度指标确定舆情用户最优主题数,通过JS散度进行相似度度量,并将计算结果作为边权重,使用VOSviewer软件构建用户社群图谱,进一步划分多个网络社群,对网络社群的主题偏好以及用户特征进行分析讨论,并准确定位网络社群中的意见领袖。本章主要研究社交网络舆情中的信息环境,与第五、六章相呼应,为第七章社交网络舆情生态性评价指标(B1、B2)和第八章社交网络舆情社群的引导策略提供理论支撑。第五章社交网络舆情用户身份图谱构建及身份识别。本章基于信息人理论,结合LDA主题模型和朴素贝叶斯分类器模型构建社交网络舆情用户身份图谱,并对用户身份进行识别。首先,采用实证研究法,以突发事件“埃航空难”话题作为信息环境构建舆情空间,挖掘舆情用户转发评论文本的深层语义特征,剖析舆情用户的身份特征和传播特征;然后利用朴素贝叶斯分类器划分舆情用户类型,结合舆情生命周期,使用Neo4j绘制用户身份图谱,从而有效掌握社交网络舆情用户身份类型,并系统剖析社交网络舆情用户主题关注点及演化过程。本章主要研究社交网络舆情中的信息人,与第四、六章相呼应,为第七章社交网络舆情生态性评价指标(B3、B4、B5)和第八章社交网络舆情用户的引导策略提供理论支撑。第六章社交网络舆情用户情感图谱构建及情感演化。本章基于信息理论,基于字词向量的多尺度卷积神经网络构建社交网络舆情用户情感图谱,有效划分舆情用户情感倾向。首先,采用实证研究法,以突发事件“埃航空难”话题为例对舆情用户的转发评论信息进行情感分类,并对构建的舆情文本情感分类模型的准确性进行验证分析,并验证模型的优越性;然后,结合舆情文本的情感倾向与突发事件舆情发展周期,使用Gephi绘制用户情感图谱,动态展示社交网络舆情用户情感演化过程,全面分析网络舆情的发展与舆情用户的情感变化规律。本章主要研究社交网络舆情中的信息,与第四、五章相呼应,为第七章社交网络舆情生态性评价指标(B6)和第八章社交网络舆情情感的引导策略提供理论支撑。第七章社交网络舆情生态性评价。本章基于信息生态系统理论提出社交网络舆情生态性评价体系。采用综合模糊评价法,对突发事件“埃航空难”话题的爆发期阶段进行生态性评价,并对评价结果进行了分析,有效地解决了生态评价指标难以量化的问题,为生态性评价提供了可操作性的解决方案。本章与第四、五、六章相呼应,为第八章社交网络舆情情感的引导策略提供理论支撑。第八章社交网络舆情引导策略。本章基于第四、五、六章的研究结论,在第七章社交网络舆情生态性评价指标的基础上,提出社交网络舆情引导策略。首先从互联网及社交网络舆情生态性的角度指出目前存在的问题;然后分别从信息环境、信息人以及信息三个维度提出了引导策略。具体而言,本章从信息环境维度,提出加强衍生话题的监测、完善社交网络舆情话题推送和重视社群服务的社群引导策略;从信息人维度,提出完善用户类型化管理、发挥主流媒体的作用和完善意见领袖沟通机制的用户引导策略;从信息维度,提出社交网络内容精细化管理、重视舆情情感引导、完善健全舆情情感预警机制的情感引导策略。本文在理论层面,提出了社交网络舆情用户主题图谱的系统构建方式,为社交网络舆情主题图谱的构建提供理论基础及实践指导。从用户社群、用户身份、用户情感三个不同维度构建了社交网络舆情用户主题图谱系统模型,从而使得管控主体能够深入挖掘用户的潜在社群、有效地识别用户身份、准确地分析用户的情感倾向;同时,提出的生态性评价指标为社交网络舆情生态评价提供了可量化的评价标准,为社交网络舆情的科学管理提供了有效的理论支撑。在舆情的具体实践中,能够指导管控主体从社群、用户、情感三个层面入手,制定相应的管控策略,指引社交网络平台的系统开发方向,保障社交网络舆情生态朝着健康的方向发展。
刘雅姝[5](2021)在《多维视角的重大突发事件演变机理及应对策略研究》文中认为我国正处于社会转型阶段,各种利益诉求增多、热点问题和突发事件易发多发,对于自然灾害、事故灾难、公共卫生事件和社会安全事件等各类突发事件的研究已经成为总体国家安全观的重要组成部分。党的十九大报告强调“统筹发展和安全,增强忧患意识,做到居安思危,是我们党治国理政的一个重大原则”,2014年中共中央总书记、国家主席、中央军委主席、中央国家安全委员会主席习近平在主持召开中央国家安全委员会第一次会议时提出,坚持总体国家安全观,以人民安全为宗旨,走出一条中国特色国家安全道路。习近平指出,对于突发事件的应急管理“是国家治理体系和治理能力的重要组成部分,承担防范化解重大安全风险、及时应对处置各类灾害事故的重要职责,担负保护人民群众生命财产安全和维护社会稳定的重要使命”。可见,近年来国家安全思想已上升到重要的指导地位。当前我国已成为世界上各种事故灾害最严重的国家之一,面临巨灾风险的防范问题、公共卫生事件的挑战、社会安全类风险,灾害种类多,分布地域广,发生频率高,造成损失重。重大突发事件产生的诸多影响严重威胁我国社会稳定和人民生命财产安全。此背景下,重大突发事件的演变机理成为亟待解决的重大现实问题。立足于系统理论及5W1H方法,融合演化博弈理论、知识图谱理论、事理图谱理论,对重大突发事件的演变机理展开研究,构建重大突发事件演变机理模型,在对重大突发事件演变机理进行实证剖析的基础上,提出了重大突发事件的应对策略。(1)构建重大突发事件演变机理模型,基于系统理论及5W1H分析方法定义重大突发事件演变机理的内涵,突破传统从单一维度研究重大突发事件演变机理的局限,从系统观角度出发解读重大突发事件演变要素、要素之间的逻辑关系,提出重大突发事件的构成要素主要包括主体行为要素(Who)、事件舆情信息要素(What)、事件事理要素(Why)、事件时间要素(When)、事件环境要素(Where)。系统性地从Who(谁推动、促进了事件演变)、What(事件演变的内容是什么)、Why(事件演变的原因是什么)等多维度视角研究重大突发事件演变机理,最终基于事件的演变机理提出重大突发事件的应对策略(How)。(2)从重大突发事件主体行为的维度(Who)解读重大突发事件演变机理,解释了事件主体行为演变的问题。基于演化博弈理论分析了重大突发事件主体行为的演变过程,明确博弈主体是由政府为代表的决策方、以网民为代表的参与方、以媒体为代表的推动方三部分组成,对其博弈动因及影响因素进行分析并构建演化博弈模型。最后对所构建的主体之间的博弈模型进行仿真分析,模拟了事件发展热度、事件负面影响持续恶化、政府奖惩机制介入情景下三方主体行为的演变,得出的结论为重大突发事件应对中主体的管理策略提供现实参考依据。(3)从重大突发事件舆情信息演变维度(What)解读重大突发事件演变机理,解释了事件演变的内容问题。基于知识图谱理论,提出事件舆情知识图谱的构建框架模型及技术架构,进而构建事件舆情知识图谱,利用舆情知识图谱挖掘舆情知识三元组、网络传播的路径结构等内容。基于数据驱动思想,通过舆情知识的进一步提取分析得到事件舆情的话题演变、舆情知识网络结构演变等过程。所得事件舆情信息演变的分析结论有益于重大突发事件应对中的舆情治理。(4)从重大突发事件演变的事理逻辑维度(Why)解读重大突发事件演变机理,解释了事件演变的原因问题。基于事理图谱理论,采用事理图谱构建的相关方法,通过本体构建、事件抽取、事件关系抽取等步骤构建了面向重大突发公共卫生事件的事理图谱及其抽象事理图谱。基于重大突发事件事理图谱挖掘重大突发事件演变过程中的事理逻辑知识,深入分析事件之间的演变规律和模式,弥补以往未能详尽阐述重大突发事件在微观层面的演变机理和运行过程的短板。基于知识驱动视角,通过事件逻辑知识演变分析、事件演变的传导路径挖掘、事件演变的动因剖析等角度揭示重大突发事件的演变逻辑与规律,进而把握重大突发事件的发展脉络,为重大突发事件的应对与治理提供科学准确的依据。(5)提出重大突发事件的应对策略(How)。依据事件的演变机理得出重大突发事件的应对策略,阐述了在突发事件情景下应如何应对的问题。基于事件演变机理的研究内容,从三个层面提出了应对策略,(1)基于事件主体行为演变的主体管理策略;(2)基于重大突发事件舆情信息演变的舆情信息治理对策;(3)基于事件主体行为演变、事件舆情信息演变、事件演变的事理逻辑三个维度的重大突发事件管控问题。理论层面上,立足于系统理论、演化博弈理论、知识图谱理论、事理图谱理论、5W1H等多种理论方法,从事件的主体演变、事件舆情信息演变以及事件演变的事理逻辑挖掘等多维视角入手,构建重大突发事件演变机理模型。通过博弈论、知识图谱、事理图谱等方法剖析重大突发事件演变机理,阐述事件演变的本质,发现事件演变中存在的问题,最后提出重大突发事件演变的应对策略。基于数据驱动思想,多维度揭示重大突发事件的演变过程,基于知识驱动思想,挖掘重大突发事件演变逻辑,促进了传统研究范式转型,科学地认识重大突发事件的演变过程,可以完善重大突发事件分析研判和预警,提高事件的总体态势感知能力,具有重要的理论意义。在实践层面上,通过爬取微博、中国新闻网、世界卫生组织网站等平台上重大突发事件的相关数据,构建重大突发事件舆情知识图谱和事理图谱,基于真实数据对理论推演部分进行实证分析,最终服务于重大突发事件的应对。本文采用总-分-总的研究逻辑,将理论与实践相结合,以期为相关部门进行科学研判、精准施策提供依据,极大地提升了社会治理的智能化和专业化水平,促进和推动我国治理体系和治理能力现代化。
冉文浩[6](2021)在《面向文景转换的空间关系抽取与优化研究》文中研究表明
练斐[7](2021)在《德语词汇长度的共时特征与历时演化》文中研究指明语言是一个由多种单位构成的复杂系统,语音、词汇、句法等子系统各司其职。语言同时是一个动态、开放的协同系统,各种语言属性互相影响。语言本身及其属性都会受语内及语外因素影响而逐步发生演化。在语言系统中,词汇具有极其重要的作用。无论在听觉层面还是视觉层面,长度都是词汇最基础也最显着的属性之一。词汇长度不仅能在一定程度上反映语言单位的复杂性,呈现文本的整体特征,词长的变化还会引起其他语言属性发生改变,进而带来语言的整体演化。词长因其特殊性,得到了语言学、心理学、教育学、交际学、信息学等不同学科领域的关注。特别是计量语言学,将词长视为研究语言整体特性的关键切入点,相关研究层见叠出。计量语言学研究主张以大规模真实语言材料为研究对象,采用数学定量方法,以揭示人类语言的普遍特性、自适应机制、演化规律及其动因。现有词长计量研究已取得丰硕成果,但仍存在以下局限:首先,就研究工具而言,大部分研究对词汇定义的探讨有限,在选择词长测量单位时一般基于前人研究或个人经验,故存在测量方法不统一的情况,尚无研究对比不同测量方法对结果造成的影响;其次,在语料特征方面,目前考察的文本类型较为单一,以文学、书信为主,多数研究选用的语料规模较小,缺少系统的跨文体分析;再者,从研究维度上看,现有研究多从共时角度出发,且文章大多重数据而轻分析,鲜有基于统一、大量、真实语料的多维度历时考察。基于上述背景,本文聚焦17-19世纪德语词汇长度的共时跨文体特征及历时演化趋势,采用计量方法从平均词汇长度、词长分布特征、文本内部词长走势、词长与其他语言属性的关系等方面展开系统研究分析,尝试回答以下问题:1)在共时层面,不同文体的德语词汇长度具有哪些共性与差异?哪些因素造成了这些跨文体特征?2)在历时层面,1600年至1899年间,不同文体的德语词汇长度分别呈现怎样的演化趋势?其演化动因是什么?本研究语料选自德语文本历时语料库(Deutsches Textarchiv,简称DTA),涵盖四个文体类型,总词次约2000万。在开展主体实证研究之前,本文充分探讨词汇定义,据此设计实验方案,并利用DTA语料库中的“报刊”文体语料展开前测。结果表明,音节是最适合书面德语的词长测量单位。鉴于德语屈折变化丰富,词汇的形符、类符、词形、词目拥有各异的语言学意义,在具体研究时应根据研究目的选择适当的词汇形态作为测算对象。本研究在对DTA语料库“文学”“应用文”“学术”三类文体300年间的360篇语料进行跨文体、跨时段、多维度分析后,主要得出如下结论:1)在共时层面上,不同文体的词汇长度特征既有个性,又显共性。语料的差异性集中体现于整体的词长特征:无论是全文平均词长,还是各词类的平均长度,抑或多音节词的占比,同时期语料均呈现出“学术>应用文>文学”的特点。造成跨文体差异的主要原因是各文体不同的写作目的和语言使用偏好。三类文体语料的相似性主要体现在三个方面:第一,各文本的词汇长度分布特征非常相似,基于词形形符得到的分布数据可用统一数学模型(单位移超泊松分布)描述。第二,词汇长度与词汇使用频率存在相关性,“词长越短使用频率越高”的特点符合幂律函数=。上述两点均为“省力原则”在德语中的体现。第三,在一篇文本内部,词汇长度呈现出波动上升的趋势。这与写作策略及篇章信息结构相关,受到人类认知特点影响。2)从历时维度看,德语词汇长度在17-19世纪间整体呈增长趋势。具体而言,“学术”语料的词长历时增速最快,“应用文”次之,而“文学”语言的演化速率较为平缓。这主要是因为学术文本和应用文对语言表达的精准度要求更高,且为了满足新的表达需求常使用复合、派生等构词法创造新词,而这往往会令词汇长度增加。其次,不同词类的演化特征不尽相同。名词、形容词、动词的增速最快,说明上述词类具有较强的构词能力。此外,词长分布模型的参数值可以在一定程度上反映文体的历时演化特征。整体而言,语言是一个自适应动态系统,词汇长度的演化过程受到社会、文化、认知、交际等因素的共同作用。本研究首次从共时和历时两个方面系统考察了德语词汇长度的跨文体特征与演化规律,在思路方法、研究语料、研究视角等方面均有创新。在思路方法层面,本文重视“词”的概念探讨,以理论指导实践,基于先导研究结果优化主体研究设计,并找到了最适合书面德语的词长测量单位,有助于改变目前词长测量单位不统一、结果难对比的研究现状。从研究语料上看,本文突破目前时间维度、文体类型单一的局限性,在选择语料时兼顾同质性与异质性,系统考察边界条件对结果的影响。不仅验证了计量语言学的定律与假设,还佐证并拓展了文体学、历史语言学、语言类型学的相关观点。在研究视角方面,本文构建起多维的词长研究范式,以共时研究为横轴、历时研究为纵轴,结合语法、认知、社会、文化因素展开多维分析,并与现有研究充分对话,展开跨语言比较。既深化了对德语词汇文体特征及其演化规律的了解,也为人类语言共性探究提供了实证基础。
李燊[8](2019)在《基于主题模型的急性心肌梗塞病症识别及变化趋势预测研究》文中研究表明【目的】本研究基于急性心肌梗塞的临床文本数据,利用数据分析挖掘技术构建急性心肌梗塞病症识别和病情变化治疗模式,发现目前电子病历临床文本数据存在的问题并提出建议,产生的模式能为临床诊断和治疗提供决策支持,推动医疗卫生大数据的挖掘利用,同时也为临床文本数据挖掘分析提供新的思路。【方法】基于从湖北省宜昌市的某区域卫生信息平台中抽取的急性心肌梗塞电子病历数据,将所获数据按照不同病程节点进行分类,考虑其整体数据结构是否标准来有针对性的进行去重、排序、jieba分词等文本预处理,同时对预处理过程中发现目前临床文本数据存在的问题并提出相应建议。然后利用主题模型LDA对电子病历中的临床文本进行主题生成,利用困惑度函数最小原则得到最佳主题产出结果。再将各病程节点的结果进行分析综合,按入院-住院-出院的时间脉络将结果整理形成急性心肌梗塞的病症识别与病情变化治疗模式,运用JS距离计算文本相似度来对病症进行识别预测。最后通过与标准诊断、临床路径、不同病种、分词工具调整结果与否与生成的模式对比,验证其准确性、合理性、可用性,用以对急性心肌梗塞进行病症识别诊断和病情发展变化及相关治疗措施预测建议。【结果】通过不断地实验,生成了较为有效的急性心肌梗塞病症识别与病情变化治疗模式。与标准病症诊断内容相比,研究生成的入院病症具有普适性与合理性,能较为有效地对实际病症文本进行匹配;与未进行添加外部词典的分词和未分病程节点的数据产出的结果相比,添加词典和分病程节点后产出的结果更具有可解释性,减少了歧义问题;利用急性心肌梗塞测试集数据对模式进行测试,准确率达89%,用陈旧性心肌梗塞和心肌梗塞恢复期、冠状动脉粥样硬化性心脏病两个病种数据测试模型的准确率分别为71%和68%,结果显示模式能对区分急性心肌梗塞和其他不同病种有较好性能;利用标准急性心肌梗塞临床路径与研究产生的病症识别与病情变化治疗模式相比,生成的模式具有合理性,且模式中包含了临床路径里未提及的主诉查体等方面内容,更为详尽。【结论】中文领域的临床文本数据挖掘分析仍处于起步阶段,非常迫切需求挖掘临床文本中高价值的数据信息。本研究利用主题模型生成对急性心肌梗塞进行病症识别与预测的模式在验证测试时有良好的表现,相较以往类似的研究来说,产出结果更为准确合理,但还有进步的空间,同时也为中文临床文本挖掘提供了新的思路。
董洋溢[9](2018)在《面向智能决策应用的本体关键技术研究》文中提出本体作为一种知识管理模型已经被广泛应用在人工智能及知识工程领域,在知识共享、知识推理及智能辅助决策等方面发挥着重要作用。特别是在以知识推理为核心的航空指挥智能决策领域,需要对以中文文档形式描述的知识进行建模和管理。本体可以形式化地保存某个特定领域或任务中的术语及术语之间的语义关系,提供领域知识或任务问题的规范化、统一的描述,为知识共享、重用及推理提供模型支持。因此,在航空指挥智能决策领域中引入领域本体及任务本体构建相应的知识模型非常必要。但是,领域本体及任务本体的构建目前主要以人工方法为主,显然费时费力,半自动或自动的构建方法已成为研究热点。论文在部委航空指挥智能决策项目的支持下,主要围绕中文领域本体和任务本体的半自动构建展开了研究。显然,中文本体的半自动构建技术又涉及到两个关键问题,即术语及术语关系的抽取。因此,论文所研究的面向智能决策应用的本体关键技术主要包括:中文术语抽取、中文术语关系抽取、中文领域本体构建及中文任务本体构建。论文的主要贡献如下:1.提出了一种基于文本特征和复合统计量权值的领域术语抽取方法(Text Character and Statistic,TCS方法)。该方法首先对中文自然语言领域文档进行预处理,然后经过粗过滤提取出候选术语wij,最后综合考虑候选术语wij的文本特征和复合统计量,计算其综合权值WT(wij),并将WT(wij)值大于设定阈值的候选术语认定为最终的领域术语。实验结果表明,该方法能有效地将用户字典、文本特征及统计规则相结合,对特定领域的中文术语抽取效果较好,获得了较高的准确率。2.提出了一种基于混合余弦相似度核函数的术语关系抽取方法(Mixed Cosine Similarity Kernel,MCSK方法)。该方法通过计算中文自然语言领域文档中的句型词性语义序列余弦相似度,以及候选层次关系词语的余弦相似度,使用两者来构建混合余弦相似度核函数,将模板规则和半监督的机器学习方法相结合对术语间的层次关系进行抽取。实验证明,该方法改善了单独使用模板规则及机器学习方法的不足,通过较少的人工标注模板,获得较高准确率和性能。3.提出了一个领域本体的半自动构建方法。该方法的具体步骤包括:确定研究领域、中文知识文档预处理、核心术语挖掘、术语之间关系的抽取及聚类、OWL本体结构化及Protégé可视化修正。文中通过构建实例及和其他方法的对比,验证了方法的有效性及较高的任务完成率。4.提出了一个任务本体半自动构建方法及查询算法。文中深入讨论了任务的分解、动态IDEF3模型、任务本体的形式化描述以及任务本体的IDEF5建模等内容,并给出了一个任务本体半自动化构建方法及基于任务本体的查询算法。并通过实例验证了方法的有效性和较高的性能。为了验证所提出方法的有效性,设计并实现了一个基于本体的指挥决策支撑平台(Command and Decision Support platform Based on Ontology,简称CDSBO)的原型系统。该系统的仿真测试验证了本文所提出的中文术语及术语关系的抽取方法、领域本体及任务本体的半自动构建方法具有较高的性能,为本体在航空智能决策领域的推理任务提供了有力地支持,实现了从命令意图到决策方案的自动/半自动推演生成。
陈德鑫[10](2017)在《基于深度学习的在线医疗信息抽取研究》文中研究指明随着移动互联网技术的发展以及公众健康自我管理意识的转变,“互联网+医疗”在逐渐的改变着人们的生活方式。目前,国内外出现了许多在线医疗社区、医疗健康信息网站以及面向各种用户的医疗健康类APP,此类在线医疗健康平台主要提供医疗健康知识、疾病信息、药物信息、医疗健康新闻以及疾病问诊等服务。患者、医护人员、医疗科研人员等不同用户在在线医疗平台上描述、分享、咨询关于疾病、药物、治疗过程、治疗方案、新的医疗知识等医疗健康相关信息。国内较为知名的在线医疗平台有好大夫在线、春雨医生、寻医问药网等,每天都有大量的活跃用户。因此在线医疗平台上包含了海量的医疗相关数据,这些数据中蕴含着丰富的医疗价值。但是此类在线医疗文本大部分是非结构化文本,如何对此大量的非结构化的在线医疗文本进行进一步的挖掘和利用,医疗实体抽取、医疗实体关系抽取和医疗实体属性抽取通常是第一步。目前,信息抽取主要关注于社交媒体文本、新闻文本等日常领域,进行人名、地名、机构名等命名实体识别和相关研究;在医疗健康领域,信息抽取则主要针对电子病历、出院小结等专业医疗文本方面。对在线医疗数据进行信息抽取的研究则较少,主要使用隐马尔可夫、支持向量机、条件随机场等机器学习方法。传统的信息抽取方法都严重依赖于人工提取的特征,人工进行特征提取不仅花费大量的时间成本和经济成本,并且提取的特征有限。深度学习方法能够有效的解决此问题,可以通过深层神经网络完成对特征的自动提取和表示,且已被学者证明在对海量数据进行信息抽取时,基于深度学习的信息抽取效果优于传统的信息抽取方法。本论文分析了在线医疗文本子语言特点,在此基础上构建混合深度学习模型进行医疗实体、医疗实体关系和医疗实体属性抽取任务,通过实验和应用案例证明了本论文所构建模型的有效性和有用性。本论文的主要研究内容主要包含以下五个方面:(1)揭示在线医疗文本子语言特点,在此基础上构建基于深度学习的在线医疗信息抽取框架。使用统计分析方法对在线医疗文本和临床文本的子语言特点进行对比分析,从文本所包含的内容、词类的使用频率、文本包含的主要语义类别等角度研究在线医疗文本的子语言特点。以在线医疗文本子语言特点为基础,分析传统信息抽取方法的不足,并对不同的深度学习模型进行深入研究,选择适用的模型构建基于深度学习的在线医疗信息抽取框架。(2)构建混合深度学习模型CNN-BLSTM进行医疗实体抽取。以i2b2 2010评测会议对电子病历医疗实体识别任务的描述为理论基础,对在线医疗信息抽取任务中的医疗实体类型和医疗实体抽取目标进行了定义。根据医疗实体抽取任务的问题描述,构建了混合深度学习模型CNN-BLSTM框架。以在线医疗文本数据处理流程为基线,从数据预处理、医疗实体抽取的特征选择、医疗实体抽取的Feature Embedding处理、BLSTM层和标签序列输出五个阶段论述了基于CNN-BLSTM的医疗实体抽取过程。三组实验结果对比分析表明,本论文所构建的混合深度学习模型CNN-BLSTM对在线医疗文本中医疗实体抽取的效果优于CNN模型和BLSTM模型。(3)构建混合深度学习模型BLSTM-CNN进行医疗实体关系抽取。以i2b22010评测会议对电子病历医疗实体关系识别任务的描述为理论基础,对在线医疗信息抽取任务中的医疗实体关系类型和医疗实体关系抽取目标进行了定义。根据医疗实体关系抽取任务的问题描述,构建了混合深度学习模型BLSTM-CNN框架。在BLSTM-CNN模型框架中,首先通过BLSTM层对句子的每个词汇的输出特征进行整合完成对整个句子的语义学习;其次根据两个医疗实体在句子中的位置将句子特征划分为三个部分,使用CNN模型对此三个部分的特征进行卷积和池化,通过CNN的全连接层提取句子的特征向量;最后将句子特征向量送入到softmax分类器中进行医疗实体关系分类。实验结果证明,本论文所构建的混合深度学习模型BLSTM-CNN对在线医疗文本中医疗实体关系抽取效果好于BLSTM模型和CNN模型。(4)研究两种混合深度学习模型在医疗实体属性抽取任务上的应用。医疗实体属性抽取既可以看做序列标注问题,也可以看做分类问题。医疗实体属性抽取的特征选择与医疗实体抽取和医疗实体关系抽取有一定的差异,对医疗实体属性抽取的特征进行重新分析和选择后,分别使用两种混合深度学习模型对医疗实体属性进行抽取。实验结果表明混合深度学习模型CNN-BLSTM对在线医疗文本中医疗实体属性抽取的效果更佳。(5)探讨在线医疗信息抽取结果在疾病关联检测中的应用。本论文对在线医疗信息抽取结果的可能应用领域进行了总结,并选取疾病关联检测进行具体的应用论证。根据疾病医疗实体间的PIP关系类型,以及疾病的时间属性和患者的时间属性,识别疾病与疾病的共现关系和因果关系,最后以医疗健康指南和相关资料对检测到的疾病关联关系进行验证。
二、受限领域中文文本内容主题概念识别研究(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、受限领域中文文本内容主题概念识别研究(论文提纲范文)
(2)学术资源挖掘方法研究综述(论文提纲范文)
1 学术资源挖掘研究主题分析 |
2 学术资源挖掘方法分类分析 |
2.1 按研究对象分析 |
2.1.1 学术论文挖掘 |
2.1.2 专利文献挖掘 |
2.1.3 工具书挖掘 |
2.1.4 学术社交媒体挖掘 |
2.1.5 教育资源挖掘 |
2.1.6 综合挖掘 |
2.2 按研究维度分析 |
2.2.1 纵向挖掘 |
1)术语/实体抽取 |
2)专业领域元素识别 |
3)关系抽取 |
4)结构功能识别 |
5)语义建模 |
2.2.2 横向挖掘 |
1)分类 |
2)聚类 |
3)关联分析 |
4)知识网络构建 |
5)网络分析 |
2.3 按采用技术分析 |
3 学术资源挖掘方法应用分析 |
3.1 学术检索系统 |
3.2 学术推荐系统 |
3.3 科技前沿识别与预测 |
4 结论与展望 |
(3)中文经济合同中“责任”表述的局部语法研究(论文提纲范文)
致谢 |
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 研究目标 |
1.3 研究意义 |
1.3.1 理论意义 |
1.3.2 方法意义 |
1.3.3 实践意义 |
1.4 论文结构 |
第二章 文献综述 |
2.1 商务汉语研究 |
2.1.1 专门用途语言与商务汉语 |
2.1.2 商务汉语研究与教学 |
2.1.3 小结 |
2.2 合同语言研究 |
2.2.1 语言学视角 |
2.2.2 教学视角 |
2.2.3 小结 |
2.3 局部语法研究 |
2.3.1 局部语法的理论机制 |
2.3.2 局部语法的发展 |
2.3.3 小结 |
2.4 本章小结 |
第三章 研究设计 |
3.1 概念界定 |
3.1.1 合同相关定义 |
3.1.2 “责任”相关定义 |
3.1.3 局部语法相关定义 |
3.2 研究问题 |
3.3 研究方法 |
3.4 研究工具 |
3.4.1 文本清理工具 |
3.4.2 语料加工工具 |
3.4.3 语料标注与分析工具 |
3.4.4 有限状态自动机构画工具 |
3.5 研究步骤 |
3.5.1 语料处理及统计阶段 |
3.5.2 局部语法描写阶段 |
3.5.3 对比分析阶段 |
3.6 小结 |
第四章 两类合同的“责任”分布 |
4.1 租赁合同 |
4.1.1 合同文本语步结构 |
4.1.2 “责任”表述在各语步的分布 |
4.1.3 责任人在各语步的分布 |
4.1.4 小结 |
4.2 买卖合同 |
4.2.1 合同文本语步结构 |
4.2.2 “责任”表述在各语步的分布 |
4.2.3 责任人在各语步的分布 |
4.2.4 小结 |
第五章 两类合同“责任”表述局部语法分析 |
5.1 租赁合同“责任”标记 |
5.1.1 责任标记的频次 |
5.1.2 责任标记的特点 |
5.1.3 小结 |
5.2 租赁合同“责任”局部语法结果与分析 |
5.2.1 实义动词 |
5.2.2 情态动词 |
5.2.3 短语 |
5.2.4 小结 |
5.3 买卖合同“责任”标记 |
5.3.1 责任标记的频次 |
5.3.2 责任标记的特点 |
5.3.3 小结 |
5.4 买卖合同“责任”局部语法结果与分析 |
5.4.1 实义动词 |
5.4.2 情态动词 |
5.4.3 小结 |
第六章 两类合同对比分析 |
6.1 词汇-语法型式 |
6.2 功能范畴体系 |
6.3 局部语法型式 |
6.4 语义韵分析 |
6.5 购销合同检验 |
6.6 局部语法的教学启示 |
第七章 结论 |
7.1 研究发现 |
7.1.1 合同“责任”表述分布 |
7.1.2 “责任”局部语法分析 |
7.1.3 租赁和买卖合同异同 |
7.1.4 创新点 |
7.2 研究局限及展望 |
7.2.1 研究局限 |
7.2.2 未来展望 |
参考文献 |
附录一 商务汉语教材 |
附录二 租赁合同样例 |
附录三 买卖合同样例 |
附录四 购销合同样例 |
(4)社交网络舆情用户主题图谱构建及舆情引导策略研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景与选题意义 |
1.1.1 研究背景 |
1.1.2 选题意义 |
1.2 国内外研究现状 |
1.2.1 国内外社交网络舆情研究现状 |
1.2.2 国内外网络舆情知识图谱研究现状 |
1.2.3 研究现状评述 |
1.3 研究内容与方法 |
1.3.1 研究内容 |
1.3.2 研究方法 |
1.3.3 研究对象 |
1.4 研究技术路线图 |
第2章 相关概念及理论基础 |
2.1 社交网络舆情的相关概念 |
2.1.1 社交网络舆情的内涵 |
2.1.2 社交网络舆情用户 |
2.1.3 社交网络舆情的特征 |
2.1.4 社交网络舆情演化过程 |
2.2 主题图谱的相关概念 |
2.2.1 知识图谱的内涵 |
2.2.2 主题图谱的内涵 |
2.2.3 主题模型的内涵 |
2.3 突发事件的相关概念 |
2.3.1 突发事件的内涵 |
2.3.2 突发事件的类型 |
2.3.3 突发事件的特征 |
2.4 信息生态的相关理论 |
2.4.1 信息生态的内涵 |
2.4.2 信息生态系统 |
2.4.3 信息生态因子 |
2.4.4 信息生态链 |
2.5 本章小结 |
第3章 社交网络舆情用户主题图谱系统模型 |
3.1 社交网络舆情用户主题图谱的信息生态要素 |
3.1.1 社交网络舆情用户主题图谱的环境要素 |
3.1.2 社交网络舆情用户主题图谱的主体要素 |
3.1.3 社交网络舆情用户主题图谱的客体要素 |
3.1.4 社交网络舆情用户主题图谱的技术要素 |
3.1.5 社交网络舆情用户主题图谱信息生态要素模型 |
3.2 社交网络舆情用户主题图谱构建 |
3.2.1 社交网络舆情用户主题图谱的实体识别 |
3.2.2 社交网络舆情用户主题图谱的属性抽取 |
3.2.3 社交网络舆情用户主题图谱的关系抽取 |
3.2.4 社交网络舆情用户主题图谱的模型 |
3.3 社交网络舆情用户主题图谱构成 |
3.3.1 社交网络舆情用户社群图谱 |
3.3.2 社交网络舆情用户身份图谱 |
3.3.3 社交网络舆情用户情感图谱 |
3.3.4 社交网络舆情生态性及评价 |
3.4 主题图谱系统模型构建 |
3.5 本章小结 |
第4章 社交网络舆情用户社群图谱构建及社群发现 |
4.1 社交网络舆情用户社群图谱问题的提出 |
4.2 社交网络舆情用户社群发现模型 |
4.2.1 LDA主题模型 |
4.2.2 相似度度量 |
4.3 社交网络舆情用户社群图谱模型构建 |
4.3.1 社交网络舆情用户社群图谱建模思想 |
4.3.2 基于LDA主题模型的社交网络舆情用户社群图谱模型 |
4.4 研究设计 |
4.4.1 数据来源 |
4.4.2 数据采集 |
4.4.3 数据处理 |
4.5 数据结果 |
4.5.1 确定最优主题数 |
4.5.2 计算JS散度 |
4.5.3 构建用户社群图谱 |
4.6 讨论分析 |
4.6.1 社交网络社群主题偏好分析 |
4.6.2 社交网络社群用户特征分析 |
4.6.3 社交网络社群意见领袖识别 |
4.7 本章小结 |
第5章 社交网络舆情用户身份图谱构建及身份识别 |
5.1 社交网络舆情用户身份图谱问题的提出 |
5.2 社交网络舆情用户身份识别模型 |
5.2.1 LDA语义特征挖掘 |
5.2.2 身份特征和传播特征构建 |
5.2.3 朴素贝叶斯分类器 |
5.3 社交网络舆情用户身份图谱模型构建 |
5.3.1 社交网络舆情用户身份图谱建模思想 |
5.3.2 基于LDA和朴素贝叶斯的用户身份图谱模型 |
5.4 研究设计 |
5.4.1 数据来源 |
5.4.2 数据采集 |
5.4.3 数据处理 |
5.4.4 舆情事件概况及周期划分 |
5.5 数据结果 |
5.5.1 用户关注主题划分 |
5.5.2 用户身份识别 |
5.5.3 构建用户身份图谱 |
5.6 讨论分析 |
5.6.1 社交网络舆情用户身份分类 |
5.6.2 社交网络舆情用户主题关注点比较 |
5.6.3 社交网络舆情用户关注点演化分析 |
5.7 本章小结 |
第6章 社交网络舆情用户情感图谱构建及情感演化 |
6.1 社交网络舆情用户情感图谱问题的提出 |
6.2 社交网络舆情用户情感分类模型 |
6.2.1 中文分词与词向量训练 |
6.2.2 卷积神经网络 |
6.3 社交网络舆情用户情感图谱构建模型 |
6.3.1 社交网络舆情用户情感图谱建模思想 |
6.3.2 基于字词向量的多尺度卷积神经网络的社交网络舆情用户情感图谱模型 |
6.4 研究设计 |
6.4.1 数据来源 |
6.4.2 数据处理 |
6.4.3 模型设置 |
6.4.4 文本向量训练与选择 |
6.4.5 整体架构与算法流程 |
6.5 基于卷积神经网络超参数确定及实验对比 |
6.5.1 卷积核尺寸 |
6.5.2 激活函数 |
6.5.3 Dropout随机失活率与迭代次数 |
6.5.4 实验结果对比 |
6.6 数据结果 |
6.6.1 情感分类结果 |
6.6.2 构建用户情感图谱 |
6.7 讨论分析 |
6.7.1 社交网络舆情用户内容特征分析 |
6.7.2 社交网络舆情用户情感分布分析 |
6.7.3 舆情用户的情感演化分析 |
6.8 本章小结 |
第7章 社交网络舆情生态性评价 |
7.1 社交网络舆情生态性评价问题的提出 |
7.2 评价指标体系构建 |
7.2.1 信息环境维度 |
7.2.2 信息人维度 |
7.2.3 信息维度 |
7.2.4 信息技术维度 |
7.3 评价方法及过程 |
7.4 实证分析 |
7.4.1 样本选择 |
7.4.2 评价过程 |
7.5 社交网络舆情生态性评价结果分析 |
7.5.1 一级指标得分情况分析 |
7.5.2 二级指标得分情况分析 |
7.6 本章小结 |
第8章 社交网络舆情引导策略 |
8.1 社交网络舆情引导问题的提出 |
8.1.1 社交网络舆情引导的重要性 |
8.1.2 社交网络舆情引导生态性挑战 |
8.1.3 社交网络舆情引导体系 |
8.2 社交网络舆情社群的引导策略 |
8.2.1 加强衍生话题的监测 |
8.2.2 完善社交网络舆情话题推送 |
8.2.3 重视网络社群服务的提升 |
8.3 社交网络舆情用户的引导策略 |
8.3.1 完善用户类型化管理 |
8.3.2 发挥主流媒体的作用 |
8.3.3 建立意见领袖的沟通机制 |
8.4 社交网络舆情情感的引导策略 |
8.4.1 社交网络内容精细化管理 |
8.4.2 重视舆情情感引导 |
8.4.3 完善舆情情感预警机制 |
8.5 本章小结 |
第9章 研究结论与展望 |
9.1 研究结论 |
9.2 研究创新点 |
9.3 研究局限及展望 |
参考文献 |
作者简介与研究成果 |
致谢 |
(5)多维视角的重大突发事件演变机理及应对策略研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景与研究意义 |
1.1.1 研究背景 |
1.1.2 选题意义 |
1.2 国内外研究现状综述 |
1.2.1 国内重大突发事件演变机理研究进展 |
1.2.2 国外重大突发事件演变机理研究进展 |
1.2.3 国内外基于事理图谱的事件演变研究进展 |
1.2.4 研究现状综述 |
1.3 研究内容与研究方法 |
1.3.1 研究对象 |
1.3.2 研究内容 |
1.3.3 研究方法 |
1.4 论文研究思路与技术路线 |
1.5 论文创新点 |
第2章 相关理论基础 |
2.1 知识图谱理论 |
2.2 事理图谱理论 |
2.3 5W理论 |
2.4 演化博弈理论 |
2.5 自然语言处理 |
2.6 本章小结 |
第3章 多维视角的重大突发事件演变机理基本内容 |
3.1 重大突发事件内涵与分类 |
3.1.1 重大突发事件内涵 |
3.1.2 重大突发事件分类 |
3.1.3 重大突发事件特征 |
3.2 重大突发事件演变的构成要素及关系 |
3.2.1 事件演变的构成要素 |
3.2.2 事件构成要素的关联关系 |
3.3 多维视角的重大突发事件演变机理 |
3.3.1 演变机理内涵 |
3.3.2 演变机理模型 |
3.4 本章小结 |
第4章 重大突发事件的主体行为演变 |
4.1 问题描述 |
4.2 事件主体的演化博弈分析 |
4.2.1 博弈主体分析 |
4.2.2 博弈动因及影响因素分析 |
4.3 假设与模型构建 |
4.3.1 模型假设 |
4.3.2 模型构建 |
4.3.3 均衡点与稳定性分析 |
4.4 模拟仿真分析 |
4.4.1 重大突发事件热度影响下的主体行为演化路径 |
4.4.2 负面影响持续恶化情景下主体行为演化路径 |
4.4.3 政府介入采取奖惩机制情景下主体行为演化路径 |
4.5 本章小结 |
第5章 重大突发事件的舆情信息演变 |
5.1 舆情信息演变概述 |
5.1.1 重大突发事件舆情信息 |
5.1.2 重大突发事件舆情知识图谱 |
5.2 重大突发事件舆情知识图谱理论模型构建 |
5.2.1 重大突发事件舆情知识图谱构建框架模型 |
5.2.2 重大突发事件舆情知识图谱技术架构 |
5.3 重大突发事件舆情知识图谱模式层构建 |
5.3.1 重大突发事件舆情本体构建 |
5.3.2 重大突发事件舆情知识图谱模式层构建 |
5.4 重大突发事件舆情知识图谱数据层构建 |
5.4.1 数据源选取及采集 |
5.4.2 数据预处理 |
5.5 基于重大突发事件舆情知识图谱的舆情演变分析 |
5.5.1 重大突发事件舆情的时序演变分析 |
5.5.2 重大突发事件舆情知识图谱传播路径结构解析 |
5.5.3 重大突发事件舆情知识图谱内容分析 |
5.5.4 重大突发事件的舆情评论话题分析 |
5.6 本章小结 |
第6章 重大突发事件演变的事理逻辑 |
6.1 重大突发事件的事理图谱研究范式 |
6.1.1 重大突发事件事理图谱内涵 |
6.1.2 重大突发事件事理图谱构建的逻辑模型 |
6.1.3 重大突发事件事理图谱的事理挖掘流程 |
6.2 重大突发事件事理图谱构建 |
6.2.1 数据采集与预处理 |
6.2.2 事理图谱构建流程 |
6.3 重大突发事件抽象事理图谱构建 |
6.3.1 事件泛化 |
6.3.2 公共卫生事件抽象事理图谱 |
6.3.3 事件知识存储 |
6.4 重大突发事件演变的事理逻辑分析 |
6.4.1 因果事件提取 |
6.4.2 事件的因果逻辑知识分析 |
6.4.3 事件演变的传导路径挖掘 |
6.4.4 事件演变的动因剖析 |
6.5 重大突发事件的动态演变 |
6.5.1 事件演变的动力学流图构建 |
6.5.2 仿真结果分析 |
6.6 本章小结 |
第7章 基于事件演变机理的重大突发事件应对策略 |
7.1 基于事件演变机理的重大突发事件应对概述 |
7.1.1 重大突发事件应对的时代背景 |
7.1.2 重大突发事件应对的目标 |
7.1.3 重大突发事件应对的特征 |
7.2 基于事件演变机理的重大突发事件应对思路及过程 |
7.2.1 重大突发事件应对思路 |
7.2.2 重大突发事件应对过程 |
7.3 重大突发事件主体管理策略 |
7.3.1 重大突发事件的参与用户管理 |
7.3.2 重大突发事件的传播平台管理 |
7.3.3 重大突发事件的政府管理 |
7.4 重大突发事件的舆情信息治理研究 |
7.4.1 事件舆情信息治理问题的提出 |
7.4.2 重大突发事件舆情信息治理对策 |
7.5 重大突发事件管控模型构建 |
7.5.1 重大突发事件管控的重大意义 |
7.5.2 重大突发事件管控面临的挑战 |
7.5.3 重大突发事件的管控模型 |
7.5.4 重大突发事件管控模型功能 |
7.6 本章小节 |
第8章 总结与展望 |
8.1 研究结论 |
8.2 研究局限 |
8.3 研究展望 |
参考文献 |
作者简介及科研成果 |
致谢 |
(7)德语词汇长度的共时特征与历时演化(论文提纲范文)
致谢 |
中文摘要 |
摘要 |
1 绪论 |
1.1 词长研究述评 |
1.1.1 多学科词长研究 |
1.1.2 词长计量研究 |
1.1.3 德语词长计量研究 |
1.1.4 现有研究评述 |
1.2 研究目的、研究问题和研究意义 |
1.3 论文结构 |
2 理论基础与研究方法 |
2.1 理论基础 |
2.1.1 词的界定 |
2.1.2 词长分布定律 |
2.1.3 词长-词频协同定律 |
2.1.4 门策拉-阿尔特曼定律 |
2.2 研究语料 |
2.2.1 德语简史 |
2.2.2 语料来源及预处理说明 |
2.2.3 语料的同质性与异质性 |
2.3 计量指标与统计方法 |
2.3.1 词长测量单位 |
2.3.2 词长类型 |
2.3.3 软件与程序 |
3 德语词长测量方式的差异性分析 |
3.1 测量单位对词长测量结果的影响 |
3.1.1 基于字母数的词长测量结果 |
3.1.2 基于字位数的词长测量结果 |
3.1.3 基于音节数的词长测量结果 |
3.1.4 结果对比及相关性探究 |
3.2 词形变化对词汇长度的影响 |
3.2.1 基于词形形符和词目形符的测量结果 |
3.2.2 基于词形类符和词目类符的测量结果 |
3.2.3 结果对比与成因探究 |
3.3 小结与讨论 |
4 德语词长特征的跨文体共时考察 |
4.1 平均词长的跨文体共时对比 |
4.2 词类平均词长的跨文体共时对比 |
4.3 词长分布的跨文体共时对比 |
4.3.1 动态词长分布 |
4.3.2 静态词长分布 |
4.4 词长与词频关系的跨文体共时对比 |
4.5 文本内部词长特征的跨文体对比 |
4.6 小结与讨论 |
5 德语词长演化的跨文体历时考察 |
5.1 平均词长的跨文体历时对比 |
5.2 词类平均词长的跨文体历时对比 |
5.3 词长分布的跨文体历时对比 |
5.4 小结与讨论 |
6 结语 |
6.1 研究概述 |
6.2 研究结果 |
6.3 创新、局限与展望 |
参考文献 |
附录1 主要术语德汉对照表 |
附录2 超长词列表(选) |
作者简历 |
(8)基于主题模型的急性心肌梗塞病症识别及变化趋势预测研究(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景 |
1.2 研究意义 |
1.3 国内外研究现状 |
1.3.1 急性心肌梗塞临床文本分析 |
1.3.2 临床文本主题模型 |
1.3.3 研究现状小结 |
1.4 研究目标和内容 |
1.4.1 研究目标 |
1.4.2 研究内容 |
1.5 研究技术路线 |
1.6 论文结构安排 |
2 相关概念与技术基础 |
2.1 主题模型 |
2.2 困惑度函数 |
2.3 JENSEN-SHANNON距离 |
2.4 中文分词 |
3 研究方法与数据来源 |
3.1 研究方法 |
3.2 数据来源 |
4 数据描述与预处理 |
4.1 数据描述 |
4.2 数据预处理 |
4.2.1 去重排序 |
4.2.2 分词 |
4.3 数据情况总结 |
5 急性心肌梗塞病症识别与预测模式构建 |
5.1 主题模型构建 |
5.1.1 困惑度选取最优主题 |
5.1.2 各节点数据的主题内容 |
5.2 病情变化治疗模式构建 |
5.3 病症识别与病情预测 |
6 急性心肌梗塞病症识别与病情变化治疗模式测试 |
6.1 标准诊断症状与入院病症比较 |
6.2 外部词典与病程节点对模型结果的影响 |
6.3 病症识别准确率测试 |
6.4 生成的模式与临床路径对比 |
7 讨论与展望 |
7.1 讨论 |
7.1.1 主题模型在中文临床文本挖掘应用 |
7.1.2 基于中文临床文本的病症识别与病情预测 |
7.1.3 中文临床文本数据质量 |
7.1.4 本研究创新点 |
7.1.5 本研究局限 |
7.2 展望 |
致谢 |
参考文献 |
综述:主题模型在临床文本挖掘及病症识别的研究现状 |
参考文献 |
附件1 攻读学位期间发表论文目录 |
(9)面向智能决策应用的本体关键技术研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 选题背景及问题的提出 |
1.1.1 选题背景 |
1.1.2 问题的提出 |
1.2 国内外研究现状分析 |
1.2.1 领域术语的抽取 |
1.2.2 领域术语关系的抽取 |
1.2.3 本体的构建及应用 |
1.2.4 存在问题分析 |
1.3 研究内容及意义 |
1.3.1 研究内容 |
1.3.2 研究意义 |
1.4 论文研究思路及组织结构 |
1.4.1 研究思路 |
1.4.2 组织结构 |
1.5 本章小结 |
2 中文本体领域术语的抽取 |
2.1 概述 |
2.1.1 术语的基本概念 |
2.1.2 术语与领域本体的关系 |
2.1.3 术语抽取的研究背景和意义 |
2.2 术语的文本特征 |
2.2.1 相关定义 |
2.2.2 术语的总体分布特征 |
2.2.3 术语的语言特征及权值 |
2.3 术语统计量的设定 |
2.3.1 TF-IDF统计量 |
2.3.2 信息熵统计量 |
2.4 术语的抽取模型及算法 |
2.4.1 术语抽取模型 |
2.4.2 粗粒度模板规则 |
2.4.3 文本特征和复合统计量权重计算 |
2.4.4 术语自动抽取模型算法 |
2.5 实验数据及分析 |
2.5.1 实验数据 |
2.5.2 实验结果分析 |
2.5.3 与其他方法的对比 |
2.6 本章小结 |
3 中文本体术语关系的抽取 |
3.1 概述 |
3.1.1 术语关系的基本概念 |
3.1.2 研究背景和意义 |
3.2 术语关系的相关定义和描述 |
3.2.1 相关定义 |
3.2.2 词语语义相似度 |
3.2.3 中文句型的相似度 |
3.2.4 ICTCLAS词性标注集 |
3.2.5 层次关系模板规则 |
3.3 相似度的计算 |
3.3.1 层次关系动词相似度的计算 |
3.3.2 句型相似度的计算 |
3.3.3 混合余弦相似度核函数 |
3.4 MCSK模型及实现算法 |
3.4.1 MCSK模型处理过程 |
3.4.2 MCSK模型实现算法 |
3.5 实验数据及分析 |
3.5.1 实验数据 |
3.5.2 实验结果分析 |
3.5.3 与其他方法的对比 |
3.6 本章小结 |
4 中文领域本体的构建 |
4.1 概述 |
4.1.1 研究背景及意义 |
4.1.2 本体自动化构建相关工具 |
4.1.3 本体的评价方法 |
4.2 中文领域本体半自动构建流程设计 |
4.2.1 确定研究领域 |
4.2.2 中文知识文档预处理 |
4.2.3 核心术语抽取 |
4.2.4 术语关系抽取及聚类 |
4.2.5 OWL本体结构化 |
4.3 中文领域本体半自动构建实例 |
4.3.1 文档预处理过程及实例 |
4.3.2 核心术语抽取算法及实例 |
4.3.3 术语层次关系抽取及聚类算法实例 |
4.3.4 OWL本体结构化算法实例 |
4.3.5 本体可视化管理实例 |
4.4 方法的评价 |
4.5 本章小结 |
5 中文任务本体的构建及查询 |
5.1 概述 |
5.2 任务的分解和管理 |
5.2.1 任务的分解 |
5.2.2 任务的状态转换 |
5.3 任务的静态数据建模 |
5.3.1 静态数据类型 |
5.3.2 静态数据模型 |
5.4 任务的动态数据建模 |
5.4.1 任务的动态IDEF3 模型设计 |
5.4.2 任务的动态IDEF3 模型实例 |
5.5 任务本体的构建方法 |
5.5.1 任务本体的形式化描述 |
5.5.2 时序关系的形式化描述 |
5.5.3 任务本体的构建流程设计 |
5.6 任务本体的构建实例 |
5.6.1 中文任务文档预处理 |
5.6.2 核心术语(活动)与关系抽取 |
5.6.3 任务本体IDEF5 建模 |
5.6.4 OWL本体结构化 |
5.6.5 任务本体的可视化实验 |
5.7 任务本体的查询算法及实例 |
5.7.1 概念扩展规则 |
5.7.2 概念扩展算法 |
5.7.3 基于概念扩展的任务本体查询算法 |
5.7.4 查询算法应用实例及分析 |
5.8 方法的评价 |
5.9 本章小结 |
6 基于本体的指挥决策支撑平台 |
6.1 概述 |
6.1.1 指挥决策领域的挑战 |
6.1.2 基于本体的知识管理需求 |
6.2 基于本体的指挥决策需求分析 |
6.2.1 数据流分析 |
6.2.2 用例图分析 |
6.2.3 基于本体的指挥决策功能分析 |
6.3 基于本体的指挥决策系统设计 |
6.3.1 基于本体的总体架构图 |
6.3.2 基于领域本体的命令识别 |
6.3.3 基于任务本体的决策方案查询 |
6.3.4 基于本体的决策方案推理 |
6.3.5 指挥方案的查询和显示 |
6.4 基于本体的指挥决策系统实现 |
6.4.1 指挥命令类battleCommand |
6.4.2 态势信息类sitMatrix |
6.4.3 指挥方案类battlePlan |
6.4.4 本体推理类inferPattern |
6.5 基于本体的决策系统仿真 |
6.5.1 指挥员功能的仿真 |
6.5.3 管理员功能的仿真 |
6.5.4 仿真结果分析 |
6.6 本章小结 |
7 结论 |
7.1 论文主要结论 |
7.2 下一步研究展望 |
参考文献 |
致谢 |
攻读博士学位期间发表的学术论文和参加科研情况 |
(10)基于深度学习的在线医疗信息抽取研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 选题背景及意义 |
1.1.1 选题背景 |
1.1.2 选题意义 |
1.2 国内外研究现状分析 |
1.2.1 相关文献梳理 |
1.2.2 网络信息抽取研究进展 |
1.2.3 深度学习及其在自然语言处理领域的研究 |
1.2.4 医疗健康信息抽取研究 |
1.2.5 国内外研究述评 |
1.3 研究目标、内容、方法、重难点与创新点 |
1.3.1 研究目标 |
1.3.2 研究内容 |
1.3.3 研究方法与工具 |
1.3.4 本论文的重难点 |
1.3.5 本论文的创新之处 |
1.4 本章小结 |
2 在线医疗信息抽取的理论基础 |
2.1 在线医疗平台基本理论 |
2.1.1 在线医疗平台的概念 |
2.1.2 在线医疗平台的功能与类型 |
2.1.3 在线医疗平台中的用户成员角色 |
2.2 网络信息抽取理论 |
2.2.1 网络信息抽取的概念及应用 |
2.2.2 网络信息抽取的内容 |
2.2.3 网络信息抽取的方法 |
2.2.4 网络信息抽取的评价指标 |
2.3 深度学习理论 |
2.3.1 深度学习的概念及应用 |
2.3.2 深度学习模型结构 |
2.3.3 深度学习方法的优点 |
2.4 本章小结 |
3 在线医疗信息抽取框架 |
3.1 在线医疗信息子语言特点分析 |
3.1.1 在线医疗信息子语言特点分析框架 |
3.1.2 在线医疗信息内容分析 |
3.1.3 在线医疗信息词类统计分析 |
3.1.4 在线医疗信息语义类别分析 |
3.1.5 在线医疗信息子语言特点总结 |
3.2 基于在线医疗信息子语言特点的在线医疗信息抽取框架 |
3.2.1 传统信息抽取方法存在的问题 |
3.2.2 基于深度学习的在线医疗信息抽取方法体系 |
3.2.3 在线医疗信息抽取框架 |
3.3 本章小结 |
4 基于深度学习的医疗实体抽取 |
4.1 问题描述 |
4.1.1 医疗实体类型定义 |
4.1.2 医疗实体抽取目标 |
4.2 混合深度学习模型CNN-BLSTM的构建 |
4.2.1 卷积神经网络模型CNN |
4.2.2 双向长短记忆模型BLSTM |
4.2.3 CNN-BLSTM模型框架 |
4.3 基于CNN-BLSTM的医疗实体抽取过程 |
4.3.1 数据预处理 |
4.3.2 医疗实体抽取的特征选择 |
4.3.3 医疗实体抽取的Feature Embedding处理 |
4.3.4 BLSTM层 |
4.3.5 标签序列输出 |
4.4 基于CNN-BLSTM的医疗实体抽取实验 |
4.4.1 实验数据集及实验环境 |
4.4.2 医疗实体抽取实验 |
4.5 本章小结 |
5 基于深度学习的医疗实体关系抽取 |
5.1 问题描述 |
5.1.1 医疗实体关系类型定义 |
5.1.2 医疗实体关系抽取目标 |
5.2 混合深度学习模型BLSTM-CNN的构建 |
5.3 基于BLSTM-CNN的医疗实体关系抽取过程 |
5.3.1 数据预处理 |
5.3.2 医疗实体关系抽取特征选择 |
5.3.3 医疗实体关系抽取Feature Embedding处理 |
5.3.4 CNN处理层 |
5.3.5 医疗实体关系分类 |
5.4 基于BLSTM-CNN的医疗实体关系抽取实验 |
5.5 本章小结 |
6 基于深度学习的医疗实体属性抽取 |
6.1 问题描述 |
6.1.1 医疗实体属性类型定义 |
6.1.2 医疗实体属性抽取目标 |
6.2 基于混合深度学习模型的医疗实体属性抽取 |
6.3 基于混合深度学习模型的医疗实体属性抽取实验 |
6.4 本章小结 |
7 在线医疗信息抽取的应用案例 |
7.1 在线医疗信息抽取的应用领域 |
7.2 在线医疗信息抽取结果在疾病关联检测中的应用 |
7.2.1 疾病关联检测的问题描述 |
7.2.2 疾病关联检测过程 |
7.2.3 疾病关联检测结果分析 |
7.3 本章小结 |
8 总结与展望 |
8.1 论文总结 |
8.2 研究不足之处 |
8.3 研究展望 |
参考文献 |
攻博期间发表的科研成果目录 |
致谢 |
四、受限领域中文文本内容主题概念识别研究(论文参考文献)
- [1]自然语言处理中的文本表示研究[J]. 赵京胜,宋梦雪,高祥,朱巧明. 软件学报, 2022(01)
- [2]学术资源挖掘方法研究综述[J]. 王颖. 现代情报, 2021(12)
- [3]中文经济合同中“责任”表述的局部语法研究[D]. 赵羚. 北京外国语大学, 2021
- [4]社交网络舆情用户主题图谱构建及舆情引导策略研究[D]. 张柳. 吉林大学, 2021(01)
- [5]多维视角的重大突发事件演变机理及应对策略研究[D]. 刘雅姝. 吉林大学, 2021(01)
- [6]面向文景转换的空间关系抽取与优化研究[D]. 冉文浩. 重庆邮电大学, 2021
- [7]德语词汇长度的共时特征与历时演化[D]. 练斐. 浙江大学, 2021(08)
- [8]基于主题模型的急性心肌梗塞病症识别及变化趋势预测研究[D]. 李燊. 华中科技大学, 2019(03)
- [9]面向智能决策应用的本体关键技术研究[D]. 董洋溢. 西北工业大学, 2018(02)
- [10]基于深度学习的在线医疗信息抽取研究[D]. 陈德鑫. 武汉大学, 2017(06)