线性模型中基于稳健诊断的局部影响分析

一、线性模型中基于稳健诊断的局部影响分析(英文)（论文文献综述）

夏章^[1]（2021）在《社区2型糖尿病患者自我管理小组活动长期效果研究》文中提出研究背景糖尿病自我管理小组活动具有成本低、效率高的特点。目前有关小组活动长期效果评价的研究较为少见,小组活动长期效果尚不明确。对已有研究检索发现,多数研究报告了临床指标,对糖尿病预后不良事件报告较少,故本次研究将分两部分开展,通过系统综述来评估自我管理对患者临床指标的长期影响,通过随访研究来评估自我管理对患者预后不良事件的长期影响,以补充系统综述分析结果的不足。研究目的1.研究自我管理小组活动对社区2型糖尿病患者血糖、血脂、血压、体重控制、生存质量、心血管病事件、自我管理依从性、就诊次数、死亡事件的长期影响。分析患者糖化血红蛋白控制的相关影响因素。2.研究自我管理小组活动对社区2型糖尿病患者并发症、合并症及死亡的影响。分析干预组患者糖尿病并发症、合并症和死亡发生的相关影响因素。3.探讨自我管理小组活动改进方法和干预重点。研究方法1.采用系统综述的方法,检索建库至2020年7月28日发表的社区2型糖尿病患者自我管理小组活动随机对照试验和群随机对照试验。文献筛选与研究质量评价过程由两名研究者独立开展。使用Cochrane Q检验和不一致指数检验评估异质性,若纳入研究异质性小或异质性大但异质性来源可识别,则选用均数差值（mean difference,MD）作为效应指标,采用Meta分析的方法计算总体效应值,并进行Meta回归与亚组分析、敏感性分析和发表偏倚分析;若纳入研究异质性大且来源无法识别,则只进行描述性分析。参照证据推荐分级的评估、制定与评价系统评估证据质量。使用Revman5.3、Microsoft Excel 2019 绘图,使用 Stata16.0、GRADE Profiler 3.6 分析数据。2.采用现场调查和信息系统匹配的方法,对北京市房山区2014年7月-11月参与自我管理小组活动试验的500名研究对象进行随访。通过现场调查收集患者人口学信息、糖尿病并发症、合并症信息,通过基本公共卫生服务系统确认患者存活情况,通过北京市死因监测系统收集患者死亡信息。采用logistic回归模型分析小组活动与糖尿病并发症、合并症及死亡发生的关系。以自我管理患者为分析对象,分析其糖尿病并发症、合并症、死亡发生的相关影响因素及交互作用。使用SAS9.4软件进行分析。研究结果1.系统综述共纳入25项研究5 071名随访患者。2项研究为低风险,1 1项研究为风险不确定,12项研究为高风险。分析结果显示,自我管理小组活动对患者糖化血红蛋白[MD=-0.39%（95%CI:-0.56,-0.21）]、舒张压[MD=-1.32 mmHg（95%CI:-2.44,-0.21）]、收缩压[MD=-1.92 mmHg（95%CI:-3.47,-0.37）]的长期效果有统计学差异（均P<0.05）,研究开展后12个月降低效果最显着,其中糖化血红蛋白可能受发表偏倚影响,舒张压和收缩压结果不够稳健。小组活动对患者总胆固醇、甘油三酯、高密度脂蛋白胆固醇、体质指数、体重的长期效果均无统计学差异（均P>0.05）,其中体质指数结果不够稳健且可能受发表偏倚影响。患者低密度脂蛋白胆固醇、生存质量、自我管理依从性、就诊次数、心血管病事件、死亡事件无法进行Meta分析。除收缩压、舒张压、总胆固醇、体重证据质量等级为中外,其他指标证据质量等级为低或极低。医生/护士/专家开展小组活动[MD=-0.53%（95%CI:-0.79,-0.27）]、小组活动持续开展[MD=-0.87%（95%CI:-0.79,-0.27）]是糖化血红蛋白降低有利因素。家属/好友参与、小组患者数≤1 0人、患者年龄<60岁是糖化血红蛋白降低的可能有利因素。2.现场调查随访362人,随访率为72.40%,信息系统匹配483人,随访率为96.60%。分析结果显示,控制协变量后,自我管理小组活动对患者糖尿病并发症、合并症、死亡发生无统计学差异（均P>0.05）。对自我管理患者而言,自我效能得分≥80分是防止糖尿病肾病[OR=0.06（95%CI:0.01,0.59）]、糖尿病下肢血管病变[OR=0.06（95%CI:0.01,0.55）]发生的保护因素;生活在城镇[OR=0.24（95%CI:0.07,0.89）]是防止并发症发生的保护因素。相比家庭人均月收入1000元以下,收入在 1000-3000 元[OR=0.28（95%CI:0.08,0.98）]是防止高血脂发生的保护因素;家庭人均月收入在1000-3000元[OR=0.36（95%CI:0.14,0.88）]、≥3000 元[OR=0.15（95%CI:0.03,0.70）]、入组前自报发生某些合并症[OR=0.20（95%CI:0.07,0.52）]是防止其他合并症发生的保护因素。居住地为城镇[OR=0.16（95%CI:0.04,0.55）]是防止入组后死亡发生的保护因素。家庭人均月收入与自我效能得分、家庭人均月收入与入组前合并症自报情况、居住地与糖尿病病程存在相加效应交互作用。研究结论1.糖尿病自我管理小组活动对患者糖化血红蛋白降低有一定的长期效果,对血压降低可能有长期效果,对血脂、体重控制、糖尿病并发症、合并症、死亡未见影响,对患者生存质量、自我管理依从性、就诊次数的长期影响尚无法定论。2.医生/护士/专家开展小组活动、小组活动持续开展是糖化血红蛋白降低有利因素,自我效能高是防止糖尿病并发症发生的保护因素,收入水平低、农村居民是糖尿病并发症、合并症及死亡发生的危险因素。3.建议自我管理小组活动由医生/护士/专家来组织开展,以患者自我效能提高为核心目标,同时建立小组活动持续开展机制,以期实现自我管理效果长期维持。4.建议把低收入人群和农村居民作为今后糖尿病干预重点人群。

唐美华^[2]（2021）在《基于神经网络的EFL教材文本复杂度分级模型的构建》文中指出文本复杂度是母语和外语阅读教学研究中的重要构念,也是应用语言学领域的重点和难点,其研究的主要目的是为学习者匹配与之语言水平相适应的阅读文本,以提高学习效果。现有研究存在如下不足:1)研究对象不清,将文本难度与文本复杂度混为一谈。文本难度指读者对文本的加工难度,受读者个体语言发展、语言能力、动机等主观因素的影响;而文本复杂度指文本自身的复杂度,是构成文本的各个语言子系统交互作用的结果,可以从客观量化的角度加以考察。2)所考察特征有待扩充。尽管研究者们不再囿于借助传统可读性公式来评判文本复杂度,开始将词汇、句法特征纳入考量范围,却很少关注语篇复杂度。3)以构建线性模型的方法为主,模型使用的特征有限,存在解释力不高、适用性不广的缺陷。本研究聚焦文本复杂度,除关注词汇、句法维度外,加入语篇复杂度特征,在特征优化的基础上,探究神经网络算法在文本复杂度分级模型构建中的应用,并对模型的性能和泛化能力加以考察。围绕以下3个研究问题展开:1)表征文本复杂度的语言特征如何确定?2)训练语料的文本复杂度分级是否合理?3)基于所选语言特征和训练语料构建的复杂度分级模型的性能和泛化能力如何?本研究借助Kyle团队研发的文本处理软件,以BNC baby为参照语料库,对词汇、句法和语篇复杂度等细颗粒度指标进行提取,采用主成分分析法对指标进行降维优化,共确定17个用以构建模型的主成分特征。经专家咨询和文献参考,选择《新概念英语》作为模型的训练语料,经聚类和方差分析后,该语料的分级合理性得以验证。在确定了模型输入特征和训练语料之后,本研究采用不同分类算法分别构建模型并对比其性能,发现基于神经网络的文本复杂度分级模型性能最优,10折交叉验证的精确率、召回率和F1均值分别达到92.10%、91.11%和90.77%。同时,与基于常见传统可读性公式和其它单维度特征构建的模型相比,基于本研究特征集构建的模型具有显着优势,在各性能评估指标上均高出20至30个百分点。最后,本研究特征集和建模方法对其它国内教材数据集具有较好的分级能力,且在多个不同数据集（如大学英语测试文本、二语写作文本以及国外教育报纸）的分级预测上也有不错的表现,具有较强的通用性和泛化能力。本研究将多元语言特征与神经网络相融合,构建文本复杂度分级模型,为文本复杂度研究提供了一条新的路径。研究成果不仅对文本复杂度研究具有一定的理论意义,在应用语言学领域也具有较高的应用价值,可以为学生阅读材料的选择、教材编写和改编以及阅读课程规划和测试设计提供参考。

杨磊^[3]（2021）在《通用加工树模型假设检验的统计等价理论及其应用》文中研究说明随着数学心理学的发展,认知心理测量模型成为了认知心理研究的重要组成部分,它促进了认知心理测量理论的发展,使得认知心理测量更精准。多项式加工树（multinomial processing tree,MPT）模型是一种用于测量和分析潜在认知过程的有效统计建模方法。它是基于发生逻辑开发的分类数据测量模型,也是针对人类潜在认知加工过程构建的认知心理测量模型,并将其直观地构建为多项式加工树的形式。目前MPT模型已在认知心理学、认知神经学等领域得到了成功的应用,特别是在源监测、再认启发、存储提取、联合再认等范式中获得了极大的成功。从结构上,MPT 模型分为二链 MPT（binary MPT,BMPT）模型和多链 MPT（multi-link MPT,MMPT）模型。许多学者分别从MPT模型的表示形式、参数类型、个体差异等方面进行了扩展研究,并统称为通用加工树（general processing tree,GPT）模型。在许多复杂的认知任务中,人们观测到的响应或行为通常是几种不同认知过程共同加工的结果,而表层的统计分析（如t检验、ANOVA等）虽揭示了其组间差异,但无法区分观测响应是由认知加工导致的还是由反向倾向或猜测导致的,而GPT模型不但能够区分这些混淆而且能够对潜在认知加工过程各阶段的潜在认知能力进行测量和检验。为了检验潜在认知能力的差异,GPT模型的假设检验是通过模型的参数约束来实施的。虽有许多学者对其进行了研究但仍有一些问题需要探讨。首先,GPT模型的参数约束类型和重新参数化过程系统深入地探讨。虽然已有研究讨论了 GPT模型的相等约束和次序约束,但在广度上GPT模型参数约束的类型缺少系统研究,在深度上其重新参数化过程的统计等价和共同特征有待深入挖掘。其次,GPT模型假设检验的统计等价问题需要深入研究,特别是MMPT模型。MMPT模型假设检验问题已有的处理方法是将MMPT模型等价转化为BMPT模型,但这通常会导致认知加工结构发生变化、模型参数失去了原有心理学含义且等价模型结构过于复杂。最后,GPT模型的计算机编码即字符串编码唯一性问题和假设检验的字符串处理也有待解决。目前,除了 GPT模型简单的相等约束和次序约束可以计算机自动实施外,其它参数约束均需要建模者手工构建,其主要原因是缺少有效的模型编码解码算法,故GPT模型的字符串编码和解码唯一性的问题也需要进行探索。故为了更好地使用GPT模型测量潜在认知过程,本文重点关注GPT模型假设检验的统计等价理论和字符串编码及其应用的探讨,主要研究的内容如下所示:第一,整合了 GPT模型基本概念的形式化描述,为GPT模型假设检验问题的探讨提供了形式规范。本文归纳并整合了 GPT模型的四要素、参数分类模型、数学等价、统计等价、和分裂变换等基本概念并给出了形式化描述（用统一的数学表达式来表示多个相似过程或结果）。同时,也探讨了 GPT模型的识别性、模型方程唯一性和统计等价构建定理等基本理论。第二,系统探讨了 GPT模型参数约束类型,并基于参数约束重新参数化的共同特征提出了代表树模型。在GPT模型框架下,潜在认知加工能力的差异性检验可通过GPT模型的假设检验来完成,而GPT模型的假设检验需要通过其参数约束来实施。故本文从参数约束关系、约束参数向量间关系和约束参数个数这三个维度探讨了 GPT模型假设检验的参数约束类型,并分别讨论了每种参数约束类型的重新参数化过程以及其认知加工结构的递归特性,并根据这些认知加工结构的共同特征提出了 GPT模型参数约束的四个代表树模型。通过对代表树模型的递归嵌套可以方便处理GPT模型参数约束条件的等价转化问题,能够为GPT模型的统计分析提供增长工具箱。第三,归纳出GPT模型参数约束表示定理和GPT模型统计封闭性的等价转化过程。为了确保潜在认知能力测量结果的有效性,GPT模型假设检验的实施需要模型的变换过程是统计等价的。为了尽可能地维持GPT模型的原有认知过程,参数约束的等价变换仅针对约束参数所在约束节点的认知加工结构进行统计等价变换,而非约束节点的认知加工结构保持不变。根据GPT模型参数约束各个类型及其重新参数化的统计等价变换过程,归纳了 GPT模型统计封闭性的等价转化过程,同时给出了参数约束的形式定义和表示定理,并总结出GPT模型假设检验的基本步骤和化繁为简的统计等价转化思路（次序约束→乘积约束→相等约束→常数约束→无约束）。进而可把带有参数约束的GPT模型统计等价地转化为无约束条件的GPT模型,完成了 GPT模型统计封闭性的等价过程。第四,提出了新的具有唯一性的GPT模型字符串语言编码解码算法。为了使GPT模型能够被计算机识别并自动执行其假设检验问题,GPT模型通常需要编码为字符串语言的形式。故本文以已有研究的基础上给出了 GPT模型字符串编码的递归定义、编码和解码规则,以及GPT模型字符串语言参数子树判别定理和节点子树判别定理及其证明。新算法不但能够实现GPT模型编码和解码字符串具有唯一性,而且使得字符串语言能很好地捕获整个GPT模型类。并根据GPT模型参数约束重新参数化过程的递归特性归纳出基于代表树模型字符串词语的递归替换规则。新的替换规则可以通过字符串词语的递归替换可实现GPT模型参数约束的统计等价变换。本文对GPT模型字符串编码解码算法的改进,既扩展了 GPT模型的字符串编码理论,有利于GPT模型的计算机编程、存储和传输。此外,基于代表树模型的模块化编码也为计算机自动实施GPT模型参数约束提供了可行性和理论支持,丰富了 GPT模型的统计分析理论和技术。最后,通过对图片优势效应源监测、文学作品中年龄差异源监测和四则混合运算认知测量三个心理学研究实例,展示了本文所探讨的GPT模型假设检验统计等价理论的可行性与实用性。在实例1图片优势的源监测中,通过实例展示了同一实验组内GPT模型相等约束和次序约束等价过程,并在已有研究结果的基础上提出了新的假设检验问题,GPT模型分析结果不但支持图片优势效应,而且进一步给出了次序约束量化指标的估计值和置信区间。实例2是文学作品阅读中年龄差异的源监测,并展示了同一实验组内和不同实验组间GPT模型假设检验的等价过程,不但分析了年轻人和好老年人对文学作品人物角色记忆的源监测分析,而且也验证了已有结果同时还提供了更加丰富的解释。实例3是用GPT模型测量了小学生四则混合运算的认知能力,同时展示了 GPT模型字符串编码具体实施过程,并将GPT模型分析的结果与独立样本t检验结果进行了比较,t检验仅能得到乘除题和混合题存在显着差异,而GPT模型还可得到两个班级在计算正确率参数和计算顺序参数存在显着差异。由此可知,GPT模型分析能够为潜在认知加工测量中提供更丰富的诊断信息,通过GPT模型可以支持和增强作者的原始分析和特定的统计测量,或至少可作为传统实证测量的补充。综上所述,本文系统地探讨了潜在认知测量模型GPT模型的统计等价理论和应用,即探讨了 GPT模型假设检验的参数约束类型及其重新参数化过程,提出了重新参数化的代表树模型,同时提出了 GPT模型字符串编码算法及基于代表树模型的替换规则。换句话说,根据GPT模型典型认知加工结构的共同特征归纳出参数约束等价变换的四个代表树模型。为了便于GPT模型假设检验的计算机编码,提出了新的GPT模型字符串编码和解码算法,新的编码算法使得GPT模型编码具有唯一性且大大简化了模型的存储和传输,同时总结了基于代表树模型字符串词语模块的递归替换规则。新的编码算法和递归替换规则为GPT模型假设检验问题的计算机传输、编码和自动执行提供了理论支撑。总之,本文的研究完善了 GPT模型潜在认知测量理论,扩展了 GPT模型的统计分析理论和统计建模技术,丰富了 GPT模型对潜在加工能力的可解释性,更有利于了 GPT模型的应用和推广。这将使潜在认知加工测量的研究推向更深层次,进一步完善认知心理测量模型的模型分析的理论体系。

苏美红^[4]（2021）在《面向回归的稳健正则化方法研究》文中提出科学技术的飞速发展为数据的采集和整理带来了便捷,与此同时给数据分析也带来了巨大的挑战.回归分析作为研究变量之间相关关系的一种数学工具,成为了数据分析与研究的主要工具之一.回归分析的主要任务是对回归系数/参数的估计,即根据已知观测值确定样本之间的相关关系,从而对未知数据进行预测或解释.正则化方法作为一种参数估计模型,在很多领域得到了广泛的应用.其中最着名的是基于平方损失的正则化估计方法,但由于平方函数的敏感性,使得该类方法稳健性不足.因此,当模型误差服从重尾分布或数据中含有异常点时,如何提高回归参数估计的稳健性,进而最大程度提高回归模型预测的准确度和可解释性,是一个非常值得研究的科学问题.本学位论文主要聚焦于两方面的研究.一方面针对线性模型中的参数估计稳健性问题展开研究,特别地,本文将主要关注于加权正则化方法中权值的选取问题,以及分位数回归中的变量相关性问题.通过解决权值选取问题和变量相关性问题来提高模型的稳健性,以达到最终提高回归模型预测准确度的目的.另一方面将围绕广义回归模型展开研究,具体将从回归模型构建角度考虑来提高模型的稳健性,主要包括如何将邻近样本信息融合到模型中;以及当回归模型中加入变量与变量之间的交互项时,如何解决重尾分布问题以保证模型的稳健性等.主要研究工作概括如下:（1）提出一种自加权稳健正则化方法.加权正则化方法在一定程度上提高了模型的稳健性,然而,权值选取不当可能会导致参数估计出现较大偏差,进而降低模型预测的准确度.通过在加权正则化模型中加入关于权重的自适应正则项,使得模型能够根据样本损失大小自主决定其权值,一方面解决了权值求解问题,另一方面提高了模型预测的精度.在理论方面,证明了估计的一致性.在求解方面,基于交替迭代算法,给出问题求解的坐标下降算法.大量人工数据集和标准数据集上的实验均表明所提方法的有效性,特别是当数据中含有异常点时,该方法相比于其他方法的优越性.（2）针对自变量的相关性提出Elastic Net罚分位数回归模型.在正则化框架下,L1惩罚项能够产生稀疏解,L2惩罚项能够同时选出相关性强的变量,而分位数估计具有一定的稳健性.本文利用它们各自的特性,提出基于分位数损失的Elastic Net罚正则化估计方法,给出模型理论上的解释,证明其估计的一致性,并给出问题求解的ADMM算法.实验结果表明所提方法表现良好,不仅具有一定的稳健性,而且能够解决变量之间存在的相关性问题.（3）建立具有邻近样本信息的回归模型.通过网络图结构,将样本的邻近样本信息有效引入到回归模型中,既考虑每个样本本身所具有的的属性特征,又获取了与之相邻的样本信息.其次,利用基于平方损失的L1罚正则化方法估计回归参数.在理论方面,基于限制特征值条件,给出了估计的误差界证明.在算法方面,通过坐标下降法进行问题的求解.大量人工数据集实验表明所构建的回归模型比普通线性回归模型具有更高的预测准确度.将其应用于房屋价格预测数据,所得结果进一步验证了所提模型的有效性.（4）提出含有交互项的回归模型参数的稳健正则化估计方法.线性回归模型虽然简单易于解释,但在一定程度上并不足以完全包含样本所提供的全部信息.通过引入交互项,从模型条件假设角度来说,可以移除线性模型的可加性假设条件;从模型解释角度来说,考虑变量之间的相互影响,可以充分挖掘数据所包含的隐藏信息.为解决模型中重尾分布问题,提出基于L1惩罚项和自适应L1惩罚项的两种稳健参数估计方法,并从理论上证明了后者估计的一致性.在算法方法,给出了基于ADMM的求解算法.人工数据集上的实验表明,当模型误差来源于重尾分布时,本文所提估计方法能够提高预测的准确度,在变量选择方法也具有明显的优势.真实数据集上的实验表明含有交互项的回归模型优于线性模型;且本文所提估计方法在预测准确度和变量选择方面均优于基于平方损失的正则化估计方法.本文在正则化框架下,主要围绕回归模型中参数的稳健估计和模型的构建展开研究,取得的成果一方面完善了稳健正则化估计方法的理论研究,另一方面为复杂多样化的数据的分析提供了有效的稳健估计方法,具有十分重要的应用价值。

李叙潼^[5]（2021）在《基于深度学习的抗肿瘤药物作用机制研究》文中指出随着近年来生命科学领域蓬勃发展,人们对肿瘤疾病机制的认知逐渐加深。癌基因依赖理论认为,癌症细胞生存特异性地依赖某个基因,该基因的失活会导致癌细胞出现生长抑制或凋亡。据此,我们已找到多种癌症的依赖性癌基因,开发针对这类基因分子靶向药物,例如靶向蛋白激酶的小分子抑制剂,是目前抗肿瘤治疗领域的发展方向。基于高通量的基因组和转录组学等技术的得到的癌细胞系的分子特征,肿瘤药物治疗已经进入了分子分型指导的个性化治疗时代,但肿瘤药物治疗的响应率仍然有限。在精准医疗的大框架下,将人工智能（AI）技术引入抗肿瘤药物及其作用机制的研究,深入挖掘药物对肿瘤治疗靶标的活性和肿瘤细胞系的敏感性,是开发高效的新型肿瘤药物的方向。AI药物发现是药学和人工智能的深度交叉。无论对肿瘤还是其他疾病而言,传统的药物研发方式长期面临着研发周期长,失败率高,成本高等局限。高性能计算的飞速发展,人工智能算法的不断优化以及化学和生物学数据的大量积累,为AI技术在药物研发领域应用提供了基础。论文第1章对AI技术在药物发现领域的发展和应用展开了详细的讨论。随后,我们从两个方面讨论了基于AI的抗肿瘤药物研究。第2章中,我们使用多任务深度神经网络模型预测小分子化合物在人类激酶谱中的多向药理学效应和选择性。第3章中,基于组学数据和蛋白-蛋白相互作用（PPI）网络,我们构建了图注意力网络模型,研究药物的体外细胞系敏感性和作用机制。蛋白激酶是癌基因依赖的主要靶标类型,开发激酶特异性的小分子抑制剂是目前抗肿瘤治疗领域的主要挑战。基于大规模生物活性数据和多任务深度神经网络（MTDNN）,我们开发了一种针对激酶的虚拟筛选模型,用于预测激酶小分子抑制剂与391种激酶的相互作用情况。激酶抑制剂具有广泛的交叉反应性,使之成为高度相关的预测任务。借由MTDNN的迁移学习效果,所获得的模型具有出色的预测能力,与过去报道的单任务随机森林方法相比始终显示出更高的性能,特别是对于活性数据不足的激酶任务仍能显示出令人振奋的高预测性。进一步地,我们对未知广谱激酶谱活性的上市和在研激酶抑制剂进行预测,并辅以严格的实验验证。结果显示,在1,410个激酶-化合物对上,模型给出了高质量的预测,au ROC达到0.75,并且成功地预测许多新颖的和治疗性的“脱靶”活性。基于预测得到的激酶谱,MTDNN还可用于描述化合物在激酶谱上的整体选择性,激酶亚家族特异的选择性及对某些疾病特异的选择性。使用训练好的MTDNN模型,我们搭建了小分子全激酶组多药理学作用的在线分析平台Kinome X。Kinome X可以对小分子在全激酶范围内的活性进行预测,并根据预测结果给出对小分子整体和激酶亚家族特异的选择性的分析。总体而言,MTDNN及基于其搭建的Kinome X提供了能够全面的研究小分子的激酶组活性和多药理学效应的有效手段,能为设计新颖的激酶抑制剂或药物重定向提供参考,并且对探索过去研究较少的激酶具有实用价值。在精准医疗的大背景下,开发基于肿瘤患者的基因组信息预测有效治疗策略的计算模型,是肿瘤治疗领域的发展方向。对此,我们使用图注意力网络（GAT）处理PPI网络,将癌细胞系的转录谱作为节点特征,用以构建药物细胞敏感性预测模型。我们使用标准化的表达谱（BEXP）作为细胞特征,跨细胞的共识基因签名（SIGN）作为药物特征,用以预测相应的药物剂量响应（AUC）。为了基于先验的生物背景对表达谱进行系统性的整合,我们采用GAT处理PPI网络,建立了两个端对端的模型,使用药物特征同时预测多个细胞系响应的多任务模型MTGAT,和使用药物和细胞系组合特征预测对应响应的多模态模型MMGAT。两种不同的框架对药物响应均有良好的预测性,预测效果全面超越了基准DNN模型。进一步地,我们使用GAT的注意力机制探索了模型的可解释性,发现注意力系数与生物机制之间存在关联。分析表明,具有更高局部注意力系数的邻居节点基因可能更多地与中心节点基因的转录和生物功能相关,而全局注意力可以有效富集到靶向药物的靶标蛋白。基于GAT的药物敏感性预测模型有助于发现未知的药物和细胞相互作用,进而发现药物响应的预测因子来揭示药物敏感性的生物机制,有希望助力抗肿瘤药物的发现和重定向。

赖晓敏^[6]（2021）在《中国农业专利的数量、质量与经济效果研究》文中认为科技兴农战略下,中国农业专利事业发展迅速,但发展过程中的研发不平衡与转化不充分问题愈发突显。得益于农业科技创新体系发展,中国农业专利规模持续扩大,新增专利数连续多年位居世界第一,且增速不断加快,后发优势明显,在特定技术领域实现由“跟跑”向“并跑”甚至是“领跑”的跨越。与此同时,专利发展过程中显现出研发不平衡、转化不充分问题,前者主要表现为农业专利在数量布局、质量层次和研发主体结构上存在失衡现象,后者主要表现为农业专利的加速扩张与农业经济的增速放缓不相适应,二者的脱钩反映出农业专利的质量不高与应用转化不足。对此,围绕如何量化并解释中国农业专利不平衡不充分发展问题,研究依次从专利数量、专利质量和专利经济效果三方面入手,综合利用专利文献计量、空间计量经济学、二元选择模型和机器学习等方法,在量化把握农业专利数量与质量水平现状的基础上,进一步探究中国农业专利产出数量水平的均衡收敛机制,农业专利质量水平的长期优化机制,以及农业专利推动产业经济发展的转化扩散机制,并据此提出推动中国农业高质量专利研发与转化的政策建议。研究主要内容和结论包括:（1）中国来源和受理的农业专利规模整体不断扩大,1985-2019年中国来源和受理的累计农业发明申请、发明授权和实用新型数分别居世界第一、第二和第一;中国农业专利多布局在以植物栽培、农药、饲料、养殖管理和肥料等小类为主的农业生产领域和以食品饮料加工处理小类为主的食品加工领域;首要应用行业是以农业生产专用设备制造、农业中间品制造和农产品加工等为主的制造业,其次是以各种农作物种植栽培为主的农林牧渔业;企业和科研机构是研发主力,个体占比趋于下降。整体上,专利数量和申请人规模在1985-1995年技术引进期较小,此后进入技术发展期,并在2008-2019年技术发展期第二阶段加速增长;不同技术领域和研发主体的技术生命周期演进存在一定差异。（2）中国农业专利呈现自东向西递减分布,数量水平由高到低分别为华东区、华北区、东北区、中南区、西北区和西南区,且各区域研发主体结构不同;数量水平的省域分布高度失衡,失衡主要由区域间差异引起,区域内相对均衡;数量水平分布具有负空间自相关性,省域分布以低高聚类为主,其次是高低聚类。发明申请和实用新型水平的省域分布呈绝对β收敛,且在技术相似和产业相似两种关联矩阵下的收敛速度快于反距离和邻接关系两种地理矩阵,而科研机构和企业三类专利水平均呈绝对β收敛,个人则仅发明授权和实用新型水平收敛;引入控制变量后,全样本和各主体的三类专利水平仍呈现条件β收敛,其中技术市场发育对各专利水平增速均有促进效果。（3）中国农业专利质量水平符合技术生命周期演化特点,在1996年进入技术发展期之后质量水平被稀释下降,质量综合指数由期初的0.70降至期末的0.40,质量的子维度技术通用性、技术创新性、法律价值和经济价值也在发展期有所下降;空间分布上,技术创新性、法律价值和经济价值呈现东高西低特点,三者分布在前期呈现一定的空间失衡,而技术通用性和综合质量水平始终较为均衡。专利规模扩张也带来泡沫专利规模的上升,累计泡沫23,135件,整体泡沫化程度为11.70%,泡沫规模在2008-2019年呈加速上升趋势,但泡沫化程度略有下降;泡沫专利空间格局与农业专利总量格局一致,即东多西少,省域分布由失衡转为均衡,但本土专利的泡沫化程度远高于境外来源专利。无论是Logit、Probit和异方差Probit模型,还是随机森林和BP神经网络算法,各方法对非泡沫专利的预测精度均趋于100.00%,但在泡沫专利的预测上,仅随机森林算法在训练样本内有99.24%的预测精度,其余方法均有明显第一类错误。（4）静态空间杜宾模型表明,中国农业专利质量及其构成受本地和相关地区农业研发要素投入、研发主体发育和创新外部环境三方面因素影响,其中研发人员投入在关联矩阵下对专利技术创新性和法律经济的间接效应为负,经费投入对技术通用性和法律价值的直接效应为正,对技术价值、法律价值和整体质量的间接效应均为负;科研机构发育对技术创新性具有正向间接效应,企业发育在地理矩阵下对法律价值和整体质量的间接效应为正,在关联矩阵下对法律价值的间接效应为负;基础研究在地理矩阵下对技术通用性、法律价值和综合质量的各效应均为负,技术市场对技术通用性、法律价值和综合质量的各效应均为正,科技转化服务对法律价值和综合质量的直接效应为负,对临近地区技术创新性的间接效应为正,信息化在地理矩阵下对技术通用性和法律价值的间接效应为负,但对经济价值为正。动态空间杜宾模型表明专利的技术通用性和法律价值具有累积性,受经济价值影响,综合质量在地理矩阵下具有累积效应,在关联矩阵下具有收敛性;动态模型中上述长期边际效应依旧成立,并进一步证实长期与短期效应的作用方向多相反。（5）以种植业为例,各空间模型中农业有效专利对农业经济产出的回归系数均显着为正,并大于普通面板模型结果,表明农业专利同时存在地理临近和技术供需联系两种扩散渠道;反距离矩阵、邻接关系矩阵、技术相似矩阵和产业相似矩阵四种空间权重下,专利对农业经济产出的总贡献分别为12.30%、12.72%、13.41%和13.16%,贡献率仅次于化肥（50.00%左右）和劳动（20.00%左右）投入,与机械投入（10.00%左右）相近;专利对农业经济的总贡献效应以本地直接效应为主,四种矩阵下的直接效应分别为11.97%、16.07%、18.29%和14.36%,而间接效应分别为0.33%、-3.35%、-4.88%和-1.21%,这种差异化的间接效应表明专利的空间溢出包含由技术扩散产生的正向辐射增益效应和农业物候相似凸显的专利权负向排他效应两部分。研究可能的创新之处有三个方面:（1）拓展并验证了农业科技创新活动的空间关联。在探讨农业科技研发绩效和经济贡献过程中,不仅考虑了反距离矩阵和邻接关系矩阵刻画的常见地理溢出效应,还基于夹角余弦定理拓展并检验了技术和产业结构相似地区间的技术供需关联溢出效应。（2）基于专利视角测度农业技术创新的经济效果。相比以往研究采用的政府科技经费投入变量,专利作为应用研究的直接成果,避免了兼顾基础研究的政府经费投入会夸大实际技术研发支出,并能全面涵盖科研机构、企业和个人等各类技术研发主体。（3）探索了农业专利质量的影响因素及其作用机制。综合技术价值、法律价值和经济价值三个维度构建质量评价体系,系统量化了中国农业专利质量现状格局,并讨论了研发要素投入、科研主体发育和创新外部环境三方面因素对综合质量及其子维度构成的影响。

王国志^[7]（2021）在《经济不确定性、经济周期与货币政策有效性研究》文中提出在全面建设社会主义现代化国家向第二个百年奋斗目标迈进的历史新征程中,国内外政治经济环境发生了显着的变化,一个突出表现就是国内外经济不确定性事件频繁发生,导致我国经济周期运行的波动性加剧,货币政策调控难度加大,因此科学研判经济不确定性对经济周期和货币政策有效性的影响对于提升宏观调控有效性推动高质量发展具有理论和现实意义。本文遵循“文献梳理——理论分析——现状测度——实证研究——理论拓展”的总体研究框架,综合采用文献分析、理论梳理、指数测算、动态计量实证研究、DSGE理论模拟等方法对经济不确定性、经济周期与货币政策调控之间勾稽关系的规律性特征开展理论和实证研究。本文首先从理论层面梳理了经济不确定性概念的起源、界定及其度量,分析经济不确定性对经济周期影响的理论机制、经济不确定性对货币政策有效性影响的理论机制以及不同经济周期下货币政策调控的相关理论,奠定全文研究的理论基础。综合现有文献来看,可以将经济不确定性的基本概念界定为经济主体对未来的发生事件的无法预测性,衡量经济不确定性程度的方法主要包括运用现有的经济变量作为代理变量、运用专业人士对未来经济预测的分歧程度、运用现代信息技术和大数据合成指数法、运用大数据爬虫抓取报纸关键词方法、运用高维宏观数据提取共同因子的方法等5种方法,其中后两种方法被广泛使用。理论机制分析结果显示,经济不确定性对经济周期的影响机制主要包括投资期权机制、预防储蓄机制、金融摩擦机制、信息传递机制、长期投资机制、H-A传导机制等6个方面,经济不确定性冲击对经济周期和货币政策调控具有显着影响。不同经济周期理论下的货币政策调控理论也存在显着差异,催生了不同的货币政策规则。其次,本文测度了我国经济周期指数,分析了经济不确定性和经济周期之间的动态关联机制。结果显示,中国经济不确定性指数走高的时点大多与特定的经济政治事件相关联,1996年1月至2020年6月期间我国一共经历了3轮完整的经济周期,第四轮经济周期尚未结束。时变格兰杰因果关系检验结果显示,在经济不确定性较高时,经济不确定性对经济周期具有一定的预测性;在经济周期交替变化的时点,经济周期对经济不确定性具有一定的预测性。动态条件相关系数分析结果显示,经济不确定性与经济周期之间具有较为显着的负向动态条件相关性,在经济紧缩期经济不确定性波动剧烈,而在经济扩张期经济不确定性波动平稳。动态溢出指数分析结果显示,经济不确定性与经济周期之间存在显着的时变动态溢出效应,且经济周期波动加大了经济不确定性,经济不确定性同样加剧了经济周期波动。第三,本文构建了MS-AR模型将我国经济不确定性指数划分为三区制,在此基础上构建LT-TVP-VAR模型分析了货币政策在不同程度经济不确定性冲击时的反应及其调控效果,得出如下结论:（1）经济不确定性冲击对数量型和价格型货币政策存在正向时变冲击效应,但在经济不确定性的低、中、高区制下调控效果存在较大差异。（2）在经济不确定性处于低区制时数量型政策在调控产出缺口方面效果比较明显。当经济不确定性处于中高区制时价格型货币政策对产出缺口实施反周期调控的效果比较明显。（3）在经济不确定性处于低区制时数量型和价格型货币政策对通胀缺口调控效果较好,在中、高区制时数量型货币政策对通胀的调控存在局限性,而价格型货币政策对通胀缺口实施反周期调控效果更优。第四,本文构建TH-SVAR和SEIVAR模型实证分析了经济周期不同阶段货币政策调控的有效性和非对称性。基于TH-SVAR模型的研究结果显示,同一货币政策工具在相同经济周期阶段对产出和通胀的调控效应具有对称性,但不同货币政策工具在经济周期不同阶段下调控效果呈现出非对称特征。数量型和价格型货币政策在经济扩张期调控效应优于经济收缩期。经济扩张期价格型货币政策对产出调控效果优于数量型货币政策,数量型货币政策对通胀调控效果优于价格型货币政策。经济收缩期两种政策工具对产出与通胀的调控效果相对复杂。基于SEIVAR模型的研究结果表明,在经济周期不同阶段下货币政策对通胀和产出的调控效果存在显着差异和非对称特征。数量型货币政策对通胀调控更为有效,价格型货币政策对产出调控更为有效。数量型货币政策在经济收缩期对通胀和产出的调控效应优于经济扩张期。价格型货币政策在经济收缩期对通胀的调控效应更加符合政策预期。价格型货币政策对产出的调控在经济收缩期优于经济扩张期。最后,本文构建了包含预期因素和异质冲击的DSGE模型探讨了货币政策有效性问题,得出如下结论:（1）当模型中引入政策预期因素后可以与数据实现较好的拟合,且预期冲击形式的有效识别使得工具变量对目标变量波动的反应程度均出现了不同程度的变化。（2）通胀对利率工具调控较为敏感,数量工具调控对产出的影响作用相对较大,然而数量冲击下产出易出现逆向波动降低调控有效性。当对预期冲击和非预期冲击进行识别后,工具变量的预期冲击对目标变量波动的影响作用均有所增加,且目标变量收敛周期均有所缩短。（3）影响产出和通胀波动的占优冲击来源分别为数量政策和利率政策,对冲击来源结构的有效分解可以提升货币政策的有效性。根据以上研究结果和我国经济金融发展及货币政策调控实践,本文提出如下政策建议:（1）准确识别经济不确定性冲击,稳定经济政策预期,以政策确定性应对经济不确定性。（2）优化货币政策量价配合机制,强化政策工具间的组合协调。（3）加强对微观主体的预期管理和舆论引导,提升货币政策调控的有效性。

李娜^[8]（2021）在《GEE框架下纵向数据均值-方差联合模型的研究》文中研究表明纵向数据是由多个体在不同的时间点或者空间点处的若干次观测的数据构成,这类数据的一个很重要的特点是个体间的观测值通常是独立的,但是每个个体的观察值具有较高的相关性。因此对纵向数据的建模要充分考虑个体内观测值的相关性。传统的关于纵向数据的分析方法,主要是在一定分布假定下对响应变量的均值进行建模,而对协方差结构做一些设定（即协方差结构是已知的,只是其中的参数未知）。这种建模的方法的优点是简单方便,但局限性是很难去验证实际数据与假定分布之间的一致性,并且当协方差结构错误设定时,会大大降低统计推断的有效性,比如会降低均值参数估计的有效性等。因此,如何在放松分布假定的情形下,对纵向数据的均值和协方差建立联合模型进行分析是一个重要和有挑战性的问题。目前在放松个体分布的假定下,对纵向数据建立均值-方差联合模型,主要采用对协方差矩阵进行不同形式的分解,同时构建均值-方差联合广义估计方程（Generalized estimating equations,GEE）进行的。采用GEE方法的优势是仅需对个体分布的低阶矩进行假定,而不需要对个体分布做任何形式上的假定,因而大大拓宽了模型的适用范围。在GEE框架下联合模型的实际应用中,如何快速有效地筛选出对模型有较大影响的自变量具有重要的意义,但是目前对GEE框架下的联合模型开发算法上易于执行并兼具oracle性质的变量选择方法研究较少。当纵向数据的联合模型确定后,判断给定联合模型的合理性以及克服实际数据与给定模型之间可能存在偏离的情况就成为另一个亟待解决的问题。通过统计诊断和稳健统计的方法可以有效解决这些问题。为此,本文主要在GEE框架下,研究了纵向数据均值-方差联合建模的变量选择、统计诊断以及稳健的联合建模这三个重要的问题。首先,提出了协方差矩阵进行修正的乔利斯基分解（Modified Cholesky decomposition,MCD）下的光滑阈值的联合广义估计方程。该光滑阈值的联合广义估计方程能够自动将无关变量的系数估计为零,因而能够同时进行变量选择和参数估计。在对该光滑阈值的联合广义估计方程的求解过程中,提出采用三个带惩罚的加权偏差准则去选取模型中的最优的调节参数并采用牛顿-辛普森算法迭代求得该方程具有稀疏性的解。在一定的正则条件下,我们研究了该光滑阈值的联合广义估计方程的解的相合性以及渐近正态的性质,同时探讨这种方法在变量选择方面的oracle性质。这个光滑阈值的联合估计方程避免了传统的对广义估计方程直接添加惩罚项进行变量选择所带来的凸优化问题并且具有算法上易于执行的优点。模拟研究和实际数据分析均展示了我们给出了光滑阈值联合广义估计方程在参数估计和变量选择方面的优良表现。其次,基于协方差矩阵进行MCD,讨论了均值-方差联合广义估计方程的统计诊断方法。我们主要采用的个体数据删除方式的“点删除”影响分析法,去探测实际数据中的异常点和强影响点。我们首先分别导出均值参数和协方差参数（自回归参数以及革新方差参数）的一步近似诊断统计量,用来近似计算个体数据删除前后估计量的改变量。然后引入伪费希尔信息矩阵作为权重矩阵构建相关参数的广义Cook距离诊断统计量。我们提出的关于全参数的广义Cook距离可以直接分解为关于均值参数、自回归参数以及革新方差参数的诊断统计量,方便我们对这三组参数进行统计诊断分析。最后,随机模拟和实际数据分析,显示了我们提出的诊断统计量能够快速以及有效的识别数据中的影响点。最后,在误差向量满足ARMA（Autoregressive moving average）过程下构建了稳健的均值-方差联合估计方程。该稳健估计方程将皮尔逊残差运用到有界的得分函数上去降低异常响应变量的影响,同时引入了Mallows类型的权重去降低杠杆点的影响。在一定的正则条件下,我们探讨了模型参数估计的相合性以及渐近正态的性质。在无污染数据和包含各种类型的污染数据的模拟实验和实际数据分析中,充分展示了无论数据来源于什么分布以及无论数据是否存在污染,我们提出的稳健的联合模型均有不错的表现。特别地,当数据存在污染数据的时候,稳健的联合模型在参数估计方面的表现要优于非稳健联合模型。本文的主要贡献有以下三个方面:（1）提出了光滑阈值联合广义估计方程。该模型有效地解决了纵向数据GEE框架下联合建模的参数估计和变量选择问题,并且具算法上易于执行的优点。（2）建立了GEE框架下联合模型的广义Cook诊断统计量。提出的诊断统计量能够快速有效的识别出实际数据中的异常点或者强影响点,为我们进一步进行统计分析提供了帮助。（3）在协方差矩阵更为一般化的分解下,提出了均值-方差稳健的联合模型。该模型很好的克服了实际数据中的异常数据或者强影响数据对模型统计推断的影响。这些在放松个体分布假定下对纵向均值-方差联合模型的研究,不论在理论还是实际纵向数据分析中均具有重要作用。

付茜雯^[9]（2020）在《计算机科技论文摘要的机翻错误类型及译后编辑》文中认为科研论文在知识传播过程中作用重大,推动国际范围内的知识共享。摘要是科研论文中必不可少的一部分,既是对论文的概括性总结,也是读者发现和探寻相关领域知识的快捷途径。然而,目前英文摘要的机器翻译质量在精确性和专业性方面都不尽人意,需要通过后期编辑和人工校对才能产出高质量的中文翻译文本。本文以计算机科学论文摘要为例,对谷歌机器翻译的300篇计算机英文论文摘要的中文版本进行了翻译错误类型分析并归类,并提出相应的译后编辑策略。首先在赖斯文本类型理论翻译策略指导下,对机器翻译系统生成的译文进行译后编辑,再邀请计算机专业以及翻译专业的专业人士进行确认。之后以DQF-MQM错误类型分类框架为依据,对机器翻译系统生成的译文中的错误进行分类。研究发现,机器翻译的计算机英文论文摘要的中文版本中存在七大类翻译错误,其中不符合中文表达习惯的翻译错误占比最大,其次是术语误译、误译、欠译、漏译、过译以及赘译。本论文研究发现,由于源文本的信息型学术文本特征,长难句、被动语态以及术语翻译是造成机器翻译错误的主要原因。针对源文本的逻辑缜密、语步序固定等特征,本研究针对性地对各类错误类型提出了相应译后编辑策略。建议译者在译后编辑中通过将隐性连接转换为显性连接从而保持源文逻辑性,通过增加主语以及调整语序处理被动语态保持源文的学术精准,通过恰当选取词意处理半技术词汇等。本研究采用定性和定量分析方法,系统归类了计算机科技文本摘要中机器翻译出现的错误,并提出相应译后编辑策略,为该领域的译者提供参考建议,从而提高该领域的机器翻译质量。

葛通^[10]（2019）在《协同积分理论的拓展与应用研究 ——基于核回归方法》文中研究说明现代经济学理论将宏观经济看作一个具有动态随机特征的复杂系统。系统随着个体的反应而变动,个体随系统的变动而进一步地做出反应。在这种反馈-负反馈经济机制的影响下,变量容易表现出非平稳的数据特征,也容易形成相互之间长期协同的复杂关联关系。协同积分理论提供了对非平稳数据建模的基础方法,已经得到了较为充分的研究和广泛的应用。但是由于经济系统本身的复杂性,一些得到经济理论和实践经验支持的重要协同积分关系可能会被协同积分检验所拒绝,进而无法借助协同积分理论来分析。随着经济数据不断呈现出新的特征以及对经济数据的认识得到不断深入,参数模型在分析复杂协同积分关系问题上有时会表现出一定的局限性。而凭借着良好的拟合能力,非参数核回归方法在复杂协同积分关系的拟合上具有独特的优势。论文借助非参数核回归方法,为一些原本很难分析和原本需要许多不同类型参数模型来分析的复杂协同积分关系提供了一个简捷而稳健的研究工具,拓展了协同积分理论的研究范围。考虑到当前中国经济正处于外部环境深刻变化和内部结构优化调整的复杂局面当中,在现阶段为复杂协同积分系统提供有效的实证研究工具,具有重要的现实意义。论文首先梳理了协同积分研究的理论工具,为更为复杂的协同积分关系的研究打下基础。然后,针对变量间关系可能存在的非线性特征,研究引入了核回归模型来估计变量间的协同积分关系,并完善了与估计过程相适应的协同积分检验方法,为存在非线性特征的协同积分系统提供了可靠的建模分析工具。进一步地,针对时间序列中可能存在的变结构现象,论文引入了时变非参数模型来对含变结构的协同积分关系做拟合,并改进了模型估计方法和模型诊断方法,实现了对存在变结构特征的协同积分系统的有效识别和可靠建模。研究发现,复杂协同积分关系可以依靠非参数核回归方法来实现较好地估计和识别。利用ADF检验和局部DW检验构造的联合检验,可以较好地实现对存在非线性特征的协同积分关系做检验。由局部DW检验推广而来的广义局部DW检验,可以用来推断变量间是否存在具有变结构特征的协同积分关系。模拟研究与理论相一致。论文还将方法应用到中国经济的实证研究当中,捕捉到了过去的工具所不能发现的复杂协同积分关系。其中包括货币投放与经济增长间的协同积分关系和进口贸易与经济增长间的协同积分关系。研究的主要创新之处有:一、为复杂协同积分关系的识别和分析提供了基于核回归方法的新工具,从而拓展了协同积分理论的研究范围。二、对非参数核回归模型中伪回归的诊断方法做了改进,设计出与核回归估计方法相适应的协同积分检验。三、将协同积分研究方法应用到中国若干热点问题的实证研究当中,借助拓展后的协同积分理论,更深刻地分析了中国经济中的货币政策影响机制和进口贸易发展规律。

二、线性模型中基于稳健诊断的局部影响分析(英文)（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、线性模型中基于稳健诊断的局部影响分析(英文)（论文提纲范文）

（1）社区2型糖尿病患者自我管理小组活动长期效果研究（论文提纲范文）

中文摘要

ABSTRACT

缩略词中英文对照表

前言

1 研究背景

2 研究意义

3 研究目的

4 研究内容

第一部分社区2型糖尿病患者自我管理小组活动长期随访效果:系统综述和Meta分析

1 研究背景

2 研究目的

3 研究内容

4 材料与方法

4.1 研究设计与相关定义

4.2 文献来源与检索策略

4.3 文献纳入与排除标准

4.4 文献筛选与资料提取

4.5 文献质量评价

4.6 统计分析

4.7 技术路线

5 研究结果

5.1 文献检索结果

5.2 纳入研究基本特征

5.3 纳入文献的质量评估

5.4 自我管理干预效果评价

5.5 证据质量评价

6 讨论

6.1 自我管理小组活动与社区患者糖化血红蛋白关系

6.2 自我管理小组活动与社区患者空腹血糖和餐后血糖关系

6.3 自我管理小组活动与社区患者血脂关系

6.4 自我管理小组活动与社区患者血压关系

6.5 自我管理小组活动与社区患者体重控制关系

6.6 自我管理小组活动与社区患者生存质量关系

6.7 自我管理小组活动与社区患者心血管病事件和死亡事件关系

6.8 国内外自我管理小组活动差异比较

6.9 本研究的可靠性与局限性

7 小结

第二部分社区2型糖尿病患者自我管理小组活动5年并发症合并症及死亡随访研究

1 研究背景

2 研究目的

3 研究内容

4 材料与方法

4.1 研究现场

4.2 研究对象

4.3 研究方法

4.4 数据处理与统计分析

4.5 质量控制

4.6 技术路线

5 研究结果

5.1 一般情况

5.2 糖尿病并发症合并症及死亡发生情况

5.3 自我管理小组活动对糖尿病并发症合并症及死亡影响

5.4 自我管理患者糖尿病并发症合并症及死亡影响因素

6 讨论

6.1 自我管理小组活动与社区患者糖尿病并发症和合并症关系

6.2 自我管理小组活动与社区患者死亡关系

6.3 自我效能与糖尿病并发症关系

6.4 低收入、农村居住地与糖尿病并发症和合并症关系

6.5 农村居住地与社区患者死亡关系

6.6 随访研究结果与系统综述研究结果关系

6.7 本研究的局限性

7 小结

研究结论

参考文献

附件

综述国内外糖尿病自我管理干预研究进展

参考文献

致谢

个人简历

附件

（2）基于神经网络的EFL教材文本复杂度分级模型的构建（论文提纲范文）

摘要

Abstract

致谢

缩略语

第一章绪论

1.1 研究缘起

1.1.1 教材研究的重要性

1.1.2 阅读文本复杂度研究的重要性

1.1.3 文本复杂度自动分级研究的重要性

1.2 研究意义

1.3 论文结构

第二章文献综述

2.1 核心概念梳理

2.1.1 教材

2.1.2 文本复杂度

2.2 文本复杂度实证研究

2.2.1 基于语料库的文本复杂度研究

2.2.2 文本复杂度自动分级研究

2.3 本章小结

第三章研究方法

3.1 研究问题

3.2 研究语料

3.3 研究步骤

3.4 研究工具和方法

3.4.1 文本复杂度特征提取

3.4.2 多元统计方法

3.4.3 机器学习及模型验证方法

3.5 本章小结

第四章文本复杂度各维度特征的确定

4.0 参照语料库的选取

4.1 词汇复杂度指标——TAALES主成分

4.1.1 词汇频率和分布

4.1.2 学术书面语特征

4.1.3 三元词互信息

4.1.4 两元词频率和分布

4.1.5 动词特定性

4.2 句法复杂度指标——TAASSC主成分

4.2.1 名词短语扩展

4.2.2 所有格

4.2.3 VAC频率和嵌入式小句

4.2.4 小句从属情况

4.2.5 VAC中构式对主动词的关联强度

4.2.6 VAC中主动词对构式的关联强度和构式频率

4.2.7 名词主语并列

4.2.8 限定词

4.3 语篇复杂度指标—TAACO主成分

4.3.1 相邻2句词汇重叠

4.3.2 相邻3句和段落间重叠

4.3.3 深度衔接

4.3.4 并列附加连接

4.4 本章小结

第五章训练语料分级合理性验证

5.1 训练语料的选取依据

5.1.1 使用时间长、业界口碑好

5.1.2 由浅入深、循序渐进

5.2 训练语料文本复杂度单元聚类

5.3 《新概念英语》文本复杂度册级对比

5.3.1 册级间词汇复杂度对比

5.3.2 册级间句法复杂度对比

5.3.3 册级间语篇复杂度对比

5.4 本章小结

第六章文本复杂度分级模型的构建和评估

6.1 模型构建及其评估方法

6.1.1 建模方法

6.1.2 模型评估方法和指标

6.2 不同方法建模性能比较

6.3 各类特征建模比较

6.3.1 传统可读性公式

6.3.2 本研究特征集

6.4 模型对不同数据集的泛化能力

6.5 本章小结

第七章结论

7.1 主要发现

7.2 主要贡献及启示

7.3 局限与展望

参考文献

附录

（3）通用加工树模型假设检验的统计等价理论及其应用（论文提纲范文）

摘要

ABSTRACT

1. 引言

2. 文献综述

2.1 心理测量模型与随机建模

2.1.1 心理测量模型

2.1.2 随机建模

2.2 认知心理测量模型

2.2.1 潜在认知加工建模

2.2.2 离散化建模:离散状态模型

2.3 多项式加工树模型

2.3.1 最简单MPT模型:单高阈限模型

2.3.2 MPT模型的基本概念

2.3.3 MPT模型的基本性质

2.3.4 MPT模型可识别性处理方法

2.3.5 MPT模型的应用领域

2.4 通用加工树模型

2.4.1 MPT模型的扩展

2.4.2 GPT模型的字符串语言

2.4.3 GPT模型的等价转化

2.5 通用加工树模型的统计分析

2.5.1 GPT模型的统计推断

2.5.2 GPT模型的统计封闭性

2.5.3 GPT模型的统计模拟

2.5.4 GPT模型的模型评价和选择

2.5.5 GPT模型的相关分析软件

3. 总体设计

3.1 问题提出

3.2 研究思路

3.3 研究意义

3.3.1 理论意义

3.3.2 实践意义

4. 理论研究

4.1 GPT模型的基本概念

4.1.1 GPT模型的四个要素

4.1.2 GPT模型形式化定义

4.1.3 GPT模型的可识别性

4.1.4 GPT模型的模型方程的唯一性及反例

4.1.5 GPT模型的统计等价

4.1.6 GPT模型的分裂变换

4.2 GPT模型参数约束的假设检验

4.2.1 GPT模型参数约束的类型

4.2.2 GPT模型常数约束的假设检验

4.2.3 GPT模型相等约束的假设检验

4.2.4 GPT模型乘积约束的假设检验

4.2.5 GPT模型次序约束的假设检验

4.2.6 GPT模型参数约束的总结

4.3 GPT模型参数约束的代表树模型

4.3.1 GPT模型参数约束的典型认知加工结构及代表树模型

4.3.2 GPT模型代表树模型的模型属性

4.3.3 GPT模型参数约束基于代表树模型递归嵌套规则

4.4 GPT模型的统计分析

4.4.1 GPT模型的统计封闭性

4.4.2 GPT模型的参数估计

4.4.3 GPT模型的假设检验

4.4.4 GPT模型的其它假设检验问题

4.4.5 GPT模型统计分析总结

4.5 GPT模型的计算机编码

4.5.1 GPT模型递归定义

4.5.2 GPT模型字符串语言编码规则

4.5.3 GPT模型代表树模型的字符编码

4.5.4 GPT模型参数约束基于代表树模型字符串编码

4.5.5 GPT模型字符串语言编码小结

4.6 理论研究的总结

5. 实证数据分析

5.1 图片优势效应的源监测

5.1.1 图片优势效应源监测及结果

5.1.2 新假设检验的重新参数化建模

5.1.3 新假设检验量化分析结果

5.1.4 讨论

5.2 文学作品中人物角色源监测及年龄差异

5.2.1 人物角色源检测及已有结果

5.2.2 GPT建模分析及结果

5.2.3 讨论

5.3 四则混合运算能力的认知测量

5.3.1 方法

5.3.2 结果

5.3.3 讨论

5.3.4 结论

5.4 GPT模型实证数据分析小结

6. 总讨论

6.1 总结和讨论

6.1.1 统计等价理论及其关系

6.1.2 基本概念的形式化界定

6.1.3 参数约束类型及其等价变换

6.1.4 参数约束等价转化的四个代表树模型

6.1.5 统计封闭性的等价过程

6.1.6 字符串编码解码算法及替换规则

6.1.7 实证数据检验

6.2 创新、不足与展望

6.2.1 研究创新

6.2.2 不足与展望

7. 总结论

参考文献

附录

攻读学位期间研究成果

后记

（4）面向回归的稳健正则化方法研究（论文提纲范文）

中文摘要

ABSTRACT

第一章绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.2.1 面向线性回归的正则化方法

1.2.2 面向广义线性回归的正则化方法

1.3 研究内容和组织结构

第二章背景知识

2.1 正则化估计方法

2.2 基于平方损失的正则化方法

2.3 基于分位数损失的正则化方法

2.4 本章小结

第三章自加权稳健正则化方法

3.1 引言

3.2 准备工作

3.3 基于SELO惩罚项的自加权估计方法

3.3.1 自适应正则项

3.3.2 RSWSELO估计

3.3.3 理论性质及证明

3.4 RSWSELO估计的求解算法

3.5 实验结果与分析

3.5.1 人工数据集上的实验

3.5.2 标准数据集上的实验

3.6 本章小结

第四章基于自变量相关性的线性模型稳健估计方法

4.1 引言

4.2 基于Elastic Net惩罚项的稳健估计方法

4.2.1 模型的构建

4.2.2 理论性质

4.2.3 求解算法

4.3 实验结果与分析

4.3.1 人工数据集上的实验

4.3.2 真实数据集上的实验

4.4 本章小结

第五章基于邻近信息的回归模型及参数估计

5.1 引言

5.2 基于网络结构信息的Lasso估计

5.2.1 模型的构建

5.2.2 误差界估计

5.3 实验结果与分析

5.3.1 人工数据集上的实验

5.3.2 真实数据集上的实验

5.4 本章小结

第六章含有交互变量的回归模型稳健估计方法

6.1 引言

6.2 交互模型的自适应稳健估计方法

6.2.1 模型的构建

6.2.2 理论分析

6.2.3 求解算法

6.3 实验结果与分析

6.3.1 人工数据集上的实验

6.3.2 真实数据集上的实验

6.4 本章小结

第七章总结与展望

参考文献

攻读博士学位期间取得的研究成果

致谢

个人简况及联系方式

（5）基于深度学习的抗肿瘤药物作用机制研究（论文提纲范文）

摘要

Abstract

第1章绪论

1.1 人工智能的兴起与发展

1.2 人工智能在药物发现中的应用

1.2.1 分子表征

1.2.2 基于结构的虚拟筛选

1.2.3 基于配体的虚拟筛选

1.2.4 从头药物设计

1.2.5 药物重定向

1.3 人工智能助力抗肿瘤药物发现

1.3.1 抗肿瘤药物的研发现状

1.3.2 抗肿瘤药物重定向

1.4 本章小结及论文总体安排

第2章基于深度学习的化合物激酶谱预测方法研究

2.1 研究背景

2.1.1 激酶抑制剂的研究现状

2.1.2 化合物激酶谱的计算预测模型

2.2 研究方法

2.2.1 数据收集和整理

2.2.2 多任务深度神经网络

2.2.3 超参数优化

2.2.4 聚类交叉验证

2.2.5 模型评价

2.3 结果与讨论

2.3.1 模型优化

2.3.2 模型在外部测试集上的评价

2.3.3 模型比较

2.3.4 模型的实验验证

2.3.5 模型应用于选择性预测

2.4 全激酶组多药理学作用在线应用平台Kinome X

2.5 本章小结

第3章基于深度学习的药物细胞敏感性预测方法研究

3.1 研究背景

3.1.1 基因组表征数据集

3.1.2 药物敏感性的计算预测模型

3.1.3 图神经网络简介

3.2 研究方法

3.2.1 数据收集及处理

3.2.2 图注意力网络

3.2.3 模型评价

3.3 结果与讨论

3.3.1 模型优化与表现

3.3.2 模型比较

3.3.3 模型的可解释性

3.4 本章小结

第4章总结与展望

参考文献

附录

致谢

作者简历及攻读学位期间发表的学术论文与研究成果

（6）中国农业专利的数量、质量与经济效果研究（论文提纲范文）

摘要

Abstract

第1章绪论

1.1 研究背景

1.2 研究目的和意义

1.2.1 研究目的

1.2.2 研究意义

1.3 国内外研究综述

1.3.1 专利研发

1.3.2 专利评价

1.3.3 专利转化

1.3.4 研究述评

1.4 研究内容与方法

1.4.1 研究思路

1.4.2 研究内容与技术路线

1.4.3 研究方法

1.5 可能的创新

第2章理论基础与分析框架

2.1 理论基础

2.1.1 技术创新理论

2.1.2 TRIZ创新方法理论

2.1.3 内生经济增长理论

2.2 概念界定

2.2.1 农业专利

2.2.2 农业专利技术生命周期

2.2.3 农业专利质量

2.3 理论分析框架

2.3.1 农业专利的数量增长与趋同

2.3.2 农业专利的质量评价与甄别

2.3.3 农业专利的有效应用与转化

2.4 本章小结

第3章中国农业专利的数量格局与技术生命周期

3.1 数据来源与研发方法

3.1.1 数据来源

3.1.2 研究方法

3.2 中国农业专利的数量分布

3.2.1 中国农业专利的全球地位

3.2.2 中国农业专利的IPC分布

3.2.3 中国农业专利的行业分布

3.2.4 中国农业专利的主体分布

3.3 中国农业专利的技术生命周期

3.3.1 中国农业专利技术整体发展阶段

3.3.2 主要农业技术领域的生命周期比较

3.3.3 三大主体的农业专利技术生命周期比较

3.4 本章小结

第4章中国农业专利的空间分布与收敛性

4.1 研究设计

4.1.1 研究方法

4.1.2 数据来源

4.2 中国农业专利的空间分布

4.2.1 中国农业专利的省域分布

4.2.2 中国农业专利水平的空间均衡性

4.2.3 中国农业专利水平的空间自相关性

4.3 中国农业专利的收敛性

4.3.1 中国农业专利水平的绝对β收敛

4.3.2 中国农业专利水平的条件β收敛

4.4 本章小结

第5章中国农业专利的质量分布与泡沫甄别——以授权发明为例

5.1 研究方法与数据来源

5.1.1 研究方法

5.1.2 数据来源

5.2 中国农业专利质量分布

5.2.1 基于综合评价指数的专利质量比较

5.2.2 基于专利宽度的技术通用性分析

5.2.3 基于专利被引的技术创新性分析

5.2.4 基于专利权利要求的法律价值分析

5.2.5 基于专利存续期的经济价值分析

5.3 中国农业泡沫专利分布

5.3.1 中国农业泡沫专利规模

5.3.2 中国农业泡沫专利分布

5.3.3 中国农业泡沫专利空间均衡性

5.4 中国农业泡沫专利识别

5.4.1 基于二元选择模型的泡沫专利识别

5.4.2 基于机器学习分类的泡沫专利识别

5.4.3 两类泡沫专利识别方法结果比较

5.5 本章小结

第6章中国农业专利质量的影响因素及其作用路径

6.1 研究方法与数据来源

6.1.1 研究方法

6.1.2 数据来源

6.1.3 空间自相关检验

6.2 中国农业专利综合质量的影响因素分析

6.2.1 中国农业专利综合质量影响因素

6.2.2 中国农业专利综合质量边际影响

6.3 中国农业专利质量影响因素的作用路径

6.3.1 中国农业专利技术通用性路径

6.3.2 中国农业专利技术创新性路径

6.3.3 中国农业专利法律价值路径

6.3.4 中国农业专利经济价值路径

6.4 考虑创新累积效应的稳健性检验

6.4.1 综合质量影响因素稳健性

6.4.2 技术通用性影响因素稳健性

6.4.3 技术创新性影响因素稳健性

6.4.4 法律价值影响因素稳健性

6.4.5 经济价值影响因素稳健性

6.5 本章小结

第7章中国农业专利的经济效果评价——以种植业为例

7.1 研究方法与数据来源

7.1.1 空间计量模型

7.1.2 数据来源

7.2 中国农业专利的经济贡献分析

7.2.1 模型适配度检验

7.2.2 地理视角下经济贡献分析

7.2.3 供需视角下经济贡献分析

7.3 中国农业专利的边际经济贡献

7.3.1 地理视角下边际经济贡献

7.3.2 供需视角下边际经济贡献

7.4 中国农业专利经济效果的稳健性检验

7.4.1 模型互为因果的内生性讨论

7.4.2 异方差空间面板杜宾模型

7.4.3 含固定效应的空间杜宾模型

7.4.4 广义空间两阶段最小二乘法

7.5 本章小结

第8章研究结论与政策建议

8.1 主要结论

8.1.1 中国农业专利数量加速增长,省域间数量水平呈现β收敛

8.1.2 中国农业专利质量阶段性下降,质量受多方面因素影响

8.1.3 中国农业专利具有显着经济贡献,贡献以本地直接效应为主

8.2 政策建议

8.2.1 优化农业技术研发资源配置,推动农业专利产出合理收敛

8.2.2 壮大市场化农业技术研发主体,加快农业技术诱致性创新

8.2.3 构建农业技术创新生态系统,促进农业高质量专利应用转化

8.3 讨论

8.3.1 研究不足

8.3.2 未来展望

参考文献

攻读博士期间的研究成果

致谢

（7）经济不确定性、经济周期与货币政策有效性研究（论文提纲范文）

摘要

Abstract

第1章绪论

1.1 选题背景与研究意义

1.1.1 选题背景

1.1.2 研究意义

1.2 文献综述

1.2.1 经济不确定性对经济周期影响机制的研究综述

1.2.2 经济不确定性对货币政策有效性影响机制的研究综述

1.2.3 经济周期不同阶段下货币政策有效性研究综述

1.3 研究方法与创新

1.3.1 研究方法

1.3.2 主要创新与贡献

1.4 论文框架与结构安排

第2章概念界定与理论基础

2.1 经济不确定性概念的起源、界定与度量

2.2 经济不确定性对经济周期影响机制的理论基础

2.3 经济不确定性对货币政策有效性影响的理论基础

2.4 不同经济周期下货币政策调控的理论基础

2.5 本章小结

第3章我国经济不确定性与经济周期测度及其协动性

3.1 我国经济不确定性走势分析

3.2 我国经济周期指数的测度和走势分析

3.2.1 传统经济周期测度方法的总结与利弊评述

3.2.2 MS-DFM测度经济周期的原理简述

3.2.3 我国经济周期指数的实时测度

3.2.4 我国经济周期统计特征与趋势分析

3.3 我国经济不确定性与经济周期协动性检验

3.3.1 经济不确定性与经济周期时变格兰杰因果检验

3.3.2 经济不确定性与经济周期间的动态相关性检验

3.3.3 经济不确定性与经济周期间的动态溢出效应检验

3.4 本章小结

第4章不同经济不确定性水平下的货币政策有效性研究

4.1 不同政策目标和不确定性水平下货币政策量价选择的初步探讨

4.1.1 不同政策目标下数量型与价格型货币政策有效性探讨

4.1.2 经济不确定影响下货币政策有效性探讨

4.1.3 双重背景下数量型与价格型政策选择的探讨

4.2 我国经济不确定性阶段划分

4.2.1 MS-AR模型

4.2.2 经济不确定性区制划分

4.3 LT-TVP-VAR模型构建与参数估计

4.3.1 LT-TVP-VAR模型构建

4.3.2 数据选取与处理

4.3.3 参数估计与检验

4.4 不同经济不确定性水平下货币政策时变反应与调控机制

4.4.1 不同经济不确定性水平下货币政策时变反应

4.4.2 数量型与价格型政策对产出调控的实时对比

4.4.3 数量型与价格型政策对通胀调控的实时对比

4.5 本章小结

第5章经济周期不同阶段下的货币政策有效性研究

5.1 经济周期不同阶段下货币政策调控的典型事实

5.1.1 经济周期波动下货币政策调控的历史演变

5.1.2 经济周期扩张阶段货币政策调控的有效性分析

5.1.3 经济周期收缩阶段货币政策调控的有效性分析

5.2 经济周期不同阶段下货币政策调控效果对比

5.2.1 TH-SVAR模型介绍

5.2.2 数据选取与检验

5.2.3 经济周期不同阶段下货币政策对产出的调控机制检验

5.2.4 经济周期不同阶段下货币政策对通胀的调控机制检验

5.2.5 数量型与价格型货币政策在经济周期不同阶段下的有效性对比

5.3 经济周期不同阶段下货币政策调控的非对称性检验

5.3.1 SEIVAR模型估计原理与脉冲响应函数构建

5.3.2 数量型货币政策在经济周期不同阶段下的非对称性检验

5.3.3 价格型货币政策在经济周期不同阶段下的非对称性检验

5.4 本章小结

第6章未预期冲击、预期管理与货币政策有效性研究

6.1 价格型和数量型货币政策的适用条件

6.2 考虑政策预期因素的DSGE模型构架

6.2.1 私人家庭

6.2.2 生产厂商

6.2.3 政府部门

6.2.4 货币当局

6.3 数据处理与参数估计

6.3.1 数据选取与处理

6.3.2 参数校准与设定

6.3.3 冲击路径识别

6.3.4 参数贝叶斯估计

6.4 脉冲响应与方差分解分析

6.4.1 脉冲响应分析

6.4.2 方差分解分析

6.5 本章小结

结论和政策建议

参考文献

攻读学位期间发表的学术论文及科研成果

致谢

（8）GEE框架下纵向数据均值-方差联合模型的研究（论文提纲范文）

摘要

Abstract

第一章绪论

第一节选题背景及其研究意义

第二节研究动态

一、纵向数据均值-方差联合建模研究动态

二、关于纵向数据变量选择的研究动态

三、关于纵向数据统计诊断研究动态

四、关于纵向数据稳健建模的研究动态

第三节研究内容和创新之处

一、研究内容

二、创新之处

第四节论文结构

第二章纵向数据均值-方差联合模型

第一节基于MCD分解下的均值-方差联合模型

一、正态分布假定下的联合模型

二、基于MCD的均值-方差联合广义估计方程

第二节基于MACD分解下的均值-方差联合模型

一、正态分布假定下的联合模型

二、基于MACD的均值-方差联合广义估计方程

第三节基于ARMACD分解下的均值-方差联合模型

一、正态分布假定下的联合模型

二、基于ARMACD的均值-方差联合广义估计方程

第四节小结与讨论

第三章光滑阈值的联合广义估计方程

第一节模型选择简介

一、经典的模型选择方法

二、带惩罚似然的方法

三、基于GEE框架下的模型选择方法

第二节均值-方差联合模型的变量选择

一、有效的光滑阈值广义估计方程

二、渐近性质

三、算法和最优调节参数的选择

第三节模拟实验

第四节实际数据分析

一、实际数据分析一

二、实际数据分析二

第五节小结与讨论

第四章纵向数据联合模型的统计诊断

第一节统计诊断方法简介

一、统计诊断的基本方法

第二节联合模型的统计诊断分析

一、模型及“点删除”统计诊断分析

第三节模拟分析

一、一步近似诊断的精度

二、均值参数的扰动

三、方差参数的扰动

四、混合分布情形下的统计诊断

第四节实际数据分析

一、实际数据分析一

二、实际数据分析二

第五节小结与讨论

第五章纵向数据稳健的均值—方差联合模型

第一节稳健的均值—方差联合模型

一、均值—方差联合模型

二、稳健的联合估计方程

三、算法与实现

四、渐近性质

第二节渐近性质的证明

一、定理5.1.1 的证明

二、引理5.1.1 的证明

三、定理5.1.2 的证明

第三节模拟实验

第四节实际数据分析

一、实际数据分析一

二、实际数据分析二

第五节小结与讨论

第六章总结和展望

一、总结

二、展望

参考文献

附录A 论文使用的数据

附录B 主要程序

致谢

本人在读期间完成的研究成果

（9）计算机科技论文摘要的机翻错误类型及译后编辑（论文提纲范文）

摘要

Abstract

CHAPTER1 INTRODUCTION

1.1 Research Background and Significance

1.2 Aims of the Study

1.3 Organization of the Thesis

CHAPTER2 LITERATURE REVIEW AND FRAMEWORK

2.1 Overview on Machine Translation and Post-editing

2.2 Previous Studies on MT Error Types and Post-Editing Strategies

2.3 DQF-MQM Error Classification Framework

2.4 Previous Studies on MT Error Types of Paper Abstracts

2.5 Text Typology Theory

2.5.1 Text Typology Theory of Reiss

2.5.2 Previous Studies on Informative Texts and Translation Principles

CHAPTER3 METHODOLOGY

3.1 Source Text and Text Analysis

3.1.1 Source Text

3.1.2 Text Analysis

3.2 Research Method

3.3 Translation Process

3.3.1 Translating300 computer science abstracts with MT system

3.3.2 Post-editing the MT-generated translation based on Text Typology Theory

3.3.3 Conducting a semi-structured interview for ensuring post-editing quality

3.3.4 Analyzing and summarizing the errors in300 abstracts

3.3.5 Preliminary error classifications based on DQF-MQM Framework

3.3.6 Conducting the2nd semi-structured interview to confirm error classifications

3.3.7 Quantitative analysis of all MT errors in the300 abstracts

CHAPTER4 RESULTS AND DISCUSSION

4.1 Error Types of Machine Translated English Abstracts

4.1.1 Unidiomatic Translation Errors in MT output

4.1.2 Terminology Mistranslation Errors in MT Output

4.1.3 Mistranslation Errors in MT Output

4.1.4 Under-translation Errors in MT Output

4.1.5 Omission Translation Errors in MT Output

4.1.6 Over-translation Errors in MT Output

4.1.7 Errors of Addition in MT Output

4.2 Post-editing Strategies for Machine Translated Abstracts

4.2.1 Post-editing Strategies for Long and Complex Sentences

4.2.2 Post-editing Strategies for Passive Voice Sentences

4.2.3 Post-editing Strategies for Technical Terms

CHAPTER5 CONCLUSION

5.1 Major Findings

5.2 Limitations and Suggestions

References

Appendix Source Texts and Target Texts of300 Abstracts

1-20 Abstracts

21-40 Abstracts

41-60 Abstracts

61-80 Abstracts

81-100 Abstracts

101-120 Abstracts

121-140 Abstracts

141-160 Abstracts

161-180 Abstracts

181-200 Abstracts

201-220 Abstracts

221-240 Abstracts

241-260 Abstracts

261-280 Abstracts

281-300 Abstracts

ACKNOWLEDGEMENTS

（10）协同积分理论的拓展与应用研究 ——基于核回归方法（论文提纲范文）

内容摘要

Abstract

第1章绪论

1.1 背景

1.2 研究的主要内容

1.3 研究的重点、主要意义和主要创新之处

第2章文献综述

2.1 协同积分理论的提出

2.2 协同积分理论的发展

2.3 非参数核回归方法在协同积分理论中的应用

2.4 文献综述小结

第3章协同积分理论与核回归方法概述

3.1 协同积分理论中一些重要概念的界定

3.1.1 平稳过程和非平稳过程

3.1.2 时间序列中的趋势

3.1.3 协同积分理论的基本概念

3.2 单位根检验

3.2.1 单位根过程

3.2.2 泛函中心极限定理

3.2.3 单位根检验的设计

3.3 协同积分系统的模型设定

3.3.1 协同积分的误差修正表示

3.3.2 协同积分的三角表示

3.3.3 协同积分的共同趋势表示

3.4 协同积分体系的估计与检验

3.4.1 基于最小二乘法的协同积分参数估计

3.4.2 基于回归残差的协同积分检验方法

3.4.3 基于极大似然法的协同积分参数估计

3.5 时间序列分析中变结构的建模

3.5.1 对变结构现象的认识和建模

3.5.2 变结构现象的存在性检验

3.5.3 变结构现象与平稳性检验

3.5.4 含变结构协同积分系统的建模研究

3.6 利用参数模型研究复杂协同积分关系时遇到的问题

3.7 核回归方法

3.7.1 核回归模型

3.7.2 可加模型

3.8 核回归方法在协同积分理论中的应用初探

3.8.1 基于核回归方法研究协同积分问题的模型设定

3.8.2 核回归估计值的统计性质

3.8.3 局部极限定理

3.8.4 与核回归方法对应的协同积分检验的设计思想

第4章非线性协同积分系统的非参数建模

4.1 基于核回归方法对非线性协同积分系统的建模过程

4.1.1 核回归方法对协同积分系统建模的一般步骤

4.1.2 非参数回归方法的分析框架与参数框架的不同

4.2 非参数核回归中的伪回归诊断

4.2.1 协同积分估计的伪回归风险和协同积分检验的取伪风险

4.2.2 基于残差的模型诊断方法

4.3 基于非参数模型残差的协同积分检验

4.3.1 非线性协同积分关系检验的检验模型

4.3.2 非线性协同积分关系检验的检验统计量

4.4 核回归方法估计和检验功效的模拟研究

4.4.1 实验设计

4.4.2 核回归方法对协同积分关系的估计拟合能力

4.4.3 联合检验方法对协同积分关系的检验功效

4.5 小结

第5章变结构协同积分系统的非参数建模

5.1 基于非参数方法对变结构协同积分关系的估计研究

5.2 基于时变非参数模型的协同积分关系检验

5.2.1 变结构协同积分关系检验的检验模型

5.2.2 变结构协同积分关系检验的检验统计量

5.3 核回归方法估计和检验功效的模拟研究

5.3.1 实验设计

5.3.2 时变非参模型对协同积分关系的估计拟合能力

5.3.3 广义局部DW检验对协同积分关系的检验功效

5.4 小结

第6章货币投放、经济增长、对外贸易间协同分关系的研究

6.1 货币供应量与经济总产出的协同关系研究

6.1.1 货币理论的相关背景

6.1.2 数据整理与统计分析

6.1.3 建模分析

6.2 经济增长与进口总值的协同关系研究

6.2.1 进口贸易的相关理论背景

6.2.2 数据整理与统计分析

6.2.3 建模分析

6.3 小结

第7章结论与展望

7.1 主要结论

7.2 不足与展望

参考文献

在学期间发表的学术论文与研究成果

后记

四、线性模型中基于稳健诊断的局部影响分析(英文)（论文参考文献）

[1]社区2型糖尿病患者自我管理小组活动长期效果研究[D]. 夏章. 中国疾病预防控制中心, 2021(02)
[2]基于神经网络的EFL教材文本复杂度分级模型的构建[D]. 唐美华. 北京外国语大学, 2021(09)
[3]通用加工树模型假设检验的统计等价理论及其应用[D]. 杨磊. 华中师范大学, 2021(02)
[4]面向回归的稳健正则化方法研究[D]. 苏美红. 山西大学, 2021(01)
[5]基于深度学习的抗肿瘤药物作用机制研究[D]. 李叙潼. 中国科学院大学(中国科学院上海药物研究所), 2021(08)
[6]中国农业专利的数量、质量与经济效果研究[D]. 赖晓敏. 华中农业大学, 2021(02)
[7]经济不确定性、经济周期与货币政策有效性研究[D]. 王国志. 吉林大学, 2021(01)
[8]GEE框架下纵向数据均值-方差联合模型的研究[D]. 李娜. 云南财经大学, 2021(09)
[9]计算机科技论文摘要的机翻错误类型及译后编辑[D]. 付茜雯. 大连理工大学, 2020(06)
[10]协同积分理论的拓展与应用研究 ——基于核回归方法[D]. 葛通. 天津财经大学, 2019(07)

标签：线性模型论文; 文本分类论文; 预测模型论文; 经济模型论文; 协同软件论文;

线性模型中基于稳健诊断的局部影响分析

一、线性模型中基于稳健诊断的局部影响分析(英文)（论文文献综述）

二、线性模型中基于稳健诊断的局部影响分析(英文)（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

写法范例：

（2）本文研究方法

三、线性模型中基于稳健诊断的局部影响分析(英文)（论文提纲范文）

（1）社区2型糖尿病患者自我管理小组活动长期效果研究（论文提纲范文）

（2）基于神经网络的EFL教材文本复杂度分级模型的构建（论文提纲范文）

（3）通用加工树模型假设检验的统计等价理论及其应用（论文提纲范文）

（4）面向回归的稳健正则化方法研究（论文提纲范文）

（5）基于深度学习的抗肿瘤药物作用机制研究（论文提纲范文）

（6）中国农业专利的数量、质量与经济效果研究（论文提纲范文）

（7）经济不确定性、经济周期与货币政策有效性研究（论文提纲范文）

（8）GEE框架下纵向数据均值-方差联合模型的研究（论文提纲范文）

（9）计算机科技论文摘要的机翻错误类型及译后编辑（论文提纲范文）

（10）协同积分理论的拓展与应用研究 ——基于核回归方法（论文提纲范文）

四、线性模型中基于稳健诊断的局部影响分析(英文)（论文参考文献）

猜你喜欢