基于粗糙集的数据挖掘及其实现

一、基于粗糙集(Rough set)的数据挖掘及其实现（论文文献综述）

钱卓昊^[1]（2021）在《多层次粗糙集模型中双边属性值泛化约简方法的研究》文中研究表明随着大数据时代的到来,具有多层次结构的数据越来越普遍,利用层次结构来对决策信息表（简称决策表）进行属性值泛化约简可以在保证分类能力不变的前提下有效降低决策表的维度,而构造合理的层次结构是研究属性值泛化约简的前提,因此研究层次结构构造方法和决策表的属性值泛化约简方法在高维数据越来越普遍的大数据时代具有重要意义。目前关于决策表的属性值泛化约简以及层次结构构造的研究大都是基于决策表的条件属性集,针对决策属性层次结构的研究较少,但仅考虑条件属性集的属性值泛化约简并不能完全挖掘决策表的泛化潜力。决策表中的每个对象都具备决策属性和条件属性两种属性,现实中很多对象的决策属性也具有层次结构,仅考虑条件属性集的层次结构会忽略决策属性可能存在的层次关系和泛化潜力。同时,目前对层次结构构造方法的研究大都局限于处理无序数据,对含有分层结构的有序数据很少涉及。基于上述背景,本文进行了以下研究:（1）为构造有效表达层次结构的属性值分类（AVT）,本文提出了VDM-AVT学习器和DAVT学习器及其实现算法,两种学习器分别可以依据决策表自动构造条件属性集和决策属性的AVT,且均能处理有序数据和无序数据。（2）针对属性值泛化约简问题,本文首先提出了多层次决策属性粗糙集模型,以此来研究决策属性AVT中分割间的关系,进而提出了多层次粗糙集模型来研究决策表全局分割间的关系。（3）在两种多层次模型基础上分别提出了决策泛化和双边属性值泛化约简的定义,并给出决策泛化的实现算法与双边属性值泛化约简的实现策略。（4）利用对比实验验证了双边属性值泛化约简的优越性。

刘克宇^[2]（2020）在《多元信息粒化与属性选择方法研究》文中研究指明随着数据收集、传输及存储技术的迅猛发展,我们对某一对象的描述更为丰富,刻画更为全面,记录更为长久,因而产生的数据往往表现出一种高维的典型特征。作为一种处理高维数据有效的数据挖掘与知识发现技术,属性约简得到了广泛的推广与应用。然而,大数据时代发展至今,数据越趋呈现多样化的复杂特性,其不仅仅局限于数据的高维度,更体现在弱监督、多尺度等问题上。正因如此,如何针对诸如此类的数据复杂性进行高效精准的分析与挖掘成为了传统属性选择方法的发展瓶颈所在。针对实际应用问题中数据的高维度、弱标签、多尺度等复杂特性,本文借鉴人类思考与解决复杂问题的粒化及分层认知模式,以多元视角进行目标解析,并在监督式信息粒化与融合、半监督粗糙数据分析、多粒度属性选择等方面展开了系统而又深入的研究与探讨,主要包括:发展了面向复杂数据的多元信息粒化与融合,多元集成的不确定性数据挖掘分析技术,构建了一整套多粒度视角下的属性选择算法框架,最终达到了能够有效提升复杂数据驱动下学习器的性能以及其问题求解的时间效率等目的。具体而言,本文的研究内容与创新成果主要涵盖以下几点。一、提出了双半径下多重监督邻域信息粒化策略。从粒计算的研究现状来看,实现信息粒化的方法大多属于无监督学习范畴,忽视了已有强监督信息的重要作用,因而缺乏在监督学习任务中的泛化性能。鉴于此,通过引入成对约束,参考样本的标签信息,在类与类之间进行样本的分割,并进一步地设计了类内类外双半径机制,分别对分割样本的相似度进行区别性地调控,指导性地给出了多重邻域信息粒化的监督式策略,过滤了信息粒化过程中易残留的不精确或不一致信息,有效地提升了信息粒化在属性噪声环境下的抗干扰能力。二、提出了半监督式多元集成的粗糙不确定性分析方法。从粗糙不确定性分析的研究现状来看,很多方法都着眼于标签完备的决策系统,过度依赖属性与标签的交互结果,而在处理标签缺失数据时就显得尤为棘手。此外,现有的分析手段往往过于单一,不足以充分挖掘隐含的深层知识与规律。鉴于此,详细剖析了当前粗糙不确定性分析方法在半监督问题上的症结所在,并进一步地提出了半监督环境下集成粗糙不确定性分析的新策略,在局部多元视角下观测属性空间,既赋予了半监督属性选择合理的语义解释,又拓宽了粗糙集方法在该问题上的应用前景。三、提出了多粒度视角下属性选择框架。从属性约简的研究现状来看,很多工作都仅考虑单个粒度层面上的约简求解,其面向由数据扰动造成的粒度变换问题时收效甚微。鉴于此,首先揭示了属性约简在粒度意义下的构造流程,并明晰了信息粒化与属性约简之间的内在关联机理。在此基础上,从信息融合的角度提出了多粒度属性约简的概念,并设计了一大类求解多粒度约简的高效算法框架,从而有效地解决了属性约简在多粒度视角下的局限性,并显着提升了约简求解的时间效率。

何海洋^[3]（2020）在《面向粒计算的动态邻域不平衡数据分类算法》文中指出数据分布不平衡问题是机器学习和数据挖掘领域的研究热点,在许多现实世界的实际应用中人们往往更关注那些数量稀少的少数类数据。为了改进不平衡数据分类算法的分类效果,通常从数据采样和分类算法这两个方向上进行完善。但是数据采样方法大多数只能在全局层面上改善数据集的不平衡程度,而无法改善在局部中的数据分布。因此近邻算法、邻域粗糙集理论以及三支决策等理论需要不断改进以更适应数据的不平衡分布。本文使用一种新的邻域构建方法,构造动态均等查询邻域,通过生成动态邻域判别稀疏程度,调整正向后验概率估计细化分类决策。该方法提高了对稀有数据的灵敏度,并为所有数据提供相同的查询机会,而不会过于偏向稀有类。利用邻域粗糙集理论对极端分布情况进行处理,消除缺乏稀有类数据的不确定性。根据细化后实例分布情况再分类决定后,基于邻域粗糙集的动态均等近邻分类算法可以将查询实例更准确地分类到类别中。本文还提出一种基于三支决策的动态均等近邻分类算法,首先构建动态均等查询邻域,之后利用三支决策理论更准确细致的对待测样本进行分类。利用正域和负域确定性信息先对一部分确定性高的样本进行分类,然后在边界域中细化局部邻域数据分布情况。调整后验概率估计根据不同数据分布情况进行分类决策,这也有助于基于三支决策的动态均等近邻分类算法可以将不平衡程度更广泛的数据集查询实例更准确稳定地分类。不平衡数据分类问题是数据挖掘的难点之一,为了提升分类算法在数据分布不平衡情况下的分类性能,本文提出了上述两种面向粒计算的动态邻域不平衡数据分类算法。最后通过实验验证,使用多个评价标准评估,两种面向粒计算的动态邻域不平衡数据分类算法在处理不平衡数据分类能力上通常优于kNN家族近邻分类器和其他类型常用分类器。

董杰^[4]（2020）在《邻域粗糙集的并行属性约简方法研究》文中认为由于科学和工业领域中数据的快速增长,传统的数据挖掘算法从数据存储和计算复杂性的角度都面临着挑战。作为数据挖掘的重要预处理技术,属性约简有助于通过消除冗余和不相关的属性来减少特征空间并提高分类性能。传统求解约简的启发式算法采用单一的度量指标作为约束条件,但这一策略并不能保证约简满足多重度量指标下约束需求。并且绝大多数的约简定义是建立在考虑所有决策类基础上的,而忽视了不同决策类别所对应的度量指标在约简前后的变化情况。除此之外,在单个节点的串行计算策略下难以处理海量数据并在庞大的搜索空间中探索有效的解决方案。针对以上问题,本文将从局部多约束角度出发,基于CUDA模型设计并实现一种并行属性约简算法。主要研究内容如下:（1）局部多约束的属性约简方法研究。首先介绍传统启发式约简算法,采用单一度量指标作为约束条件,如近似质量和条件熵。接着从局部的视角出发,分别对每一个决策类别进行约简。于是提出一种面向局部多约束的属性约简策略,其目的是使得每个决策类别都能够满足多重度量指标下的约束条件。实验结果展现了该约简方法的有效性。（2）邻域粗糙集近似和条件熵并行算法研究。首先分析CPU和GPU的结构差异,并介绍CUDA编程模型。接着讨论局部多约束条件的计算步骤,设计一种计算邻域等价类和决策类的并行算法,通过CUDA划分数据集并基于Multi-GPU计算局部条件熵和邻域粗糙集的上下近似。最后,通过三种度量指标评估并行算法的性能。实验结果表明了该算法的可行性。（3）并行属性约简算法研究。首先阐述传统属性约简算法的局限性,接着分析属性约简的并行性,给出三种并行策略的时间消耗。然后通过CUDA实现一种数据与任务并行的算法,不同决策子系统通过属性重要度得到候选属性。最后,候选属性子集进一步约简得到最终结果。实验结果表明了该算法具有较好的加速比和扩展性,可以有效处理数据挖掘中的海量数据。

余培^[5]（2020）在《基于XGBoost算法的电力用户信用风险预警及分级服务策略》文中研究指明结合新电改的形势,对客户做出合理而且综合的信用评价,成为供电企业提高经营效率所面临的一个重要议题,是决定供电企业进一步发展的重要因素。对电力用户信用等级的预测和评价,能够助力于合理开展电网企业的风险评价工作,同时也为电网企业的运营风险管理提供了理论指导和方法支撑,最大化地提前规避风险、降低风险。为了对信用评价体系做出改进,并且帮助供电企业规避电力交易时的风险,本文研究了电力用户信用风险评价原则和指标,重点参考中国电力企业联合会发布的指标体系,从电力市场信用风险内外部评价指标入手,优化了现有的评价指标体系,使其更具有实用性;同时基于粗糙集理论及条件属性的综合权重计算法得出对应指标评价权重,有效量化了各指标。基于该指标体系,本文用XGBoost算法及随机森林算法分别构建了电力用户信用风险预警模型,从财务信用风险、交易信用风险等方面对电力用户的信用风险进行了预测,并将随机森林预测模型结果与XGBoost预测模型结果进行对比。更进一步地,基于电力用户的信用风险评价结果及预测结果,本文提出电力用户的分级服务体系设计,可以针对不同风险等级的电力用户提供相应服务,以期改善电力市场交易体制,驱动对资源最优化分配,促进电力行业的健康发展。

李阳^[6]（2019）在《基于邻域粗糙集的度量方法及其应用研究》文中研究表明在当今科技飞速发展的时代,人工智能成为核心领域之一,机器学习和数据挖掘逐渐影响着人们的生活,很多科技产品都是在此基础上的应用与研究,如指纹或人脸识别考勤设备、汽车无人驾驶、高级智能化机器人等新技术,这些利用信息科技推动发展的新技术使人们的生活和工作变得更加方便和高效。在众多的领域中,聚类分析是一类重要的应用技术,将粗糙集应用在聚类分析上也是当前研究的热点领域。本文首先对常用的度量方法进行介绍和总结,分析了不同度量方法的优势特点以及应用领域。针对已存在度量方法的不足,结合邻域粗糙集理论的思想,提出了基于邻域粗糙集理论的度量方法,同时对该方法的特性、背景以及应用场景进行深入的分析。本文将该度量方法应用在智能算法以及聚类分析上,提高了原始算法的性能。本文的主要工作如下:（1）提出了邻域粗糙集度量方法。首先,通过邻域粗糙集理论介绍了已有的度量方法。然后,利用邻域粗糙集中的近似集得到近似精度以及近似分类质量,通过近似精度、近似分类质量求出重要度、粗糙度从而提出邻域粗糙集度量方法。最后,通过实验得出该度量方法能够得到较好的结果。（2）将提出的基于邻域粗糙集理论的度量方法应用在粒子群聚类算法上,并利用大量实验进行验证。首先,对各种改进的度量方法进行分析和总结,挑选出具有代表性的度量方法进行对比。然后,在真实数据集和人工数据集上,针对不同的聚类评价指标和不同的度量方法进行实验。最后,分别在两方面对聚类结果进行比较分析,包括不同算法使用相同的度量方法和相同的算法使用不同的度量方法。（3）将提出的方法应用在密度峰值聚类算法上。首先,对该度量方法应用的背景以及应用场景进行研究分析。其次,详细分析了 DPC算法存在的缺陷,即:DPC中的方法使用清晰的邻域关系来计算局部密度时,不能从距离上识别出不同点的邻域隶属度,另外对不平衡数据以及多峰值数据进行聚类时得不到理想的结果。最后,将具有代表性的数据集利用不同的聚类评测标准进行实验。

宋剑^[7]（2019）在《粗糙集属性离散化与属性约简的研究及应用》文中进行了进一步梳理随着科技的进步与发展,人们能够采集到的数据规模正在不断地增加。如何从这些数据中提取有价值的信息已经成为人们关注的重点问题。粗糙集作为一种信息处理工具经过了几十年的研究和发展,已经被广泛应用于机器学习、数据挖掘等多种领域中。经典粗糙集只能够处理离散型数据,因此需要对连续数据进行离散化处理。离散化算法可以分成有监督和无监督两种算法,其中,无监督离散化算法不需要考虑类别属性,因此这类算法效率高,但是离散化后数据的分类精度较差。有监督离散化算法借助类别属性来指导离散过程,从而可以获得较好的离散化效果。目前大部分有监督离散化算法为单属性离散化算法,该类算法没有考虑多维属性之间的关系,很难得到数目少且较优的断点集。属性约简是粗糙集理论的核心内容之一。目前很多学者根据不同的理论提出了许多优秀的属性约简算法。差别矩阵方法因其简单直观受到了广泛的关注,但是该方法的主要问题就是矩阵中存在大量的冗余的差别信息元素,这些冗余元素不仅对影响算法运行结果而且导致空间存储代价很高。针对这些缺点,许多研究者根据不同的存储结构来对该算法进行改进。基于区分链表的属性约简是一种利用链表结构来存储差别信息的方法,该方法在一定程度上降低了空间代价,但是该方法只是在构造链表中删除了那些包含核的差别信息元素,对于那些没有包含核且重复的元素没有做出处理。本文的研究工作主要有以下三个方面:首先,本文提出了一种基于二元蚁群和变精度粗糙集的多属性离散化算法,该算法通过在候选断点集上建立二元蚁群网络,运用变精度粗糙集的近似分类精度来构建适宜度评价函数,以此来搜索最优的离散断点集,通过实验表明该方法在降低断点数量以及提高分类准确率方面有所改善;然后,针对区分链表的缺点,本文提出了二进制链表结构来存储差别信息,在构造该链表过程中所有的冗余元素都会被删除并在此结构的基础上提出了相应的属性约简算法。多组数据的实验结果表明本文提出的属性约简算法可以更快地获得约简集。最后,结合这两种算法设计并实现一个基于粗糙集预处理的葡萄酒质量预测系统。

龚杰^[8]（2019）在《基于数据挖掘的配电变压器故障诊断》文中研究表明电力变压器作为电网主要枢纽设备,在电力系统中具有举足重轻的地位,其运行状态直接影响电网的安全运行。及时、准确地判断变压器故障类型一直是学者们研究的热点,传统的三比值法是过去几十年来应用最为广泛的故障诊断方法,但因其编码存在边界、模糊等缺陷致使故障诊断的正确率不高。同时随着各种在线检测装置的应用,电力设备检测数据爆炸式增长,传统诊断方法更显得心余力绌;而数据挖掘技术在处理海量数据、挖掘隐藏信息方面具备得天独厚的优势,如今被广泛应用于金融、气象、道路交通等领域。因此本文结合数据挖掘与传统诊断方法,提出一种融合数据约简、改进引力搜索、模糊核聚类的变压器故障诊断方法。本文对传统的基于油中溶解气体的变压器故障诊断方法进行理论学习,归纳、总结出油浸式电力变压器的故障类型,分析了变压器油中溶解气体产生的原理及其与相应故障的联系;指出三比值法存在的缺陷,并以此作为下一步故障诊断的切入点。概述了数据挖掘的基本过程以及常用的几种智能算法,选择模糊核聚类为本文故障诊断模型的基础,详细研究了该算法的原理特征、数学模型及其实现步骤。选取H2、CH4、C2H2、C2H4、C2H6、CH4/H2、C2H2/C2H4、C2H4/C2H6作为变压器故障诊断的原始特征量,初步构建变压器故障诊断的主体模型,仿真实验发现基础模糊核聚类的诊断正确率过度依赖初始聚类中心向量而陷入局部收敛。考虑到知识系统中不同条件属性对决策的贡献程度不同,冗余的条件属性可能使得决策者无法正确地辨别有用的信息,而且知识系统中数据维度越高故障诊断过程越复杂、繁琐。因此引入粗糙集和核主成分分析,以UCI标准数据集wine为例进行仿真实验,结果显示wine数据集经核主成分分析处理后原始线性不可分数据变得线性可分;经过粗糙集处理后,原始数据不仅降低了维度而且还保持了原有的类别信息,有助于数据挖掘。针对模糊核聚类的不足融入万有引力搜索,构建引力核聚类诊断模型;该模型以核函数参数和聚类中心作为搜索粒子,在初始的种群空间中寻找最优解;同时利用混沌初始化、动态逼近策略、纵向交叉策略优化万有引力搜索,增强算法搜索的多样性、改善初始群体的分布性以及算法的寻优效率。结合粗糙集和核主成分分析,本文分别搭建了基于粗糙集与万有引力核聚类和基于核主成分分析与万有引力核聚类的变压器故障诊断模型,仿真实验结果显示后者的诊断结果稍优于前者,且两者诊断正确率均优于模糊核聚类,这表明本文所提出的方法在变压故障诊断方面具有一定的应用性。

周润苗^[9]（2019）在《基于粗糙集智能推荐的乡村旅游微信应用平台研究》文中研究说明随着网络技术的飞速发展,互联网已进入万联网时代,丰富的信息资源给人们带来极大方便的同时,对人们也造成了一定的困扰,也就是人们在海量级增加的信息海洋中无法快速的找到自己想要的信息。智能推荐系统通过研究用户的兴趣偏好,结合所查找信息的一些相关特征来进行计算,帮助人们快速的找到自己心仪的信息。传统的智能推荐方法较少关注用户具体行为、位置等个性化信息,这往往会造成所推荐的结果准确率不高。因此如何提高推荐结果的准确率变得非常重要。本文针对当前推荐系统推荐结果准确率不高的问题,以粗糙集理论为基础,借助本体技术,建立了一个乡村旅游智能推荐模型,并通过乡村旅游微信小程序进行验证。本文主要研究工作如下:（1）通过对旅游产品智能推荐文献研究,归纳总结目前常用的方法,提出自己的观点;（2）通过文献分析和对乡村旅游产品实地调查,构建乡村旅游产品和用户个性化兴趣的本体模型;（3）通过对粗糙集的基本理论和属性约简的常用算法文献研究,确定采用基于差别矩阵的属性约简方法来对乡村旅游产品信息进行属性约简,得到核属性,同时结合用户个性化动态兴趣模型,计算用户对产品属性的兴趣度,再通过对乡村旅游产品与用户兴趣相似度综合计算排序来进行乡村旅游产品的推荐;（4）设计一个乡村旅游微信小程序来对推荐模型进行实例验证。研究结果表明,运用基于粗糙集理论的用户个性化智能推荐模型为乡村旅游微信平台用户进行产品信息推荐是行之有效的,它大大提高了对用户信息推荐的准确率。

张天驰^[10]（2019）在《脑胶质瘤核磁共振图像分割方法研究》文中研究说明医学图像处理技术作为医疗的重要技术手段,发挥着不可替代的作用。脑瘤是影响人类健康的重要原因之一,基于核磁共振图像（Magnetic Resonance Imaging,MRI）进行脑胶质瘤标志物分割辨识是目前最有效的医疗诊断技术手段之一,因此,研究脑瘤MRI图像分割技术具有重要的理论研究意义和实际应用价值。本文针对脑胶质瘤MRI图像目标物形状复杂且不规则、边缘模糊、目标和背景灰度值相近等特征,基于纳什均衡、粗糙集和粗糙熵、玻色-爱因斯坦凝聚等理论,研究脑胶质瘤MRI图像分割问题,旨在为提高脑瘤等医学图像分割质量探索新方法。论文主要研究内容如下:研究基于纳什均衡理论改进支持向量机（Support Vector Machine,SVM）的脑胶质瘤图像分割方法。针对SVM中惩罚参数的设置影响图像分割准确性的问题,提出熵和标准差双重约束的新型纳什均衡模型,研究图像特征及其分割过程与纳什均衡理论及其推理机制之间的关系,得出新型纳什均衡模型参数计算方法,构建纳什均衡过程。提出基于新型纳什均衡模型改进SVM,采用熵和标准差双重约束的纳什均衡收益通过纳什均衡推理来设定SVM中的惩罚参数。通过对脑胶质瘤MRI图像分割实验验证本文方法的效果。研究基于纳什均衡理论的目标边缘区域聚类方法。针对脑胶质瘤图像目标边缘区域模糊的问题,提出两步纳什均衡聚类方法,通过类内最大相似性判断（目标区域内部节点之间的最大相似度）和类间最小相似性判断（目标和背景区域的节点之间的最小相似度）获得脑瘤目标区域和背景区域。基于纳什均衡理论改进C-V模型,通过该模型得到脑瘤目标轮廓线;针对脑瘤图像目标边缘区域相似的问题,提出基于纳什均衡的纹理相似区域判断与合并方法,获得脑瘤目标区域和背景区域之后,基于纳什均衡理论改进多纹理特征C-V模型,将图像中节点特征映射为纳什均衡的收益,通过纳什均衡推理来设定C-V模型中平均灰度参数。通过改进后的C-V模型求得脑瘤目标轮廓线。通过MRI脑瘤图像分割实验验证本文方法的效果。研究基于粗糙集和粗糙熵的Petri网脑瘤图像分割方法。针对粗糙集和粗糙熵只对轮廓线上某个节点自身进行判断不对该节点相邻节点进行相关性判断而导致脑瘤图像分割轮廓线不准确的问题,提出基于粗糙集和粗糙熵的Petri网的脑瘤图像分割方法,提出粗分割、精分割两阶段分割方式:第一阶段基于粗糙集和粗糙熵进行粗分割以获得目标对象的初步轮廓;第二阶段通过Petri网进行精分割,利用Petri网进行对多边界选择和前后向校正以得到更精确的目标轮廓。通过实验验证该方法在提高图像分割准确性方面的效果。研究基于玻色—爱因斯坦凝聚理论（Bose–Einstein Condensate,BEC）的脑胶质瘤图像分割模型。针对脑胶质瘤形状通常为囊性或环状增强的边缘轮廓而难以对其图像进行精确分割的问题,为探索新的医学图像分割方法,本文尝试将BEC理论应用于脑瘤图像分割。基于BEC构建支持向量机（SVM）中的核函数,提出一种BEC核函数的SVM脑瘤图像分割方法。通过不同类型的脑胶质瘤图像分割实验,对比验证本文方法与其他相近方法的分割效果。研究基于量子虫洞粒子群优化算法的脑瘤图像分割方法。针对具有“瓶颈”和“硬脑尾”等复杂形状的脑瘤图像分割问题,引入量子和虫洞理论来改进量子粒子群优化算法（Quantum-behaved Particle Swarm Optimization,QPSO）,提出一种新的量子虫洞粒子群优化算法（Quantum and Wormhole-behaved Particle Swarm Optimization,QWPSO）,提出将图像中节点分为种子粒子节点和像素粒子节点两类,给出区分两类节点的分类公式。提出一种虫洞双曲线路径公式,给出QWPSO算法的计算公式。通过实验验证本文方法和其他方法的对比效果。为复杂形状的脑瘤MRI图像分割探索一种新方法。

二、基于粗糙集(Rough set)的数据挖掘及其实现（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、基于粗糙集(Rough set)的数据挖掘及其实现（论文提纲范文）

（1）多层次粗糙集模型中双边属性值泛化约简方法的研究（论文提纲范文）

摘要

abstract

第一章绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 论文研究内容及挑战

1.4 论文组织结构

第二章多层次粗糙集模型泛化约简相关理论基础

2.1 粗糙集基础理论

2.2 决策表的层次结构

2.3 属性值泛化约简

第三章条件属性AVT的构造方法

3.1 VDM-AVT学习器实现方法

3.2 VDM-AVT学习器的评估

3.2.1 VDM-AVT-AGR模型

3.2.2 仿真实验过程与结果分析

第四章决策属性AVT的构建方法

4.1 DAVT学习器原理概述

4.2 决策属性值所对应样本聚类簇的簇间相似度计算

4.2.1 单个样本对象与聚类簇的相似度

4.2.2 簇间相似度

第五章基于AVT的多层次粗糙集模型

5.1 基于AVT的多层次决策属性粗糙集模型

5.2 基于AVT的多层次粗糙集模型

第六章双边属性值泛化约简

6.1 基于正域的决策属性值泛化算法

6.2 基于正域的双边属性值泛化约简

6.2.1 基于正域的双边属性值泛化约简定义

6.2.2 基于DAVG-PR与 GRPR的双边泛化约简策略

第七章实验过程及结果分析

7.1 数据集及预处理

7.2 实验方法

7.3 实验结果与分析

第八章总结与展望

8.1 总结

8.2 展望

致谢

参考文献

攻读学位期间参加科研情况及获得的学术成果

（2）多元信息粒化与属性选择方法研究（论文提纲范文）

摘要

Abstract

第1章绪论

1.1.研究背景与意义

1.2.关键方法与技术

1.2.1.信息粒化

1.2.2.属性约简

1.3.存在问题与挑战

1.4.本文工作与贡献

第2章监督信息粒化下的属性约简

2.1.问题描述

2.2.相关知识

2.3.本章工作

2.3.1.类内外双半径监督信息粒化

2.3.2.监督粒化的属性评价与选择

2.4.实验分析

2.4.1 实验数据

2.4.2 实验设置

2.4.3 实验结果

2.5.本章小结

第3章半监督决策系统下的属性约简

3.1.问题描述

3.2.相关知识

3.3.本章工作

3.3.1.局部邻域决策错误率

3.3.2.半监督集成属性选择

3.4.实验分析

3.4.1.实验数据

3.4.2.实验设置

3.4.3.实验结果

3.5.本章小结

第4章多粒度问题下的属性约简

4.1.问题描述

4.2.相关知识

4.3.本章工作

4.3.1.多粒度属性约简的定义

4.3.2.多粒度属性选择加速器

4.4.实验分析

4.4.1.实验数据

4.4.2.实验设置

4.4.3.实验结果

4.5.本章小结

结论与展望

参考文献

攻读硕士学位期间取得的研究成果

攻读硕士学位期间主持与参与的科研项目

致谢

（3）面向粒计算的动态邻域不平衡数据分类算法（论文提纲范文）

摘要

Abstract

1 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.2.1 不平衡数据采样方法的研究现状

1.2.2 近邻分类算法与粒计算的研究现状

1.3 主要研究内容

1.4 论文组织结构

2 理论基础

2.1 kNN近邻分类方法

2.2 邻域粗糙集理论

2.3 三支决策理论

2.4 本章小结

3 基于邻域粗糙集的动态均等近邻分类算法

3.1 构建动态均等查询邻域

3.2 判别稀有类数据实际分布情况

3.3 细化分类决策

3.4 基于邻域粗糙集的动态均等近邻分类算法

3.5 本章小结

4 基于三支决策的动态均等近邻分类算法

4.1 构建动态均等查询邻域及各情况举例

4.2 动态均等查询邻域内等价类划分及正域计算

4.3 基于三支决策的动态均等近邻分类算法

4.4 本章小结

5 面向粒计算的动态邻域不平衡数据分类算法实验分析

5.1 实验环境及实验方案介绍

5.1.1 实验环境介绍

5.1.2 评估指标

5.1.3 评估对比相关分类器

5.1.4 实验设置

5.2 基于邻域粗糙集的动态均等近邻分类算法实验

5.2.1 相关数据集选择

5.2.2 基于邻域粗糙集的动态均等近邻分类算法实验对比分析

5.3 基于三支决策的动态均等近邻分类算法实验

5.3.1 相关数据集选择

5.3.2 基于三支决策的动态均等近邻分类算法实验对比分析

5.4 本章小结

总结

参考文献

致谢

作者简历及攻读硕士学位期间的科研成果

（4）邻域粗糙集的并行属性约简方法研究（论文提纲范文）

摘要

Abstract

第1章绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.2.1 粗糙集理论的研究现状

1.2.2 属性约简的研究现状

1.3 研究内容和组织结构

第2章粗糙集理论概述

2.1 经典粗糙集的基础知识

2.1.1 等价关系与等价类

2.1.2 上近似与下近似

2.1.3 知识约简

2.2 邻域粗糙集的基础知识

2.2.1 邻域粒化

2.2.2 邻域粗糙集逼近

2.3 本章小结

第3章局部多约束的属性约简算法

3.1 传统近似质量约简

3.2 局部近似质量约简

3.3 局部多约束属性约简

3.4 实验结果与分析

3.5 本章小结

第4章邻域粗糙集近似和条件熵并行算法

4.1 GPU和 CUDA

4.1.1 硬件结构

4.1.2 并行控制

4.2 并行计算邻域粗糙集近似和条件熵

4.3 实验结果与分析

4.4 本章小结

第5章并行属性约简算法

5.1 传统属性约简算法的局限性

5.2 属性约简算法的并行性

5.2.1 正区域算法与信息熵算法的并行性

5.2.2 属性约简的并行化策略

5.3 基于CUDA的并行属性约简算法

5.4 实验结果与分析

5.5 本章小结

结论与展望

参考文献

攻读硕士学位期间发表的论文情况

致谢

（5）基于XGBoost算法的电力用户信用风险预警及分级服务策略（论文提纲范文）

摘要

Abstract

第1章绪论

1.1 选题背景与意义

1.2 国内外研究现状

1.2.1 国外研究现状

1.2.2 国内研究现状

1.3 本文的主要内容

第2章电力用户信用评价指标体系的优化设计

2.1 电力用户信用风险评价原则

2.2 电力行业信用评价指标体系

2.3 现有评价体系的指标分析

2.4 评价指标体系设计

2.4.1 内部评价指标的选取

2.4.2 外部评价指标的选取

2.5 本章小结

第3章基于粗糙集综合权重法的评价指标权重确定

3.1 粗糙集理论

3.2 基于区分矩阵属性的权重确定方法

3.3 基于粗糙集综合权重算法的指标权重计算

3.4 评价结果的信用等级划分

3.5 算例分析

3.6 本章小结

第4章电力用户信用风险预警模型

4.1 预警模型比较分析

4.2 基于XGBoost算法的信用风险预警模型

4.2.1 XGBoost算法理论

4.2.2 XGBoost风险预测模型及算例分析

4.3 基于随机森林算法的信用风险预警模型及算例分析

4.3.1 随机森林算法理论

4.3.2 随机森林风险预测模型及算例分析

4.4 随机森林预测模型与XGBoost预测模型对比分析

4.4.1 基于算例分析结果的模型差异对比

4.4.2 XGBoost与随机森林模型特点的差异对比

4.5 本章小结

第5章基于风险预警结果的电力用户分级服务

5.1 差异化服务内容

5.2 基于风险预警结果的不同信用等级电力用户分级服务

5.2.1 信用等级预测为AAA及AA的电力用户

5.2.2 信用等级预测为A及B的电力用户

5.2.3 信用等级预测为C的电力用户

5.3 本章小结

第6章结论与展望

6.1 结论

6.2 展望

参考文献

附录

攻读硕士学位期间发表的论文及成果

致谢

（6）基于邻域粗糙集的度量方法及其应用研究（论文提纲范文）

摘要

Abstract

变量注释表

1 绪论

1.1 研究背景与意义

1.2 国内外研究现状

1.3 本文研究内容

1.4 论文章节安排

2 相关理论与方法

2.1 度量方法

2.2 聚类分析

2.3 聚类特点

2.4 本章小结

3 一种新的基于邻域粗糙集理论的度量方法

3.1 理论基础

3.2 基于邻域粗糙集理论的度量方法

3.3 本章小结

4 应用于粒子群算法的粗糙度量方法

4.1 相关工作

4.2 粗糙粒子群算法

4.3 实验与结果

4.4 本章小结

5 应用于密度峰值聚类算法的粗糙邻域度量方法

5.1 相关工作

5.2 粗糙邻域密度峰值聚类算法

5.3 实验与结果

5.4 本章小结

6 总结与展望

6.1 总结

6.2 展望

参考文献

作者简历

致谢

学位论文数据集

（7）粗糙集属性离散化与属性约简的研究及应用（论文提纲范文）

摘要

ABSTRACT

第一章绪论

1.1 课题背景和意义

1.2 国内外研究现状

1.2.1 粗糙集模型的研究现状

1.2.2 离散化方法的研究现状

1.2.3 属性约简方法的研究现状

1.2.4 研究现状小结

1.3 本文的主要工作

1.4 论文结构

第二章相关知识介绍

2.1 知识的相关概念

2.2 粗糙集的基本概念

2.3 属性约简

2.4 离散化问题的描述

2.5 本章小结

第三章连续属性离散化

3.1 离散化算法

3.1.1 无监督离散化算法

3.1.2 有监督离散化算法

3.2 变精度粗糙集的介绍

3.3 基于二元蚁群算法与变精度粗糙集的离散化

3.3.1 二元蚁群算法

3.3.2 适宜度函数

3.3.3 算法设计

3.4 实验结果与分析

3.4.1 数据准备

3.4.2 实验环境

3.4.3 实验对比

3.5 本章小结

第四章粗糙集属性约简

4.1 属性约简算法

4.2 简化差别矩阵

4.3 基于区分链表的属性约简算法

4.4 基于二进制链表的属性约简算法

4.4.1 二进制链表的构建算法

4.4.2 基于二进制链表的属性约简算法

4.5 实验结果与分析

4.5.1 数据准备

4.5.2 实验环境

4.5.3 实验对比

4.6 本章小结

第五章基于粗糙集预处理的葡萄酒质量预测系统的实现

5.1 系统功能设计

5.2 系统的实现与应用

5.2.1 数据准备

5.2.2 数据的离散化

5.2.3 属性约简

5.2.4 生成预测模型

5.2.5 预测结果

5.3 实验对比

5.4 本章小结

第六章总结与展望

参考文献

作者在读期间科研成果介绍

致谢

（8）基于数据挖掘的配电变压器故障诊断（论文提纲范文）

摘要

ABSTRACT

第一章绪论

1.1 本课题的背景及研究意义

1.2 数据挖掘技术研究现状

1.3 变压器故障诊断研究现状

1.4 论文的主要研究内容

第二章变压器故障分析及数据挖掘

2.1 概述

2.2 变压器内部故障类型

2.3 油中溶解气体来源

2.4 特征气体分析变压器故障

2.5 数据挖掘技术

2.6 本章小结

第三章基于模糊核聚类的变压故障诊断

3.1 概述

3.2 模糊核聚类

3.2.1 聚类分析

3.2.2 模糊C均值聚类

3.2.3 核函数基本理论

3.3 基于模糊核聚类的变压器故障诊断

3.4 本章小结

第四章基于粗糙集与核主成分分析的数据约简

4.1 概述

4.2 数据挖掘预处理

4.3 粗糙集理论

4.3.1 知识表达系统

4.3.2 集合的上下近似与不可分辨关系

4.3.3 决策表约简

4.4 核主成分分析

4.4.1 主成分分析原理

4.4.2 核主成分分析基本思想和推导过程

4.4.3 核主成分分析算法步骤

4.5 UCI数据集模拟仿真

4.6 本章小结

第五章基于改进模糊核聚类的变压器故障诊断

5.1 概述

5.2 引力搜索算法

5.3 改进引力搜索算法

5.3.1 混沌初始化

5.3.2 动态逼近学习

5.3.3 纵向交叉

5.4 基于改进模糊核聚类算法的变压器故障诊断

5.4.1 故障诊断模型

5.4.2 融合数据约简与改进引力核聚类的变压器故障诊断

5.5 本章小结

结论与展望

参考文献

攻读学位期间发表的论文

攻读学位期间发表的专利

攻读学位期间参加的科研项目

致谢

（9）基于粗糙集智能推荐的乡村旅游微信应用平台研究（论文提纲范文）

摘要

ABSTRACT

1 绪言

1.1 研究背景和意义

1.1.1 研究背景

1.1.2 研究意义

1.2 国内外研究综述

1.2.1 乡村旅游国内外研究现状

1.2.2 粗糙集与旅游产品推荐研究现状

1.3 研究内容及方法

1.3.1 研究内容

1.3.2 研究方法

1.4 论文组织结构与技术路线

1.4.1 论文组织结构

1.4.2 论文研究技术路线

1.5 本章小结

2 Rough Set理论

2.1 Rough Set简介

2.2 Rough set的相关概念

2.3 属性约简算法

2.4 本章小结

3 乡村旅游平台本体模型构建

3.1 本体概念和构建方法

3.2 乡村旅游产品本体构建

3.3 乡村旅游平台用户本体模型构建

3.3.1 乡村旅游平台用户信息

3.3.2 乡村旅游平台用户个人信息

3.3.3 用户模型构建

3.3.4 动态用户兴趣模型

3.4 本章小结

4 Rough set智能推荐模型的构建

4.1 智能推荐技术

4.2 基于Rough set理论的乡村旅游产品属性约简

4.2.1 乡村旅游产品属性约简

4.2.2 乡村旅游产品属性决策实验数据

4.2.3 乡村旅游产品属性约简

4.3 用户相似度计算

4.4 乡村旅游产品推荐

4.5 本章小结

5 Rough set推荐模型在乡村旅游微信平台的应用

5.1 乡村旅游微信平台需求分析

5.2 基于微信的乡村旅游平台设计

5.2.1 乡村旅游微信平台总体框架设计

5.2.2 乡村旅游微信平台总体功能设计

5.2.3 乡村旅游微信平台小程序功能设计

5.2.4 乡村旅游微信平台后台功能设计

5.3 乡村旅游平台性能和开发环境分析

5.3.1 乡村旅游微信平台性能分析

5.3.2 乡村旅游微信平台开发环境分析

5.4 乡村旅游微信平台数据库设计

5.4.1 数据库的逻辑设计

5.4.2 数据库的详细设计与实现

5.5 乡村旅游微信平台实现

5.5.1 乡村旅游微信平台用户模块

5.5.2 乡村旅游微信平台产品模块

5.5.3 乡村旅游微信平台检索模块

5.5.4 乡村旅游微信平台购物模块

5.5.5 乡村旅游微信平台产品推荐模块

5.5.6 乡村旅游微信平台实现效果图

5.6 粗糙集推荐模型在平台的测试

5.7 本章小结

6 结论与讨论

6.1 总结

6.2 创新点

6.3 讨论

参考文献

致谢

（10）脑胶质瘤核磁共振图像分割方法研究（论文提纲范文）

摘要

Abstract

第1章绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.2.1 基于纳什均衡理论的医学图像分割技术研究现状

1.2.2 基于粗糙集和粗糙熵的医学图像分割技术研究现状

1.2.3 基于量子理论的医学图像分割技术研究现状

1.2.4 基于其它理论的医学图像分割技术研究现状

1.3 论文主要研究内容与结构框架

1.3.1 论文主要研究内容

1.3.2 论文结构框架

第2章基于纳什均衡理论改进SVM图像分割方法

2.1 引言

2.2 纳什均衡模型和纳什均衡过程

2.2.1 纳什均衡理论及其在图像分割中应用简述

2.2.2 具有双重约束的纳什均衡模型

2.2.3 双重约束纳什均衡模型参数计算方法

2.2.4 纳什均衡过程

2.2.5 双重约束纳什均衡模型算法及算例

2.3 基于纳什均衡理论改进SVM图像分割方法

2.4 实验验证

2.4.1 新型纳什均衡方法的基本性能实验

2.4.2 新型纳什均衡方法的脑瘤图像分割实验

2.5 本章小结

第3章基于纳什均衡的目标边缘区域聚类方法

3.1 两步纳什均衡分类方法

3.1.1 引言

3.1.2 两步纳什均衡分类方法

3.1.3 基于纳什均衡理论改进C-V模型

3.1.4 实验验证

3.2 基于纳什均衡的纹理相似区域判断方法

3.2.1 引言

3.2.2 基于纳什均衡的纹理相似区域判断方法

3.2.3 基于纳什均衡理论改进多纹理特征C-V模型

3.2.4 实验验证

3.3 本章小结

第4章基于粗糙集和粗糙熵的Petri网图像分割方法

4.1 引言

4.2 粗糙集和粗糙熵

4.3 基于粗糙集和粗糙熵的粗分割方法

4.4 基于Petri网的精确分割方法

4.4.1 构建图像精确分割的Petri网框架

4.4.2 基于Petri网的图像精确分割方法

4.5 实验验证

4.6 本章小结

第5章基于玻色—爱因斯坦凝聚理论的脑图像分割模型

5.1 引言

5.2 BEC和胶质瘤的相似性分析

5.3 BEC核函数

5.4 对BEC核函数的理论分析

5.5 实验验证

5.5.1 单节点集合的分割实验

5.5.2 双节点集合的分割实验

5.5.3 脑胶质瘤图像分割实验

5.5.4 本文方法与其他方法的对比实验

5.5.5 基于BEC改进SVM与基于纳什均衡改进SVM方法的对比实验

5.6 本章小结

第6章基于量子虫洞粒子群优化算法的脑瘤图像分割方法

6.1 引言

6.2 基于QWPSO的脑肿瘤图像分割方法

6.2.1 QPSO算法

6.2.2 本文提出的量子虫洞粒子群优化算法

6.3 实验结果与分析

6.3.1 脑肿瘤MRI图像分割结果及分析

6.3.2 脑肿瘤CT图像分割结果及分析

6.3.3 实验结果讨论

6.4 本章小结

结论

参考文献

攻读博士学位期间发表的论文和取得的科研成果

致谢

四、基于粗糙集(Rough set)的数据挖掘及其实现（论文参考文献）

[1]多层次粗糙集模型中双边属性值泛化约简方法的研究[D]. 钱卓昊. 西安石油大学, 2021(09)
[2]多元信息粒化与属性选择方法研究[D]. 刘克宇. 江苏科技大学, 2020(03)
[3]面向粒计算的动态邻域不平衡数据分类算法[D]. 何海洋. 大连海事大学, 2020(01)
[4]邻域粗糙集的并行属性约简方法研究[D]. 董杰. 江苏科技大学, 2020(03)
[5]基于XGBoost算法的电力用户信用风险预警及分级服务策略[D]. 余培. 华北电力大学(北京), 2020(06)
[6]基于邻域粗糙集的度量方法及其应用研究[D]. 李阳. 山东科技大学, 2019(05)
[7]粗糙集属性离散化与属性约简的研究及应用[D]. 宋剑. 成都信息工程大学, 2019(05)
[8]基于数据挖掘的配电变压器故障诊断[D]. 龚杰. 广东工业大学, 2019(02)
[9]基于粗糙集智能推荐的乡村旅游微信应用平台研究[D]. 周润苗. 中南林业科技大学, 2019(01)
[10]脑胶质瘤核磁共振图像分割方法研究[D]. 张天驰. 哈尔滨工程大学, 2019(04)

标签：粗糙集论文; 聚类分析论文; 大数据论文; 数据挖掘算法论文; 数据挖掘技术论文;

基于粗糙集的数据挖掘及其实现

一、基于粗糙集(Rough set)的数据挖掘及其实现（论文文献综述）

二、基于粗糙集(Rough set)的数据挖掘及其实现（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

写法范例：

（2）本文研究方法

三、基于粗糙集(Rough set)的数据挖掘及其实现（论文提纲范文）

（1）多层次粗糙集模型中双边属性值泛化约简方法的研究（论文提纲范文）

（2）多元信息粒化与属性选择方法研究（论文提纲范文）

（3）面向粒计算的动态邻域不平衡数据分类算法（论文提纲范文）

（4）邻域粗糙集的并行属性约简方法研究（论文提纲范文）

（5）基于XGBoost算法的电力用户信用风险预警及分级服务策略（论文提纲范文）

（6）基于邻域粗糙集的度量方法及其应用研究（论文提纲范文）

（7）粗糙集属性离散化与属性约简的研究及应用（论文提纲范文）

（8）基于数据挖掘的配电变压器故障诊断（论文提纲范文）

（9）基于粗糙集智能推荐的乡村旅游微信应用平台研究（论文提纲范文）

（10）脑胶质瘤核磁共振图像分割方法研究（论文提纲范文）

四、基于粗糙集(Rough set)的数据挖掘及其实现（论文参考文献）

猜你喜欢