排序方式: 共有32条查询结果,搜索用时 0 毫秒
1.
Dirichlet分布是一类包含正参数向量的连续多元概率分布,在比例结构问题中具有广泛的应用。针对Dirichlet混合样本的聚类问题,进行了最大期望(EM)算法和动态聚类算法研究。首先,推导其数学过程,并给出算法迭代步骤。然后,利用数字仿真实验,比较了EM算法与动态聚类算法两种机器学习算法在Dirichlet混合样本中的聚类效果。最后,计算对数似然函数值、程序运行时间、收敛迭代次数、聚类正确率、真正率(TPR)和假正率(FPR)6个评价指标。仿真实验结果表明,EM算法聚类正确率更高但是运算效率相对较低,而动态聚类算法运算效率较高但是损失了部分聚类正确率。因此,实际应用中建议综合权衡聚类正确率与运算效率的相对需求后,再选取合适算法进行Dirichlet混合样本聚类。 相似文献
2.
函数型数据的回归分析研究主要集中在函数型线性模型。不要求因变量为连续型随机变量,可以为离散型或属性数据(对应于泊松或Logistic回归),对同时含有数值型多元变量和函数型变量的广义线性模型的估计问题进行分析,采用非参数方法得到了参数部分和非参数部分的估计量,并给出了一种重加权算法进行参数求解,解决了含数值型和函数型混合数据类型自变量的回归问题,同时扩展了函数型线性模型的应用范围。估计过程中,分别采用了函数型主成分和B样条基函数,并给出了基函数个数选择的准则。数值模拟结果表明,所提出方法具有良好的可行性与正确性。 相似文献
3.
现有区间数据分析的方法通常假设数据在某一区间上服从均匀分布,这在实际数据分析中通常是不成立的.针对此问题,在原始数据来源于连续分布的简单假设下,利用经过分布函数变换后的随机变量服从(0,1)上的均匀分布,分别采用经验分布函数和核估计对原始数据的分布函数进行估计.基于此设计变换,对变换后的数据进行均匀分布的假设检验,通过检验后进行后续的区间数据分析,使得均匀分布的假定得以成立,保证了统计理论上的严谨性.数据模拟结果表明,将经验分布函数变换后的数据作为研究对象,进行区间数据分析,所得到的统计建模结果更加合理且具有较强的解释力. 相似文献
4.
基于全信息的正态分布型数据的线性回归分析 总被引:1,自引:0,他引:1
针对正态的分布型符号数据,提出一种新的线性回归分析方法.以体现正态的分布型数据的全部原始信息为出发点,给出正态的分布型变量的一阶矩、二阶原点矩、二阶混合原点矩的定义和计算原则.在此基础上,定义针对正态的分布型数据的线性回归模型以及残差信息的平方和,推导最小二乘回归系数.仿真实验证明了该方法所得回归模型在解释能力和预测能力上的有效性以及相对于"中心法"的优越性.给出的正态分布型变量数字特征的定义和计算原则为将其他经典的多元统计方法推广到分布型数据奠定了基础. 相似文献
5.
Gram-Schmidt回归及在刀具磨损预报中的应用 总被引:5,自引:3,他引:2
多元线性回归是一种应用广泛的统计分析方法.在实际应用中,当自变量集合存在严重多重相关性时,普通最小二乘方法就会失效.为解决这一问题,利用Gram-Schmidt 正交变换,提出一种新的多元线性回归建模方法——Gram-Schmidt回归.该方法可实现多元线性回归中的变量筛选,同时也解决了自变量多重相关条件下的有效建模问题.将该方法应用于机械加工过程中刀具磨损的预报分析,有效地进行了变量筛选,并得到了解释性强同时拟合优度也很高的模型结果. 相似文献
6.
多元线性回归的预测建模方法 总被引:25,自引:1,他引:24
根据历史的样本数据,建立多元线性回归的预测模型;从而在不需要未来样本数据的情况下,预测未来时刻多元线性回归模型中的回归参数,以及主要的模型精度评估指标.对多元线性回归模型参数的预测,转化为对其变量集合的增广矩阵的叉积阵的预测.对叉积阵进行谱分解,利用高维群点主轴旋转的预测建模方法,通过Givens变换得到特征向量矩阵的转角值,对自由取值的转角以及特征值建立预测模型.仿真实验例示了该方法的主要计算步骤;计算结果显示,利用本模型得到的拟合值精度较高,预测值真实可信.最终计算结果和实验结果吻合较好,表明这种方法可以用于分析和预测众多领域中因变量对自变量的回归关系问题. 相似文献
7.
单形空间中多元成分数据的Fisher判别方法 总被引:1,自引:1,他引:0
首先,基于Aitchison单形空间成分数据运算法则,提出成分数据向量的代数体系,其中包括成分数据向量的加法、数乘、减法、内积、范数以及距离等定义.在此基础上,根据Fisher判别分析原理,建立多元成分数据的线性判别函数,以及利用距离判别的思想,根据待判样本投影点的得分与各类中心投影点的均值之间的距离,对待判样本进行归类建立判别规则,从而提出一种针对多元成分数据的判别方法.最后,通过仿真方法及实际案例验证该方法的有效性.给出的成分数据向量的代数体系为将其他多元统计方法推广到多元成分数据奠定了基础. 相似文献
9.
多维数据表的动素分解,合成和向前推测 总被引:1,自引:1,他引:1
多维数据瑗态规律的研究焦点,集中在如何克服其数据规模庞大的困难,并同时保护数据系统一性质。对此,本文提出了多维数据分解与合成理论,在对动素间的协调性,动素合成方式以及动素分解完备性进行论述和理论证明的基础上,给出了多维动态数据表向前推测的工作步骤。该方法将手推测数据系统主要特征的变化规律,来实现对多维数据表的整体预测,这将使多维数气压 表推测过程更为简捷,直观和有效。 相似文献
10.
一种新的判别决策树的建树准则 总被引:2,自引:0,他引:2
王惠文 《北京航空航天大学学报》2000,26(1):111-113
讨论了一种新的判别决策树评价准则,在建立二分树的过程中,提出采用不可分辨度最大下降作为选择自变量的原则.这种新准则与经典的非纯度下降算法在概念上是近似的.如果适当定义非纯度下降算法中的权重,则这两个准则就是完全等价的.然而,新准则的计算更加简单,并且通过案例分析可知,对新准则计算结果的解释也更加容易. 相似文献