搜索结果: 16-30 共查到“工学 KNN”相关记录30条 . 查询时间(0.396 秒)
基于聚类算法的KNN文本分类算法研究
K近邻 隶属度 文本分类
2009/7/17
KNN算法是一种在人工智能领域如专家系统、数据挖掘、模式识别等方面广泛应用的算法。该算法简单有效,易于实现。但是KNN算法在决定测试样本的类别时,是把所求的该测试样本的K个最近邻是等同看待的,即不考虑这K个最近邻能表达所属类别的程度。由于训练样本的分布是不均匀的,每个样本对分类的贡献也就不一样,因此有必要有区别的对待训练样本集合中的每个样本。利用聚类算法,求出训练样本集合中每个训练样本的隶属度,利...
简化的粒子群优化快速KNN分类算法
K近邻分类器 粒子群优化算法 相似度
2009/7/15
提出了一种有效的k近邻分类文本分类算法,即SPSOKNN算法,该算法利用粒子群优化方法的随机搜索能力在训练集中随机搜索.在搜索k近邻的过程中,粒子群跳跃式移动,掠过大量不可能成为k近邻的文档向量,并且去除了粒子群进化过程中粒子速度的影响,从而可以更快速地找到测试样本的k个近邻.通过验证算法的有效性表明,在查找k近邻相同时,SPOSKNN算法的分类精度高于基本KNN算法。
基于KNN的不良文本过滤方法
KNN 算法 不良文本过滤 χ2统计量
2009/12/28
不良文本过滤是当前的一个研究热点。通过对χ2 统计量的具体分析,证明χ2 统计量在2类文本特征项提取过程中特有的优势。提出正面文本阈值δ,并从理论上推断出该值的大小。在此基础上改进KNN算法,消除了KNN算法中N的不确定性,彻底实现了无参性,大幅减少了分类所用的时间。实验证明,该算法符合Web实时在线分类的要求。
用于WEB文档分类的并行KNN算法
文档分类 K最近邻 并行策略
2009/7/6
针对WEB文档分类中KNN算法计算复杂度高的缺点,不同于以往从减少训练样本集大小和采用快速算法角度来降低KNN算法的计算复杂度,从并行的角度出发,提出一种在Hyper-cube SIMD模型上的并行算法,其关键部分的时间计算复杂度从O(n2)降为O(log(n)),该算法与传统的串行算法相比,能显著地提高分类速度。
KNN算法是一种常用的效果较好的文本分类算法。但是标准KNN算法中,近邻的数目K对所有处理文本都是一样的,而判断类别时加权的仅仅是文本之间的相似度。基于近邻序列的排序,提出了变K算法,并且结合效果较好权重算法,形成了柔性的KNN算法,提高了分类的效果。
基于SVM和KNN的蛋白质耐热性分类
氨基酸含量 SVM KNN 蛋白质耐热性
2009/6/24
以氨基酸含量为特征向量,研究了SVM和KNN预测蛋白质耐热性的准确度。结果表明,基于SVM的分类效果较好,其局部预测率和全局预测率分别为82.4%和83.4%;而基于KNN方法的局部预测率和全局预测率分别为77.6%和79.9%。两种方法的预测率均表明氨基酸含量是影响蛋白质耐热性的主要因素。
基于KNN图的两阶段孤立点检测及应用研究
孤立点检测 KNN图 微阵列数据
2009/6/23
针对两种基于KNN图孤立点检测方法:入度统计法(ODIN)和K最邻近(K-nearest Neighbor,RSS)算法的不足,提出了一种新的改进方法:两阶段孤立点检测方法,并进行了适当扩充使之适用于数据集中孤立点数目未知情况下的孤立点检测。算法应用于“小样本,高维度”的基因微阵列数据集进行样本孤立点检测取得了很好效果,证明了此方法的有效性。
基于辅助变量KNN分析的软测量建模方法
KNN 辅助变量
2009/6/11
提出一种基于辅助变量最近邻(KNN)分析的软测量建模方法,该方法将KNN算法应用于辅助变量分类,根据分类结果,应用核主成分分析(KPCA)和支持向量回归机(SVR)相结合进行软测量建模。KNN分析独立于后继回归模型,却又直接影响模型结构,KPCA作为中间层,在KNN分类结果指导下提取不同类别包含辅助变量高阶信息的特征主元,然后使用SVR建立特征主元和主导变量之间的回归模型。用该方法建立粗汽油干点软...
基于kNN算法的异常行为检测方法研究
kNN算法 分类 异常行为检测
2009/4/24
阐述了异常行为检测的相关概念,介绍了kNN算法,探讨了异常行为检测与分类技术的关系。结合kNN算法的优点以及异常行为检测与分类的相似性,提出了基于kNN算法的异常行为检测方法,给出了其计算方法,并确定了检测的过程,分析了该方法的特点和优势。基于kNN算法的异常行为检测方法通过不断的自学习,会成为信息安全的一道有效防线。
基于KNN算法的组合式非搜索特征选择算法
非搜索 最大信息压缩指数 KNN
2009/4/24
随着特征维数的不断增长,搜索性特征选择算法付出巨大的时间代价,而非搜索性算法则由于其时间代价小,而且能有效去除冗余特征等优越性越来越受到关注。该文介绍了一种非搜索性算法——KNN特征选择算法,该算法通过计算特征间的相关性来消除冗余特征,时间代价小。在此基础上,该文提出了一种基于KNN算法的组合式非搜索特征选择算法。
二阶段近似KNN离群挖掘算法与应用
基于距离的离群 近似最近邻 k均值聚类
2009/2/18
针对高维大数据集,提出了二阶段近似最近邻离群挖掘算法(TPOM),在聚类的基础上,通过加速最近邻查询和改善剪枝效率,提高了循环嵌套KNN算法的离群检测效率。应用分析表明,该算法对于实际数据集有良好的适用性和可扩展性,具有近似线性的时间复杂度。
CFW的CBR与ART-KNN集成智能预测
CFW 智能预测 基于案例推理
2008/12/11
结合基于案例推理(CBR)方法和ART-KNN网络,提出了一种黄瓜枯萎病(CFW)的集成智能预测方法。与传统的CBR相似案例检索任务不同的是,该方法用受训ART-KNN网络对新案例分类后根据提出的案例相似性测度来计算相似案例集。对ART-KNN网络的分类性能进行测试,确定了网络的最优相似参量ρ,得到最高平均分类正确率达94.4%。对CFW进行预测,确定了案例相异阈值R的最优范围,得到病株率、病叶率...
针对雷达自动目标识别中的库外目标拒判问题,提出了一种人工生成库外样本的方法和一种加权k最邻近(k nearest neighbors, KNN)分类器。通过人工生成库外高分辨距离像样本,解决了在训练阶段无法获取库外样本的难题。加权KNN分类器同时满足了基于问题和基于数据两大设计要求,能够很好地处理拒判问题。通过基于接收机工作特性(receiver operating characteristic,...
采用灵敏度方法对距离公式中文本特征的权重进行修正;提出一种基于CURE算法和tabu算法的训练样本库的裁减方法,采用CURE聚类算法获得每个聚类的代表样本组成新的训练样本集合,然后用tabu算法对此样本集合进行进一步维护(添加或删除样本),添加样本时只考虑增加不同类交界处的样本,添加或删除样本以分类精度最高、与原始训练样本库距离最近为原则。