首页 > 论文范文 > 计算机论文 > 计算机论文范文:探讨主动学习的流程和结构

计算机论文范文:探讨主动学习的流程和结构

1 引言
计算机技术发展迅速,使得当今社会的发展己经离不开信息网络。由于计算机网络传递的信息中涉及到金融、科学教育、军事等各个领域,其中包含巨大的经济或国家利益,所以少不了来自各方各面的网络攻击,网络攻击的表现形式也是多种多样,譬如病毒感染、窃取数据、信息的篡改等等。网络信息安全关系着国家的安全,民族的发展,随着全球信息化越来越广,它扮演的角色越来越重要。
2 入侵检测技术的介绍
2.1 常用的入侵检测技术
依据数据源划分,可以将入常用的侵检测技术划分为两大类:基于主机的入侵检测系统和基于网络的入侵检测系统。
2.1.1 基于主机的入侵检测系统
该系统是通过对主机的审计记录和日志文件的审查从而获得所需的数据源,同时综合主机上的其他例如文件系统属性集进程状态等信息来获得不法行为的信息。这种方法的优点是硬件需求低,对网络流量敏感度低,效率高,能够较准确的定位入侵并迅速做出响应。其缺点是对主机资源的依赖性太强,全面部署的代价较高。
2.1.2 基于网络的入侵检测系统
相对于基于主机的入侵检测系统,基于网络的入侵检测系统通常部署于网络设备的节点上,通过对网络上所传输的原始数据流的监听,获得网络数据,并提取有用信息。通过将所提取的信息与已知的具有攻击特性的数据的类比,来确定入侵行为。该种方法的优点是配置简单,脱离操作系统,实时监测,可监测的范围广等。它的缺点为是精确度低。
2.2 入侵检测系统存在的问题
就当前的发展情况来说,入侵检测技术依然是一个极具吸引力的领域,对异常检测技术的研究具有较高的难度,也正是她的这个魅力吸引着众多的安全技术研究人员的注意。就目前所提出的入侵检测技术依然存在着较多的问题,具体有:
(1) 目前的网络缺乏高度嗅探技术;
(2) 网络中缺乏对 IPV6 协议栈的支持;
(3) 入侵检测系统过高的误警和漏警率;
(4) 入侵检测系统的自适应能力;
(5) 如何应对正对入侵检测系统的攻击。
上述数条都是当前入侵检测技术研究所存在的比较突出的问题,在我们对入侵检测技术的进一步研究开发中也应该着重对以上几个方面加大力度。
3 基于向量机主动学习的通信网络入侵检测算法优化设计
3.1 基于向量机(SVM)主动学习算法的网络入侵检测过程
异常检测方法在网络入侵检测过程中可以检测出那些未知的攻击,它大多数采用的建模方式都是基于机器学习之上的。在机器学习阶段,理论上为了达到比较理想的检测效果,需要对大量和合适的训练样本集进行训练。但是,在实际的网络中,大量和合适的训练样本集的截获是相当困难的。这样就要求能够实现在少量样本的情况下获得比较理想的检测效果。下面本论题将研究一种基于 SVM 主动学习算法的网络入侵检测的具体过程。
通关过分析可知基于 SVM 主动学习算法的网络入侵检测系统的功能模块应该包含数据采集模块、特征提取模块、向量化处理模块、支持向量库模块、SVM 训练模块、SVM 检测模块和系统响应模块等。具体的过程为数据采集模块从网络中采集网络数据流,然后将这些数据流传送给特征提取模块,特征提取模块进行特征提取处理,发送给向量化处理,向量化后的样本可以作为分类样本和预分类样本分别传给支持向量库和 SVM 检测模块,接下来分类样本中的正确样本就可以进行 SVM 训练,不正确的样本收到 SVM 检测,做出系统响应等响应。

3.2 支持向量机(SVM)主动学习的入侵检测算法优化设计
3.2.1 核函数的选择
虽然多种因素都能影响到 SVM 的分类性能,但是有已存在的研究表明:在 SVM 分类中,所选取的 SVM 核函数的类型对 SVM 的分类性能影响不大,但是,SVM 核函数选取的参数却与分类性能相关,在本论题的优化设计中选取的 SVM 核函数为 ,影响 SVM 的分类性能即分类正确率的主要因素是 参数以及相对应的错误判决因子 C。错误判决因子 C 是在已知的特征空间中用来调整学习机的经验风险与置信范围的比例,这样就可以优化学习机器的推广能力,对于不同的数据子空间 C 的最优值也不尽相同,C 值的不稳定会使系统的泛化性能降低;核函数中的参数的变化可以间接的改变最优超平面与实践超平面之间的映射函数,这样就增加了在较高维特征空间中样本数据集的分布复杂度, 参数也在一定程度上影响着系统的泛化性能。但是目前这两个参数的选择方法却只是靠试凑法来计算,这样就造成了很多人为的不恰当、随机和盲目选择性。
3.2.2 支持向量机主动学习的入侵检测算法的优化设计
下面本文将提出一种优化算法来对上面提到的 参数以及相对应的惩罚系数 C 进行优化计算。这种算法得到在较高维空间中最优解的方法是通过利用个体相互之间的合作与竞争关系来实现的。算法的第一步实现了在可解空间中对一群粒子进行初始化,同时得到粒子的初始状态 ( 位置和速度等 ),假设每个粒子都是对 参数以及相对应的惩罚系数 C 进行优化计算的可行解,粒子的特征可以由它的位置和速度以及适应度的值来表现,适应度的值决定了对应解的优化程度,是由目标函数确定的。这样就形成了迭代关系,进行的每一次迭代,每个粒子的位置更新都是根据本身的位置极值和所有粒子的速度极值来实现的,这样每一次更新都可以得到一组位置和速度以及适应度,即一组最优解。优普论文发表网是为广大评职称客户提供全文方位的人工智能论文下载、计算机论文快速发表服务的首选网站。
在上述的算法中,假若有一颗粒子已经搜索到了当前的一个最优解,其他粒子就会因为这个最优解的吸引而快速的聚集到其附近,这种收敛方法虽然速度很快,但是有很大的概率是这个最优解不是一个全局最优解,而仅仅是一个局部最优解,这样就会造成粒子群无法再在解空间内对其他方向搜索最优解,很容易陷入早早收敛的局部最优状态。为此本文将再对上述算法进行优化。算法的具体实现如下:(1) 给定算法的最初参数,对粒子种群进行初始化,产生粒子的初始状态 ( 位置和速度等 )。
(2) 通过对目标函数的确定,计算出每个体粒子的适应度的值 ,并且得出位置极值以计算出位置极值情况下的适应度的值,把两个适应度的值相比较,若通过对目标函数的确定计算得出的粒子适应度的值更好,则要在解空间中更新粒子的位置极值。
(3) 把每个粒子的位置极值与全局速度极值适应度的值进行比较,若得到更好的结果,则要在解空间中更新粒子的速度极值。
(4) 根据公式 可以计算出群体粒子的适应度方差 。其中,n 为群体粒子中粒子的数目; 为群体粒子中第 i 个粒子的自身适应度的值; ( ) 为群体粒子中平均适应度的值;(5) 根据公式计算在第m次进行迭代计算的变异概率。
(6) 是 随 机 产 生 的 数, 如 果,则当前的速度极值的计算公式为, 其 中, 为 服 从Gauss(0,1) 分布的随机变量。
(7) 判断是否满足初始设定的条件,若满足,迭代过程完毕,执行下一步;否则执行第(2) 步,知道满足设定条件。
(8) 根据得到的 Gbest 计算出 参数以及相对应的惩罚系数 C,然后对 SVM 分类器进行训练,直到满足所有样本都未标注的候选样本集不存在样本或者到达设定的分类精度。
4 总结
本文深入探讨了通信网络中主动学习的流程和结构,对主动学习中的学习算法做了深入研究,研究其各种相关定义以及其的学习过程和查询过程,利用因子分析的统计学方法,提出了基于自适应特征加权的特征提取和选择方法,并给出该方法的详细步骤说明。
参考文献
[1] 厉剑 . 入侵检测系统分析 [J]. 电脑知识与技术 ( 学术交流 ),2007(19).
[2] 周晏 , 韩毅 . 初探入侵检测技术 [J]. 电脑知识与技术 ,2008(03).
[3] 刘洁 . 基于支持向量机的网络入侵检测系统研究 [D]. 中南大学 ,2008.
[4] 程学云 . 支持向量机及其在入侵检测中的应用研究 [D]. 南京师范大学 ,2007. 

本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。QQ:522-52-5970

论文   计算机   主动