学海网 文档下载 文档下载导航
设为首页 | 加入收藏
搜索 请输入内容:  
 导航当前位置: 文档下载 > 所有分类 > 自然科学 > 天文/地理 > 基于支持向量机的Internet流量分类研究
免费下载此文档

基于支持向量机的Internet流量分类研究

是玩

计算机研究与发展

JournalofComputerResearchandDevelopment

ISSN

1000—1239/CN11—17771TP

46(3):407—414。2009

基于支持向量机的Internet流量分类研究

(中国科学院软件研究所北京100190)(中国科学院研究生院北京100049)

(xupeng@iscas.ae.en)

InternetTrafficClassificationUsingSupportVector

XuPeng,LiuQiong,andLinSen

(Institute

Machine

ofSoftware。ChineseAcademyofSciences,Beijing100190)

(GraduateUniversityofChinese

Academy

ofSciences,Beijing100049)

Abstract

fl

AccuratetrafficclassificationiSthekeystoneofnumerousnetworkactivities,SOithasbeen

fl

hottopicinnetworkmeasurementfor

longtime.In

recent

years,Internettraffic

classification

usingmachinelearninghasbeen

newdirectioninthisarea.NaiveBayesanditsimprovedmethods

are

havebeenwidelyusedinthisarea,becausetheydepend

on

simpleandefficient.However,thesemethods

to

theprobabilitydistributionofsamplespace,SOtheyhaveconnaturalinstability.Inorderproblem。anewmethod

based

on

handlethispaper.This

support

vector

machine(SVM)isproposedinthis

problem

to

fl

method

converts

the

Internettraffic

classification

quadraticoptimization

problemusing

accuracy

non-linear

transformationandstructuralriskminimization,whichperformsgood

andstability.Afterthetheoreticalanalysis,thecomparisonexperimentswithNaiveBayes

on

anditsimprovedmethods

traffic

SetSare

given.Theexperimentresultsvalidatethatsupport

not

vector

machinemethodhasthreeadvantagesinInternettrafficclassification:Firstly,itisflowattributesthismethod

to

necessary

for

satisfytheindependencehypothesis,SOfeatureselectioniswork

well

with

poor

not

required.Secondly,

use

can

prioriknowledge.Lastly,this

methoddoesn’t

the

probabilitydistributionofsamplespace,SOitKeywords

can

classifyInternettrafficstably.

vector

trafficclassification;networkmeasurement;trafficflow!supportmachine;

statisticalattribute

摘要准确的网络流量分类是众多网络研究工作的基础,也一直是网络测量领域的研究热点.近年来,利用机器学习方法处理流量分类问题成为了该领域一个新兴的研究方向.在目前研究中应用较多的是

朴素贝叶斯(naiveBayes,NB)及其改进算法.这些方法具有实现简单、分类高效的特点.但该方法过分

依赖于样本空间的分布,具有内在的不稳定性.因此,提出一种基于支持向量机(sulbport

vector

machine,SVM)的流量分类方法.该方法利用非线性变换和结构风险最小化(structural

risk

mi~nimi‘zati’on,SRM)原则将流量分类问题转化为二次寻优问题,具有良好的分类准确率和稳定性.在理论分析的基础上,通过在实际网络流集合上与朴素贝叶斯算法的对比实验,可以看出使用支持向量机方法处理流量分类问题,具有以下3个优势:1)网络流属性不必满足条件独立假设,无须进行属性过滤;2)能够在先验知识相对不足的情况下,仍保持较高的分类准确率;3)不依赖于样本空间的分布,具有较好的分类稳定性.

收稿日期:2007—08—06;修回日期:2008-09—12

基金项目:国家“九七三”重点基础研究发展计划基金项目(2007CB307100,2007CB307106)

万方数据

第1页

免费下载Word文档免费下载:基于支持向量机的Internet流量分类研究

(下载1-10页,共10页)

我要评论

相关文档

站点地图 | 文档上传 | 侵权投诉 | 手机版
新浪认证  诚信网站  绿色网站  可信网站   非经营性网站备案
本站所有资源均来自互联网,本站只负责收集和整理,均不承担任何法律责任,如有侵权等其它行为请联系我们.
文档下载 Copyright 2013 doc.xuehai.net All Rights Reserved.  email
返回顶部