题目:网络加密流量的应用类型分析及方案实现
一、描述及要求
1.主要采用机器学习方法,完成网络加密流量的数据预处理—>模型训练调优—>模型部署应用,完成对未知网络加密流量的应用类型识别。
2.方案实现:训练集不做限制,推荐采用公开数据集,方便和已有方法进行性能对比,如VPN加密数据集ISCX-VPN-NonVPN-2016(http://iscxdownloads.cs.unb.ca/iscxdownloads/ISCX-VPN-NonVPN-2016/#ISCX-VPN-NonVPN-2016),该数据集包含VPN和非VPN下的邮件、聊天、文件传输、P2P应用、VoIP、流式应用等共计12个类别。数据集中存在的信息均可使用,如数据包的时间戳信息和多层协议字段等。预处理方法、机器学习方法,开发平台不限。
二、评审得分点
1.训练集/测试集的有效获取和合理性分析
2.数据预处理和主流机器学习算法的对比分析
3.选择或设计一种算法进行代码实现,仿真结果分析
4.能够对算法进行改进优化,分析识别性能或效率提升的情况
5.实现软件原型系统,抓取真实网络数据,验证方法的实际可行性
三、输出要求
1.算法设计文档和短发代码(python/java/c/c++/matlab)。
2.软件平台实现方案和最终效果展示。
四、奖项设置
获奖团队可根据参赛项目类别优先推荐参加第十四届中国研究生电子设计竞赛评奖