第二十届中国研究生电子设计竞赛 “AMD”企业命题
一、公司介绍 AMD成立于1969年,总部位于美国加州圣克拉拉,现已发展为全球领先的高性能与自适应计算公司,全球员工超过28,000名(截至2025年3月)。公司产品涵盖CPU、GPU、FPGA、DPU及系统级芯片,并结合强大的软件能力,广泛应用于云端、边缘和终端设备。 AMD致力于推动人工智能发展,提供端到端的AI训练与推理解决方案,构建开放生态系统,并积极与中国生态伙伴合作,助力产业数字化转型。中国是AMD全球战略的重要市场。自1993年进入中国以来,AMD不断扩大在华投入,业务涵盖产品销售、战略合作、新品开发等。2004年成立大中华区总部,现由高级副总裁潘晓明领导。 2006年,AMD在上海设立研发中心,以上海研发中心为主体的中国研发中心逐渐发展壮大,现已成为全球研发体系的重要组成,拥有超4,000名研发人员,覆盖芯片设计、软件开发与系统测试,并与本地客户紧密合作,推动技术落地。近年来,AMD在AI创新与可持续发展方面表现突出,荣获“2023年度杰出可持续创新企业”“2023-2024年度最受尊敬企业”称号,2024“世界互联网大会杰出贡献奖”等多项荣誉。二、奖项设置 一等奖:1名¥10,000 二等奖:2名¥5,000 三等奖:3名¥2,000三、赛程安排 报名截止时间:2025年7月10日24:00。 作品提交截止时间:2025年7月20日24:00。 报名方式:采用线下报名方式,报名截止前完成报名费缴纳,并将参赛作品打包压缩,与线下报名表(见附件)、缴费凭证一并发送至官方邮箱。建议优先提交报名表,便于命题企业提供技术支持。 报名邮箱:CIEEDA@163.COM 缴费账号(线下转账): 1、开户名称:中国电子学会 2、账号:9558850200000514831 其他: 1、7月10日报名截止后,秘书处将组织团队在官网完善信息并生成获奖证书,电子发票将发至队长邮箱。 2、线下报名仅延长截止时间,不影响其他赛程安排。四、命题描述 赛题一:基于ROCmonRadeon™平台的DeepSeek大语言模型部署性能优化 1、赛题描述:随着AMDROCm软件栈对RDNA3架构支持的不断完善,面向专业及创意人士设计的AMDRadeon™PROW7000系列工作站显卡,凭借其卓越的48GBGDDR6显存容量,正逐步成为应对当前AI开发面临的严峻挑战时有效且经济的解决方案。目前,ROCm搭配W7000系工作站GPU的组合已支持大部分业内主流的模型以及部署框架。本命题要求参与者在搭载单张W7000工作站GPU的平台上优化使用vLLM框架部署DeepSeek-R1-Distill-Qwen-7B模型的性能。建议的优化方向包括但不限于:提升常见算子(如Elementwise、GEMM等)的执行效率,并对部署管线中的算子进行融合优化。ROCmonRadeon™对诸多量化方法(如AWQ、Marlin等)提供支持。对算法使用的计算内核(如Attention、MoE等)进行优化。 2、提交要求:参赛者应基于指定代码仓库(如vLLM、PyTorch、Triton等)进行代码更改,经本地编译验证后提交codepatch,并附上本地测试结果显示的性能提升幅度。性能提升基于代码改正,而非依靠部署参数调整。具体参数参见技术支持部分。2.1赛题提交要求(初赛)技术论文–Word文档(必选)视频文件,限制3分钟(必选)门型展架,尺寸180cm*80cm(必选)演示说明–PPT文档(可选)2.2赛题提交要求(决赛)技术论文–Word文档(必选)演示说明–PPT文档(必选) 3、评分标准:所有提交的代码将统一在ROCmonRadeon™平台上进行验证,并根据性能提升的幅度进行排名。基础得分=优化幅度百分比x100加分项:(由AMD评审团打分)创新性(5分):优化方案的原创程度及复杂程度。实用性(5分):优化方案对ROCm生态推广的积极作用。可读性(2分):提交优化方案的详细阐述文档或PPT。 4、技术支持:4.1硬件平台配置(报名审核后,通知云服务申请表)CPUAMDEPYC™965496-CoreGPUAMDRadeon™PROW7800ProfessionalGraphicsMemory768GDiskSpace8TB4.2视频教程在8卡AMDW7800运行DeepSeekR1,链接:https://www.bilibili.com/video/BV1i8j3zJExM4.3本地开发环境推荐使用AMDRadeon™PROW78004.4技术支持扫描二维码加入赛题-竞赛交流QQ群:4.5软件环境Benchmark教程(以修改vLLM为例)(1)准备DeepSeek-R1-Distill-Qwen-7B模型和ShareGPT_V3_unfiltered_cleaned_split.json数据集(2)推荐使用PyTorch-On-ROCmDockerImage创建container。(3)在container内安装带有本地修改的vLLM。(4)启动vLLMserver(1)运行benchmark并观测结果4.6相关链接AMDRadeon™PROW7800ProfessionalGraphicsSpecification:https://www.amd.com/en/products/graphics/workstations/radeon-pro/w7800.htmlGettingStartedGuide:UsingAMDROCm™SoftwareonRadeon™GPUs:https://www.amd.com/en/developer/resources/ml-radeon.htmlInferencingandservingwithvLLMonAMDGPUshttps://rocm.blogs.amd.com/artificial-intelligence/vllm/README.html 赛题二:基于AMDAIPC系统的AI应用开发(自由命题) 1、赛题描述:AIPC(人工智能个人电脑)是一种集成AI技术的个人电脑,通过本地算力、自然语言交互、个性化大模型等核心能力,重构传统PC的体验,使其从工具升级为“个人智能助理”。参赛队伍使用AMD指定的APU产品开发一个AI应用,围绕以下领域(包括但不限于):AI应用专业领域AI应用日常生活娱乐AIPC与其他智能设备的链接与整合补充说明: (1)AIPC本地模型优化方案:针对AIAgent等现有应用,提出优化其在AIPC本地运行效能的创新方案(可融合大预言模型LLM、计算机视觉CV、文本处理OCR、语音交互ASR等): a.模型轻量化:应用模型压缩技术(量化、蒸馏、剪枝等),实现模型精简与本地适配,兼顾精度。 评分依据:优化前后模型大小、推理性能、系统负载数据对比。 b.推理加速:采用优化技术(算子、图结构、内存管理等),提升本地推理效率(如prefill、tokengeneration速度)。 评分依据:性能提升量化数据。 (2)行业赋能方案:为教育、医疗、娱乐、办公等场景,设计基于AIPC本地AI的创新应用(例如:作业批改、病例分析、文章润色)。 评分核心:创新性、实用性、可行性。 (3)其他 2、赛题要求:2.1硬件环境AIPC云平台接入(报名审核后,通知云服务申请表)型号:BeelinkSER/处理器:AMDRyzenHX370/内存:32GBRAM/存储:1TBSSD操作系统:Windows11外设请根据AI应用设计自行配置2.2AI应用的设计与实现:基于所提供的硬件环境,以及利用AMD推荐模型https://huggingface.co/amd或者自选模型,完成所选场景下的AI应用开发。参赛作品须提出创新的解决方案,展示其前瞻性的思考和设计。参赛作品须具有实际的应用价值。参赛作品须充分发挥AMD产品的算力优势(iGPU,NPU,CPU)实现本地AI推理。加分项:充分利用本地AI算力前提下,提升电源利用能效。2.3赛题提交要求(初赛)技术论文–Word文档(必选)视频文件,限制3分钟(必选)门型展架,尺寸180cm*80cm(必选)演示说明–PPT文档(可选)2.4赛题提交要求(决赛)技术论文–Word文档(必选)演示说明–PPT文档(必选) 3、评分标准:3.1技术创新和实用性30%AI应用基于的模型(或模型组)提出创新的解决方案能够有效地解决现实世界中的问题复杂度和计算效率示例:一个使用深度学习技术进行图像分类的模型,若其准确率超过90%且计算速度快于现有方法,则会得高分。3.2AI应用程序与用户交互程度20%示例:一个语音助手模型,若能根据用户的口音和语调自适应,并提供直观的界面,则会得高分。3.3论文,PPT的清晰度与逻辑20%文献综述全面、正确方法描述清晰、易于理解结果分析合理、令人信服3.4功能完整度+稳定性15%完成所有预定任务运行速度和稳定性示例:一个文本生成模型,若其能生成高质量文本且运行速度快、稳定,则会得高分。3.5Demo(现场直播、预先录制视频等形式)10%清晰展示该应用的功能和性能可以帮助用户轻松理解和使用该应用示例:一个人脸识别模型,若其Demo能快速、准确识别人脸并提供友好界面,则会得高分。3.6用户隐私数据是否受到保护5%是否收集和存储用户的隐私数据用户的本地隐私数据是否加密是否会将本地存储的隐私数据上传到网络是否有明确的隐私政策和使用条款 示例:一个社交媒体分析模型,若其在不收集用户隐私数据的情况下完成分析,并提供清晰的隐私政策,则会得高分。 4、参考链接:AMDAISolutions:https://www.amd.com/en/solutions/ai.htmlAMDHIPSDKonWindows:https://rocm.docs.amd.com/projects/install-on-windows/en/latest/index.htmlAMDRyzenAI:https://ryzenai.docs.amd.com/en/latest/index.html 5、赛题-竞赛交流QQ群: 附件:第二十届研电赛AMD企业命题报名表