中国研究生创新实践系列大赛管理平台

【延长报名】AMD企业命题报名与作品提交截止时间分别延长至7月15日、20日。

发布时间：2025-06-27 来源：中国研究生电子设计竞赛阅读次数：257

　　一、公司介绍

　　AMD 成立于 1969 年，总部位于美国加州圣克拉拉，现已发展为全球领先的高性能与自适应计算公司，全球员工超过 28,000 名（截至 2025 年 3 月）。公司产品涵盖 CPU、GPU、FPGA、DPU 及系统级芯片，并结合强大的软件能力，广泛应用于云端、边缘和终端设备。

　　AMD 致力于推动人工智能发展，提供端到端的 AI 训练与推理解决方案，构建开放生态系统，并积极与中国生态伙伴合作，助力产业数字化转型。

　　中国是 AMD 全球战略的重要市场。自 1993 年进入中国以来，AMD 不断扩大在华投入，业务涵盖产品销售、战略合作、新品开发等。2004 年成立大中华区总部，现由高级副总裁潘晓明领导。

　　2006 年，AMD 在上海设立研发中心，以上海研发中心为主体的中国研发中心逐渐发展壮大，现已成为全球研发体系的重要组成，拥有超 4,000 名研发人员，覆盖芯片设计、软件开发与系统测试，并与本地客户紧密合作，推动技术落地。近年来，AMD 在 AI 创新与可持续发展方面表现突出，荣获“2023年度杰出可持续创新企业”“ 2023-2024年度最受尊敬企业”称号，2024“世界互联网大会杰出贡献奖”等多项荣誉。

　　二、奖项设置

　　一等奖：1名 ¥10,000

　　二等奖：2名 ¥5,000

　　三等奖：3名 ¥2,000

　　三、赛程安排

　　（一）报名截止时间：2025年7月15日24:00。

　　（二）作品提交截止时间：2025年7月20日24:00。

　　（三）报名方式：采用线下报名方式，报名截止前完成报名费缴纳，并将参赛作品打包压缩，与线下报名表（见附件）、缴费凭证一并发送至官方邮箱。建议优先提交报名表，便于命题企业提供技术支持。

　　（四）报名邮箱：CIEEDA@163.COM

　　（五）缴费账号（线下转账）:

　　1. 开户名称：中国电子学会

　　2. 账　　号：9558850200000514831

　　（六）其他:

　　1. 7月15日报名截止后，秘书处将组织团队在官网完善信息并生成获奖证书，电子发票将发至队长邮箱。

　　2. 线下报名仅延长截止时间，不影响其他赛程安排。

　　四、命题描述

　　赛题一：基于 ROCm on Radeon™平台的DeepSeek大语言模型部署性能优化

　　1、赛题描述：

　　随着 AMD ROCm 软件栈对RDNA3架构支持的不断完善，面向专业及创意人士设计的 AMD Radeon™ PRO W7000 系列工作站显卡，凭借其卓越的48GB GDDR6 显存容量，正逐步成为应对当前 AI 开发面临的严峻挑战时有效且经济的解决方案。目前，ROCm 搭配W7000 系工作站 GPU的组合已支持大部分业内主流的模型以及部署框架。

　　本命题要求参与者在搭载单张W7000工作站GPU的平台上优化使用vLLM框架部署DeepSeek-R1-Distill-Qwen-7B 模型的性能。

　　建议的优化方向包括但不限于：

　　提升常见算子（如 Elementwise、GEMM 等）的执行效率，并对部署管线中的算子进行融合优化。

　　ROCm on Radeon™对诸多量化方法（如 AWQ、Marlin 等）提供支持。

　　对算法使用的计算内核（如 Attention、MoE 等）进行优化。

　　２、提交要求：

　　参赛者应基于指定代码仓库（如 vLLM、PyTorch、Triton等）进行代码更改，经本地编译验证后提交code patch，并附上本地测试结果显示的性能提升幅度。性能提升基于代码改正，而非依靠部署参数调整。具体参数参见技术支持部分。

　　2.1 赛题提交要求 (初赛)

　　技术论文 – Word文档 (必选）

　　视频文件, 限制3分钟 (必选)

　　门型展架，尺寸180cm*80cm（必选）

　　演示说明 – PPT文档 (可选)

　　2.2 赛题提交要求 (决赛)

　　技术论文 – Word文档 (必选）

　　演示说明 – PPT文档 (必选)

　　3、评分标准：

　　所有提交的代码将统一在 ROCm on Radeon™ 平台上进行验证，并根据性能提升的幅度进行排名。

　　基础得分 = 优化幅度百分比 x 100

　　加分项：（由AMD评审团打分）

　　创新性（5分）：优化方案的原创程度及复杂程度。

　　实用性（5分）：优化方案对ROCm 生态推广的积极作用。

　　可读性（2 分）：提交优化方案的详细阐述文档或 PPT。

　　4、技术支持：

　　4.1 硬件平台配置

　　（报名审核后，通知云服务申请表）

CPU	AMD EPYC™ 9654 96-Core
GPU	AMD Radeon™ PRO W7800 Professional Graphics
Memory	768G
Disk Space	8TB

　　4.2 视频教程

　　在8卡AMD W7800运行DeepSeek R1，

　　链接：https://www.bilibili.com/video/BV1i8j3zJExM

　　4.3 本地开发环境　　　

　　推荐使用 AMD Radeon™ PRO W7800

　　4.4 扫描二维码加入赛题一竞赛沟通QQ群

　　4.5 软件环境

　　Benchmark教程（以修改vLLM为例）

　　（1）准备DeepSeek-R1-Distill-Qwen-7B 模型和ShareGPT_V3_unfiltered_cleaned_split.json数据集

　　（2）推荐使用PyTorch-On-ROCm Docker Image创建container。

　　（3）在container内安装带有本地修改的vLLM。

　　（4）启动vLLM server

　　（1）运行benchmark并观测结果

　　4.6相关链接

　　AMD Radeon™ PRO W7800 Professional Graphics Specification:

　　https://www.amd.com/en/products/graphics/workstations/radeon-pro/w7800.html

　　Getting Started Guide: Using AMD ROCm™ Software on Radeon™ GPUs:

　　https://www.amd.com/en/developer/resources/ml-radeon.html

　　Inferencing and serving with vLLM on AMD GPUs

　　https://rocm.blogs.amd.com/artificial-intelligence/vllm/README.html

　　赛题二：基于AMD AI PC的AI应用开发 (自由命题)

　　1、赛题描述：

　　AI PC (人工智能个人电脑) 是一种集成AI技术的个人电脑，通过本地算力、自然语言交互、个性化大模型等核心能力，重构传统PC的体验，使其从工具升级为 “个人智能助理” 。

　　参赛队伍使用AMD 指定的APU产品开发一个AI应用，围绕以下领域 (包括但不限于):

　　AI应用专业领域

　　AI应用日常生活娱乐

　　AI PC与其他智能设备的链接与整合

　　补充说明:

　　（1）AIPC本地模型优化方案：针对AI Agent等现有应用，提出优化其在AIPC本地运行效能的创新方案（可融合大预言模型LLM、计算机视觉CV、文本处理OCR、语音交互ASR等）：

　　a. 模型轻量化：应用模型压缩技术（量化、蒸馏、剪枝等），实现模型精简与本地适配，兼顾精度。

　　评分依据： 优化前后模型大小、推理性能、系统负载数据对比。

　　b. 推理加速：采用优化技术（算子、图结构、内存管理等），提升本地推理效率（如prefill、token generation速度）。

　　评分依据： 性能提升量化数据。

　　（2）行业赋能方案：为教育、医疗、娱乐、办公等场景，设计基于AIPC本地AI的创新应用（例如：作业批改、病例分析、文章润色）。

　　评分核心： 创新性、实用性、可行性。

　　（3）其他

　　2、赛题要求：

　　2.1 硬件环境

　　AI PC 云平台接入（报名审核后，通知云服务申请表）

　　型号：Beelink SER / 处理器：AMD Ryzen HX370 / 内存：32GB RAM / 存储：1TB SSD

　　操作系统：Windows 11

　　外设请根据AI应用设计自行配置

　　2.2 AI应用的设计与实现:

　　基于所提供的硬件环境，以及利用AMD 推荐模型 https://huggingface.co/amd 或者自选模型，完成所选场景下的AI应用开发。

　　参赛作品须提出创新的解决方案，展示其前瞻性的思考和设计。

　　参赛作品须具有实际的应用价值。

　　参赛作品须充分发挥AMD 产品的算力优势 (iGPU, NPU, CPU)实现本地AI推理。

　　加分项：充分利用本地AI算力前提下，提升电源利用能效。

　　2.3 赛题提交要求 (初赛)

　　技术论文 – Word文档 (必选）

　　视频文件, 限制3分钟 (必选)

　　门型展架，尺寸180cm*80cm（必选）

　　演示说明 – PPT文档 (可选)

　　2.4 赛题提交要求 (决赛)

　　技术论文 – Word文档 (必选）

　　演示说明 – PPT文档 (必选)

　　3、评分标准：

　　3.1 技术创新和实用性 30%

　　AI应用基于的模型（或模型组）

　　提出创新的解决方案

　　能够有效地解决现实世界中的问题

　　复杂度和计算效率

　　示例：一个使用深度学习技术进行图像分类的模型，若其准确率超过90%且计算速度快于现有方法，则会得高分。

　　3.2 AI应用程序与用户交互程度 20%

　　示例：一个语音助手模型，若能根据用户的口音和语调自适应，并提供直观的界面，则会得高分。

　　3.3 论文，PPT的清晰度与逻辑 20%

　　文献综述全面、正确

　　方法描述清晰、易于理解

　　结果分析合理、令人信服

　　3.4 功能完整度 + 稳定性 15%

　　完成所有预定任务

　　运行速度和稳定性

　　示例：一个文本生成模型，若其能生成高质量文本且运行速度快、稳定，则会得高分。

　　3.5 Demo (现场直播、预先录制视频等形式) 10%

　　清晰展示该应用的功能和性能

　　可以帮助用户轻松理解和使用该应用

　　示例：一个人脸识别模型，若其Demo能快速、准确识别人脸并提供友好界面，则会得高分。

　　3.6 用户隐私数据是否受到保护 5%

　　是否收集和存储用户的隐私数据

　　用户的本地隐私数据是否加密

　　是否会将本地存储的隐私数据上传到网络

　　是否有明确的隐私政策和使用条款
　　示例：一个社交媒体分析模型，若其在不收集用户隐私数据的情况下完成分析，并提供清晰的隐私政策，则会得高分。

　　4、参考链接：

　　AMD AI Solutions：https://www.amd.com/en/solutions/ai.html

　　AMD HIP SDK on Windows: https://rocm.docs.amd.com/projects/install-on-windows/en/latest/index.html

　　AMD Ryzen AI: https://ryzenai.docs.amd.com/en/latest/index.html

　　5、赛题二竞赛沟通QQ群：

附件：第二十届研电赛AMD企业命题报名表