登录
账号
密码
还没有参赛账号,立即注册 >
还没有单位账号,申请创建 >
返回
【延长报名】AMD企业命题报名与作品提交截止时间分别延长至7月15日、20日。
发布时间:2025-06-27 来源:中国研究生电子设计竞赛 阅读次数:257

  一、公司介绍

  AMD 成立于 1969 年,总部位于美国加州圣克拉拉,现已发展为全球领先的高性能与自适应计算公司,全球员工超过 28,000 名(截至 2025 年 3 月)。公司产品涵盖 CPU、GPU、FPGA、DPU 及系统级芯片,并结合强大的软件能力,广泛应用于云端、边缘和终端设备。

  AMD 致力于推动人工智能发展,提供端到端的 AI 训练与推理解决方案,构建开放生态系统,并积极与中国生态伙伴合作,助力产业数字化转型。

  中国是 AMD 全球战略的重要市场。自 1993 年进入中国以来,AMD 不断扩大在华投入,业务涵盖产品销售、战略合作、新品开发等。2004 年成立大中华区总部,现由高级副总裁 潘晓明 领导。

  2006 年,AMD 在上海设立研发中心,以上海研发中心为主体的中国研发中心逐渐发展壮大,现已成为全球研发体系的重要组成,拥有超 4,000 名研发人员,覆盖芯片设计、软件开发与系统测试,并与本地客户紧密合作,推动技术落地。近年来,AMD 在 AI 创新与可持续发展方面表现突出,荣获“2023年度杰出可持续创新企业”“ 2023-2024年度最受尊敬企业”称号,2024“世界互联网大会杰出贡献奖”等多项荣誉。

  二、奖项设置

  一等奖:1名 ¥10,000

  二等奖:2名 ¥5,000

  三等奖:3名 ¥2,000

  三、赛程安排

  (一)报名截止时间:2025年7月15日24:00。

  (二)作品提交截止时间:2025年7月20日24:00。

  (三)报名方式:采用线下报名方式,报名截止前完成报名费缴纳,并将参赛作品打包压缩,与线下报名表(见附件)、缴费凭证一并发送至官方邮箱。建议优先提交报名表,便于命题企业提供技术支持。

  (四)报名邮箱:CIEEDA@163.COM

  (五)缴费账号(线下转账):

  1. 开户名称:中国电子学会

  2. 账  号:9558850200000514831

  (六)其他:

  1. 7月15日报名截止后,秘书处将组织团队在官网完善信息并生成获奖证书,电子发票将发至队长邮箱。

  2. 线下报名仅延长截止时间,不影响其他赛程安排。

  四、命题描述

  赛题一:基于 ROCm on Radeon™平台的DeepSeek大语言模型部署性能优化

  1、赛题描述:

  随着 AMD ROCm 软件栈对RDNA3架构支持的不断完善,面向专业及创意人士设计的 AMD Radeon™ PRO W7000 系列工作站显卡,凭借其卓越的48GB GDDR6 显存容量,正逐步成为应对当前 AI 开发面临的严峻挑战时有效且经济的解决方案。目前,ROCm 搭配W7000 系工作站 GPU的组合已支持大部分业内主流的模型以及部署框架。

  本命题要求参与者在搭载单张W7000工作站GPU的平台上优化使用vLLM框架部署DeepSeek-R1-Distill-Qwen-7B 模型的性能。

  建议的优化方向包括但不限于:

  提升常见算子(如 Elementwise、GEMM 等)的执行效率,并对部署管线中的算子进行融合优化。

  ROCm on Radeon™对诸多量化方法(如 AWQ、Marlin 等)提供支持。

  对算法使用的计算内核(如 Attention、MoE 等)进行优化。

  2、提交要求:

  参赛者应基于指定代码仓库(如 vLLMPyTorchTriton等)进行代码更改,经本地编译验证后提交code patch,并附上本地测试结果显示的性能提升幅度。性能提升基于代码改正,而非依靠部署参数调整。具体参数参见技术支持部分。

  2.1 赛题提交要求 (初赛)

  技术论文 – Word文档 (必选)

  视频文件, 限制3分钟 (必选)

  门型展架,尺寸180cm*80cm(必选)

  演示说明 – PPT文档 (可选)

  2.2 赛题提交要求 (决赛)

  技术论文 – Word文档 (必选)

  演示说明 – PPT文档 (必选)

  3、评分标准:

  所有提交的代码将统一在 ROCm on Radeon™ 平台上进行验证,并根据性能提升的幅度进行排名。

  基础得分 = 优化幅度百分比 x 100

  加分项:(由AMD评审团打分)

  创新性(5分):优化方案的原创程度及复杂程度。

  实用性(5分):优化方案对ROCm 生态推广的积极作用。

  可读性(2 分):提交优化方案的详细阐述文档或 PPT。

  4、技术支持:

  4.1 硬件平台配置

  (报名审核后,通知云服务申请表)

CPU

AMD EPYC™ 9654 96-Core

GPU

AMD Radeon™ PRO W7800 Professional Graphics

Memory

768G

Disk Space

8TB

  4.2 视频教程

  在8卡AMD W7800运行DeepSeek R1,

  链接:https://www.bilibili.com/video/BV1i8j3zJExM 

  4.3 本地开发环境   

  推荐使用 AMD Radeon™ PRO W7800

  4.4 扫描二维码加入赛题一竞赛沟通QQ群

  

  4.5 软件环境

  Benchmark教程(以修改vLLM为例)

  (1)准备DeepSeek-R1-Distill-Qwen-7B 模型和ShareGPT_V3_unfiltered_cleaned_split.json数据集

  (2)推荐使用PyTorch-On-ROCm Docker Image创建container。

  (3)在container内安装带有本地修改的vLLM。

  (4)启动vLLM server

  

  (1)运行benchmark并观测结果

  

  4.6相关链接

  AMD Radeon™ PRO W7800 Professional Graphics Specification:

  https://www.amd.com/en/products/graphics/workstations/radeon-pro/w7800.html

  Getting Started Guide: Using AMD ROCm™ Software on Radeon™ GPUs:

  https://www.amd.com/en/developer/resources/ml-radeon.html

  Inferencing and serving with vLLM on AMD GPUs

  https://rocm.blogs.amd.com/artificial-intelligence/vllm/README.html

  赛题二:基于AMD AI PC的AI应用开发 (自由命题)

  1、赛题描述:

  AI PC (人工智能个人电脑) 是一种集成AI技术的个人电脑,通过本地算力、自然语言交互、个性化大模型等核心能力,重构传统PC的体验,使其从工具升级为 “个人智能助理” 。

  参赛队伍使用AMD 指定的APU产品开发一个AI应用,围绕以下领域 (包括但不限于):

  AI应用专业领域

  AI应用日常生活娱乐

  AI PC与其他智能设备的链接与整合

  补充说明:

  (1)AIPC本地模型优化方案: 针对AI Agent等现有应用,提出优化其在AIPC本地运行效能的创新方案(可融合大预言模型LLM、计算机视觉CV、文本处理OCR、语音交互ASR等):

  a. 模型轻量化: 应用模型压缩技术(量化、蒸馏、剪枝等),实现模型精简与本地适配,兼顾精度。

  评分依据: 优化前后模型大小、推理性能、系统负载数据对比。

  b. 推理加速: 采用优化技术(算子、图结构、内存管理等),提升本地推理效率(如prefill、token generation速度)。

  评分依据: 性能提升量化数据。

  (2)行业赋能方案: 为教育、医疗、娱乐、办公等场景,设计基于AIPC本地AI的创新应用(例如:作业批改、病例分析、文章润色)。

  评分核心: 创新性、实用性、可行性。

  (3)其他

  2、赛题要求:

  2.1 硬件环境

  AI PC 云平台接入(报名审核后,通知云服务申请表)

  型号:Beelink SER / 处理器:AMD Ryzen HX370 / 内存:32GB RAM / 存储:1TB SSD

  操作系统:Windows 11

  外设请根据AI应用设计自行配置

  2.2 AI应用的设计与实现:

  基于所提供的硬件环境,以及利用AMD 推荐模型 https://huggingface.co/amd 或者自选模型,完成所选场景下的AI应用开发。

  参赛作品须提出创新的解决方案,展示其前瞻性的思考和设计。

  参赛作品须具有实际的应用价值。

  参赛作品须充分发挥AMD 产品的算力优势 (iGPU, NPU, CPU)实现本地AI推理。

  加分项:充分利用本地AI算力前提下,提升电源利用能效。

  2.3 赛题提交要求 (初赛)

  技术论文 – Word文档 (必选)

  视频文件, 限制3分钟 (必选)

  门型展架,尺寸180cm*80cm(必选)

  演示说明 – PPT文档 (可选)

  2.4 赛题提交要求 (决赛)

  技术论文 – Word文档 (必选)

  演示说明 – PPT文档 (必选)

  3、评分标准:

  3.1 技术创新和实用性 30%

  AI应用基于的模型(或模型组)

  提出创新的解决方案

  能够有效地解决现实世界中的问题

  复杂度和计算效率

  示例:一个使用深度学习技术进行图像分类的模型,若其准确率超过90%且计算速度快于现有方法,则会得高分。

  3.2 AI应用程序与用户交互程度 20%

  示例:一个语音助手模型,若能根据用户的口音和语调自适应,并提供直观的界面,则会得高分。

  3.3 论文,PPT的清晰度与逻辑 20%

  文献综述全面、正确

  方法描述清晰、易于理解

  结果分析合理、令人信服

  3.4 功能完整度 + 稳定性 15%

  完成所有预定任务

  运行速度和稳定性

  示例:一个文本生成模型,若其能生成高质量文本且运行速度快、稳定,则会得高分。

  3.5 Demo (现场直播、预先录制视频等形式) 10%

  清晰展示该应用的功能和性能

  可以帮助用户轻松理解和使用该应用

  示例:一个人脸识别模型,若其Demo能快速、准确识别人脸并提供友好界面,则会得高分。

  3.6 用户隐私数据是否受到保护 5%

  是否收集和存储用户的隐私数据

  用户的本地隐私数据是否加密

  是否会将本地存储的隐私数据上传到网络

  是否有明确的隐私政策和使用条款
  示例:一个社交媒体分析模型,若其在不收集用户隐私数据的情况下完成分析,并提供清晰的隐私政策,则会得高分。

  4、参考链接:

  AMD AI Solutions:https://www.amd.com/en/solutions/ai.html

  AMD HIP SDK on Windows: https://rocm.docs.amd.com/projects/install-on-windows/en/latest/index.html

  AMD Ryzen AI: https://ryzenai.docs.amd.com/en/latest/index.html

  5、赛题二竞赛沟通QQ群:

  

 

附件:第二十届研电赛AMD企业命题报名表