在人工智能全面迈入"大模型时代"的当下,模型推理效率正演进为制约技术产业化的关键瓶颈。面对端侧设备算力约束与云端算力成本激增的双重挑战,需构建从芯片架构到框架设计的全栈式技术突破体系,重点聚焦三大核心挑战:
其一,面向AI计算场景的芯片架构创新,如何利用AI模型的自回归、扩散生成等特点牵引芯片架构设计?
其二,跨平台推理框架的深度优化,怎样构建调度机制,实现从移动终端到云服务器的全场景覆盖?其三,软硬件协同优化范式的革新,如何结合,硬件与软件层的推理框架设计,拓宽AI推理的性能边界?
本论坛汇聚优秀学者与产业专家,共同探索大模型推理的效能优化路径。论坛分为上下两场,首先介绍偏重应用、系统的优化方向,然后介绍偏重硬件的优化方向。
论坛嘉宾包括:
李萌 北京大学助理教授
傅致晖 OPPO研究院AI系统技术主管
糜泽羽 上海交通大学副教授
孙广宇 北京大学长聘副教授
裴瑞光 OPPO研究院AI系统专家
宋卓然 上海交通大学副教授
由CCF主办的YEF2025于2025年5月22-24日在横琴召开。此次大会由CCF会士、副理事长,华中科技大学教授金海担任大会主席,以“智辟新径”为主题,汇聚了中国计算机领域的青年精英及知名专家,共同探讨科技前沿,开启智慧新篇章。在三天的时间里,预计将组织7场特邀报告、2场大会论坛、1场思想秀、1场优秀大学生学术秀及22场专题论坛。
更新时间:2025-05-28
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号