Schedule

13:30-14:10

RWKV,面向未来的高效 AI大模型架构

RWKV是全球领先的新型高效大模型架构,具有开源开放全球生态。从2020年研发,目前已迭代至第8代,特点: 1)纯RNN无attention,适合超高并发和超长推理;2)能效优秀、速度和显存恒定、已适配国内外多款芯片,单5090解码7B模型可达10000tok/s以上 全球使用RWKV训练模型的论文已达140篇,涵盖各种模态。2024年微软在数亿台电脑部署RWKV运行库,2025年中国电科发布基于RWKV的30B模型。

14:10-14:50

通用Agent及多模态模型实践分享

通用Agent及多模态模型实践分享

14:50-15:30

面向业务场景落地的 AI 加速芯片软件生态实践

结合燧原科技的AI加速芯片在客户业务场景中大规模落地的案例,探讨国产软件生态发展演进的过程和未来趋势的判断。

15:30-16:10

从 Demo 到生产:解密大模型私有化落地的技术挑战与 LazyLLM 解决方案

大模型的能力正在快速扩展,但真正能在企业内部稳定落地的项目仍凤毛麟角。私有化部署不仅考验算力与安全,更考验算法层面的工程化能力——如何在有限资源下同时保障生成质量、响应速度与知识准确性,成为落地成败的关键。 本次演讲将结合典型企业场景,系统探讨从 Demo 到生产的关键算法挑战,并分享一系列经过验证的优化路径,主要包括: 1. 私有化落地的市场行情与客户需求分析 2. 结合实际案例,剖析企业客户在私有化部署中的核心需求与痛点; 3. RAG 精度优化与知识对齐算法:介绍在私有知识场景下提升检索召回与生成一致性的策略; 4. 多模态能力扩展与跨域融合:探讨多模态内容在企业级RAG中的集成方法; 5. Agent 驱动的智能增强:阐述如何通过Agent机制实现RAG的动态调度与智能协作,使其真正服务于业务价值。

16:10-16:50

运用 Elasticsearch 及大模型构建 AI 驱动的搜索应用

Elasticsearch 是全球领先的搜索引擎。传统的词汇搜索不能满足当今智能时代的需求。语义搜索,也就是根据文字的语义来进行搜索,而不是简单的关键词匹配。另外,我们也需要针对其它的数据类型,比如图片,语音及视频来进行搜索。Elasticsearch 除了提供传统的词汇搜索,还同时提供向量搜索(密集向量,稀疏向量)。它可以完美地解决文字语义搜索及多媒体数据的搜索,多模态的数据搜索。单纯的向量搜索也并非完美,特别是针对文字搜索。我们可以使用混合搜索(词汇搜索,向量搜索)进行多路召回并对最终结果进行排名。这种方法可以提供搜索的提高精度及召回率。在人工智能发展的今天,结合大模型,我们把搜索到的结果结合大模型,使用 GenAI 可以让我们得到完美的推理结果。由于企业数据或私有数据在每时每刻都在生成,而大模型的知识受限于在模型生成的时候,而且大模型的数据也只是网页数据训练而得到的。大模型在缺乏上下文的情况下使用大模型来对企业或者私有数据进行推理,在很多的时候会产生幻觉,因为这些知识不存在于大模型中。结合 Elasticsearch 的向量搜索技术针对企业数据或私有数据进行搜索,把搜索结果作为上下文提供给大模型,从而消除幻觉。这种技术也被称作为 RAG(检索增强生成)。本议题将详细介绍 Elasticsearch 的向量搜索技术及如何使用它进行 RAG 的应用开发以及最新的 Agentic RAG(AI agents builder)。
©开源中国(OSChina.NET) 北京奥思研工智能科技有限公司 京ICP备2025119063号