在乌镇,“大模型”成为“高频热词”

宰父甜 数码 2024-11-21 5 0

光明网记者 雷渺鑫 李飞

" 文心智能体技术,受到人脑快思考慢思考的启发,在基础大模型之上研制了基于思考模型的慢思考机制,更理性、更准确。"

"Angel 大规模机器学习平台在规模方面采用了 GPU 拓扑感知调度 , 研发了层次化规约计算 , 实现了单任务万卡的线性扩展。"

" ‘认知决策智能体技术创新及应用’项目通过图智能、运筹优化等技术突破,实现了基于万亿级关联关系、行业知识和专家经验的实时推理决策。"

……

在 11 月 19 日下午举行的 2024 年世界互联网大会领先科技奖颁奖典礼现场," 大模型 " 多次出现,成为 " 高频热词 "。

2024 年世界互联网大会领先科技奖颁奖典礼现场。光明网记者 潘迪摄 / 光明图片

自 ChatGPT 发布后,以大模型为代表的人工智能技术正在引领科技创新和产业变革浪潮。如果说普通观众是 " 看热闹 " 的直观感受,那么大模型的研究者和从业者,则更关心这条新赛道上更深层次的 " 门道 "。

大模型时代,模型参数超过万亿,训练数据超过十万亿,如此庞大的规模,给模型训练和推理带来三个关键挑战,即通信挑战,如何实现大规模 AI 算力节点的高速互联;效率挑战,如何实现高效的训练性能和推理速度;规模挑战,如何实现万卡甚至更大规模集群的线性扩展。

对此,腾讯公司副总裁蒋杰表示,"Angel 大规模机器学习平台关键技术与应用 " 项目,通过自研 RDMA 网络、显存 + 主存一体化机制及 GPU 拓扑感知调度等技术,实现了通信、效率与规模的全面优化,为大规模机器学习模型的训练和推理提供了强有力的支撑。

" 截至今年 9 月,Copilot 已搭载了 GPT-4o 等领先模型,集成了多项创新功能。例如 AI 时代的开创性数字工具 Copilot Pages,与数据中枢 BizChat 无缝集成,将网页数据、工作数据和业务数据整合到用户的工作流中,构建出全新的多用户实时、持续的 AI 协作模式。" 微软全球资深副总裁张祺介绍,诸多独特优势,使 Copilot 不同于其他 AI 服务,开创了以 AI 为思维引擎的全新工作模式。

然而,技术的革新并未止步。百度公司发布的文心智能体技术,则是对人工智能模仿人类思考能力的深度探索。百度公司首席技术官王海峰介绍,文心智能体基于思考模型的慢思考机制,通过思考过程的有监督精调、行为决策的偏好学习、结果反思的增强学习等思考增强训练,实现了从 " 模仿 " 到 " 思考 " 的跨越。

这一突破,不仅提升了文心大模型的能力,充分释放其潜力,更加速了应用的爆发:代码智能体、农民院士智能体、个人助手等 " 遍地开花 " ……据了解,截至目前,文心智能体已凝聚超过 80 万开发者、15 万家企业。

技术的创新,最终要真正实现 " 落地 ",才能发挥其价值。在蚂蚁科技集团股份有限公司首席技术官何征宇看来,新一代人工智能技术在大规模落地中,面临领域认知能力弱、复杂推理能力差、端到端落地难三大挑战。此次发布的 " 认知决策智能体技术创新与应用 " 项目,正是将人工智能技术深度融入产业实践的生动例证。

该项目通过研发万亿参数的可信大模型基座、高性能知识决策引擎及行业智能体开发平台,实现了人工智能在医疗、民生、金融等领域的广泛应用,显著提升了行业的认知力和行动力。

回顾过去,人工智能大模型产业的发展已经取得了令人瞩目的成就;展望未来,智能化浪潮势不可挡,人工智能将深刻改变我们的生活和工作方式。

在此过程中,我们也应清醒的认识到,人工智能技术的发展仍面临数据安全、隐私保护、伦理道德等诸多挑战和问题,如何平衡好技术创新与社会责任的关系,确保人工智能技术的健康、可持续发展,亟待解决。

" 独木不成林,单弦难成曲。" 人工智能大模型产业的发展离不开社会各界的共同努力。我们相信,在科技巨头的引领下,在广大开发者和企业的积极参与下,人工智能大模型产业将迎来更加广阔的发展前景,向着 " 以人为本、智能向善 " 聚力前行。

[ 责编:邢彬 ]

版权声明

本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。

分享:

扫一扫在手机阅读、分享本文

评论