行业洞察 -北京灵木数据科技有限公司

科技创业者的媒体合伙人

热议中！AI论坛盛会洞悉“芯”趋势

主编：转载

【通讯转载自网络|本文末尾注明出处】

随着人工智能技术的飞速发展，全球范围内关于AI的盛会也如雨后春笋般涌现。近期，一系列备受瞩目的AI盛会即将拉开帷幕，吸引了来自世界各地的专家学者、企业代表和技术爱好者。这些盛会不仅为业界提供了交流合作的平台，更成为推动AI技术创新与应用的重要力量。

在即将到来的盛事中，我们见证了AI技术在不同领域的深度融合与创新应用。从智能机器人到自动驾驶，从语音识别到图像识别，AI正以前所未有的速度改变着我们的生活。而这些盛会，正是展示AI技术最新成果、探讨未来发展趋势的重要舞台。

世界人工智能大会

4月23日下午，“WAIC Circle·AI预见生态论坛”在上海国际贸易中心成功举办。以“知行合一，预见AI大模型创新之路”为主题，邀请产学研等多领域的专家学者和行业先锋企业，共同探讨AI技术在不同领域的应用实践和未来发展趋势，助力企业在AI+时代中把握先机，实现创新突破。本次论坛全程进行直播，WAIC平台约4万人次同时观看，现场座无虚席。

01.知行合一，与行业大咖共话AI落地

本次论坛汇聚来自复旦大学、上海财经大学、上海大学、互影科技、仟传网络、每日互动、同济工程咨询等多元机构的专家、学者及企业高管，通过多维度、跨学科、跨领域的交流与互动，共同探讨AI大模型在企业中的应用实践、挑战与机遇，真正推动AI大模型在企业的落地发展。[i]

主旨演讲环节，复旦大学管理学院教授、博导，复旦大学智慧城市研究中心主任凌鸿教授围绕“AI大模型的底层思考和发展趋势：AI+时代，颠覆性创新机会在哪里？”主题展开分享。他从Sora切入，介绍了机器与人类认知世界方式的不同，深入浅出的分析了AI大模型的能力以及它所带来的影响，深入探讨了数字化浪潮下AI大模型的底层思考逻辑和发展趋势，揭示了个人、组织应如何把握AI所带来的颠覆性创新机会。他强调，人工智能非人类智能，要让机器做机器擅长的事情，人做人擅长的事情。凌鸿教授的演讲为与会嘉宾提供了对AI大模型发展趋势的深刻见解，并激发了对AI时代创新机会的思考。

02.实践洞察：AI大模型赋能千行百业

随着AI技术的不断进步和创新，AI大模型正成为引领行业发展的重要引擎，为各行业带来革命性变革和巨大赋能。活动现场，来自娱乐、金融和营销等领域的行业领军人物，通过生动的案例展示，分享各自领域中AI大模型的应用案例，展示AI技术在不同行业中的创新实践和潜在机遇，为企业“AI+业务”创新提供丰富的思路和启示。

实践洞察环节，三位演讲嘉宾结合自身所处行业案例，从娱乐、金融、媒体传播与营销等多领域的AI应用实践出发，分享了如何利用AI技术推动行业创新的深刻见解。互影科技创始人鹍鹏站在一线从业者的角度，展示了AI为娱乐产业带来的新创作模式与内容体验。上海财经大学统计与管理学院副教授张立文分享了AI大模型在金融业中的落地探索实践和前瞻思考。仟传网络科技创始人、董事长苏旋揭示了AI如何帮助品牌更精准判断社交媒体风向、指导营销方向，并自动生成针对性的广告内容。

03.前瞻洞见：“数据”加速企业转型升级

数字时代，“数据”成为新型生产要素，不仅是企业经营管理的重要资源，更是推动创新和发展的关键驱动力。数据资产入表，将企业数据转化为优质资产，并使其成为企业的战略性资源和核心资产，成为企业发展的新动力和增长点。本次论坛聚焦于“数据”，深入探讨了企业如何充分利用数据资源，实现业务增长和竞争优势，为企业转型升级提供了重要参考。

前瞻洞见环节，每日互动公司总裁刘宇总结了数据在行业中大规模应用所面临的问题与挑战，提出“数据要分级、分类，更要分场景论证、分场景使用”的主张，并通过实际案例，展示了数据价值流动和创造的具体应用。同济工程咨询事业部合伙人房钰君围绕数据的资产价值、当下的市场机会以及企业当前可以做的事情三个话题展开，深入探讨了公共数据的资产入表以及公共数据如何赋能企业数据转型。两位演讲嘉宾聚焦“数据”，分析了数据如何成为企业创新和增长的关键驱动力，强调了数据在当今企业运营中的核心地位和战略价值。

全球机器学习技术大会

4月25日，CSDN携手知名的高端IT咨询与教育平台Boolan，在上海环球港凯悦酒店隆重举办了ML-Summit 2024全球机器学习技术大会。此次大会以大模型技术演进、多模态、大模型工程与架构、GenAI产品创新及探索、AI基础设施等前沿技术为核心议题，共设12大技术专题。大会邀请了微软、阿里、百度、智谱、百川、零一万物、智源、面壁智能、小米、北京大学、复旦大学、eBay、恒生电子、达观、金山、度小满、曙光、元戎、PPIO等众多领军企业及组织的顶尖技术专家和学者。他们针对大模型的最新技术动向及行业痛点，深入剖析了大模型技术的实践应用案例及实战经验，为与会者带来了一场精彩纷呈的技术盛宴。

ML-Summit 2024全球机器学习技术大会的宗旨是面向AI研发一线，坚持干货和实战输出，旨在汇集世界各地的AI领域专家、学者以及来自不同行业的AI精英，共同探讨机器学习领域的最新进展和未来趋势。通过会议，参会者能够深入了解大模型技术的演进、多模态、大模型工程与架构、GenAI产品创新及探索、AI基础设施等前沿技术，分享最佳实践、最新进展和未来趋势。

大会围绕机器学习技术设置了多个专题论坛，包括但不限于大语言模型技术演进、多模态大模型前沿、代码大模型与软件变革、大模型+行业落地实践、GenAI产品创新与探索、大模型工程与架构、大模型应用开发实践、大模型应用框架与工具、AI智能代理、AI Infra大模型基础设施、ML/LLM Ops大模型运维以及算力基建与性能优化等。这些主题全面覆盖了机器学习的多个关键领域，为参会者提供了深入了解和探讨机器学习技术发展的机会。通过此次会议，参会者不仅可以学习到最新的技术知识，还可以与业界专家进行深入的交流和探讨，共同推动大语言模型技术的创新与发展。同时，会议也为不同行业的AI精英提供了一个交流合作的平台，促进了跨行业的合作与创新。

这次ML-Summit 2024全球机器学习技术大会的演讲者阵容强大，包括众多著名的AI专家。

例如，复旦大学教授、博士生导师张奇，他是MOSS大模型的核心人员，前搜狗首席研究员，并在自然语言处理领域有着深入的研究和丰富的实践经验。他在ACL、EMNLP、COLING等重要国内外会议上多次担任程序委员会主席、领域主席、讲习班主席等，发表论文150余篇，并获得了美国授权专利4项。

此外，还有零一万物的联合创始人潘欣，他主要关注机器学习平台、推荐系统、算法应用等工作，曾在Google、百度、腾讯等知名公司担任关键职务，拥有丰富的AI技术研发和团队管理经验。

另外，大会还邀请了Daniel Povey博士，他是著名的语音识别开源工具Kaldi的主要开发者和维护者，被称为是Kaldi之父。他的工作对语音识别领域做出了重大贡献，其论文被广泛引用，对业界和学术界产生了深远影响。

01.聚焦大模型技术创新与落地，共赴 AGI 新时代！[ii]

上午 9 点，CSDN 高级副总裁、Boolan 首席技术专家李建忠为大会带来主题为《AGI 2024 技术创新研究与思考：大模型驱动的计算产业范式转换》的开场演讲。他指出，大模型在整个计算产业链中引发持续的轰动效应，是因为它带来了计算范式、开发范式、交互范式共三大范式转换。

李建忠 CSDN 高级副总裁、Boolan 首席技术专家

首先是计算范式的转换，包括体系架构和任务模型两大方面，计算的体系架构会从图灵-冯诺依曼计算架构转为神经网络计算架构，计算的任务模型则从围绕“存取、计算、显示”为中心的检索模型转为围绕“学习、预测、生成”为中心的生成模型。在开发者关注的开发范式方面，李建忠表示，大模型驱动的开发范式正在从传统命令编程、当前的大模型辅助软件开发，到未来面向模型（神经网络）的编程演进。其中，针对大模型辅助软件开发，李建忠提出“五级自动软件开发”参考框架，将软件开发智能化程度分为五级 L1~L5。其中，李建忠特别提到 AI 智能体的关键作用——“智能从来不是一步到位的，它不仅仅是认知和创造，更是规划、迭代、协作和使用工具”。在面向模型（神经网络）编程方面，李建忠表示未来的编程将跳出高级语言、编译/链接、执行这样的传统过程，逐步转变为收集训练数据并设定训练目标，将数据集、目标设置、架构设置通过编译过程转换为表示神经网络权重、前馈过程的二进制语言，这是对软件开发更大的颠覆式转换。在交互范式的变革方面，李建忠谈到今年最大的变化是多模态的发展，自然语言交互界面（LUI）和多模态合力将在未来为终端应用交互带来全新体验，将计算的潜力释放到更广泛的人类。在谈到 Sora 的成功时，李建忠指出 OpenAI 创新性地选择了“通用可扩展”的 Diffusion Transformer 路线，包括使用 Patch 来统一各种视觉数据的“元表示”，这些技术创新的底层原因是 OpenAI 坚持 Scaling Law 的技术信仰，选择适配“可扩展”的技术路线。演讲最后，李建忠总结道，计算、开发与交互的三大范式转换，将深刻影响计算产业的未来，包括基础设施、开发流程和应用形态。国际知名语音识别专家、Kaldi 之父、IEEE Fellow、小米集团首席语音科学家 Daniel Povey 博士站在 AI 整个历史长河的发展中看待当下 LLM 技术，他表示，AI 的发展是个漫长的过程，没有终点。

DanielPovey，Kaldi 之父、IEEE Fellow、小米集团首席语音科学家

在 Daniel Povey 看来，ChatGPT 等大模型产品的流行能让人们学到很多自然语言和 AI 知识，这些模型的训练往往只基于一个预测损失函数，而增加模型规模和训练数据大小能进一步提高模型性能。基于此，Daniel 在现场为开发者深入分享了他及新一代 Kaldi 团队在机器学习研究及实践中的最新成果，包括声学编码器 Zipformer、神经网络优化器 ScaledAdam 以及全新的标准化模块 BiasNorm 等。模型更迭迅猛，未来充满未知，Daniel Povey 给出了他的答案。他表示未来的模型会更注重处理预测其他事物的信息，尤其是跨模态的信息，如文本与图像。面对业内所热议的 AI 是否会取代部分劳动力的问题，Daniel 这样讲道：“纵观历史，人们总是因自动化会导致工作岗位被摧毁而感到恐慌，但从长远来看，似乎并没有造成问题，因为总会有新的工作出现。”不过，Daniel Povey 担心的是，人们会越来越依赖那些集中化、复杂且脆弱的系统。这将带来巨大的安全隐患，比如一个黑客或一个简单的漏洞，可能会导致某个供应商的所有自动驾驶汽车全部停止，有可能直接导致整个国家甚至全球的交通瘫痪。在复旦大学教授、眸思大模型负责人张奇看来，“大语言模型是实现 AGI 的必由之路吗？”这近乎是一个哲学问题，如果大模型是 AGI 的必由之路，那么现阶段场景、任务、领域模型可能都毫无意义；如果大模型不是 AGI 的必由之路，那么我们需要重新思考和定位通用大模型的研究意义。因此，对这个问题如何认知，也将走向截然不同的道路。

张奇，复旦大学教授、眸思大模型负责人

张奇表示，“推理能力”是 AGI 的核心，而推理能力又包含了演绎推理和归纳推理、溯因推理。在演绎推理方面，从科学数据来看，ChatGPT 和 GPT-4 都擅长解决著名的逻辑推理阅读理解基准，但是大模型对于分布外数据集处理仍有待提高。在实验中通过检索、分类、比较、逆向搜索四种能力来衡量大模型对知识运用能力时，我们发现，语言模型难以完成比较和分类任务，也无法进行逆向知识搜索，除非知识以逆序出现在预训练数据中。最终，张奇教授得出一个结论：演绎推理作为单独任务可以优化，但演绎推理能力在其他任务中并不能自动获得。在归纳推理维度，目前行业中的大模型在任务复杂程度增大时，准确率接近为 0，且训练过程中简单加入过程作用也十分有限。整体而言，大模型的能力的产生首先源于在预训练阶段构建了大量基础的知识，将知识压缩和表示学习，进而通过指令微调，将能力注入，最后基于奖励函数、强化学习将生成任务能力提升。其实大模型的任务能力并非一开始就具备，而是后期不断叠加上去的。需要注意的是，由于任务的不断叠加，会使得一些任务能力下降。所以，叠加任务能力和保持质量方面也会存在一定的冲突。张奇认为，大模型可以很快速地在很多任务上做到 70 分，然而基于大模型在任何任务上完成 90 分却是十分困难的。只是简单增大数据量无法实现效果增加，未来标注数据的准确程度要求会十分苛刻。对此，他建议道，“忘记 AGI、涌现、对齐、激发 …”等网红术语，可以从统计机器学习角度“再出发”。2023 是百模大战的一年，而进入到 2024 显然是多模态与大模型产品落地的关键一年。大会现场，水木分子联合创始人和首席技术官乔木博士为我们带来了《多模态生物医药大模型及其行业应用》的主题演讲。乔木表示，时下”通用大模型底座 + 行业大模型 + 行业 Killer App“共同构成了 AI 时代操作系统，而当前大模型产业已经从上半场的通用能力建设演进至下半场的行业应用。

乔木，水木分子联合创始人和首席技术官

以其身处的生物医药领域为例，乔木认为，这一领域还存在海量多模态数据价值亟待挖掘，如药物小分子、蛋白质序列数据以及单细胞数据，以及诸多的知识图谱和超过 1.15B 文献、专利等。为了探索生物、化学、环境、材料不同行业的模型实践，水木分子与清华大学智能产业研究院合作共同推进 AI4S（AI for Science）科学研究，也联合开源 BioMedGPT 生物医药科研基础模型，统一生物编码语言、化学分子语言与自然语言。此外，水木分子还带来了新一代对话式药物研发助手 ChatDD (Drug Design) ，重新定义药物研发模式，同时也发布其商业化的全球首个千亿参数生物医药多模态大模型 ChatDD-FM 100B。最终激发大模型在生物医药的管线战略情报、商业价值评估、专利分析等多场景下的潜力。

02.高峰对话：大模型的演进与 AI 创新之路

今年上午主会压轴的圆桌对话环节中，CSDN高级副总裁、Boolan 首席技术专家李建忠，Kaldi 之父、IEEE Fellow、小米集团首席语音科学家 Daniel Pove，复旦大学教授、眸思大模型负责人张奇，水木分子联合创始人和首席技术官乔木在Athena labs CTO 王兴明的主持下，围绕“大模型的演进与 AI 创新之路”展开深度的探讨与经验分享，同时也为与会者们进行精彩的答疑。

对于过去一年大模型的发展，令李建忠印象深刻的主要有两件事，一是 Sora 的架构和 GPT 一样继续遵循Scaling Law，具有极强的扩展能力，并且在大规模数据上训练时展现出了惊人的“涌现能力”，而无需对三维空间、物理规律等进行规则化引导。另一个是 AI Agent 智能体的快速发展，进一步实现软件开发的高度自动化。Daniel Povey 谈到大模型中语音领域的应用时表示，AI 同传并不会很快走进现实，机器无法精准预测人们下一步所表达的内容。他觉得扩散模型是未来值得关注的领域。“大型模型的泛化能力是当前备受关注的焦点之一”，乔木博士指出，如何更有效地理解专业领域的信息，是许多垂直领域模型的关注点。通用大模型要想解决专业领域内有深度，有难度的问题，同样需要提升专业能力。乔木表示，“对于BI 和专利法律等问题挑战，不仅在生物医药领域存在，同时也在金融等其他领域也存在。我们需要进一步提升通用大模型在专业领域的适用性，或者开发针对各行业的垂直大模型，以帮助用户获取特定领域的知识。这些解决方案应该具有通用性，能够面向不同的用户。因此，对于通用大模型而言，如何在不同的行业发挥作用，对其泛化能力提出了更高的要求。”面对开发者提出的“在实际应用中，大型模型的推理能力一定程度上还是基于概率统计的思路进行的，而如何探索出大模型推理的可行性路径”的痛点难题，张奇根据时下大型模型已经具备的四个能力给出了自己的建议：1. 长文本建模能力：过去，token 受限于 512 的长度，长文本建模较为困难。现在，我们可以利用更大规模的模型，至少做到支持 4k、8k 来进行更好的长文本建模。 2. 更好的语义表示：大规模训练后，模型语义表示能力得到了大幅提升。3. 多任务处理（multitask）能力：尽管挑战不小，但通过多任务学习，可以混合处理工作任务。4. 多语言处理能力：现在多语言处理相对容易，大型模型已能胜任。如果在工作中的任务可以往这四个方面发力，推理成功可能性较大。

回顾近期这一系列AI盛会，我们不难发现，人工智能已经成为推动社会进步的重要力量。通过这些盛会，我们见证了AI技术的飞速发展，也看到了其在各个领域的广泛应用。同时，这些盛会也为业界提供了交流合作的机会，促进了AI技术的创新与发展。

展望未来，我们有理由相信，随着技术的不断进步和应用场景的不断拓展，AI将在更多领域发挥重要作用。我们期待未来能有更多这样的盛会，汇聚全球智慧，共同推动人工智能技术的繁荣与发展，为人类社会的进步贡献更多力量。