【圆桌论坛·大模型应用全景扫描】
编者按 政务智能化面临数据安全与场景适配双重挑战,DeepSeek以“开源+双轮架构”破局,借“生成+推理”穿透垂直场景,用全栈国产化部署筑牢安全防线。本期业内专家从技术、安全、落地等维度,解析DeepSeek如何以“开源钥匙”开启“本土智治”,在合规与适配间走出“攻守之道”,为政务数字化转型提供技术与安全平衡的国产方案。
用“开源钥匙”开启政务数智化试验田
——业内专家共议DeepSeek政务落地“攻守之道”
主持人:
本报记者 张明柳
嘉宾:
博思数采科技股份有限公司副总裁 陈 旭
国泰新点软件股份有限公司副总裁 何永龙
浪潮云总经理助理 陈 尧
采招云数智化采购研究中心 宋 军
主持人:DeepSeek凭借哪些核心技术与架构创新,成为垂直领域大模型应用的新标杆?
何永龙:DeepSeek在各个行业领域引发高度关注,核心在于其精准解构了垂直领域中“规则体系、数据要素与决策链条”的复杂关联。其“内容生成+逻辑推理”双轮驱动的架构,不仅拓展了通用模型的能力边界,更是构建了透明化、可审计的决策机制。在招标采购领域,随着数智化建设的纵深推进,兼具招采专业深度与业务逻辑的垂直领域大模型也逐步成为刚需,而DeepSeek在各行业的成功实践已为招标采购行业树立了标杆。
陈旭:DeepSeek创新采用“生成+推理”融合架构,突破传统大模型“黑箱”局限。其逻辑推理准确率高于ChatGPT-4,且能输出逐步推导过程。例如,在政策解读场景中,DeepSeek-R1不仅给出结论,还附带推理链条,使决策过程可追溯,契合政务领域对AI决策合规性的严苛要求。相较之下,ChatGPT基于单一Transformer架构,参数规模虽大但推理过程不可解释,难以满足政务场景对透明度的需求。
陈尧:DeepSeek通过多头潜在注意力(MLA)、多令牌预测(MTP)等技术,在数学、代码、自然语言推理等任务中表现卓越。以公文处理为例,其语义理解与生成能力可提升效率30%以上,为数字政府建设提供核心技术支撑。
主持人:“生成+推理”融合架构在政务等场景中具备哪些独特优势?
何永龙:DeepSeek-R1通过“生成+推理”双引擎的原生协同与闭环进化,准确性和可解释性需求内化为其核心能力。推理引擎作为“逻辑锚点”和“规则卫士”,在生成前、中、后进行深度介入与验证,确保输出严格基于事实与规则;同时,其推理过程的结构化显性化输出,彻底打破了传统大模型的黑箱困境。相较于依赖统计概率和通用知识的ChatGPT等模型,DeepSeek实现了预防性纠错、过程可审计、决策可溯源的质变,为构建可信、可靠、透明的招标采购领域智能应用提供了坚实的技术基础。
陈旭:DeepSeek基于6710亿参数的MoE(混合专家)架构,包含256个专家模块,每次仅激活8个,实现高效知识利用。其模型分支V3侧重对话生成,通过指令微调和强化学习优化互动体验;R1侧重逻辑推理,结合链式思维(CoT)技术,实现复杂问题的逐步分解。例如,在政策解读时,R1会自动关联历史版本、相关法规及执行案例,确保输出与政策意图一致,同时附带推理步骤,增强可信度。
陈尧:针对简单业务场景,使用DeepSeek生成式模型,依赖高质量政务语料(政策文件、办事指南等)训练,确保内容合规性;针对复杂业务场景,使用DeepSeek推理模型引入思维链技术,对生成内容进行多轮事实核查与因果链验证,例如在解读政策时,自动关联历史版本、相关法规及执行案例,确保输出与政策意图一致。通过以上“生成+推理”双能力方案,尽可能定向使用不同类型模型擅长能力,降低幻觉问题。同时,使复杂模型推理过程尽可能显化,降低用户幻觉感觉。
主持人:DeepSeek怎样实现中文公文生成的严谨性和语境贴合度远超通用模型?
何永龙:DeepSeek凭借根植中国土壤的独特基因,展现出显著的本土化优势。在招标采购领域,专业政策术语以及业务的依赖表述较为常见。我们通过对大模型的强化学习,使其对招标采购行业复杂且动态更新的法规体系能够做到精准理解。相较于ChatGPT等通用模型,其在中文场景处理上更具优势,能避免国际通用模型常有的“水土不服”现象。
陈旭:DeepSeek训练语料涵盖政策文件、法律条文、官方信函等,针对中国特色政务文本进行专项调优,确保措辞符合制度与文化语境。DeepSeek生成的中文内容措辞严谨、贴合语境,在政策解读、智能写作等任务中表现专业。例如,用户反馈其公文生成能力可直接用于正式文件起草,中文表达力优于通用模型。反观ChatGPT,虽具有多语言能力,但因训练语料侧重不同,在处理中文公务场景时往往不够地道,术语理解准确率较DeepSeek低。
陈尧:DeepSeek基于海量中文语料训练,支持方言及口语化表达转换,并引入思维链技术强化逻辑推理,使其在政策术语解析、民众诉求分析等场景中更精准,增强政府与群众沟通的亲和力。
宋军:DeepSeek的设计使之既能流畅生成自然语言,又能逐步推理分解问题,输出带有清晰推理链条的答案。此外,DeepSeek还通过领域知识融合,将政务领域的专业知识和业务流程嵌入模型,使其在处理政务任务时更加得心应手。在实际应用中,DeepSeek的这些技术优势得到了充分体现。例如,在智能问答系统中,它能够提供准确、详细的政策解读;在公文生成与审核任务中,它能够生成符合规范的公文,并进行严格的格式和内容检查。
主持人:开源策略在降低成本和推动创新等方面有哪些助力?
何永龙:作为国产模型代表,DeepSeek以坚定开源策略打破僵局,将模型权重、训练框架及数据管道全面开源,赋予用户充分自由度,大幅降低使用成本,使开发者与企业能以较低成本进行模型微调和应用开发。同时,DeepSeek的开源促进了人工智能行业对底层技术的理解、掌握和自主创新能力的培养,是构建安全可控、具有国际竞争力的国产AI的关键路径。这种开放的创新模式,也在加速人工智能大模型在各个行业领域的应用与落地。
陈旭:作为国内团队自主研发的模型,DeepSeek采用开源策略,公开模型与算法,缩小开源与闭源性能差距,构建繁荣AI生态圈,契合国家信创产业战略。同时,支持本地化部署,数据完全自主可控,符合信息安全与数据合规要求。这种模式大幅降低政务用户使用AI的成本与门槛——训练费用仅为ChatGPT的十分之一,推理算力需求为五分之一,且通过蒸馏技术解决数据稀缺问题,加速各行业应用落地。
主持人:如何利用开源特性低成本实现本地化适配?
何永龙:大模型输出内容的精准性至关重要。一方面,不仅需紧密贴合地方业务实际;另一方面,更要确保表述严谨规范、通俗易懂。这一特性要求必须以行业的专业语料对大模型进行深度强化训练,使其真正成为懂政策、熟流程、通业务的“行业专家”。为此,我们公司系统性梳理了招标采购领域的全场景知识图谱,覆盖公平竞争审查规则、智能辅助评标评审体系、政策法规解读等核心业务模块。通过构建结构化、本地化的知识网络,在响应需求前大模型可自动触发多维检索机制:先基于行业知识库进行内容匹配与逻辑校验,再结合地方特色数据完成本地化校准,最终输出兼具政策合规性、业务适配性与表达准确性的专业结果。
陈尧:政务系统的场景差异性要求大模型具备灵活适配能力。DeepSeek的开源特性免除模型采购费用,使资金可重点投入本地化适配。例如,在公文写作场景中,不同地区对公文格式、政策引用的要求存在差异,DeepSeek支持快速微调,结合本地知识库优化输出。
宋军:DeepSeek通过垂直领域预训练与敏捷微调能力,为政务高频场景提供专业化、可定制的AI模型支持。特别是DeepSeek针对政务高频需求(如政策解读、表格填写、公文生成)预训练专业模型,并支持快速微调。这种“开箱即用”的特性,使其成为政务智能化的“即插即用”型工具。也为政务服务开辟了新的服务空间,为公众提供更优质的服务。
主持人:在政务场景中,如何实现数据安全与自主可控双重保障?
陈旭:DeepSeek支持完全部署于本地服务器与政务内网,不依赖外部云服务,满足敏感业务“网络隔离”需求。例如,辽宁省鞍山市已在政务云信创环境下完成DeepSeek模型本地部署。不少央企和政务部门甚至实现了DeepSeek从底层国产芯片到模型框架的全栈适配,达成软硬件自主可控。这种部署模式使政务部门可在离线或内网条件下使用模型,避免数据上传云端的泄漏风险,同时不受网络波动影响,在应急指挥等场景中实现99.99%的可用性。
ChatGPT依赖云端服务,数据需传输至第三方,政务机构无法掌控流向,且持续API付费成本高昂。DeepSeek在政务场景中实现了数据与外网隔离。诸如“原始数据不出域、数据可用不可见”等安全原则在实际部署中得到贯彻。DeepSeek还便于结合现有政务系统实行权限管控和日志审计——机构可限定仅授权用户访问模型,并记录问答内容以供监管审查。与此同时,各地普遍将本地业务数据接入DeepSeek构建政务知识库,即将本机关的文件材料等加工后“投喂”给模型,以提供领域定制知识。这种私有化+本地知识库方式在最大程度上保证了安全性,也提升了模型回答的针对性和运行效率。
陈尧:私有化部署支持模型训练、微调及交互全流程在内网完成,结合权限管控与日志审计系统,实现“数据不出域”与“操作可追溯”。例如,某政务部门通过限定仅授权用户访问模型,并记录问答内容,确保敏感信息流转可控。
宋军:DeepSeek的数据安全防护系统是依据国家网信办联合国家发展改革委等七部门联合公布的《生成式人工智能服务管理暂行办法》的要求而构造的。该系统有三重防护:一是物理隔离。原始数据全程在内网处理存储,不与外网交互;二是权限管控。结合政务系统现有权限体系,实现用户访问分级管理;三是知识本地化:对接本地政务知识库,定向“投喂”政策文件与业务数据,提升回答精准度的同时避免敏感信息外溢。这种“数据可用不可见”模式,更具有中国特色,既符合监管要求,又能通过内容过滤规则定制,满足不同政务场景的合规需求。
本报拥有此文版权,若需转载或复制,请注明来源于中国政府采购报,标注作者,并保持文章的完整性。否则,将追究法律责任。