仅用7天便突破1亿用户,刷新ChatGPT、TikTok等国际产品的增长纪录。这场由技术突破引发的行业地震,正在重构全球AI竞争版图。
在刘永旗的观点里,DeepSeek的“破圈”效应已引发全球产业链重构,这已成为不争的事实。
刘永旗认为,DeepSeek的影响力超过2022年ChatGPT的面世。一方面,云服务争夺战已经打响。微软Azure、亚马逊Bedrock等国际云巨头争相接入DeepSeek模型,华为云、阿里云则推出“千卡集群+DeepSeek适配”的国产化方案;另一方面,硬件生态绑定正在建构。英伟达NIM平台将其列为推荐推理框架,AMDMI300XGPU针对其优化性能,英特尔更实现酷睿处理器离线运行,这意味着未来AIPC可能标配“中国芯+中国脑”。
聚焦到金融业场景,DeepSeek应用呈现爆发趋势。刘永旗表示,已有至少37家国内券商部署DeepSeek-R1本地化方案。已某券商投研部透露,其行业报告生成效率从8小时缩短至20分钟,并实现宏观数据与产业链图谱的自动关联。
从成本与推理能力上,刘永旗分析称,DeepSeek-R1在模型训练与模型算法等方面实现了创新,并显著降低了成本。尤其在推理能力上,DeepSeek-R1表现突出,对于券商应用提供了重要价值。
从应用效果方面,刘永旗称,通过创新的模型架构和工程优化,DeepSeek大幅降低了训练和推理成本,DeepSeek-R1的整体训练成本比OpenAI少了一个数量级以上。在模型性能方面,DeepSeek-V3作为MoE模型,在多项测评中超越主流开源模型,性能媲美顶尖闭源模型。DeepSeek-R1在后训练阶段大规模使用强化学习技术,极大提升了模型推理能力,在数学、代码、自然语言推理等任务上比肩OpenAI o1正式版。其蒸馏出的6个小模型在多项能力上实现了对标OpenAI o1-mini的效果,拓展了多场景应用潜力。
看点二:证券业算力、模型、数据和场景全面革新
目前,证券行业已在投资顾问、投资银行、投资研究、客户服务、风险控制以及信息技术等多个领域实现了大模型的具体应用。刘永旗告诉记者,大模型的企业级应用主要涉及算力、模型、数据和场景这四个方面,而DeepSeek在这四个方面对证券行业产生了显著影响。
首先是算力方面。国内大模型参数规模从最初的100多亿逐渐扩展700多亿,此前主流模型仍在千亿以下。然而,DeepSeek-R1的全尺寸参数规模已达到6000多亿。随着模型效果提升与尺寸增大,算力需求迅猛增长。叠加证券行业对于安全以及合规的高要求,证券公司不得不在本地化部署的限制下支持激增的应用需求,赋能业务发展。
再者是模型方面。刘永旗谈到,目前国内主流大模型要么部分开源,要么不开源,而DeepSeek不仅效果出色,而且全部开源。这一特点将刺激更多的商业模型开源,为企业级应用带来更多选择,使得企业能够根据不同的业务场景适配更多的模型,从而更好地满足多样化的业务需求。
还有数据方面。目前业界成熟的方案是通过将数据转化为知识库,再利用RAG(检索增强生成)的方式赋能业务场景。DeepSeek在此基础上以其强大的数据分析能力和推理归因能力,为证券行业提供了更为便捷和高效的应用途径,有助于企业更好地挖掘数据价值,提升业务决策的准确性和效率。
第四是场景方面。通用大模型通常需要精心设计的提示词来引导其思考和输出,以达到可上线的业务效果。而DeepSeek-R1在推理过程中,会先根据输入的内容进行思考,然后再生成回答。在实际落地过程中,仅需要简单的提示词就能达到很好的效果,大大降低了企业级应用的门槛,加速了业务创新。此外,DeepSeek-R1在复杂推理方面相较于通用模型具有明显优势,能够结合结构化和非结构化数据,在投顾、投研、投资等业务中探索更复杂的场景,突破了简单知识库问答的限制,进一步拓展了业务场景的广度和深度。
这些影响已经具化到了银河证券的探索中,尤其是公司所构建的覆盖投顾服务全链条的智能中枢。
一方面,基于大模型的深度推理分析能力、智能知识调用能力与自我修正机制,结合银河证券自身沉淀的专业数据库、业务数据库与研究资源库,实现客户数据深度挖掘与精准画像,推动投顾服务与产品的精准推送,协助投资顾问快速生成多形式的客户综合金融解决方案,满足投资者“千人千面”的财富管理需求,给予客户更高效、更定制化的投资体验。
另一方面,深度融合自研投顾平台G-Winstar(问TA),基于大模型的复杂任务处理能力与推理能力,将DeepSeek等大模型能力应用于投顾展业的全链条。依据中国银河证券多年来的投顾展业经验,在服务的事前、事中、事后分阶段场景中逐步嵌入专家经验,实现多场景深度对接,确保大模型“答得有用、答得更好”。真正帮助一线投顾灵活地应对多样化展业场景需求。此功能上线,将大幅提升投资顾问专业服务质效。
还没有评论,来说两句吧...