日前,在福建省福州市鼓楼区安泰街道南门兜地铁站里举行的2025年就业援助月专项活动中,工作人员利用AI技术和大数据分析等先进技术,为求职者提供智能化的岗位匹配和职业规划建议。
谢贵明摄(人民视觉)
" style="">
日前,在福建省福州市鼓楼区安泰街道南门兜地铁站里举行的2025年就业援助月专项活动中,工作人员利用AI技术和大数据分析等先进技术,为求职者提供智能化的岗位匹配和职业规划建议。
谢贵明摄(人民视觉)
一位江苏市民正在使用大模型辅助完成日常工作。
王坤垚摄
" style="">
一位江苏市民正在使用大模型辅助完成日常工作。
王坤垚摄
国家互联网信息办公室2025年1月8日发布的信息显示,截至2024年12月31日,共302款生成式人工智能服务在国家网信办完成备案,其中2024年新增238款备案。
从名单看,细分领域的大模型大量涌现,如科大讯飞的“讯飞星火教育大模型”、平安健康的“聊个天大模型”等。与此同时,随着DeepSeek-V3等大模型产品凭借更低成本、更强性能引发海内外市场关注,越来越多国产生成式人工智能大模型加入了“提质+降价”的队伍。
国产大模型应用情况如何?正处于什么样的发展阶段?带着这些问题,记者进行了采访。
功能更强
工作生活“好搭子”
备案数量的增多,从一个侧面反映出国产大模型在工作和生活中出现的频率增高了。
国产大模型具体发挥着怎样的作用?“把自己从繁琐、细碎的基础工作中解放出来”是很多用户谈到应用体会时的第一感受。
安徽姑娘强宇铭目前主修法律专业。在她看来,和人际沟通类似,如果能够给大模型提供明确且精准的提示词,使用者就能获得事半功倍的效果。“国产大模型是我学习的‘好搭子’。国内人工智能企业月之暗面开发的Kimi大模型帮我搜最新的司法立法动态,文心一言能帮我草拟或润色文章。我还会使用通义法睿等专门针对法律行业的大模型服务,来回答法律问题、辅助案情分析,并生成各类法律文书。”强宇铭举例说。
除了搜索和生成之外,大模型提供的服务也越来越专业、越来越精细。
“有一次,我临时需要将一份专业报告中的多种图片调整成统一大小。这需通过Word文档中的VBA功能实现,不仅需要编写代码,而且较为复杂。要是在以前,我只能自己上网搜寻教程并从基础学起。现在,豆包大模型提供的解决方案非常实用,同时提供了具体的代码示例。”在上海从事房地产开发工作的薛天朗说。
据百度智能云AI与大模型平台业务副总经理李景秋介绍,扩展大模型应用场景需要满足不同维度的要求:一是基座模型质量,要有一个可被指令增强的基础模型;二是准备相关场景化数据,关注数据与实际场景的一致性和配适性;三是在训练过程中找到最优的调试参数。
李景秋说,依托大模型强大的能力,百度智能云千帆平台开始与更多行业和企业进行合作。比如,在教育领域,借助大模型,“考试宝”为其会员提供试题解析服务的能力显著提升。在招聘领域,猎聘利用大模型快速从简历中抽取信息进行语义分析,人才供需匹配效果更好。“目前,互联网行业之外,金融、教育、文娱、能源等行业都能看到大模型的身影。”她说。
中国信通院政策与经济研究所主任工程师程莹认为,国产大模型技术在语言、视觉、多模态等领域持续突破,在文本、音频、视觉、3D等数据方面实现多模态统一,持续突破人工智能感知、理解和推理世界的能力边界。这些,拓展着大模型与各行各业融合的深度和广度。“如今,芯片制造商、数据供应商、模型研发企业、应用开发商等方面协同合作正日益增强,共同创造全新应用场景和市场空间。”
成本更低
应用普及“降门槛”
本领增长的同时,国产大模型的使用成本也不断降低。
不久前,杭州深度求索人工智能基础技术研究有限公司推出的DeepSeek-V3上线并同步开源,快速吸引了全球同行的目光。在多项基准测试中,DeepSeek-V3的成绩超越了不少开源模型,并在性能上和世界顶尖的闭源模型不分伯仲。OpenAI创始成员安德烈·卡帕斯称赞道:“DeepSeek—V3使得在有限算力预算上进行模型预训练这件事变得容易。”
算力门槛降低、训练成本减少、性能持续提高……这些变化,在很多国产大模型上都有体现。
2024年12月底,阿里云计算有限公司宣布对大模型产品进行新一轮降价,其中Qwen-VL-Plus输入价格每千tokens(源代码中可以被编译器识别的最小单位)从0.008元降至0.0015元,降幅达81.3%。按照最新价格,1块钱可以处理约600张720P图片或1700张480P图片。此前,字节、百度、智谱AI等国内大模型领军企业也纷纷调降了相关产品和服务的价格。
国产大模型降价底气何在?商业上是否可持续?
记者了解到,在降成本方面,国产大模型供应商们正在不断取得新进展。
有的进行峰谷调节,优化配置资源。“豆包大模型通过技术创新来降低成本,定价上有合理的毛利空间,既能保障企业和开发者用得起,又确保自身商业可持续。”火山引擎相关负责人说,业务团队从算法设计阶段就考虑到超大规模的推理需求,在KV cache机制等方面进行创新,使模型能够用更低成本完成复杂的推理任务。在工程方面,利用规模化优势,根据科研、办公、休闲娱乐等不同场景的不同负载进行波峰波谷混合调度,实现整体成本的降低。
有的主打差异供给,力求事半功倍。比如,千帆大模型平台根据用户不同需要进行针对性供给,从而降低其使用成本。“我们提供多种类型的大模型服务,支持企业调用旗舰级模型解决复杂问题,使用轻量级模型解决简单问题,从而大幅降低使用成本。”百度智能云千帆产品相关负责人说,千帆积极提供工具链支持企业对轻量级模型进行训练调试,同时通过提供数据飞轮、模型蒸馏等模型精调技术和训练方法进行效果提升,帮助企业用户以更低成本、更高效率完成专有模型的全链路开发。
在中国信通院人工智能研究所软硬件与生态部主任李论看来,国产大模型降价有多方面因素。从供给侧看,算法、芯片等软硬件进步带来的技术红利,让大模型训练及推理成本逐渐降低。从需求侧看,降低价格可以鼓励更多用户和企业使用大模型,从而丰富应用场景、创造全新价值、实现规模效应。“随着预训练阶段逐步完成,全球及国内大模型厂商将转向大力推进大模型的后训练及推理侧工程技术优化。未来,高性价比的大模型服务有望增加。”李论说。
前景更好
“边干边学”是趋势
多位业内人士表示,理想情况下,大模型产品应实现价格、私密安全性和大模型能力效果的平衡。现实中,国产大模型还面临缺乏高质量数据、特定场景表现不佳、服务不稳定等挑战,需要在性能优化中扩大应用,在应用扩大中提升性能。“我们要用好大模型的基本能力、创意能力、多模态能力、业务能力、创新能力和科学能力,并将其与我国产业创新应用场景充分结合,最终赋能百行千业。”360集团创始人周鸿祎说。
数据的数量决定大模型的广度,数据的质量决定大模型的精度。在实践中,不少企业正通过让大模型“边干边学”实现良性循环。
腾讯云智能AI产品专家赵新宇介绍,大模型在不同行业落地的同时,也在推动其自身的成长。比如,“少年得到”的K12语文作文批改功能,就应用了腾讯混元大模型的多模态能力。这款产品通过腾讯云智能的OCR技术识别学生作文内容,并根据设置好的评分标准,由大模型为作文打分。“通常,大模型和学校教师判分,偏差需要控制在5分甚至更低。”赵新宇说,客户群体的扩大不仅对大模型提出了新要求,也有助于加快大模型开发迭代速度,提高大模型的实用性和适应性。
中国移动基于10086客服领域多年沉淀的客服业务特色数据资源,通过对用户意图识别、语言理解、逻辑推理、知识检索等任务的针对性、系统化训练,让“九天”客服大模型不断焕发新生机。“5G网络支撑起海量数据和大规模连接需求,让全社会的信息流动更加顺畅、更加高效,人与人、人与物、物与物的连接更加紧密,经济社会发展的网络底座更加健壮。”中国移动董事长杨杰说,中国移动推广“九天”多模态通用大模型服务,积极推进更大参数体量、更强推理能力的模型训练。
专家预计,“边干边学、边学边用”的良性循环将会让国产大模型加速走进日常生活。
“未来,大模型有望全方位融入普通人的生活。它可以作为生活助手,即时解答各类知识疑问;可作为娱乐伙伴,帮助人们创作小说、绘画、音乐等;可以作为健康管家,预警健康风险,辅助医疗咨询。”程莹说。
还没有评论,来说两句吧...