拆解国产大模型混战：密集发布原因何在？算力受限怎么解决？看点-财经视野网

当前位置: 首页 >> 咨询

拆解国产大模型混战：密集发布原因何在？算力受限怎么解决？看点

发布时间：2023-04-13 17:54:29 来源：南方都市报·湾财社

ChatGPT这把火，在国内越烧越旺。

继阿里云“通义千问”在4月11日官宣之后，算上商汤早一天推出的大模型“商量”，百度3月份的“文心一言”，国内已正式上线了三家大语言模型。

(资料图)

而坊间相关消息仍如雨后春笋，甚至有不少模型已是有名有姓，粗略数来多达六七家。

短短三个月内，国内头部厂商扎堆挤上赛道，密集上线大语言模型，这到底是各家的技术创新集中爆发，抑或只是出于市场竞争压力？在国内GPU仍整体受限的情况下，缺乏算力支持的大语言模型领域为何看似一片繁荣？这波ChatGPT国产浪潮如何直面海外竞争，又将去往何方？

大模型已上线三家，超五家背后排队

我们先来梳理一下国内大语言模型赛道的现状。

国内关于大语言模型的最早一批消息在今年年后。2月9日，科大讯飞向媒体透露，其AI学习机、讯飞听见等将成为公司类ChatGPT技术率先落地的产品，具体将于5月6日发布。

3月中旬，百度率先推出了“文心一言”，正式开启国内科技企业的较量。

不久后，在3月29日的2023数字安全与发展高峰论坛上，360创始人周鸿祎以彩蛋形式披露自家GPT类模型Demo，现场用360浏览器演示了智能搜索场景，还对其中的部分回答内容“点踩”，表示并不满意。同时，周鸿祎戏称此次演示只是把“孩子抱上给大家看看”，并不是要发布中国版ChatGPT。

3月31日，有消息称网易有道的教育场景下类ChatGPT模型“子曰”将于近期推出，基于“子曰”大模型研发的AI口语老师和中文作文批改DEMO已完成，将在近期开放内测。

4月8日，京东集团副总裁何晓冬在人工智能大模型技术高峰论坛上也透露，京东将在今年发布新一代大模型“ChatJD”，定位为产业版本ChatGPT。

4月10日，旗下拥有浏览器Opera、社交娱乐平台StarX等产品的互联网平台出海企业昆仑万维官方宣布，其与奇点智源合作自研的国产大语言模型——「天工」3.5即将发布，并于4月17日启动邀请测试。

而在近日，华为云官网下的“盘古”系列的NLP(自然语言处理)大模型、CV(机器视觉)大模型、科学计算大模型被标注为即将上线状态，外界猜测这意味着华为即将加入大模型竞赛。

甚至短视频与信息分发领域的王者，字节跳动也被曝年初就已开始组建专门的大模型团队。其中大语言模型方向由字节搜索部门牵头。还有消息称，原阿里达摩院科学家，超大规模多模态预训练模型M6的技术负责人杨红霞已加入该团队。

国产大模型多为ToB，且“每家必备”

纵览上述信息，这波国产大语言模型浪潮的第一个显著特点自然浮出水面——

当前，国产大语言模型均未对公众大面积开放，也没有明确的ToC(面向公众)入口，未来发展大多也走ToB(面向企业)路线。

当前已正式上线的三家中，百度、商汤有关负责人曾向南都记者表示，自家大模型为toB产品。阿里方面在4月11日举办的阿里云峰会上也宣称，未来“通义千问”将主要面对企业定制个性化服务。

而在已有消息的几家中，科大讯飞、网易有道两家皆已透露了基于公司类GPT技术所要落地的产品；京东的“ChatJD”明确定位为产业版本ChatGPT；华为虽未透露更多大模型信息，但其模型所属的“盘古”系列早在2021年就已上线。

而根据华为云人工智能领域首席科学家田奇在2023年人工智能大模型技术高峰论坛上的演讲，“盘古”系列下的NLP大模型主要面向智能文档搜索、智能ERP(企业资源计划系统)、小语种大模型等行业，多处理类案检索、企业财务异常检测等商业场景。

因此，整体看来，国内大语言模型赛道的公司在开发模型后，更倾向于将相关模型嫁接到自家的C端服务中，或者走私有化部署、企业定制等路线。

2023年人工智能大模型技术高峰论坛田奇演讲

而在与海外相同赛道的公司对比之后，不难得出第二个特点——相比海外，国内厂商更倾向于“每家必备”一个大模型。

当前，海外头部科技公司如OpenAI、谷歌等，其开发都以基础模型(Foundation Models)为主，不管是ChatGPT、Gpt4，还是PaLM-E，都是类似AI基础设施的基础大模型。其他公司，要么索性走开源社区的路线，要么像美国云服务巨头Salesforce一样，直接与OpenAI合作接入ChatGPT使用。在某种程度上，可以说是“大家都在规定范围里各自赚钱”。

国内的互联网生态则不同。中科深智创始人兼CEO成维忠向南都记者表示，国内但凡涉及数据等核心能力，哪怕一个公司再小，也一定会为自己建设一套完整系统或是框架，这可能是出于“互相抢夺市场以固定地盘”的需要。因此，国内基于大数据等核心能力的服务本身是割裂的，其规模效应也远远赶不上美国同类企业。

“比如刚才说的Salesforce已经是ToB领域中的世界级公司了，但如果中国有Salesforce的话，它一定会自己做个大模型。”成维忠说。

基于这种“每家必备”的特点，成维忠认为，当前国产ChatGPT的浪潮更可能是一种“市场行为”，也就是说，国内企业更倾向自己独立做一个大模型，并不考虑用其他方服务。而如此密集的上线行为，或是出于资本市场的压力。

“从公司战略角度来说，不太可能急赶急地推出大模型，而且很多公司推出的大模型里无所不包，我觉得这在短期其实是做不到的——很大程度上应该还是在回应客户的市场压力，同时很多上市公司也面临着资本市场的压力……当然，ToB或者说私有化部署、定制这条路线对技术的要求也会低一些。”成维忠表示。

国产ChatGPT如何应对海外竞争？

无论是客户需求还是资本压力，AIGC(AI生成式内容)、大语言模型显然已成为一块价值飙升的市场，那么，紧锣密鼓上线的国产ChatGPT们，是否将直接面对来自全球的激烈竞争？

在成维忠看来，竞争毫无疑问已经开始，且无法避免。因为这是一个类似芯片的市场，对于最终应用的能力影响极大。尤其是在ToB端，基础大模型级别的ChatGPT、GPT4，偏向应用层的Midjourney、Stable Diffusion对于企业来说都已经是被市场验证过的，效果极佳的工具，那么在这种情况下，国内市场被主流大模型及应用侵蚀掉一部分就是必然的。

不过，技术产品要抢夺海外市场，绕不开数据安全、数据保密等问题。不久前，意大利就宣布封禁ChatGPT，德国、法国、爱尔兰、西班牙等国家也紧随其后，开始考虑对AI聊天机器人采取更严格的监管。

出于这方面原因，昆仑万维CEO方汉认为，海外的AI模型进国内市场首先需要合规，还会牵扯到很多隐私和数据安全问题，因此对于这一赛道，海内外企业其实很难直接发生竞争。

在谈到涉及大模型开发的另一重要影响因素——算力时，方汉坦言，当前国内确实还处在一个GPU整体受限的情况下，之所以当前大语言模型能呈现出一种比较繁荣的景象，是因为目前国内还有不少存量GPU，足以支撑目前这一波的大语言模型训练。

“当然，如果制裁长期持续，肯定会对后续的大模型训练造成影响，不过现在国产的训练芯片也在迅速发展，像华为、寒武纪、阿里等等都可以作为替代。而且，就算计算硬件不行，只要软件优化能跟得上，我觉得大模型领域仍然会持续进行高速发展。”

大语言模型，出路在何？

书到最后，两位资深从业者也向南都记者描述了大语言模型的未来。

方汉认为，大语言模型将深刻影响两个方面。

第一，非常基础的互联网应用“搜索”。事实上，“搜索”已经近20年没有出现过大的变革，其基本的流程也就是用户打开对话框，输入关键词获取结果，业界这些年也一直都在卷搜索速度、精准度等等。但现在，大语言模型彻底改变了“搜索”——以前是打开搜索引擎获取所需信息，现在可能就会打开大模型，或是集成了大模型的搜索引擎，不仅能获取所需信息，还能通过持续不断的对话不断精确答案。

第二，方汉认为，大模型改变的并非一个独立的应用市场，而会对现有的全部应用市场进行改造。对此，成维忠补充表示，在ChatGPT火了之后，其实很多人都忽略了OpenAI推广的Plugins.它整合一系列第三方工具，其中包括不少企业应用、图像处理等多方面的插件，能够帮助用户人员更轻松通过ChatGPT调用第三方工具软件。

“这就相当于打造一个超级入口，在未来，可能各式各样的App应用都能接入或者被接入ChatGPT，这就有可能永久地改变整个互联网的生态。”成维忠说。

再回看这次国产大模型浪潮，成维忠认为，即使在未来能赶上主流模型的差距，也不会像美国那样呈现出OpenAI一家赋能其他科技巨头的趋势，更可能变成若干个大厂一起服务中小型企业和传统企业——这就使得中国出现一个大模型的经济回报远小于海外。

那么，这次国产大模型浪潮还能持续多久？在成维忠看来，这就得看各家的“信仰”了。因为这不是一个单纯的技术问题，而是一个巨大的、持续的投资决策，到底哪些公司有决心一直投入下去，还很难判断。

（文章来源：南方都市报·湾财社）

标签：

上一篇：全球速讯：侧透玻璃机箱！微星海皇戟AS台式机上新：i7+RTX 4070

下一篇：最后一页

每日推荐

拆解国产大模型混战：密集发布原因何在？算力受限怎么解决？看点

ChatGPT这把火，在国内越烧越旺。继阿里云“通义千问”在4月11日官宣之后，算上商汤早一天推出的大模型...

2023-04-13
第133届广交会展览面积创历史新高启用D区展馆|全球新资讯

第133届广交会将于15日在广州广交会展馆开幕，全面恢复线下展。本届广交会启用D区展馆，使得展览面积由过去

2023-04-13
万年青：公司下属子公司万年青电子公司目前未开展相关生产经营业务

每经AI快讯，有投资者在投资者互动平台提问：请问公司旗下的万年青电子有限公司是一家半导体产业公司么？他

2023-04-13
全球速讯：侧透玻璃机箱！微星海皇戟AS台式机上新：i7+RTX 4070

快科技4月13日消息，微星推出新款海皇戟AS台式机，显卡用上了最新发布的RTX4070。外观设计上，新款主机采用

2023-04-13
全球快看点丨索尼IMX858传感器横空出世：小米13 Ultra要用

快科技4月13日消息，索尼官网正式揭晓了新一代传感器IMX858，这枚Sensor将由小米13Ultra首发，这次小米

2023-04-13
ST龙净付华泰股权转让款抢跑上交所2问上市公司利益-最新快讯

中国经济网北京4月13日讯上海证券交易所网站近日发布关于福建龙净环保股份有限公司应收华泰保险股权转让款

2023-04-13
环球观察：中国高铁五纵五横（五纵五横）

1、五纵五横”综合交通运输网络。2、指的是指黑河至三亚、北京至上海、满洲里至港澳台、包头至广州、临...

2023-04-13
五彩传说蔚蓝的故乡（五彩传说）今日热闻

1、五彩为羽善为心，2、时晴时雨传妙音。3、唤福降瑞世人亲，4、爱贤惜才现山林。以上就是【五彩传说蔚蓝的

2023-04-13
新动态：m5混合砂浆配合比是多少_m5混合砂浆配合比

1、M5的混合砂浆配合比如下：质量比水泥：砂：水：石灰1 00:4 24:0 83:0 3每立方重量（k

2023-04-13
如何安装 Halo Eyeball 嵌入式照明_送给高中生最好的礼物女生-环球滚动

Halo生产一系列使用眼球装饰的嵌入式照明解决方案。这种装饰有一个旋转装置，可以调整以将光线照射到房间的

2023-04-13
如何密封砖砌壁炉_送给高中生最好的礼物是什么_天天热门

你需要的东西毛巾桶1茶匙。液体洗洁精硬毛刷抹布泵式喷雾器封水机用防水密封剂密封砖砌壁炉。砖砌的壁炉为

2023-04-13
让科创企业金融服务插上“投商行一体化”的翅膀 ---招商银行北京分行“行业路演厅”系列活动纪实

让科创企业金融服务插上“投商行一体化”的翅膀---招商银行北京分行“行业路演厅”系列活动纪实

2023-04-13
私家车一般买哪几种保险？私家车保险怎么买划算？

私家车一般买哪几种保险？私家车必须购买交强险，可以根据需求选择商业车险，如车损险、第三者责任险、...

2023-04-13
牡丹卡是信用卡吗？牡丹国际信用卡有什么特点？

牡丹卡是信用卡吗？中国工商银行发行的银行卡都统一命名为牡丹卡。这也就代表牡丹卡里有信用卡，但不是...

2023-04-13
黄金与黄金基金的涨跌有关系吗？长期来看投资黄金和基金哪个收益大？

黄金与黄金基金的涨跌有关系吗？一般来说，黄金基金与黄金价格呈正相关。当金价上涨时，黄金基金通常会...

2023-04-13
海关总署：一季度中国出口船舶1033艘，同比增46.3%

海关总署2023年4月13日数据显示，2023年3月中国出口船舶436艘，同比增加19%；1-3月累计出口1033艘，累计同

2023-04-13
现货黄金向上触及2020美元/盎司，日内涨0.29%。焦点精选

现货黄金向上触及2020美元盎司，日内涨0 29%

2023-04-13
纸黄金和现货黄金走势一样吗？纸黄金和现货黄金的区别有什么？

纸黄金和现货黄金走势一样吗？纸黄金与现货黄金（伦敦金）价挂钩，采取24小时不间断交易模式，其走势基...

2023-04-13
财政金融动员需要做哪些准备？财政金融动员怎么实施？

财政金融动员需要做哪些准备？现代战争是立体战争，财力消耗大。为了适应未来战争的需要，保障战争经费...

2023-04-13
金融动员是什么意思？财政金融动员的主要措施包括什么？

金融动员是什么意思？金融动员主要是指一个国家为稳定战时经济金融水平而采取的筹集资金的行为。一般来...

2023-04-13
补办建设银行卡需要什么？建行卡可以异地挂失补办吗？

补办建设银行卡需要什么？补办建行银行卡需带身份证到开户银行办理。如果银行卡丢失，补办前需要挂失。...

2023-04-13
国债逆回购是债券吗？国债逆回购有限制金额吗？

国债逆回购是债券吗？国债逆回购不是债券。虽然国债确实是债券之一，但准确地说，国债逆回购是一种抵押...

2023-04-13
教育储蓄的存钱模式是什么？教育储蓄的好处有哪些？

教育储蓄的存钱模式是什么？教育储蓄,是银行针对教育而推出的储蓄产品,具有教育金、教育储备、储蓄增值...

2023-04-13
什么是教育储蓄利率？教育储蓄存款利率是多少？

什么是教育储蓄利率？教育储蓄是指个人按国家有关规定在指定银行开户、存入规定数额资金、用于教育目的...

2023-04-13
不开会员就看广告，这“规矩”得改

第三，将“体验式消费”转化为消费者的“两难选择”，对于广告发布者而言，可以说是一种“短期行为”，...

2023-04-13