出品 | 搜狐科技
作者 | 梁昌均
(资料图片)
编辑 | 杨锦
在高调呼吁暂停开发高级别人工智能后,近日,马斯克被爆出斥资数千万美元购买上万张GPU训练算力,并成立对标OpenAI的X.AI公司以开发大模型。
ChatGPT引爆的AI大模型,正在成为全球科技巨头竞相追逐的新战场。
国外有微软、谷歌、亚马逊,国内更是遍地开花。“大模型发布月”名不虚传,刚刚过去的一周基本以“天”为计不断更新。继百度之后,华为、阿里、腾讯、360、商汤、知乎、毫末智行、昆仑万维等纷纷公布大模型进展,可能成为中国AI发展史上最“内卷”的一周。
同时,创业市场依然不断有大佬进入,搜狗创始人王小川,美团联合创始人王慧文和元老级高管陈亮纷纷投身AI大模型。王小川和百度李彦宏阵营围绕技术差距等问题打起口水战,为AI大模型添了一把火。
国内诸神混战,热闹非凡,热度甚至完全超过美国。但狂飙之下,形形色色的入局者也需想清楚这背后的挑战——除数据、算力和算法外,更关键的是如何跑通技术和商业的闭环。
大模型混战,大佬隔空互怼
刚刚过去的四月第二周,国内AI大模型浪潮迎来巅峰。先是华为公布了盘古大模型的进展,360宣布将基于360GPT大模型开发的360智脑落地搜索场景。
随后商汤公布日日新大模型,开启内测的阿里通义千问正式亮相,毫末智行发布全球首个自动驾驶大模型DriveGPT雪湖·海若,再到腾讯推出性能提升3倍的新一代高性能计算集群,知乎推出中文大模型知海图AI,让人目不暇接。
AI创业圈也不断有大佬进入,美团前高级副总裁、最高决策机构S-team成员陈亮近日已入局大模型创业,这是继王慧文之后第二位投身大模型创业的美团元老。
此前被寄予厚望的王小川也正式官宣,和前搜狗COO茹立云联合创立百川智能,并放话年底做出中国最好的大模型,还因和李彦宏阵营的隔空互怼引发圈内关注。
接下来,预计还会有更多的大模型发布。京东称将在今年发布千亿级参数的言犀大模型,昆仑万维的天工3.5在今日开启内测,科大讯飞将在5月发布大模型产品。
字节跳动、网易等国内有头有脸的公司都在研发大模型。雷军也表示,对大模型会全力以赴,坚决拥抱,并称正在研发一些有趣的技术和产品。
据民生证券不完全统计,目前国内已发布超过30个大模型。此前宣布大模型创业的出门问问创始人、CEO李志飞则预计,中国未来1-2年会看到50家以上公司做大模型。
国内目前布局AI大模型的企业和机构 资料来源:民生证券
这场混战也引发了很多争论,王小川就不认同李彦宏称文心一言与OpenAI仅相差两个月的言论。关于国内与OpenAI的差距,目前并没有统一的对比标准。最“自信”的李彦宏认为仅差两个月,周鸿祎、王小川等认为相差2到3年,也有“中间派”认为差距是1到2年。
此外,关于巨头和创业公司在大模型时代的机会,各方立场也不同。不少观点认为,大模型是烧钱窟窿,只有巨头能玩得起,创业公司机会不大。李彦宏就表示,中国创业公司基本不会出现下一个OpenAI,重新做一个ChatGPT没有多大意义,也没有必要重复去造轮子。
李志飞曾在国内率先声称要做“中国的OpenAI”,但经过一个月后逐渐变得冷静,认为国内大概率不会出现OpenAI,而通用大模型不一定适合所有人,包括大佬们。
今年以来入局AI大模型创业的大佬
但也有很多观点认为,创业公司在技术和商业层面也有很大机会。王小川认为,大厂更注重业务目标,自身惯性使其很难做0到1的创新,创业公司更适合去做通用人工智能,这与李彦宏的立场截然不同。
如此种种,孰是孰非,难有定论。而类似的争议也将延续,如近日因马斯克等人呼吁暂停研发更高级别人工智能引发的AI监管问题,全球也并没有形成一致的共识。
不得不的警惕是,在人潮汹涌之际,需要防止大模型出现类似元宇宙的短命现象。当年元宇宙的火爆程度并不比大模型弱,但最终潮水褪去,微软、Meta等大厂灰头灰脸进行收缩,元宇宙终究是触不到的海市蜃楼。
从目前来看,国内在大模型上还是有些浮躁,不少企业在技术或产品没有打磨好之前便匆忙推向市场,借助概念蹭热点的公司更是不在少数。国内要想赶超OpenAI,做好大模型,可能还需要的是冷静,以及长期深耕的准备。
从大炼模型到炼大模型
国内开启对大模型的研发,时间并不算太晚。就在OpenAI推出GPT-2并接受微软10亿美元投资的一个月后,即2019年3月,百度就发布了上亿规模参数的ERNIE1.0(文心大模型),这是中国第一个正式开放的预训练大模型。
目前,百度的文心大模型已迭代到ERNIE3.0版本,参数规模超越GPT-3达到2600亿,是全球首个知识增强的千亿AI大模型,文心一言、文心一格等即是基于ERNIE3.0打造。
但百度抢下国内首发并未带来大模型的升温,而是直到两年后才受到更多关注。2021年3月,科研机构智源研究院推出悟道1.0大模型,三个月后迭代至悟道2.0,参数规模高达1.75万亿,是GPT-3的10倍,刷新之前谷歌创下的1.6万亿参数纪录,是彼时中国首个和全球最大的万亿级模型。
国产大模型逐渐成为巨头的游戏,人工智能从大炼模型迈向炼大模型时代。华为在2021年推出盘古大模型,腾讯和阿里也先后推出混元大模型和通义大模型,其中阿里的多模态大模型M6的参数在不到两年内从3亿暴增到10万亿,目前仍是全球最大预训练模型。
从百度、华为、阿里、腾讯等巨头的布局来看,其更注重打造通用的基础大模型,因此规模也往往更大。不过,巨头的玩法并不适合所有公司。
一般来说,模型越大,对算力要求越高,成本也就越高。据浙江大学人工智能研究所所长吴飞介绍,ChatGPT的训练门槛是1万张英伟达V100芯片,约人民币10亿元,模型训练算力开销是每秒运算一千万亿次,需运行3640天。
而从创业公司来看,李志飞认为5000万美元是基本门槛,王慧文和王小川首轮融资都是这个规模。因此,并不是所有的企业都有能力,或者说有必要去做通用模型,专注于垂直领域依然有很大的机会。
目前,也有不少公司专注打造面向具体行业和场景的垂直大模型,如毫末智行面向自动驾驶领域的DriveGPT雪湖·海若,创新奇智推出的工业大模型产品奇智孔明,云从科技也计划募资超36亿元研发行业大模型。
达观数据董事长兼CEO陈运文认为,与通用大模型相比,垂直大模型参数少,训练成本和使用成本将更具有竞争力。目前,该公司也正在研发名为“曹植”的垂直领域模型。
值得注意的是,巨头在打造通用模型外,也面向不同技术领域进行布局。百度以文心大模型为底座,面向自然语言理解、计算机视觉、多模态、生物计算等领域都推出大模型,华为、腾讯和阿里也是类似。百度则更快人一步,目前已在能源、金融、制造、教育等领域推出36个行业大模型。
百度副总裁吴甜曾对搜狐科技解释称,通用模型对行业特有的数据和知识的把握能力依然有不足之处,因此有必要打造行业大模型。她认为,这是通用模型未来能够广泛应用最有效的方式。如今这也得到更多认可,华为也不断推出面向具体行业的大模型,阿里也将在今天发布行业大模型。
对于大模型的发展,过去都在追求规模,短短两三年参数就从亿级别达到10万亿级别。但越来越多的观点认为,大模型并不是越大越好,或者说在参数继续增加的同时要更加关注如何提升模型的能力。
OpenAI首席执行官山姆·奥特曼近日就提到,OpenAI正接近语言大模型规模的极限,规模不再是衡量模型质量的重要指标,而规模越大并不一定意味着模型越好,未来需要有更多方式来提升模型的能力和效用。
他认为,未来模型参数应该向更小的方向发展,或者以多个小模型协作的方式工作。实际上,大小模型协同也越发成为国内产业界共识,达摩院曾就将此视为未来趋势之一。吴甜也表示,大模型在产业应用上非常重要,但不是唯一方向,大小模型并非互斥,而是相互协同。
C端哑声,普遍押注B端应用
选择做大模型仅仅是第一步,更为关键的是如何打通技术和商业的闭环。正如李志飞所说,做出通用人工智能又能怎么样,更重要的还需要make AGI accessible。
过去人工智能的商业模式主要是针对特定任务、场景开发专用小模型,难以标准化,导致成本高企,这也是为何几乎所有AI公司难以盈利的根本所在。通用模型则可以将下游碎片化任务和场景一网打尽,推动人工智能从作坊式完成工业级的标准化生产和商业应用。
目前,OpenAI的GPT模型在商业化方面走在前列。C端实现会员收费,上亿用户将为其提供一定的变现潜力;B端通过API和插件方式服务客户,同时还借助微软实现在搜索、办公等领域落地,并通过云对外提供更为泛化的能力,这也成为国内模仿的打法。
不过,国内基于大模型C端产品或面临更为严格的限制和监管。百度文心一言和阿里的通义千问仍在内测阶段,国内目前还没有一款C端产品如ChatGPT般向公众开放。
生成式人工智能在监管上也正在受到更多关注。近日我国发布了《生成式人工智能服务管理办法(征求意见稿)》,明确要求不得出现歧视,生成内容应当真实准确、防止生成虚假信息等,如果出现,除内容过滤外,还要通过模型优化等进行优化。作为生成式人工智能的固有缺陷,这在从技术上难以保证和彻底解决。
可以预见,在未来一段时间内,基于大模型的C端产品或难以突破,这也在很大程度上使得国内大厂普遍都在押注B端落地。
从头部大厂布局来看,其推出的大模型不仅是自身业务的支撑,如百度将文心一言落地在自家搜索、小度和智能驾驶等业务上,阿里所有业务也都将接入通义千问;更为重要的是,这些企业还将大模型的能力对外输出,助推行业数字化和智能化的进一步升级。
业界也已逐渐达成共识,比尔·盖茨、阿里CEO张勇等人都认为,所有行业或产品都会被AI大模型重塑,从而带来新一轮的升级。
目前,大厂都在计划通过云的方式对外输出大模型的能力,云计算成为AI大模型落地的最佳方式,模型即服务(MaaS)越发受到关注,而这也将带来大模型成本的降低。据阿里云透露,未来在云上训练一个模型的成本将有可能降低到现在的十分之一,甚至是百分之一。
这使得企业不需要再从“零”起步去训练出一个“好用”的大模型,而是可以直接调用大厂的通用大模型,再结合自身的行业知识积累和应用场景,就能以较低成本“一键”生成适合自己的专属大模型。
不过,关于C端和B端谁更有前景,目前并无定论。普遍的观点认为,B端将是大模型应用富矿。但在王小川看来,C端服务才是未来更大的机会。
以大模型为代表的AI 2.0狂潮时代,将是一场持久战。打口水战没有意义,只有打通技术和商业的闭环,最后才有可能在混战中取胜。
从头部大厂布局来看,其推出的大模型不仅是自身业务的支撑,如百度将文心一言落地在自家搜索、小度和智能驾
IT之家4月18日消息,彭博社马克・古尔曼(MarkGurman)在最新一期PowerOn时事通讯中表示,即将在6月召开的W
《死亡岛2》即将于4月21日正式发售,登陆PlayStation5,XboxSeries,PlayStation4,XboxOne和Epic平台,发行商
直播吧4月18日讯 今日76人主帅里弗斯在球队训练结束后接受了媒体采访。谈到篮网球星米卡尔-布里奇斯G1出色
今日76人主帅里弗斯在球队训练结束后接受了媒体采访。昨日,莫兰特与字母哥均在防守人想造进攻犯规的对抗中
一、四川省内江市天气预报1、威远县气象台2023年04月18日03时03分发布大风蓝色预警信号。2、小河镇、越溪镇
今天小编肥嘟来为大家解答以上的问题。五四精神的当代价值ppt,五四精神的当代价值相信很多小伙伴还不知道,
1、现在的机箱早已经没有PC喇叭了,也就是SPEAKER,所以主板上的SPEAKER跳针连不连接都不重要了。
1、知识产权资料库是我们免费为企业提供的最具价值的知识产权数据库。2、内容多为原创,部分内容收集于网上
1、曹园是黑龙江省牡丹江市张广才岭兴建的一片私人建筑群,距市区约10公里。2、建于2005年,已建成园门园、
1 生姜怎么吃:生姜,学名菊芋,又名生姜。它是一种富含淀粉的根类食品,富含菊粉、多糖等成分。食用对人体
1、通常电影的制作都会用杜比音效。2、应为杜比音效在制作电影音效上较有经验。3、而在电影中用DTS音效通常
今天小编肥嘟来为大家解答以上的问题。段祺瑞执政府,段祺瑞简介相信很多小伙伴还不知道,现在让我们一起来
今天小编肥嘟来为大家解答以上的问题。机车排量,机车排量cc什么意思相信很多小伙伴还不知道,现在让我们一
就4月15日有游客称在淄博烧烤店遭遇强制消费特定烤串一事,17日,涉事烧烤店——淄博八大局烧烤城老板回...
据珠海公安:4月12日上午,香洲反诈中心受邀参与香洲区实验学校举办的“全民国家安全教育日”主题活动,...
近日,气温节节攀升,每一天都感觉热浪滚滚。满街的短袖轻衫表明,珠海又提前入夏啦!据市气象局消息,珠海
4月17日,记者从铜仁市2023年“人才日”活动新闻发布会上获悉,4月下旬至5月下旬之间,该市将开展20项“...
1、春不种,秋无收。2、 枣芽发,种棉花。3、 立夏勿下雨,犁耙倒挂起。4、 五月端午晴,烂稻刮田
1、春不种,秋无收。2、 枣芽发,种棉花。3、 立夏勿下雨,犁耙倒挂起。4、 五月端午晴,烂稻刮田
“吨粮田”促单产夯实丰产基础眼下,北方大部分地区冬小麦进入拔节期,也是春管的关键期。今年的中央一...
1、营养师资格证一般安排在每年的7月和12月。考试地点按照报名时的区域安排。2、2019年3月ACI注册国际营养
1、2020年立秋时间是2020年8月7日星期五。2、立秋是二十四节气中的第十三个节气。北斗七星的斗柄指向西南,
2023年6月天津普通高中学业水平合格性考试报名时间2023年6月普通高中学业水平合格性考试于2023年4月18日至2
为新业态从业者权益织密“防护网”
广告
X 关闭
广告
X 关闭