首页 > 智能影音 >

国产AI大模型狂飙:科技巨头一把手挂帅上阵督战,芯片价格大涨

“ 什么样的平行宇宙里,才能做到让一个脱离一线 15 年的人,去怼一个脱离一线 1.5 年的人。”4月14日凌晨,搜狗创始人王小川发布微博回怼百度副总裁肖阳。

这场互掐源自李彦宏不久前的一句表态,他认为文心一言和ChatGPT的差距可能就在一两个月。王小川的一句“怎么可能只差两个月?那一定是在另一个宇宙。”引得百度搜索平台负责人肖阳开怼,“王小川脱离一线太久,确实跟百度不在一个宇宙,自然对国内人工智能技术的发展缺乏了解、当年搜狗也立志取代百度搜索,结果显而易见。”于是便有了王小川深夜发微博的一幕。


(相关资料图)

在这场口水宇宙里,百度与搜狗的隔空嘴战火药味十足,这可能源自他们对AI发展进度看法不一致,也可能源自他们对产品看法不一致,更可能源于现实世界里AI大模型的硝烟四起。

战火是从大洋彼岸的ChatGPT开始蔓延,3月16日百度发布“文心一言”,之后华为、阿里、腾讯、小米、知乎、商汤等十多家公司陆续发布或预告发布自研大模型,百花斗艳的春日成了互联网大厂的AI大模型斗兽场。

相爱相杀的场面在互联网圈并不让人陌生。当年一度喧嚣不已的“百团大战”最后也仅剩美团一家独大。

今天,历史似乎在重演。ChatGPT横空出世后,各大公司在大模型赛道上你追我赶,力求在风口喝上热汤。

但这不仅仅是分一杯羹,更像是一场源于危机意识的国际阵地保卫战。

风已起,大厂们开始逐浪,但这场数字模型盛宴终将去往何方?

一把手挂帅掌舵

拨开唇枪舌剑、剑拔弩张的背后,是各大厂一把手紧锣密鼓的挂帅上阵的架势。

目前,百度方面由李彦宏亲自下场盯研发,一名百度人士对时代周报记者表示,“文心一言发布会前以天为单位汇报进度,节奏非常快。目前还是由CTO王海峰牵头,副总裁吴甜直接负责大模型。研发大模型的主力是自然语言处理技术部门,吴甜则在2010年就进入该部门。”

华为盘古公开负责人是华为云人工智能领域首席科学家田奇;阿里方面的大模型研究一直放在阿里云的达摩院,由阿里云智能 CTO、 阿里云首席科学家周靖负责,阿里CEO张勇兼任阿里云CEO;腾讯混元助手项目则是由腾讯最高级(17 级)研究员、腾讯首席科学家张正友负责。

字节目前尚未发布自研大模型相关进度。但一名字节内部人士告诉时代周报记者“我们内部有一个娱乐性质的接口,不确定是自研发还是调用ChatGPT。涉及敏感问题比如内部架构,它都能回答得出来,且答案玄妙,结合了实际情况和民间流传版本。”

各大厂一把手挂帅涌向AI,不难看出大厂管理层对大模型的重视。

事实上,这场人工智能取代人类的大风蓄力已久,从1950年的图灵测试到今天,人工智能走了73年。百度、阿里、华为等公司最早在2019年开始研发自家大模型,如果从人工智能的投入开始计算,百度至少在2010年已经布局。

大风背后,是更为庞大的应用场景和应用需求。

4月11日,蓝色光标刚刚宣布获得微软云官方AI调用和训练许可,相隔一天就有消息传出。蓝色光标管理层决定无限期全面停用文案外包。

阿里方面也宣布,未来阿里大模型将会包揽营销图案、产品介绍、产品描述等工作。去年已经挑选部分商家使用该技术,原本预计花费数百万广告营销图案,可覆盖40%的工作量。

腾讯混元AI大模型则覆盖了自然语言处理、计算机视觉、多模态等基础模型,且应用于腾讯微信搜索、腾讯广告等自有业务场景。总裁刘炽平在年度财报会上曾表示,腾讯业务实际上聚焦于社交、通讯和游戏领域,这意味着大模型主要围绕用户间的互动,同时要求高质量的内容。

华为的盘古系列AI大模型包含NLP(自然语言处理)大模型、CV(机器视觉)大模型、科学计算大模型三大类型。CV大模型可应用于工业铁路等行业,NLP大模型应用于智能文档搜索等领域;科学计算大模型可以应用于气象预报、海浪预测等领域。其中,盘古CV大模型在铁路故障检测系中与传统检测方法相比,降低了人工成本,并且在故障样本检测中,识别率达到了99%以上。

可谓八仙过海,各显神通。大厂们看中的可能不仅是AI可以提高工作效率,取代部分比较机械的工作,更重要的是这在未来可以衍生出各种需求。

2008年,央视上映电视剧《魔幻手机》爆火,这部电视剧讲述的正式来自2060年傻妞牌智能手机来到2006年结识陆小千等人,穿越时空,保卫地球,情节科幻,跌宕起伏,令人上头。

最吸引人的点在于傻妞这款手机可以变成人型,具有人的思考、对话和行为能力,拥有一个手机,就像拥有一位忠实的朋友。简单来说,她能根据一切场景结合人类指令的语义、语气(语义理解能力),并考虑到人类的情感、实际需求(共情能力、人格模拟能力例如阿里的猫娘人设),深入理解并给出最合适的回答(基于海量数据信息搜索、数字计算、加工处理并给出解决方案)。即便是最复杂的中文理解,也能轻松掌握。

谁能拒绝一个能提供“情绪价值与工作价值”的多功能聪明朋友呢?

爆火的科幻惊悚美剧《黑镜》中也展示了关于人机交互应用的片段,从生活到工作,从交友到恋爱,有无数的场景与需求中使用大模型中的“数据喂养、训练进化”等概念。生活技能、精神陪伴、交友玩乐、恋爱指引,人们有太多的抉择想要有大数据作为参考。

“风潮背后是需求。如果只能使用他国产品,就像把大脑放在别的国家怀抱里一样危险,从模型安全、数据安全来说,不能全部开放给GPT,比如意大利直接宣布禁用ChatGPT。如果私密数据被吸收,后续产生飞轮效应很难停止。所以国内必然要研发自有平台。”泰岳梧桐资本合伙人杨扬告诉时代周报记者,“从投资人角度来看,未来超大模型可能不会太多,市场份额中垂类会分类,根据原有业务赛道的优势在细分领域上进行多模块发展会是比较合理的方向。”

芯片价格大涨

但想要拥有自研大模型平台,第一个门槛就是钱。

近日,华创资本合伙人熊伟铭曾对媒体表示:“10亿美元的启动资金,是参与竞赛的门票。”据国盛证券报告估算,GPT-3单次训练成本约为140万美元,大型语言模型则高至1200万美元。

假设烧钱单位不是美元,我们就以10亿人民币为门槛,天眼查上注册资本10亿以上的企业有多少家呢?可显示的答案是:8家。

接近百度文心一言业务的朱青(化名)告诉时代周报记者,“大模型领域,独角兽公司和创业公司的资金没法做,只能基于开源大模型的基础上去做。”

原腾讯副总裁,Google资深研究员吴军也曾公开表示 “ChatGPT不算是一项新技术革命,中国的大部分研究机构是做不了的ChatGPT,不是说研究水平的问题,而是因为ChatGPT太耗资源。”

以阿里为例,阿里曾在财报中披露训练大模型M6时,使用了 512 张英伟达 V100 GPU,V100是 A100 的前序产品,性能大约是A100的三分之一。而A100在4月16日京东上公开售价约为11万元一张,这意味着单次训练成本高达数千万元。

但一只脚迈入门内的大厂,即使有资金作为底气,硬件上也可能存在障碍。在国内,云计算技术人士有一个说法是,做好AI大模型的算力最低门槛是1万枚英伟达A100芯片。

2022年三季度,英伟达针对中国需求根据A100芯片推出降维版本A800,但传输速率大于600GB/s的限制改为了400GB/S。换句话说,处理信息的效率降低而耗电量增加。

AI大模型狂飙的同时,芯片的价格也水涨船高。据媒体报道,3月27日,京东上A800最高售价为93999元。但4月15日,时代周报记者在京东上查看A800,发现最高售价已涨至99799元(原价99999),短短半个月涨价5800元,涨幅6.17%。A800背后的芯片厂商英伟达(Nvidia)更是在三个月内股价涨幅近200%。

要知道,2023年以来,比特币自1.6万美元升至2.3万美元,整体涨幅也不过接近40%。

事实上,GPU芯片的重要性来自于它对算力的作用。算力简单来说就是处理信息,实现目标结果输出的计算能力,AI大模型的升级训练往往需要几千亿级的数据量作为支撑,GPU作为信息处理器,就像支撑心脏跳动的大动脉,保持高效畅通才能实现心脏良好运转。

实际上,各大厂也有先手陆续研发自己的芯片。百度在2020年就开始部署昆仑芯片、腾讯同样在2020年成立星星海实验室研究硬件工程,华为的麒麟芯片则在2008年开始研发,只是无论哪家,性能上仍无法完全与A100对齐。

4月14日,腾讯也发布混元大模型背后的训练框架AngelPTM,按腾讯的说法,用于AI推理的自研芯片紫霄已经完成量产,能够提供高达3倍的计算加速性能,以及超过45%的整体成本节省。

但当下的情况始终是自研不足,储备有限,朱青表示:“产业界都在研究这个问题,但无解。只能尽快发展芯片制造的全产业链。对此情形,可考虑租用算力,比如百度、华为都曾与鹏城实验室合作训练大模型。”

因此,一旦踏入大模型的赛场,比起内部比拼GPU储备量,更重要的还是将目光放长远。各大公司原有的数据参数将会是训练大模型进一步优化的关键,结合产业会是更好的选择。

秉烛夜行,去往何方?

细分领域的发展已然在摸索当中了。

当代社会,伴随越来越繁忙的工作节奏,人们无暇社交,情感需求也将成为细分领域的需求大类。百度文心一言的首批生态合作伙伴中,年轻人语音虚拟社交平台Soul也赫然在列。

不久前B站上引爆全网的阿里通义测评视频中,猫娘人设的对话体验对于喜欢二次元的用户来说有极强杀伤力,有网友评论到“会喵它就已经赢了”。足见社交平台上语音人设的吸引力。

华为则以“推动人工智能开发从“作坊式”到“工业化”升级为目标,力求形成关键技术壁垒,为煤矿、水逆、电力、金融、农业、国家云创造产业价值。

阿里的大招则是“所有软件都值得接入大模型升级改造”,更长远的计划是帮助每家企业打造自己的专属大模型。

眼下加入AI大模型的公司,在摸石头过河的同时也在积极探寻护城河产品,但对比ChatGPT,各大厂原本的优势赛道经验并无明显加持效果。

黑夜中秉烛,摸索而行,路线很多,但没有一个人知道,如何可以走到罗马。

巨头崛起之路上,被迫防守还是主动杀出门去,很难自主答题。时间和时机,随时都在变化。

按OpenAI CEO 、“ChatGPT之父”Sam Altman的说法,全球AI运算量每隔18个月就会提升一倍。在科技日新月异的时代,任何入局的公司都需要认真对待随时变化的战局,这可能是AI时代的新“摩尔定律”。

4月14日,亚马逊云科技(AWS)推出了自己的生成式AI服务Bedrock,正式加入AI赛道。未来的路肯定是越来越拥挤,留给大厂们的打嘴战的时间也不会太多了。

正如上海市人工智能行业协会秘书长钟俊浩所说的,“OpenAI起步早、积累久、投入大,国内GPT在核心能力和全面性方面都存在较大差距,特别是推理能力、问题理解能力、文本生成能力、系统工程能力等方面,这种核心能力的差距,我们还需要一段时间来追赶。”

从技术追赶到规范管理,每一步都有很长的路要走。

我们都知道这是一场漫长的战斗,打嘴炮并不会获得最后真正的胜利。

(文中朱青为化名)

责任编辑:Rex_17

关键词:
推荐阅读