导语
(资料图)
无论从产品层面还是传播层面,文心一言的发布都算不上顺利。发布会上,李彦宏直言,“文心一言相比于 ChatGPT,还有很高的门槛”;传播上,选择播放预录视频而非现场演示的百度,遭到了不少对文心一言实际能力质疑。此前,ChatGPT 的令人惊艳的能力引发了人们对它将如何改变未来的热议。顶着“中国版 ChatGPT”名号出生的文心一言,在这场 AIGC 的竞赛中,将扮演什么样的角色?
一、文心一言的“不完美”
就在文心一言发布的前一天,OpenAI 正式发布了其最新的多模态预训练大模型 GPT-4。相比于 2020 年推出的 GPT-3,GPT-4 的回答准确性、多模态输入能力都有着显著提升。
面对如此强大的竞争对手,在第二天文心一言的发布会上,李彦宏出现了罕见的紧张,李彦宏坦言,“文心一言对标ChatGPT、甚至是对标GPT-4,门槛是很高的。我自己测试感觉还是有很多不完美的地方。”
文心一言和ChatGPT 的差距,从两者背后的大模型的参数数量就可见一斑。根据百度百科的资料显示,文心大模型的参数为 2600 亿。尽管官方并未公布 GPT-4 的参数数量,但不少信息源表示,GPT-4 的参数数量相比上一代的 1750 亿有了大幅提升,达到了 100 万亿的量级。
一般来说,参数数量越多,模型越能够表示和学习复杂和多样的知识。虽然大量的参数会让训练时间和成本大幅上升,但从现阶段来说,模型参数仍是规模越大越好。
此外,基于 GPT-4 的新 ChatGPT 也和文心一言在产品层面上也有着不小的区别。基于GPT-4的新 ChatGPT是一个多模态预训练模型,能够处理图像和文本,以文本的方式进行输出。而文心一言只能用文本输入,然后按照指令生成文本、语音、图像和视频。
相关从业者表示,与多模态输入相比,多模态输出的难度要低一些。比如输出语音,就是先输出文字然后再加一个TTS技术,这个技术业内已经比较成熟。而通过文字指令生成图片以及视频的相关技术,在百度之前, Meta 和 OpenAI 早有涉足。而 GPT-4 所展现的图片理解能力,要让大模型能够“看见并理解”图片内容,这就需要在预训练阶段就把图片和图片标注信息作为训练数据,技术难度显著提升。
二、教育公司们,看中了文心一言的什么?
尽管文心一言相比于业内顶尖水平还有着不小的差距,但文心一言发布前,高途、中公、昂立、千锋和达内等多家教育公司纷纷宣布与文心一言达成合作。目前,文心一言已经有超过10万家企业申请测试,并且有650余家企业宣布接入。
百度在发布会上表示,相比于 GPT-4,专注于中文市场的文心大模型在中文领域具备更为出色的自然语言处理能力,在中文语言和中国文化这些领域会有更好的表现。而选择与文心一言合作的教育公司们,或许正是看中了这一点。
不久前,高途创始人陈向东接受采访时提到,随着技术的演进,一些工作相对重复、单调,如简单回复统一答案、不需要做过多延展的助教老师需求会急剧减少,这部分人工未来很可能会被机器代替。有时机器可能比助教回复得还要好和快,效率也更高,确实有替代风险。
如果文心一言这样的技术广泛用于教育场景,就会为不少正在身陷亏损漩涡的教育公司节省巨大的人力成本。此外,李彦宏在发布会中表示,通过百度智能云,文心一言可以帮助企业构建自己的模型和应用。也就是说,文心一言不仅可以充当“助教”,还可以结合教育公司们的实际业务,处理大量的数据和内容,包括教学资料、学生作业和测试结果等。这些数据可以帮助教育公司更好地了解学生的学习情况和需求,并制定更有效的教学策略和课程设计,长期来看,这不仅可以提升教育公司的效率,也可以提升其课程在未来的竞争力。
不过,对于教育公司来说,接入文心一言也存在一定的风险。3 月初,夸克指控高途旗下考途APP非法盗取夸克APP大学题库引发了人们对于教育内容版权的关注。夸克表示,从去年起,夸克发现考途APP在没有授权的情况下一直非法窃取夸克大学题库数据。有媒体对比两个APP搜题相同题目的结果发现,两个平台给出的答案无论是答案内容、答案格式还是解题思路几乎完全一样。
尽管文心一言拥有自己的生成内容的能力,但它所生成的内容也大都基于从互联网上的内容进行学习再输出。也就是说,在教育场景之下,文心一言所生成的内容,如解体思路、文学赏析等都可能存在一定的版权风险,这也是未来接入教育企业们需要关注的问题。
三、文心一言,还需要更多时间
文心一言发布会当天,百度港股股价下跌6.36%,市值蒸发约300亿人民币。有GPT-4 珠玉在前,资本市场对文心一言的能力显然没有那么有信心,而并未现场展现文心一言实际能力的发布会又加剧了资本对于百度的不信任。
但到了第二天,百度港股股价出现反转,涨幅达到13.67%。随着文心一言开放测试的进行和企业接入的增加,资本市场开始看到了文心一言的市场潜力。
尽管并未达到行业顶尖水平,但对 AI 长期投入和在中文领域具有先发优势的百度,是最有可能与 OpenAI 相媲美的中国公司。随着越来越多的用户使用文心一言,其进化的速度可能远比我们想象的要快。百度也在发布会上表示,“一旦有了真实的人类反馈,文心一言的进步速度会非常快,我们都希望它快点成长”。
此外,由于相关政策的限制,百度在中文领域掌握的数据远比海外的竞争对手更多,其与国内商业公司的合作限制也相对较少,对于刚刚起步的文心一言来说,其未来还有不少的想象空间,文心一言可能会走上与 ChatGPT 完全不同的发展道路,探索出不同的商业模式,现在对文心一言下定论还为时尚早。毕竟,这场 AIGC 的竞赛,才刚刚开始。
责任编辑:Rex_25