“无产业不AI,无应用不AI。” 随着AI(人工智能)大模型技术落地,AI应用遍地开花。连日来,多家企业发布基于大模型的AI应用产品。身处“百模大战”时代,如何打造国产大模型应用产品?如何为大模型提供更普惠的算力、寻找更合适的场景?
(相关资料图)
发布现场图。
6月1日,阿里云对外披露通义大模型最新进展,上线聚焦音视频内容的AI新品“通义听悟”,成为国内首个开放公测的大模型应用产品。有专家认为,云计算是打造大模型最合适的形式,而大模型的进化过程,或将会对传统云计算架构开始新一轮的改造。
阿里云AI新产品“通义听悟”开放公测
记者在发布现场了解到,阿里云此次公布的“通义听悟”接入了“通义千问”大模型的理解与摘要能力,是一款主攻音视频领域的工作学习AI产品。不同于传统录音软件的内容反馈,“通义听悟”在实时记录的基础上,能够将谈话内容以文字的形式更直观地呈现给用户,并进行归档和总结。针对多语言交流场景,“通义听悟”也将在今后推出翻译功能,弥合语言上的差异,真正让交流在无障碍的情况下完成。
除了对语音内容进行实时记录,“通义听悟”还能自主处理视频信息,生成简要概括,并对内容进行分段和中心思想的提取,根据用户的需求定位到相应的视频片段。值得一提的是,“通义听悟”还与阿里云盘进行了联动,用户可以便捷地将视频从阿里云盘上传到“通义听悟”进行处理,极大提高了用户的工作效率和使用体验。
在照顾普通用户办公、学习的需求以外,“通义听悟”还在其它细分领域为不同群体设置了定制化功能:依靠Chrome插件,外语学习者和听障人士可以通过双语悬浮字幕条观看没有字幕的视频;对于经常出现日程冲突的职业人士,“通义听悟”还能作为“会议替身”,在静音状态下入会,由AI进行会议记录和重点整理。
“我们生活在一个技术变革的时代。”阿里云智能首席技术官周靖人表示:“随着AI的发展,将会有越来越多的AI助手诞生,它们不仅会提高我们工作的效率,还能显著改善我们生活的体验。”
国内科技巨头加速布局,AI大模型竞争升级
“通义听悟”大模型应用进入落地期,无疑在行业内掀起了一阵波澜。然而值得注意的是,阿里云并不是这条赛道上的唯一选手,国内的互联网科技圈的“颠覆”暗潮在不断涌动。新诞生的AI大模型越来越多,已有的AI大模型越来越强。记者梳理发现,目前这一赛道上还有不少竞跑者觊觎着同一块蛋糕、同一片蓝海。
首先是以百度、阿里为代表的“巨头派”。今年3月16日,百度“文心一言”极速发布,打响国产大语言模型内卷的第一枪;随后不到一个月,4月11日的阿里云峰会上,阿里云智能首席技术官周靖人正式宣布推出大语言模型“通义千问”。作为当今两大互联网巨头,百度和阿里深刻洞见了AI能为产业带来的颠覆能力,尽早入局方能抢得先机。
其次是小米、360、知乎等“互联网科技派”。小米集团继今年3月对外表示正在探索AI大模型后,在5月24日晚的一季度财报电话会中,小米总裁卢伟冰表示,公司已经于4月正式组建AI实验室大模型团队,目前AI领域相关人员超1200人。卢伟称:“小米会积极拥抱大模型,但不会像Open AI一样做通用大模型,而是会深度和业务结合协同,利用AI技术提升内部效率。”
在4月“2023知乎发现大会”上,知乎发布了大语言模型“知海图AI”并内测首个站内大模型应用功能“热榜摘要”。时隔一个月之后,知乎在“2023数博会”上带来了又一款站内的大模型应用功能“搜索聚合”;在5月18日的第七届世界智能大会上,360集团CEO兼董事长周鸿祎展示了两款大模型产品“360智脑”以及AI生图工具“360鸿图”。
5月24日,微盟发布基于大模型的AI应用型产品WAI。截至发布当天,微盟WAI已正式上线包括“话术生产、短信模板、商品描述、种草笔记、直播口播稿、公众号推文、短视频带货文案”等25个实际应用场景。
此外还有以科大讯飞、商汤、云从为代表的“坚守派”。这些企业无论在AI行业的风口还是低谷,始终坚定在AI战线。深耕多年的“霸主”,势必会与奋起直追的生力军们发生交锋。记者注意到,作为国内率先将大模型落地应用的厂商科大讯飞目前已推出面向教育、办公、车载等行业的解决方案。
中国科学技术信息研究所发布的一份报告显示,据不完全统计,2020年至2023年间,中国已发布了79个参数在10亿规模以上的大模型。有业内人士分析认为,国产化大模型呈井喷式发展,一方面是企业为了应对Open AI带来的“鲶鱼效应”,一方面是相中发展大模型能为产业带来的长远利益和升级动力。群雄逐鹿,各家纷纷放出大招,在狂热的市场浪潮中一路高歌猛进,加速着AI的迭代升级。在AI大模型竞争升级的趋势下,“百模大战”一触即发。
落地为王:大模型产品如何避免“华而不实”?
如阿里CEO张勇所言,“AI时代,所有产品都值得用大模型重做一次。”面对大模型时代带来的大机遇,各家企业奋勇争先,抢占生态位。但无论声量如何喧哗,如果缺乏确定的商业化落地前景,没有踏实的落地服务能力,再好的大模型也难言胜算。作为新兴产物的大模型,要落地又谈何容易?有分析认为,横亘在大模型构思与产品化中间的,主要有两大问题:一是市场培育问题。当下大模型仍然处于一个教育市场、教育客户的阶段,作为一项新技术,需求方对于大模型的能力边界认知还不够清晰,客户对于大模型的技术实现程度、具体细分场景落地能力都还不太了解,这需要大模型企业和客户共同进步。
ChatGPT的横空出世实际上帮助软件的用户进行了一次关于AI的科普,在某种程度上带来了更多对语言大模型进行商业化应用的需求。阿里云此次发布的“通义听悟”是大模型产品适应场景化需求的一个很好的例子,用户在长期使用后甚至可能培养出与AI“并肩作战”的工作习惯,这对企业来说都是潜在的消费市场。
另一个是成本问题。不同细分场景落地的AI所需要的训练语料是不一样的,想要得到一个足够有效且好用的大模型,需要投入足够多且针对性的语料,这意味着大量的成本投入和深厚的技术沉淀。华为云人工智能领域首席科学家田奇表示,大模型开发和训练一次需要耗费1200万美元。资本门槛和技术门槛之高,反映给消费者的最直观体现就是获取服务所需要支付的价格不菲。比如基于讯飞星火认知大模型打造的“讯飞听见”,语音转文字——机器快转功能的套餐从19.8元/2小时到888元/100小时不等;红极一时的OpenAI,由gpt-3模型升级到更加“聪明”的gpt-4,需要额外支付每月20美元的费用。
此外,对于国产AI大模型而言,算力是另一个关键问题。大模型的打造需要普惠的算力基础设施,云计算是打造大模型最合适的形式。然而随着大模型技术的落地应用,可能对传统云计算架构产生影响和改变,需要增加更强大的计算节点和存储设备,优化数据传输速度和可靠性,并提供定制化的解决方案。
大模型的未来发展还面临着来自安全性、真实性方面的挑战。今年4月,国家互联网信息办公室发布的《生成式人工智能服务管理办法(征求意见稿)》提出,国家支持人工智能算法、框架等基础技术的自主创新、推广应用、国际合作,鼓励优先采用安全可信的软件、工具、计算和数据资源。同时提出,生成式人工智能产品提供服务前需申报安全评估。
有业内人士认为,大模型技术为社会发展带来机遇的同时,也会带来许多治理挑战。下一步不仅要营造创新生态,还需要重视防范风险。只有在解决这些问题的基础上,大模型才能真正发挥其潜力,实现在各个领域的广泛应用。
大模型竞赛是一场马拉松,比拼的不是眼下谁跑得快,而是看谁今后走得远。未来,谁能打造出比肩ChatGPT的国产AI应用?我们将持续关注。
采写:奥一新闻记者 管玉慧
实习生:辛豫
责任编辑:Rex_03