ChatGPT引领的大模型时代,小模型还有机会吗?
添加书签专注AIGC领域的专业社区,关注GPT-4、百度文心一言、华为盘古等大语言模型(LLM)的发展和应用落地,以及国内LLM的发展和市场研究,欢迎关注!
随着ChatGPT的问世,人工智能(AI)行业进入了全新的发展阶段。大模型作为一种颠覆性技术,正在吸引越来越多的头部厂商和创业者投入其中。
据花旗最新报告,保守估计生成式AI未来发展规模空间至少达100亿美元,算上对云计算的加成和推动,市场增长潜力将进一步打开。
有数据显示,今年只有1%的内容由AI生成,到2025年,这一数据将达到10%。这场狂欢背后,实际上是AI发展的一次重大飞跃,将带来一场生产力的革命。
为何ChatGPT能成为AI发展的拐点?大模型后续的发展将呈现什么样的趋势?在大模型时代,中小模型将如何?
在5月17日由NVIDIA初创加速计划和TGO鲲鹏会在成都主办的“‘科技+资本’双轮驱动的ChatGPT&LLM”闭门大咖会上,稀奇资本合伙人雷强生告诉《每日经济新闻》记者,从目前来看,大模型的赛道已经拥挤不堪,机遇更倾向于头部厂商以及有号召力的互联网大佬,而对于更多的新入局者来说,应该在小模型和子模型层面寻找机会。
每个行业都需要大模型吗?
以ChatGPT为代表的AI技术被视为未来十年最具颠覆性的技术。随着ChatGPT的现象级爆红,科技领域的创业DNA都动了。一时间,打造大模型和类ChatGPT产品成为最热门的话题和趋势。据统计,目前国内已有百度、阿里巴巴、华为等超过40家企业和机构发布了大模型产品或公布了大模型计划。
为什么ChatGPT会触发AI的拐点?
亚马逊云科技资深解决方案架构师贺杨在会议上表示,计算能力增长、数据增长、模型复杂性是AI处于拐点的关键驱动因素。他解释称,“我们可以将ChatGPT理解为AI 2.0,与AI 1.0最本质的区别是用模型驱动任务,将海量的数据压缩存储到模型里面,用非监督的数据进行训练。这样的大模型可以支持很多重要任务,包括文本生成、归纳、提取、问答。”
毫无疑问,从GPT-3所需的参数量来看,训练大模型需要极大的代价。单是计算和资本的投入对大多数企业来说都是难以承受之重。以OpenAI举例来说,训练ChatGPT除了上万张GPU芯片的投入以外,一个月的用电量也相当于17万家庭一年的用电量。此外,模型的性能调优也极其耗时,大概花了半年时间。
图片来源:主办方供图
在这样的背景下,是不是所有企业或者每个细分领域都需要大模型呢?
昆仑万维CEO方汉认为,“所有行业现在都要干这个事儿,这是不得不干的,行业大模型的价值其实不在于做这个模型,而在于怎么做数据,这是特别苦的事情,但所有人、所有行业都应该重复这个过程。”
多模态发展是共识,但不会带来人类智慧的跃升
目前,AI正在从文本、语音、视觉等单模态智能,向着多种模态融合的通用人工智能方向发展。“基于多模态的预训练大模型将成为人工智能基础设施”,这一观点已成为业内共识。建立统一的、跨场景、多任务的多模态基础模型正在成为人工智能研究的一个关键课题。
总部位于硅谷的向量数据库公司Zilliz的创始人兼CEO星爵解释道,大模型作为一个语言模型,第一次把所有多模态、跨模态统一到一个框架,它精确描述所有意图、所有知识,把所有模态跨模态串联起来。他估计未来两到三年所有的模块都会打通。
阿里巴巴达摩院的一份报告提到,多模态预训练模型的发展将重塑人工智能商业模式,并为人们的生产生活方式带来积极影响。对个人而言,类似CLIP(对比语言-图像预训练)的多模态模型,将使更多非技术出身的人能够表达自己的创造力,无需再借助工具和编程专业能力。
对于这点,成都普朗克科技创始人于芳表示无比赞同。她指出,对于喜欢画画和创造,而同时又属于“手残星人”的使用者来说,“多模态会赋予有创意、有想法的人‘手’和‘眼’,为其带来无限的创作体验,让以前的不可能变为可能,这将是多模态给予这个时代的可能性。”
而对于企业来说,多模态预训练模型将成为企业生产效率提升的关键。商业模式上,具备大数据、算力资源和模型开发能力的科技企业,将会成为模型服务的提供方,帮助企业将基础模型的能力与生产流程融合起来,实现效率和成本最优。
虽然大模型能够实现的很多,但昆仑万维CEO方汉在会上提到一个有趣的观点,即大模型并不会带来人类智慧的提升。他表示,“人类所有的智慧都用文字记录下来了,而现在所有的多模态图像跟视频的人类智慧含量特别少,高质量语料几乎用完了。”不过,从工程角度来说,他认为,图片跟视频这种多模态大模型应用上就特别有价值。
大小模型未来几年将“齐步走”
实际上,在2015年之前,小模型被认为是理解语言的“最先进的技术”。这些小模型擅长分析型任务,被用于从“预测送达时间”到“欺诈信息分类”等各类任务中。
在大模型搅动全球之后,小模型是不是就走到“末路”了?
星爵认为,大模型跟中小模型在未来几年会并存。从技术层面来看,他以计算机为例来解释,ChatGPT的通用大模型是超级计算机,而我们每个人携带的笔记本、手机等智能模型,是更小的模型,不需要很强的算力就能获得很好的效果。而从业务层面分析,一定会出现资源配置更加高效的小模型,尤其细分领域的专用模型。
谷歌近日在一年一度的开发者大会上推出最新大模型PaLM 2。这款大模型有四种参数,从小到大分别为“壁虎” (Gecko),“水獭”(Otter)、“野牛”(Bison)、“独角兽”(Unicorn)。AI产品经理、技术博客Orange’s AI主理人Leo此前也对《每日经济新闻》记者表示,这种模式非常灵活,最小模型的速度非常快,可以在手机本地运行,而GPT-4则是单一大模型,速度较慢。
站在投资人的角度,稀奇资本合伙人雷强生认为,更多的机会集中在小模型和子模型方面。
他在论坛后接受《每日经济新闻》记者采访时表示,“大模型赛道的主要玩家就是头部厂商以及有号召力的互联网大佬,例如,前美团联合创始人王慧文和创新工场董事长兼首席执行官李开复。”
在他看来,生成式AI的定位更多是一个工具,赋能其他行业降本增效,这正是小模型的机会。大模型就像是高速公路这类基础设施,其修建需要资金实力更强的企业,但除了高速公路,社会还需要国道、省道等。
对于小模型领域的发展,他指出,“这主要集中在两个方面:一是针对垂直类行业的小模型,二是重在提升效率等的偏工具类的小模型。”
当被问及如何选择投资标的时,他告诉每经记者,主要分为两类:聚焦场景化应用的老玩家以及初创企业。“老玩家拥有大量高质量的行业数据,加上新的技术方式,就会创造更丰富的应用场景以及更完善的客户体验,市场空间更大。”他同时强调了选择优势产业的重要性,“只有优势的产业才能长出创新的机会。”
本文来源每日经济新闻,如有侵权请联系删除
END
「AIGC开放社区」ChatGPT对话机器人大合集,扫描二维码免费使用