周鸿祎谈大模型扎堆:现在说超越ChatGPT的叫吹牛

添加书签

专注AIGC领域的专业社区,关注GPT-4、百度文心一言、华为盘古等大语言模型(LLM)的发展和应用落地,以及国内LLM的发展和市场研究,欢迎关注!

5月7日,周鸿祎连轴转场俞敏洪与东方甄选直播间,销售其名下两本书——《超越好奇》《数字安全网络战》。在东方甄选直播间不足十分钟的时间内,《超越好奇》的销量已超过在俞敏洪直播间一个半小时的销售量。

周鸿祎在东方甄选直播间内顺应了董宇辉的主播风格,主要以闲聊为主,浅谈了何为创业、年轻人的好奇心等。在俞敏洪直播间内,周鸿祎谈及对当下火热大模型与ChatGPT的看法,他称,以前的人工智能技术很碎片,“不通用”的问题导致大家对它丧失了热情。

OpenAI的成功让行业热议是否过去中国公司过于“功利”地追求盈利,而不愿长期投入技术。对此,周鸿祎认为,这是因为公司都比较现实,美国公司也一样,Meta(NASDAQ:META)搞元宇宙亏了100亿美元也受不了,OpenAI最牛的一点就是坚信通用人工智能能成功,且最终把这条路给趟出来了,这里面既有运气也有坚持。

至于目前国内多家公司密集推出大模型产品的现象,周鸿祎称,首先要感谢OpenAI与ChatGPT把方向跟技术路线探索出来了,第二要感谢开源生态与开放论文,剩下留给公司们要做的主要是工程化的训练层面,这是当下大家都能做大模型的原因。

至于目前国内大模型发展与OpenAI之间的差距,周鸿祎称他同意王小川的观点——差距最少有两年。此前王小川认为OpenAI比国内领先三年时间。追上GPT-3.5可能一年时间是有机会的,但目前OpenAI已经达到GPT-4的级别,GPT-5也在训练过程当中了,因此“追上”需要三年。

回到国内大模型发展问题,周鸿祎表示,互联网公司都去做大模型的原因,是因为没人能笃定某一家公司能做出来成功的大模型产品。但这个技术对中国很重要,它是工业级的,对各行各业都能带来工业革命级的推动。但在早期,周鸿祎认为后来者在大模型技术领域肯定是模仿与“抄袭”,但在做的过程中一定会越来越了解,未来有可能会弯道超车、后来者居上,“但上来就说能超越,那才叫吹牛呢”,周鸿祎表示。

5月6日,科大讯飞(002230.SZ)推出星火认知大模型,科大讯飞董事长刘庆峰表示,认知大模型成为通用人工智能的曙光,科大讯飞有信心实现“智能涌现”。当前讯飞星火认知大模型已经在文本生成、知识问答、数学能力三大能力上超过ChatGPT。

“到今年的10月24日(科大讯飞全球开发者节),我们希望星火能够在通用认知大模型能力上对标ChatGPT,在中文上超越ChatGPT,在英文上达到跟它相当的水平。”刘庆峰表示。

此前360推出大模型产品“360智脑”,在俞敏洪直播间,周鸿祎也对“360智脑”进行了多模态演示。在制图环节,“360智脑”完成了周鸿祎与俞敏洪合照、松鼠喝啤酒等要求,但在制作“俞敏洪喝啤酒”图片环节发生卡顿,据了解是因“360智脑”储备俞敏洪图片不足所致。

本文来源第一财经,如有侵权请联系删除

END