中国各大科技公司ChatGPT技术布局及应用场景全析
添加书签近日,科技圈关于ChatGPT的讨论持续发酵。
凭借与用户聊天过程中“类似人类”的智能化表现,ChatGPT迅速了吸引人们的目光,仅两个多月就实现注册用户数量破亿,创下增速纪录。
ChatGPT全名为Chat Generative Pre-Trained Transformer,是一种大型语言模型。ChatGPT使用基于GPT-3.5架构的大型语言模型(LLM),既能够写诗歌、编代码,还能创造剧本、帮你面试出题、发表论文,以及实现更广泛的搜索服务等,呈现出解放人类生产力的惊人潜质。
用“一夜蹿红”来形容ChatGPT并不为过。国外,谷歌、微软的ChatGPT版搜索引擎战打得正火热;国内,无论是互联网大厂还是初创企业,都准备挽起袖子大干一场。
2月10日晚,原美团联合创始人王慧文一改以往“悠然南山”的形象,在朋友圈高调宣布自己的人工智能宣言——称要“组队拥抱新时代,打造中国OpenAI”,自掏腰包5000万美元带资入组,不在意岗位、薪资和title,将自身定位为负责研发之外的其余事务,“各位大牛不必为资金忧心,放心施展你的才华,杂事交给我来打理。”
此前,百度、阿里巴巴、网易、360、字节跳动等互联网大厂均表态将推出整合ChatGPT的相应产品。
可以看到,ChatGPT对于国内企业而言无疑还是一个新事物,在共识尚未形成之时,有人义无反顾,有人隔岸观望。
本文梳理了目前国内已经入场的科技企业,让我们一起来看看他们的最新布局:
百度
2月7日晚,百度在官方微信公众号宣布即将推出大模型新项目“文心一言”(ERNIE Bot)。目前这一项目正在做上线前的冲刺。
2月8日,百度CEO李彦宏2023年一季度OKR关键任务被曝光,内容为“引领搜索体验的代际变革”。据接近百度人士透露,此次文心一言落地,首站将直接接入百度搜索。
作为国内首家透露“类ChatGPT”项目的公司,百度方面还表示,目前文心一言在做上线前的冲刺。按照谷歌和微软的节奏,文心一言开放内测还有可能提前。
百度官方微信公众号还在2月9日发布消息称,文心一言尚未注册社交账号,3月和大家正式见面。
具体来说,百度这款类似ChatGPT的 AI 对话程序,是一种可扩展的“生成式搜索”功能产品。
此前,百度已经全面布局AIGC相关产品链。百度方面表示,ChatGPT 相关技术百度都有。百度在 AI 四层架构中有全栈布局,包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用,“文心一言”则位于模型层。
目前在内部业务中,百度移动生态(MEG)、百度智能云(ACG)、百度技术中台群组(TPG)、百度智能驾驶事业群组(IDG)几大业务中都有 AI 技术能力加持。
阿里
2月8日从阿里巴巴处获悉,阿里版聊天机器人ChatGPT正在研发中,目前处于内测阶段。
2月9日,阿里内测中的达摩院版ChatGPT提前曝光。新产品可实现的功能包括知识问答、AI绘画、代码生成、小说续写、文案撰写、写诗作词等。从人工问答的水平看,达摩院版ChatGPT也实现了相对真实的回答,而且也实现了多轮问答。
实际上,在2022年5月份,在超大规模多模态预训练模型M6的发布之后,阿里就曾公布过相应的能力,在AIGC方面,生成的实景图片已经十分逼真。
根据介绍,M6将模型参数规模扩展到了十万亿,平均单卡可承载200亿参数。据阿里方面公布的数据显示,M6在同等参数规模能耗仅为此前业界标杆的1%,极大降低大模型训练门槛。
同时间,钉钉方面也者表示,阿里版本的ChatGPT对话机器人将和钉钉深度结合。
此前,曾有钉钉用户尝试在钉钉机器人中接入OpenAI公司的ChatGPT,测试发现,钉钉机器人不仅可以接入OpenAI的ChatGPT,开放的API接口还可以接入更多机器人,甚至是用户自己开发的机器人。不过,目前尚不清楚,阿里内部研发的聊天机器人与钉钉将以怎样的方式结合。
腾讯
2月9日,腾讯表示,目前在ChatGPT相关方向上已有布局,专项研究也在有序推进。
2022年4月21日,腾讯对外正式对外披露“混元”AI大模型,该模型包含但不限于:计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等多个方向的超大规模AI智能模型。“混元”大模型基于腾讯太极机器学习平台进行研发,借助GPU算力,实现快速的算法迭代和模型训练。
目前,“混元“AI大模型已被广泛应用到广告创作、广告检索、广告推荐等腾讯业
在2月初,腾讯旗下的腾讯研究院发布了《AIGC发展趋势报告2023》。报告中指出,AIGC的商业化应用将快速成熟,市场规模会迅速壮大。当前AIGC已经率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大发展,市场潜力逐渐显现。
报告指出,在广告领域,腾讯混元AI大模型能够支持广告智能制作,即利用AIGC将广告文案自动生成为广告视频,大大降低了广告视频制作成本。巨大的应用前景将带来市场规模的快速增长。
报告还引用一份预测称,未来五年,10%至30%的图片内容由AI参与生成,有望创造超过600亿元人民币以上市场规模。国外商业咨询机构则预测,预计到2030年,AIGC市场规模将达到1100亿美元。
实际上,腾讯拥有“微信”这一国民级移动应用程序,包括在公众号、视频号、看一看等功能中都有 AI 算法加持。目前,腾讯在 AI 技术领域的业务,主要包括腾讯 AI 实验室、腾讯优图等。
根据数据研究机构Statista近日公布的2021年 AI 技术专利排名中,腾讯位列第一,第二是百度,超过了微软、谷歌等硅谷科技巨头。
京东
2月10日,京东正式宣布,京东云旗下言犀人工智能应用平台将整合过往产业实践和技术积累,推出产业版ChatGPT:ChatJD,预计参数量为千亿级,主要应用在零售和金融2个领域。并公布ChatJD的落地应用路线图“125”计划。ChatJD将以“125”计划作为落地应用路线图,包含一个平台、两个领域、五个应用。
此前,京东集团副总裁何晓冬便表示,京东在ChatGPT领域拥有丰富的场景和高质量的数据,例如京东云言犀每天和用户进行1000万次的交互,使得算法能够及时地迭代更新。
何晓冬认为,ChatGPT是令人兴奋的前沿探索,言犀则是大规模商用的客户服务系统,未来京东也会不断结合 ChatGPT的方法和技术点,融入到产品服务中来,推动人工智能的产业落地。
京东云在AIGC&ChatGPT的布局,主要聚焦文本、声音、对话生成、数字人生成和通用型Chat AI 技术五个方面:
文本生成(NLG):从2019年开始,京东接连发布基于自研领域模型K-PLUG(参数量10亿),对于给定商品的SKU,自动生成长度不等的商品文案,包括商品标题(10个字)、商品卖点文案(100字)、商品直播文案(500字)三类,聚焦商品文案生成。目前商品文案写作能力已经覆盖2000多个京东的品类,京东的商品文案生成技术已累计生成文案30多亿字。
语音生成(TTS):从2018年开始,京东自研语音生成技术,当前的线上版本是6.1版本。京东定制化的精品音色只需要30分钟的训练数据,小样本个性化音色克隆只需要10句话的训练样本。482人对比盲测显示,多颗粒度韵律增强的语音合成技术达到业内领先,并支持中文、英文、泰语,广东话、成都话等各类方言音色。语音合成主要应用到智能客服、SaaS外呼、金融、AI直播等产品。
对话生成:不同于闲聊式对话,任务导向性对话与体验强相关,需要解决真实世界深度复杂的任务。针对多样化复杂场景下对话决策推理能力弱的问题,言犀推出了可解释的多跳推理、数值推理和高噪音场景下口语化表达的话语权决策新方法,实现了多轮对话从信息匹配到复杂推理的技术突破。在WikiHop数据集上,以74.3%的准确率,首次超越人类表现水平74.1%的准确率。此外,京东云旗下言犀人工智能平台可以为17.8万商家提供智能咨询与导购服务,为商家节省30%+人力成本,服务已覆盖零售行业超过80%品类,以及50%+京东平台商家,包括美的、华为、阿迪达斯、联想等品牌。
数字人生成:京东云从2021年开始研发数字人技术,目前已具备全栈自研的2D孪生、3D写实和3D卡通三类数字人合成技术。目前,数字人技术产品已广泛应用于政务、金融、零售直播等领域。
通用型ChatAI:自2020年发布“言犀”人工智能应用平台以来,京东云打造创新对话与交互技术、产品,包括京东智能客服系统、京小智平台商家服务系统、智能金融服务大脑、智能政务热线,言犀智能外呼、言犀数字人等,服务范围包括17.8万第三方商家,2022年通过文本、语音、数字人等多模态多轮对话方式在多样化的场景上共服务京东域内外14亿人次用户。
三六零(360公司)
2月6日,360明确表态,计划尽快推出类ChatGPT技术的demo版产品。
2月8日晚,360发布公告称,公司目前在类ChatGPT、文本生成图像等技术在内的AIGC技术上有持续性的研发及算力投入,但截至目前,所形成的全部成果均仅作为公司内部自用的生产力工具使用,公司的类ChatGPT技术的各项指标只能达到略强于GPT-2的水平,与当前的ChatGPT相比尚有代差的落后。
三六零在互动平台表示,该公司的人工智能研究院从2020年开始一直在包括类ChatGPT技术在内的AIGC技术上有持续性的投入,但截至目前仅作为内部业务自用的生产力工具使用,且投资规模及技术水平与当前的ChatGPT3相比还有较大差距,各项技术指标只能做到略强于ChatGPT 2。由于训练数据源及应用方向的原因,在中文环境下的实际效果强于ChatGPT 2。
三六零表示,360在数据资源端有丰富的多模态大数据积累和相关语料、尤其是中文语料,相较于国外同行落后的是预训练大模型和有效的多模态数据清洗与融合技术。公司有充足的资金储备可用于购买大规模算力,在继续深入自行研发的同时,不排除寻找强有力的合作伙伴,以开放的心态搭建多方共享平台、补足短板,快速缩小差距。公司也计划尽快推出类ChatGPT技术的demo版产品。AIGC技术除了在搜索引擎的应用之外,还可以辅助数字安全能力的提升。
作为全球最大的数字安全公司,360公司此前发布了《全球人工智能安全治理报告》。报告显示,作为一种数字技术,人工智能“双刃剑”特征明显,不仅自身存在数字安全威胁和隐患,随着人工智能工程化、场景化、平台化落地不断加快,人工智能安全需求已经超越单纯技术范畴。
目前,360AI安全实验室所开发的AI框架安全监测平台,已累计发现Tensorflow、Caffe、Pytorch等主流机器学习框架及供应链漏洞200多个,其中提交给谷歌Tensorflow的漏洞数98个,包括24个高危、严重漏洞,在全球各大厂商中排名第一,成果入选了中央网信办“人工智能企业典型应用案例”。
2月9日,周鸿祎和张朝阳的对话里透露,360不会放弃对ChatGPT这项技术的追踪。红衣教主直言,如果企业搭不上ChatGPT这班车,很可能会被淘汰。在他看来,“有泡沫总不是坏事,会有更多优秀的人才,会有更多的资金涌入。”
不过,周鸿祎也表示,切忌盲目入局,要看其过去十年有没有在服务器算力上的投入,有没有做人工智能的团队,有没有大数据的存储。
网易
2月8日,网易有道对外表示,该公司未来或将推出ChatGPT同源技术产品,应用场景围绕在线教育。据透露,网易有道的 AI 团队此前便投入到ChatGPT同源技术产品的研发。近年来,团队在神经网络翻译、计算机视觉、智能语音AI技术、高性能计算等关键技术方面均取得重要突破。
此外,网易公司旗下网易伏羲也值得关注。据悉,网易伏羲成立于2017年,是国内专业从事游戏和泛娱乐产业人工智能研究和应用机构,研究方向包括强化学习、图像动画、自然语言、虚拟人、用户画像、大数据平台、云计算平台、云游戏等领域。
目前,网易伏羲已服务超200家客户,应用日均调用量超数亿次。根据官网显示,伏羲产品主要包括元宇宙虚拟活动平台“瑶台”、人机协作PaaS平台“有灵机器人”、虚拟人平台以及智能挖机。
字节跳动
字节在研发ChatGPT的道路上,虽然全栈技术不是很突出,但在商用方面走的比较靠前。从去年年底开始,字节就在研发类ChatGPT项目,目前已在内部上线了测试插件,由AI Lab主导,当前还在探索当中。并且在此前,字节的AML团队内部开发了火山引擎大模型训练框架veGiantModel。这一模型类似于为ChatGPT提供支持的GPT-3.5系列模型。
而在GPT-3.5之前,节很早就着手研究基于GPT2、GPT3的训练模型和产品,并且字节旗下的火山引擎也在NLP(自然语言处理)应用方面有研究积累。
目前,字节对话机器人、机器翻译、机器写作上有不少研究,特别是针对内容创作这一块。在ChatGPT被用作写文章前,字节跳动就研发了Xiaomingbot自动写稿平台,自2016年上线以来,已经累计写了60万篇文章,覆盖了17项的体育赛事,支持6种语言。
2月9日,有传闻称字节跳动的人工智能实验室(AI Lab)有开展类似ChatGPT和AIGC的相关研发,未来或为PICO提供技术支持。
然而,旗下PICO相关负责人直接否认了传闻,说消息不实,PICO目前没有采用类似ChatGPT技术的产品规划。
科大讯飞
科大讯飞将于今年5月发布ChatGPT相关落地产品。
科大讯飞2月8日则在投资者互动平台透露,ChatGPT主要涉及到自然语言处理相关技术,属于认知智能领域的应用之一,科大讯飞在该方向技术和应用具备长期积累。
2月9日,据报道,科大讯飞Al学习机将成为公司类ChatGPT技术率先落地的产品,并于今年5月发布。
科大讯飞回应称,ChatGPT主要涉及到自然语言处理相关技术,属于认知智能领域的应用之一,公司在该方向技术和应用具备长期深厚的积累;并强调,公司已经在当前核心技术、产业场景、行业数据等深厚积累的基础上,于2022年12月份进一步启动生成式预训练大模型任务攻关,科大讯飞AI学习机将成为该项技术率先落地的产品,将于2023年5月6日进行产品级发布。该技术突破将在AI学习机的中英文作文辅导、中英文口语学习等方面带来显著提升。
知乎
2月8日,知乎股价暴涨,或受ChatGPT概念带动。其中美股(NYSE: ZH)开盘涨超10%,港股(02390.HK)下午收盘涨39.57%,盘中一度扩大至50%,创下2023年开年以来最高涨幅。
据悉,在微软推出的ChatGPT版新Bing搜索中,部分中文问答是基于知乎站内相关资料生成的。此前2019年,知乎与百度曾达成战略合作,知乎全站上亿问答以智能小程序的形式接入百度App、百度搜索等产品矩阵中。投资人认为,知乎未来可能将承担ChatGPT中文语料底层。
快手
近日,快手也对外表示,正在开展大规模语言模型(LLM Large Language Model)相关研究,并启动了相应专项,覆盖LLM模型训练、文案自动创作与生成、对话系统开发等领域。
云从科技
作为“AI 四小龙”(云从、商汤、旷视、依图)之一,云从科技出身中科院重庆研究院,其股东多为“国资背景”,并被市场冠以“AI 国家队”的称号,拥有国内领先的 AI 技术能力。
2月6日,云从科技发布公告称,经公司自查,公司目前经营活动一切正常,未发生重大变化,并表示公司未与OpenAI开展合作,ChatGPT的产品和服务未给公司带来业务收入。
此前,云从也曾宣布自家的理念与OpenAI较为一致。
去年11月,云从表示在AIGC赛道上面已有所布局;今年1月,云从科技表示,该公司的理念与OpenAI很大程度上是一致的,而且目前的发展趋势与公司的长期布局相吻合,尤其高度认同“预训练大模型+下游任务微调”的技术趋势,从2020年开始,云从已经陆续在NLP、OCR(光学字符识别)、机器视觉、语音等多个领域开展预训练大模型的实践。
旷视科技
作为聚焦物联网场景的人工智能(AI)独角兽公司,尽管旷视科技并没有推出对标ChatGPT 的产品,但其在 AI 算法生产、深度学习框架、训练推理一体等方面均有技术储备。
目前,旷视研究院的核心科研成果包括AI生产力平台Brain++ 、开源深度学习框架旷视天元MegEngine、AI算法生产平台AI Service、移动端高效卷积神经网络ShuffleNet等多项创新技术和产品。
旷视的技术愿景是“AI in Physical”,通过构建底层统一的感知-决策-执行技术体系,做真正影响物理世界的 AI 技术创新。
旷视进一步表示,生成式大模型有望突破图像大模型的上限,并推动底层架构的统一。因此,在应用上,一方面,旷视会开发底层模型设计和工程能力,跟有场景需求和内容生成能力的合作伙伴一起,开发出有价值的AIGC应用。另一方面,旷视选择专注“AI in Physical”,把底层技术研究更多应用在自动驾驶、机器人这样的复杂决策领域。
现阶段,旷视通过算法量产已经帮助能源、教育、零售、运动健身等行业的多个客户在日常生产与经营中运用AI技术,实现降本增效。
商汤
商汤科技自2016年起便开始全面布局AIGC方面的各个技术领域,包括文字、语音、图像、视频、代码、三维人物动作等多模态的数据分析和内容生产。
目前,基于商汤SenseCore AI大装置,通过规模化量产商用模型推动大规模产业智能化升级。商汤科技正在构建一站式AI基础服务平台SenseCore商汤大装置AI云,实现人工智能即服务AIaaS(AI-as-a-Service)。
依图
2月7日,一位前依图科技员工在接受时代周报记者采访时表示,此前依图科技中的医疗业务涉及到自然语言处理,但2021年依图科技将相关业务出售后,便不再涉及这一赛道,因此也没有ChatGPT的应用场景了。
结语
人工智能不仅需要巨大的投入,还需要庞大的用户数据基础,只有互联网巨头才有这个能力产出伟大的产品。
国外是微软、谷歌、亚马逊,而国内则是百度、腾讯等互联网巨头最具潜力;相比国外巨头,国内巨头正投入大量资金和人力成本快速发展人工智能技术,在没有硝烟的人工智能竞赛中,中国企业也将异军突起!
附: