微软宣布GPT-4o模型,可在 Azure OpenAI上使用
添加书签专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!
5月14日,微软在官网宣布,OpenAI最新发布的多模态模型GPT-4o,可以在 Azure OpenAI 云服务中使用。
据悉,GPT-4o支持跨文本、视频、音频多模态推理,例如,通过GPT-4o打造一个AI助手,用于辅导孩子解答数学题或者进行实时翻译。
微软和OpenAI一样出于安全考虑只开放了GPT-4o的文本和图像分析功能。未来几周内会陆续开放视频、音频解读功能,使用范围也会从美国扩大至更多的国家。
此外,微软会在5月21—23日西雅图举办的 “2024 Build” 全球开发者大会上,介绍更多与GPT-4o相关的创新内容。
申请试用地址:https://aka.ms/oai/access
微软build大会活动介绍:https://build.microsoft.com/en-US/home
OpenAI发布的最新大模型GPT-4o再一次在全球范围内引起热议,其强大的多模态解读、输出能力非常惊艳,在场景化落地方面甚至比Sora更宽广、实用。
例如,GPT-4o支持的最新ChatGPT可以通过语音、视频模式,辅导孩子解答数学题。在整个过程可以实现1V1保姆式辅导,孩子做一步AI就会解答一下。
这样做的好处有很多一方面可以扩展孩子的解题思维;另一方面,可以让孩子深度了解这道题的原理与机制。目前多数AI助手都很难做到。
把GPT-4o当成学习机也没问题,例如,学习西班牙语言,把一些苹果、香蕉通过视频让GPT-4o看到,然后让其用标准的西班牙语说出来。这不仅能学习到词汇,就连口语都一起练了。
我们去面试的时经常会为形象发愁,我到底该穿西装还是休闲服呢?应该如何搭配颜色,才能给人更好的第一印象呢?
现在有了GPT-4o就方便的多。可以告诉它你今天要面试的行业,然后再通过视频让它评价你的形象以及如何改进。就像钢铁侠的贾维斯一样为你提供各种建议,当你的生活小秘书。
GPT-4o不仅在视频、音频表现出了强大性能,在图片方面也实现了大幅度提升。例如,将现实照片直接转换成漫画风格的图片。
让GPT-4o创作一枚纪念币:我想创作一个矢量图形,上面描绘着OpenAI的标志,下面写着GPT-4o。标志的宽度与文本大致相同。
边框周围的边距是均匀的。标志和文本靠近放置,中间没有间隔或线条。背景是黑色的,标志和文本填满了正方形的画布,同时加入两张参考图片。
GPT-4o很快就会根据你输入的要求,输出一张矢量的纪念币设计创意图。如果不满意,可以在此基础之上继续修改直到满足需求为止。
微软表示,GPT-4o的推出将对各行业带来变革性体验和更多的业务尝试,例如,将GPT-4o与客户系统相结合,为用户提供拟人化实时的服务,并通过强大的AI分析能力为决策者制定各种计划提供数据支撑。
本文素材来源微软官网,如有侵权请联系删除
END
本篇文章来源于微信公众号: AIGC开放社区