微软宣布GPT-4o模型，可在 Azure OpenAI上使用

添加书签

AIGC开放社区
2024-05-15

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！

5月14日，微软在官网宣布，OpenAI最新发布的多模态模型GPT-4o，可以在 Azure OpenAI 云服务中使用。

据悉，GPT-4o支持跨文本、视频、音频多模态推理，例如，通过GPT-4o打造一个AI助手，用于辅导孩子解答数学题或者进行实时翻译。

微软和OpenAI一样出于安全考虑只开放了GPT-4o的文本和图像分析功能。未来几周内会陆续开放视频、音频解读功能，使用范围也会从美国扩大至更多的国家。

此外，微软会在5月21—23日西雅图举办的 “2024 Build” 全球开发者大会上，介绍更多与GPT-4o相关的创新内容。

申请试用地址：https://aka.ms/oai/access

微软build大会活动介绍：https://build.microsoft.com/en-US/home

OpenAI发布的最新大模型GPT-4o再一次在全球范围内引起热议，其强大的多模态解读、输出能力非常惊艳，在场景化落地方面甚至比Sora更宽广、实用。

例如，GPT-4o支持的最新ChatGPT可以通过语音、视频模式，辅导孩子解答数学题。在整个过程可以实现1V1保姆式辅导，孩子做一步AI就会解答一下。

这样做的好处有很多一方面可以扩展孩子的解题思维；另一方面，可以让孩子深度了解这道题的原理与机制。目前多数AI助手都很难做到。

把GPT-4o当成学习机也没问题，例如，学习西班牙语言，把一些苹果、香蕉通过视频让GPT-4o看到，然后让其用标准的西班牙语说出来。这不仅能学习到词汇，就连口语都一起练了。

我们去面试的时经常会为形象发愁，我到底该穿西装还是休闲服呢？应该如何搭配颜色，才能给人更好的第一印象呢？

现在有了GPT-4o就方便的多。可以告诉它你今天要面试的行业，然后再通过视频让它评价你的形象以及如何改进。就像钢铁侠的贾维斯一样为你提供各种建议，当你的生活小秘书。

GPT-4o不仅在视频、音频表现出了强大性能，在图片方面也实现了大幅度提升。例如，将现实照片直接转换成漫画风格的图片。

让GPT-4o创作一枚纪念币：我想创作一个矢量图形，上面描绘着OpenAI的标志，下面写着GPT-4o。标志的宽度与文本大致相同。

边框周围的边距是均匀的。标志和文本靠近放置，中间没有间隔或线条。背景是黑色的，标志和文本填满了正方形的画布，同时加入两张参考图片。

GPT-4o很快就会根据你输入的要求，输出一张矢量的纪念币设计创意图。如果不满意，可以在此基础之上继续修改直到满足需求为止。

微软表示，GPT-4o的推出将对各行业带来变革性体验和更多的业务尝试，例如，将GPT-4o与客户系统相结合，为用户提供拟人化实时的服务，并通过强大的AI分析能力为决策者制定各种计划提供数据支撑。

本文素材来源微软官网，如有侵权请联系删除

END

本篇文章来源于微信公众号: AIGC开放社区

即将举行的活动