英伟达发布视觉AI Agent,能用AI总结真实世界了
添加书签专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!
全球AI领导者NVIDIA(英伟达)发布了全新开发产品——NVIDIA AI Blueprint。
AI Blueprint主要用于开发视觉AI Agent,几乎任何行业都能开发出用于分析视频、图像的AI Agent来提升工作、监控效率等。
例如,开发一个智能体自动监控仓库工作环境,当有工人违规工作时可以自动发出警告,同时还能回答用户问题、生成内容摘要等,支持免费下载体验。
申请试用:https://build.nvidia.com/nvidia/video-search-and-summarization
AI Blueprint为视觉计算开发者提供了一套完整的优化软件,用于构建和部署能够处理和理解大量实时视频流或数据档案的生成性AI Agent。
用户可以通过自然语言提示来定制这些视觉AI Agent,而无需专业的代码,这极大降低了在各个行业和智能城市应用中部署AI Agent的门槛。
视觉AI Agent由视觉大模型驱动,能够解释物理世界并执行推理任务。NVIDIA的AI Blueprint可以配置NVIDIA NIM微服务,开发者可以轻松替换其他VLMs、LLMs和图形数据库,并使用NVIDIA NeMo平台针对他们独特的环境和用例进行微调。
通过使用AI Blueprint可以帮助开发者节省开在调查和优化智能城市应用的生成性AI模型上花费的数月时间。在NVIDIA GPU上部署在边缘、本地或云端,它可以极大地加速搜索视频档案以识别关键时刻的过程。
例如,在仓库环境中,可以开发一个视觉AI Agent在工人违反安全协议时发出警报;在繁忙的交通路口,AI Agent可以识别交通事故并生成报告以帮助紧急响应工作;
在公共基础设施领域,维护人员可以要求AI Agent审查航拍画面,识别退化的道路、铁路或桥梁,以维护安全性。
对于视力受损的人士,视觉AI Agent可以总结视频内容,帮助他们理解视频信息。在体育赛事领域,能够自动生成赛事回顾和总结。在智能城市和交通管理方面,城市管理者可以询问关于街道活动的问题,并接收改善运营的建议。此外,这些Agent还能帮助标记大量视觉数据集,帮助开发者训练其他AI模型。
目前,全球著名系统集成商和技术解决方案提供商,包括联想、埃森哲、戴尔科技,正在将英伟达的AI Blueprint带到全球的企业和城市,推动下一波AI应用的部署,以提高工厂、仓库、商店、机场、交通路口等地的生产力和安全性。
本文素材来源英伟达,如有侵权请联系删除
END
本篇文章来源于微信公众号: AIGC开放社区