重庆发布首个自主研发大语言模型——“兆言”
添加书签专注AIGC领域的专业社区,关注OpenAI、百度文心一言等大语言模型(LLM)的发展和应用落地,关注LLM的基准评测和市场研究,欢迎关注!
近日,上海交通大学重庆人工智能研究院在西部(重庆)科学城正式发布“兆言”大模型,这也是重庆首个自主研发的大语言模型。
随着ChatGPT在全球大火,大模型成为了当下最炙手可热的话题,2023年也成为大模型迸发之年。有数据显示,全球已发布数百个大模型,今年以来国内也相继发布80余个大模型。
“此前发布的以ChatGPT为代表的通用大模型,存在一些行业落地的痛点,比如领域知识缺失、系统调用不精准、部署成本高昂等。”
上海交大重庆人工智能研究院院长、首席科学家金石介绍,举个例子来讲,通用大模型好比是“通才”,但由于缺乏专业知识和行业数据积累,其行业深度就显得不够,再加上系统调用不精准,因此在回答某些专业性很强的问题时,它可能就是在“一本正经地胡说八道”。
“兆言”则致力于打造行业大模型,就好比是“专才”,是上海交大重庆人工智能研究院基于全球领先的AI大模型技术研发,通过积累海量数据,辅以独特的数据处理和AI训练技术,以达到精准、专业的文本输出,并且能够实现以自然语言选择、调用应用程序的能力,助力打造个性化的智能产品。
“‘江州司马青衫湿’中的‘江州’是指重庆吗?”当天,发布会对“兆言”进行了演示,并与业内知名大模型作了对比。
重庆日报记者看到,“兆言”的回答不仅介绍了“江州”和重庆这个名称的历史关系,而且没有混淆重庆和九江,知道“江州”是现在的九江。而另一大模型却给出了错误的回答。
“‘兆言’寓意为‘兆文厚积,言出成章’。”金石表示,这既表达了大模型的创建过程涉及海量数据的收集与处理,即“兆文厚积”,也表达了大模型能实现高精度、专业级别的文本输出,即“言出成章”,让人们获取到真正所需的信息。
此外,“兆言”的研发还把小型化部署作为重点,通过蒸馏学习、模型压缩、专用推理芯片,大幅降低了模型训练和推理成本。在行业内特定任务上,回答质量不降低的同时,模型调用成本仅为小型化前的四百分之一,让更多中小型企业也能应用大模型,让以模型为基础的产品在市场上更有竞争力。
“概括起来,‘兆言’具有精度高、效率高、成本低三大特点,更好地赋能制造、医疗、金融、文旅、法律、服务等行业领域。”金石介绍。比如,在医疗领域,“兆言”可以提供医疗辅助,通过深度学习医疗数据,提升医疗服务的质量和效率。
“过去,医疗服务受限于医生的专业知识和经验,且咨询响应速度慢,服务质量有限。”他举例说,“兆言”则可以深度学习医疗记录和症状描述,提供全面准确的诊断和治疗建议,提升医疗服务的响应速度和质量。
发布会上,上海交大重庆人工智能研究院还与华院计算技术(上海)股份有限公司、重庆赛迪工程咨询有限公司、重庆誉存科技有限公司、中国移动通信集团重庆有限公司、北京流金岁月传媒科技股份有限公司、重庆赛宝工业技术研究院有限公司进行了签约,将发挥各自优势,促进大模型技术在制造、金融、文旅、教育、医疗等不同行业场景的落地应用。
未来,上海交大重庆人工智能研究院将根据重庆产业布局需求,在行业垂直领域不断优化和升级,将“兆言”大模型产品应用到各个领域中,助力西部(重庆)科学城建设和重庆数字经济发展。
本文来源重庆日报,如有侵权请联系删除
END