人人能打造类ChatGPT“对话搜索引擎”,Vectara获得2亿元融资
添加书签专注AIGC领域的专业社区,关注GPT-4、百度文心一言、华为盘古等大语言模型(LLM)的发展和应用落地,以及国内LLM的发展和市场研究,欢迎关注!
北美时间5月30日,生成式AI平台Vectara宣布获得2850万美元(约2亿元)种子轮融资,本次由Race Capital领投。
Vectara提供了类ChatGPT对话式服务,用户可以将PDF、Word、PPT、RTF等文件数据上传至Vectara平台中,构建数据搜索引擎。例如,你上传了一份50页PDF的员工手册,然后通过对话框可以对整个内容进行提问,如新入职的员工需要遵守哪些规则?Vectara会根据上传的内容给出答案。
简单来说,Vectara的平台可以根据用户提供的数据语料库,快速通过语言模型embedding出独属用户的 “ChatGPT”,以节省大量开发时间。Vectara已经开源,地址:https://github.com/vectara/vectara-answer
目前,Vectara已经全面开放,注册即可使用。「AIGC开放社区」注册账号体验了一下,该平台简单、易用、生成内容效率高,非常适用于查看上百页PDF的文献资料,并且所有生成的内容都真实可靠。(免费体验地址:https://vectara.com/grounded-generation/)
AIGC开放社区申请的账号
前几天,一位律师通过ChatGPT协助办案被坑的事件风靡全球。纽约资深律师施瓦茨在提交的法庭文件中,使用了ChatGPT提供的6个类似裁决成功的案例,但其中很多都是假的让这位律师非常懊悔。
像这种事件并不少见,主要是因为ChatGPT在预训练过程中使用了很多“黑箱数据”,包括歧视、虚假、非法等内容,所以,会看到ChatGPT出现“胡说八道”的行为。
而Vectara只提供了类ChatGPT的容器,至于里面装的数据内容完全由用户自己决定,这保证了生成的内容100%正确,避免虚假内容的出现。事实上,很多大型企业例如,律商联讯、摩根大通、LG等,开始通过这种方式训练自己的类ChatGPT机器人,用于提升工作效率。
Vectara产品展示
产品方面,Vectara是基于大语言模型和布尔精确匹配的产品,可根据用户上传的文档数据结合上下文理解,提供与类ChatGPT类似的问答服务。支持中文、英文、韩文、西班牙、法语、德语等多国语言。
使用流程非常简单,简单4步就能完成。1)登录Vectara平台后,选择创建语料数据库。
2)为数据库起一个名字、描述和过滤器选项。其中,过滤器可以隐藏、过滤一些特定内容,使得生成内容更符合用户需求。
3)上传文档数据,用户可上传PDF、Word、PPT、RTF、txt、邮件等格式文档内容。
4)建立语料库后,通过对话框开始提问内容。例如,我能把医院账单记在税上吗?Vectara会根据用户上传的内容,自动生成答案。
需要注意的是,Vectara会生成一系列答案,对生成的内容进行评分,排名最高的会在前面并且会标注数据来源。
Vectara表示,对于用户上传的数据资料会保证其安全,不会用于训练模型。Vectara本身应用的大语言模型已经使用海量数据进行训练,可以理解不同类型数据以及提问输出的内容格式。
此外,Vectara会将每一位用户的语料库,使用不同的对称密钥保护和数据加密。会使用TLS对传输中的数据进行加密,甚至大型用户可以创建和管理自己的数据加密密钥。
目前,小型企业、个人用户可以免费使用Vectara的产品。如果大型企业需要特定业务场景,例如,法律、金融、保险等,Vectara可以提供量身定制服务。
本文素材来源Vectara官网,如有侵权请联系删除
END
「AIGC开放社区」ChatGPT对话机器人大合集,扫描二维码免费使用