GPT-4Turbo的股价预测、财务分析能力,比人类更好
添加书签专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!
芝加哥大学布斯商学院的研究人员在SSRN上发表了,一篇名为《Financial Statement Analysis with Large Language Models》的论文。
研究人员向OpenAI的GPT-4Turbo模型仅提供了标准化和匿名的财务数据,剔除了任何叙述性信息,并使用了一种“思维链”( Chain-of-Thought,简称“CoT”)的提问方式让其预测未来财务收益。结果显示,GPT-4Turbo的准确率高达60.35%,远高出人类专业分析师的53%。
研究人员还发现,GPT-4Turbo对预测小公司的股价能力更好,例如,基于GPT-4Turbo的股票投资策略,每年能获得超过12%的阿尔法收益和较高的夏普比率,轻松跑赢大盘基准。
这也就是说,如果使用特定的金融数据对GPT-4Turbo进行预训练、微调,用来选股票的能力会比基金经理、股票经纪人收益更高。
即便与同类型的专业金融模型相比也大幅度领先。看到这里,金融从业人员是不是手里一凉,感觉饭碗有点不保了呢~
论文地址:https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4835311
思维链提示方法
CoT提示是提升GPT-4Turbo金融预测能力的关键,也是本次实验的重要模块之一。
当人类在面对复杂问题时,通常会采取一种逐步分析的方法,将大问题分解为小问题,然后逐一解决。这种方法不仅帮助人类理解问题的各个方面,还有助于系统地探索更多的可能的解决方案。CoT便是借鉴了这个思想。
首先,CoT提示的第一步是让模型理解提供的财务报表。这包括识别报表中的关键项目,如收入、成本、资产、负债等,并理解这些项目的基本含义。这一阶段是整个分析过程的基础,为后续的深入分析奠定基础。
在理解了财务报表的基础上,CoT提示引导模型识别关键的财务趋势,例如收入增长、成本控制、资产增值等。通过识别这些趋势,模型能够捕捉到公司财务状况的变化,并为后续的分析提供重要的线索。
接下来,CoT提示要求模型计算和分析各种财务比率,如流动比率、债务比率、盈利能力比率等。这些比率提供了对公司财务状况更深入的洞察。通过计算这些比率,模型能够从不同的角度评估公司的财务表现。
在识别了趋势并计算了比率之后,CoT提示引导模型综合这些信息,形成对公司整体财务状况的评估。该阶段需要模型运用其分析能力,将分散的信息整合成一个连贯的评估。这不仅需要模型理解各个财务指标的含义,还需要模型能够将这些指标联系起来,形成一个全面的视角。
最后,基于对当前财务状况的分析,CoT提示要求模型预测公司未来收益的变化方向。这是财务分析的终极目标,也是投资者做出决策的关键依据。通过预测未来收益,模型能够为投资者提供重要的参考信息。
需要注意的是在分析的过程中,模型被要求生成叙述,解释它的分析过程和得出的结论。这些叙述对于理解模型的思考过程很重要。它们不仅帮助用户理解模型是如何得出结论的,还能够增加用户对模型预测的信任度。
GPT-4Turbo善于预测小公司股价
小型上市公司通常面临信息不对称问题、财务报告不详尽、市场关注度低,且容易受到个别事件的高度影响。
使得基于历史数据的传统模型,在预测小型公司股价变动时难以提供准确预测。而GPT-4Turbo每年却能取得超过超过12%的阿尔法收益和较高的夏普比率。研究人员认可,这是有以下几个原因。
综合分析能力强:GPT-4Turbo能够整合财务报表中的数字信息,并通过思维链提示模拟人类分析师的推理过程,生成有关公司未来表现的有用叙事。
这些叙事洞察不仅包含标准财务比率的计算,还有对这些比率背后业务状况的分析。这表明GPT-4Turbo不仅处理数据,还理解数据背后的业务逻辑,这对于解读小型公司的复杂情况很关键。
减少记忆依赖:尽管GPT-4Turbo的训练数据可能含有较多来自大公司的信息,但其在小公司预测上的优异表现挑战了认为其仅仅是基于记忆工作的观点。这表明GPT-4Turbo能够超越其训练数据的局限,展现出一定的泛化分析能力。
信息提取与整合分析:GPT-4Turbo能够从财务报表中提取的关键信息,并通过自动生成的叙述,揭示了公司未来业绩的潜在趋势。例如,模型频繁计算和提及的运营利润率、资产和库存周转效率以及流动比率等,显示了它对财务健康指标的关注与理解。
测试数据与方法
为了确保分析的准确性和模型训练的有效性,研究人员使用了Compustat数据库中1968年至2021年间的财务数据。
为了进一步保证大模型的公正性和避免潜在的记忆偏差,研究人员对财务报表进行了匿名化和标准化处理,去除了所有可能识别公司身份的信息。
这一步非常重要,保证了模型的预测不是基于对特定公司的先验知识,而是基于财务数据本身的分析。
研究人员认为,GPT-4Turbo等大模型可以辅助金融专业人员分析那些,信息不透明度高、数据稀缺的金融数据,可有效提升业务的收益并增强整合、分析数据的能力。
本文素材来源芝加哥大学布斯商学院论文,如有侵权请联系删除
END
本篇文章来源于微信公众号: AIGC开放社区