ChatGPT应用专题研究:ChatGPT投资相关插件测试及策略开发
(报告出品方/作者:方正证券,曹春晓、邓璐)
1 引言
2023 年 5 月 13 日,OpenAI 宣布对其 ChatGPT Plus 用户推出网络浏览及插件功 能。此次更新为 ChatGPT Plus 用户带来了巨大的变革,用户可以通过网络浏览 功能获取最新的信息,不再局限于处理到 2021 年为止的数据。此外,Plus 用户 可以通过插件功能与现有平台进行集成,可以访问如 Expedia,Kayak 和 Instacart 等网络服务的第三方插件,也可以指示 ChatGPT 在特定网站上执行任 务。 ChatGPT 的第三方插件推出速度较快,截至 2023 年 6 月 13 日,已经有 385 个插 件应用上线,同时 OpenAI 也在不断改善插件的使用体验,如目前已提供了插件 的检索功能,方便用户快速找到所需要的插件。
2 部分办公应用类插件介绍
2.1 Wolfram
Wolfram 插件是由科学计算软件开发商Wolfram Research 公司开发的应用插 件。Wolfram Research 是一家全球知名的科学和技术公司,其产品包括 Mathematica、Wolfram Alpha、Wolfram Language 等。其中 Mathematica 是一 款强大的数学软件,被广泛用于科学、工程、数学和计算领域。它提供了一种 统一的接口,可以进行符号计算、数值计算、数据可视化和编程等多种任务。 Wolfram Alpha 是一个在线的计算知识引擎,可以理解自然语言输入,对各种问 题进行计算和回答。它的知识库包括了数学、物理、化学、生物、地理、历史 等多个领域。Wolfram 插件可以使用 Wolfram Alpha 和 Wolfram Cloud 的强大计 算和数据查询能力,为用户提供数学计算、物理、化学、生物、地理、历史等 不同领域的知识,同时也可以实现数据可视化和生成图像。Wolfram 插件的接入 大大弥补了 ChatGPT 本身在数学运算等方面的不足。
Wolfram 插件大幅提升了 ChatGPT 在知识储备方面的能力,但并非所有的数学 计算都能准确完成。对于复杂度较高的数学问题,仍然需要通过其他途径解 决。
2.2 AskYourPDF & ChatWithPDF
AskYourPDF 插件设计用于从 PDF 文档中快速提取信息。它通过接受用户提供的 PDF URL 链接或文档 ID(doc_id)来工作。如果提供了 URL,插件会首先验证它 是否是正确的 URL。验证 URL 后,插件将会下载 PDF 并将其内容存储在向量数据 库中。如果用户提供了 doc_id,则直接从数据库中检索文档。然后,插件扫描 存储的 PDF,找到用户查询的答案或检索特定细节。 ChatWithPDF 插件允许用户加载和查询 PDF 文档或 Google Drive 文档。用户必 须首先提供一个 PDF URL 进行处理。一旦 PDF 加载,用户可以查询、分析或提 出问题,无需每次都指定 PDF 名称。 这两个插件从功能来看相似度比较高,都可以解析读取 PDF 文件,并且交互提 问,但首先必须是公开可获得的 URL 链接,因此我们测试将宁德时代 2022 年年 报 PDF 文档上传至 tmpfiles.org,并测试二者的使用效果(tmpfiles.org 上传 文件后创建的是临时 URL,将在 60 分钟后失效,以下链接为测试链接)。
从测试结果来看,ChatWithPDF 在解析 PDF 文件时遇到了问题,给出的回复存在 明显的数据错误,而 AskYourPDF 插件能精确提取财报信息并给出了准确的数据 总结。此外,AskYourPDF 也能较好的完成一定的内容整合和分析任务。
AskYourPDF 与 ChatWithPDF 是最早上线的两款处理 PDF 文本的插件应用,后续 陆续上线了多款含有类似功能的插件,不同的 PDF 文档处理插件有不同的优势 和应用场景,用户可以根据自己的需求选择合适的插件来完成特定任务。
2.3 WebPilo
t WebPilot 是一个用于访问和交互网页的工具。通过这个插件,ChatGPT 可以访 问指定的网页链接,获取网页的内容,然后根据用户的需求进行处理,例如提 取特定的信息,重写内容,翻译等。
除浏览网页检索信息外,还可以使用 WebPilot 插件处理公开的 PDF 链接等,我 们以近期热度较高的论文《Can ChatGPT Forecast Stock Price Movements? Return Predictability and Large Language Models》为例,尝试通过 WebPilot 插件来总结论文信息并交互。
3 金融市场相关插件测试对比
3.1 PortfolioPilot
PortfolioPilot 是最早上线的一批插件之一,也是第一个上线的组合管理相关 的插件。该插件是由 Global Predictions 公司开发的 AI 驱动的投资指导工 具。它可以提供全面的投资组合评估,个性化的投资组合建议,以及获取关于各种证券(如 ETFs,股票,加密货币,债券和共同基金)的最新信息。此外, 它还可以提供有关宏观经济趋势的信息。 我们以组合评估为例,输入一个特定的资产组合,PortfolioPilot 可以帮我们 分析该组合的预期收益、行业及国家暴露情况、潜在风险以及对应的改进方案 等等。
其中,全球预测模型是 Global Predictions 公司开发的 AI 模型,该模型使用 了一种复杂的机器学习方法来预测证券的预期收益和风险。这种方法结合了大 量的数据,包括宏观经济数据、公司财务数据、市场数据和新闻情绪等,以生 成对未来收益和风险的预测。其结果是否可信需要投资者自行评估或进行更为 深入的了解,不过该插件确实可以解决普通投资者在实际投资过程中遇到的一 些问题,对于将来国产大模型的应用落地可以提供一定的参考。此外,由于数 据限制,目前无法提取和处理 A 股相关的证券信息。
3.2 Boolio Invest
Boolio Invest 是一个基于定量方法进行分析的全球股票价值分析工具,可以帮 助用户获取特定国家和股票的详细信息。Boolio 插件的主要功能是通过 "postApiStockSummary"方法,提供给定国家和股票的摘要信息。插件返回的信 息包括当前价格、历史价格、市值、交易量、股息等。该插件目前可以获取 A 股上市公司的股票信息和分析结果。不过该插件不支持以组合的形式进行交互 和信息提取,如想获取大量股票的信息较为困难。
从反馈的信息来看,Boolio Invest 插件不仅提供了基础的公司信息、财务信 息、价格信息及风险信息等,同时也提供了不同定量模型给出的评分情况,然 而与 PortfolioPilot 插件类似,这些定量模型的开发细节等均未提供,对于其 结果的可信度如何,还需要投资者更深入的了解其策略细节,方可应用。
3.3 PortfoliosLab
PortfoliosLab 是一个用于分析股票、ETFs、基金、加密货币等的工具。它可以 提供历史性能、波动性、风险指标、夏普比率、最大回撤等详细信息。我们以 Vanguard Total Stock Market ETF 和 Vanguard S&P 500 ETF 为例,通过 PortfoliosLab 提取两只产品相应的数据信息。从数据覆盖角度来看, PortfoliosLab 也无法提取 A 股上市公司或基金产品的信息。
以上三个插件有一定的相似性,但也有较大的区别,我们综合对 比了 PortfolioPilot、PortfoliosLab 和 Boolio Invest 三个插件的功能区 别,可以看到,PortfolioPilot 除了无法提供全球股票价值分析外,其他方面 的功能性在三个插件中是最为完善的,相较而言具有明显优势。但不同的插件 都有各自不同的应用场景,用户可以根据特定的需求选择使用不同的插件,以 更好的实现目标。
4 使用 Noteable 插件完成复杂投资策略开发
在报告《ChatGPT 在择时、风格、行业、选股中的应用实践——ChatGPT 应用探 讨系列之二》中我们曾利用 ChatGPT 的编程能力实现了部分投资策略,不过基 于 ChatGPT 聊天窗生成的代码无法直接运行,需要将代码复制到本地运行及调 试。Noteable 插件的上线大大降低了投资者建立复杂模型的难度。Noteable 插 件允许用户在聊天界面中直接创建、编辑和运行 Jupyter 笔记本。这个插件提 供了一种新的、交互式的方式来进行数据分析和机器学习的工作,无需离开聊 天界面。具体来看,该插件具有以下功能:
1)创建和编辑笔记本:用户可以创建新的 Jupyter 笔记本,并在其中添加和编 辑代码、Markdown 或 SQL 单元。这使得用户可以在一个统一的环境中进行编程 和文档编写。 2)运行代码:用户可以运行笔记本中的代码单元,并在聊天界面中看到结果。 这使得用户可以快速地进行实验和调试。 3)管理项目和文件:用户可以创建和管理项目,每个项目可以包含多个笔记本 和数据文件。用户还可以查看项目中的文件列表,以及每个文件的详细信息。 4)数据源管理:用户可以查看和管理笔记本的数据源,这使得用户可以方便地 进行数据分析和机器学习任务。 5)内核管理:用户可以查看和管理他们的内核会话,包括启动和关闭内核。 6)用户信息管理:用户可以查看他们的 Noteable 账户信息,这对于调试权限 问题非常有用。 这些功能都是通过 Noteable 插件的各种命令来实现的,用户可以在聊天界面 中直接输入这些命令来使用这些功能。
4.1 使用 Noteable 插件实现数据下载及可视化分析
我们首先通过 Noteable 插件实现对纳斯达克指数最近一年的表现进行 EDA 数据 分析。
除了通过 API 接口下载数据外,我们还可以将本地的数据上传至 Noteable 平 台,再通过 ChatGPT 来完成策略的开发和实现。需要注意的是目前 Noteable 平 台只能上传 25 个文件,且每个文件不超过 100M,对于更大规模的数据,可以将 数据上传到 Noteable 支持的云存储服务,如 Amazon S3,Google Cloud Storage,Azure Blob Storage 等。然后在 Noteable 中配置数据源以访问这些 数据。或者如果数据存储在数据库中,如 MySQL,PostgreSQL,MongoDB 等,也 可以在 Noteable 中配置数据库连接。这将允许直接从 Noteable 查询和处理数 据库中的数据,大幅提升了数据处理效率。
4.2 使用 Noteable 插件构建机器学习择时模型
通过 Noteable 插件可以实现大量模型的开发和测试,我们以择时策略为例,通 过 Noteable 来构建一个 LTSM 模型对沪深 300 指数的择时策略。
4.3 使用 Noteable 插件训练财务造假预测模型
接下来我们通过 Noteable 插件完成一个简单的财务造假预测模型的训练。为此 我们需要首先准备基础数据,我们的造假样本为 2002 年之后,A 股市场被中国 证监会、沪深两市交易所公开确定为财务造假的上市公司。剔除 IPO 之前以及 新股上市当年造假的数据,对于同一家上市公司连续多个年度造假的数据,仅 保留其首次造假年份作为研究数据。此外,我们采用控制样本匹配法,选取造 假样本当年同行业所在的上市公司(剔除被证监会、交易所处罚的公司)作为 对照样本。 在特征指标筛选方面,我们结合公司参与年报财务造假的动机、常见的手段, 重点以财务指标为研究对象,整理了包括审计师意见、前一年度是否亏损、前 五大股东占比、应收账款占流动资产比例、预付款项占流动资产比例、其他应 收款占流动资产比例等一系列指标作为特征指标来训练模型。由于财务造假研 究在学术界以及业界已有较多的研究和应用,本文中我们不做过多赘述,直接 通过 Noteable 插件来训练模型。
从上述训练结果来看,模型的准确率较高,但精确率、召回率、F 值等指标相对 较低,这与样本分布有较大关系,我们可以继续与 ChatGPT 交互完成模型的改 进和优化,此处不再赘述。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
精选报告来源:【未来智库】。「链接」