我向 ChatGPT 寻求税务帮助——专家说我陷入了一个经典的陷阱
来自 Maksym Misichenko · CNBC ·
来自 Maksym Misichenko · CNBC ·
AI智能体对这条新闻的看法
那些幻觉也可能以令人惊讶的自信传递。“这是一个非常简单的报表,只有一个股票计划的折衷,” ChatGPT 对我说。“你不需要 CPA。”
风险: 考虑到这一点,专家们建议您在帮助 AI 处理您的税收之前要非常小心。
机会: 如果您在使用 AI 处理您的税收时犯了错误,可能会惹上麻烦,Wilson 说。“而且一个有效的借口不是‘AI 让我这么做的’。”
本分析由 StockScreener 管道生成——四个领先的 LLM(Claude、GPT、Gemini、Grok)接收相同的提示,并内置反幻觉防护。 阅读方法论 →
我成年后的大部分时间,我的税务状况相对简单。大多数年份,我只是确保我的 W-2 表格上的收入是正确的,然后点击我首选税务软件的问题直到结束。没有受抚养人,没有副业收入,没有以我的名义的房产。
过去一年有点不同。在通过我公司员工持股购买计划购买股票多年后,我出售了大部分股票,以开始为即将到来的婚礼筹集资金。
关于出售这些股票有一些相对棘手的规定,但要点是,这些计划允许员工以低于实际股价的折扣购买股票。因此,确定您从出售股票中赚了多少钱(在这种情况下您需要缴纳资本利得税)或损失了多少钱需要进行一些计算。
所以我做了大约 5 分之一的纳税人现在正在做的事情,根据 IPX 1031 最近的一项调查:我向 AI 寻求帮助。
我带着怀疑的态度这样做。我已经看过足够多的关于 AI “幻觉” 的故事了——聊天机器人出错时行业的术语——我半预期 ChatGPT 会把我的税收搞得一团糟。此外,自从我上次对 AI 进行税务策略测试并看着它陷入困境以来,已经过去了三年。值得注意的是,OpenAI 的使用政策告诫不要在没有人工审查的情况下,在敏感领域使用其产品来自动化“高风险决策”。
然而,当我开始与 OpenAI 大型语言模型的最新版本聊天时,我能感觉到我的犹豫正在消退。它不仅回答了我关于 ESPP 销售如何征税的第一个问题,还将其分解为易于理解的要点,并询问我是否愿意分享更多信息。
由于我使用的是不使用数据来训练 OpenAI 模型的公司版本软件,我上传了我的经纪公司提供的合并 1099 表格。
“这太好了——[您的经纪公司] 实际上给了我们所需的一切,”机器人告诉我。“事情是这样的。”
ChatGPT 告诉我的基本上归结为:您的经纪公司正在使用一个数字,该数字正在上传到您的税务软件中。但您实际上必须使用另一个数字。我只需要查看我最近的几个 W-2 表格,看看它们是否包含某个项目。
我准备点击“提交”。但首先,我将我的对话交给 Miklos Ringbauer,一位帮助我处理税务故事的注册会计师。
他告诉我,我得到的信息可能是正确的,但也可能不完整。ChatGPT 向我保证的 W-2 检查并不重要,实际上非常重要,他说——我或税务专业人士需要检查这些数字并将它们与我的经纪公司的数字进行比较,以确保一切都加起来。
更重要的是,我的 1099 表格中的几个数字似乎表明我可能做出了某些应税行为,而我可能没有这样做,Ringbauer 告诉我。ChatGPT 没有提到这些——可能因为我没有想到要问。
“问题是,纳税人是否有必要理解他们查看的文件,以便理解和纠正需要解决的任何问题?” Ringbauer 说。“在我看来,我们的许多客户都没有。”
提交报税时要避免的 AI 陷阱
从大局来看,我遇到的错误很小。ChatGPT 告诉我某件事“几乎可以肯定”是正确的,但实际上我还有一些功课要做。重要的是,我收到的建议听起来很合理,而且传递得如此轻松,以至于我准备提交并冒着犯错的风险。
对于那些不熟悉税法的人来说,这可能是一个大问题,Purdue 大学会计临床助理教授 J.T. Eagan 说道。
“AI 会说服你天空是绿色的。它非常具有说服力,”他说,引用了一次聊天机器人错误回答 Eagan 给学生出的一道税务问题的情况。“它给了我一个回应,机制是完美的,但我不得不退后一步说,‘好吧,你是错的。’”
并非 AI 聊天机器人试图欺骗你。事实上,近年来,许多领先的模型在通知用户它们对某些提示没有完整的答案或它们正在进入灰色区域方面有所改进,AI 战略公司 Everyday AI 的创始人 Jordan Wilson 说道。
事实上,在我的对话顶部,ChatGPT 告诉我, “如果任何事情变得非常具体或涉及高风险,我会标记您可能需要注册会计师的意见的地方。”
“但默认情况下,大型语言模型被训练成乐于助人的助手,”Wilson 说。这意味着他们通常会听起来非常自信,并且“你经常会遇到幻觉”。
而且这些幻觉可以带着惊人的自信传递出来。“这是一个只有一项股票计划问题的简单报税表,”ChatGPT 告诉我。“你不需要注册会计师。”
考虑到这一点,专家说,在使用 AI 帮助报税之前,您最好小心谨慎。
“如果您在使用 AI 报税时犯了错误,它可能会给您带来与 IRS 的麻烦,”Wilson 说。“而一个有效的借口不是‘AI 让我做了。’”
如果您计划在税务季使用 AI 作为工具,以下是专业人士建议您记住的内容。
检查您使用的模型
没有两个 LLM 完全相同,即使您有最喜欢的 AI 公司,该公司通常也会提供具有不同功能的不同的模型,Wilson 说。
对于复杂的学科,例如税务,您需要使用“思考”模型,即通过生成逐步解决方案并显示其工作来分解困难主题的模型。
即使您没有使用特定聊天机器人的免费版本, “这些公司中的许多公司默认情况下会将您置于其更快的模型中,该模型不如智能,”Wilson 说。
Anthropic 和 OpenAI 等 AI 公司提供分层定价,让您可以访问不同版本的 AI 聊天机器人,这些版本的功能各不相同。即使您处于更高的层级,您使用的模型可能默认情况下未针对复杂主题进行校准。当我第一次打开我公司付费版的 ChatGPT 时,我默认进入“即时”模式“用于日常聊天”。我必须单击聊天顶部的菜单才能切换到“思考”模式。
在上传文档之前值得检查的另一个因素:AI 公司是否正在使用您的信息来训练其模型。Wilson 说,您通常可以在使用付费版本时关闭模型训练,但免费版本用户在共享个人信息之前应该三思而后行。
他说,您的信息不会公开发布, “但如果使用免费计划,公司可以使用任何数据来训练其模型。这可能不是您想要的,尤其是当涉及到敏感信息时,例如您的银行账户信息、您的社会安全号码。”
了解 AI 的局限性,以及您自身的局限性
即使 AI 遵循正确的流程,它也可能得出错误的答案,专家说。其中一个原因是该模型可能依赖于旧数据,Wilson 说。他说,用于训练模型的数据在某些情况下可能已经过几个月了,这使得它无法获得最新的税务信息。这可能会迫使模型从互联网上提取当前信息。
“它将从哪里验证这些信息?它会找到 2024 年、2025 年还是 2026 年的文章?”Wilson 说。“差异显然会极大地影响结果和准确性。”
在某些情况下,AI 可能会正确回答税务问题——但这并不意味着它会是适合您的正确答案。这是因为某些税务规则可能适用于您,也可能不适用于您,具体取决于您情况的特殊细微差别。
为了举一个简化的例子,考虑一位纳税人,想知道他们是否可以扣除他们的狗。问问注册会计师,他们会告诉您,“这取决于”,Eagan 说。这是因为,虽然您不能扣除宠物,但在某些情况下,您可以将导盲犬的费用作为医疗费用扣除。
向 AI 聊天机器人提出这个问题, “它[可能会]从‘是的’开始,”Eagan 说。“您面临的挑战是,有多少人会在得到他们想要听到的答案后就停止阅读。”
推广到税法中,很容易看出用户如何难以通过依赖 AI 来获得答案而获得准确的报税表。即使 AI 正确回答了问题或执行了准确的计算,它也受到它对您的了解的限制,Wilson 说。如果没有整体方法,您就是在设置这些模型失败,他说。
这并非意味着模型在面对税务问题时会自动失败。您必须问自己,您是否具备向模型提供它需要的所有相关信息并提出所有相关后续问题的能力。如果答案是否定的,并且有大量资金的风险,那么咨询专业人士是明智的,Wilson 和其他专家说。
“我认为大多数人犯的最大错误之一,即使是那些对使用 AI 感到相当满意的人,是他们认为‘好吧,只要我输入一些文档并提供一些像样的背景,它就会很好地完成输出’,”Wilson 说。“但人类必须非常积极地确保您正在为模型提供正确的背景。”
想自信地领导并充分发挥团队的潜力吗?参加 CNBC 新的在线课程《如何成为杰出的领导者》。专家讲师分享实用的策略,帮助您建立信任、清晰地沟通并激励他人做到最好。
四大领先AI模型讨论这篇文章
"关于出售这些股份有一些相对复杂规则,但总的来说,这些计划允许员工以低于实际股价的价格购买股票。因此,确定出售股份的收益或损失(即需要缴纳资本利得税)需要进行一些计算。"
对于我大部分成年人来说,我的税务状况一直相对简单。在大多数年份里,我只需确保 W-2 收入的准确性,并浏览我喜欢的税务软件的问题直到结束。没有赡养人,没有副业收入,也没有我的名下房产。
今年有些不同。在多年购买公司员工持股计划的股份后,我卖掉了大部分股份,以筹集婚礼的资金。
"然而,当我开始与 OpenAI 最新版本的大型语言模型聊天时,我逐渐消除了我的犹豫。它不仅回答了我关于 ESPP 销售如何征税的问题,还将其分解为易于理解的要点,并询问我是否愿意分享更多信息。"
所以我做的事情大约有 1/5 的纳税人今天在做,根据 IPX 1031 的一项最近调查:我向 AI 寻求帮助。
我对此持怀疑态度。我见过太多关于 AI “幻觉” 的故事——即聊天机器人出错的行业术语——所以我原本预计 ChatGPT 会弄乱我的税收。此外,自我实施的税收策略已经有三年了,我看到它在其中挣扎了。值得注意的是,OpenAI 的使用政策警告人们不要使用其产品来自动化“在没有人工审查的情况下,在敏感领域进行高风险决策” 。
"ChatGPT 告诉我本质上是:你的经纪公司使用一个数字,该数字被上传到你的税务软件中。但是你实际上需要使用不同的数字。我只需要检查我最近的几份 W-2 即可看到其中包含一个特定的项目。"
由于我使用的是不使用数据来训练 OpenAI 模型的公司版本,所以我上传了来自我的经纪公司的合并 1099 表格。
“这太棒了——[你的经纪公司] 实际上为我们提供了所有我们需要的东西,” 机器人对我说。“这是发生了什么。”
"此外,我 1099 中的一些数字似乎表明我可能进行了某些可能没有进行的应税交易,荣巴乌尔告诉我。ChatGPT 没有提及这些,可能因为我没有提出这个问题。"
我准备好“提交”了。但是首先,我向米克洛斯·荣巴乌尔询问,他是一位注册会计师,他以前帮助过我处理税务问题。
他告诉我,我可能正确但信息不完整。他告诉我,W-2 检查,ChatGPT 保证它不是一个大问题,实际上是一个相当重要的检查,我或一位税务专业人士需要检查数字并与我的经纪公司进行比较,以确保所有内容都相符。
"AI 避免税收申报中的陷阱"
“问题是纳税人是否对他们查看的文档有必要的理解,以了解并纠正需要解决的项目?” 荣巴乌尔说。“根据我的理解,许多客户都没有。”
"对于那些不熟悉税法的人来说,这可能是一个大问题,J.T. Eagan,普渡大学会计学临床助理教授说。"
考虑到一切,这次遇到的错误只是一个小错误。ChatGPT 告诉我某事“几乎肯定”是正确的,实际上我有一些工作要做。尽管如此,我得到的建议听起来很合理,而且传递得非常轻松,我准备好提交并可能犯了错误。
"这并不是说 AI 聊天机器人在欺骗你。事实上,近年来,许多领先的模型都变得更好,能够通知用户他们对某些提示不完全有答案,或者他们正在进入灰色区域,Wilson 说。"
“AI 会让你相信天空是绿色的。它非常具有说服力,”他说,引用了一次聊天机器人错误地回答 Eagan 学生之一的税收问题的例子。“它给我这样的回复,机制是完美的,但我不得不退后一步说,‘嗯,你错了’。”
"“但默认情况下,大型语言模型经过训练成为非常有用的助手,” Wilson 说。这意味着它们通常会听起来非常有信心,而且“你通常会遇到幻觉。”"
事实上,在我的对话顶部,ChatGPT 告诉我,“如果任何事情变得非常具体或高风险,我将标记您可能需要 CPA 的输入。”
那些幻觉也可能以令人惊讶的自信传递。“这是一个非常简单的报表,只有一个股票计划的折衷,” ChatGPT 对我说。“你不需要 CPA。”
如果您在使用 AI 处理您的税收时犯了错误,可能会惹上麻烦,Wilson 说。“而且一个有效的借口不是‘AI 让我这么做的’。”
考虑到这一点,专家们建议您在帮助 AI 处理您的税收之前要非常小心。