两小时之税:一位家庭医生对 AI 笔记的真实看法
来自我们一位早期试点医生的笔记,经其许可后编辑发表。——ActiveScribe 团队
每一项关于医生职业倦怠的研究中都会引用一个数字,正是这个数字最终让我开始认真看待 AI 临床助手。我每花一小时坐在患者面前,过去就要花大约两小时来记录这次就诊。其中一部分是在白天,在诊室之间、在另一位患者已经在等候的间隙完成的;但更多的,是夜里,在沙发上,在孩子们都睡着之后。医学文献给这种现象起了一个绰号——"睡衣时间"——我觉得这个说法既贴切,又令人愤怒。
我想诚实地写写在我开始在临床中使用 ActiveScribe 之后,什么变了,什么没变,因为诚实的版本比市场版本更有用。
变了的:诊室里的氛围
第一件变了的事情,不是文档,而是眼神交流。
我花了十一年训练自己,让自己能在患者讲述症状时同时在笔记本电脑上打字。我是擅长这件事的——我可以一边记录主诉,一边在恰当的时刻点头——但我每次就诊时都知道,自己是在同时把两件事做得不好,而不是专心把一件事做好。从我停止打字、只是倾听的那一天起,就诊以一种我没有计划过的方式变好了。患者告诉我更多。我捕捉到了原本会忽略的细节。我离开诊室时知道发生了什么。
单凭这一点就足以值回票价了。
变了的:那份笔记
ActiveScribe 实时转录就诊过程,并在患者走到走廊时就生成一份可供我审阅的 SOAP 笔记。这份笔记是我的风格——不是因为它在我的数据上训练过,而是因为我入驻时上传了几份我以前的笔记,系统把它们当作示例来对齐我的写作风格。我的 SOAP 看起来就像是我写的。缩写是我用的。小节标题是我用的。冗长(或简洁)也是我自己的。
这些笔记还有一个出乎我意料的功能:引用标记。生成笔记中的每一项陈述都附有一个小标记,我可以点击它,跳转到转录稿中患者说出这句话的确切位置。如果一份笔记写着"患者否认有自杀意念",我可以在两秒内核实患者确实在那个时刻、用那些原话说过这句话。仅这一项功能,就让我从"我有保留地信任它"变成了"我信任它"。
没变的:我的责任
这是每一个 AI 临床助手宣传中都被一笔带过的部分:我仍然会审阅每一份笔记。ActiveScribe 是快的——我才是医生。医师外科医生学院不会因为是 AI 生成了我的病历就免除我的责任。如果我签了字,那就是我的。如果它错了,那也是我的责任。
ActiveScribe 改变的,是我在病历上做的工作的类型。从前,我是凭记忆构建笔记,这意味着瓶颈在于我的回忆能力。现在,我是对着转录稿审阅一份草稿,这意味着瓶颈在于我的注意力。审阅确实比构建快得多——对我来说,大约快四倍。但它不是免费的,也不应该是免费的。
我见过同行匆匆扫一眼 AI 生成的笔记就点"批准",连读都没读。那是带额外步骤的医疗事故。这个工具并不能免除你的判断责任。它把你过去花在机械操作上的时间释放出来,让你可以把它花在判断上。
没变的:那些 AI 帮不上忙的就诊
有些就诊根本不适合 AI 临床助手。一位处于危机中的患者的复杂精神科评估,不是去想麦克风有没有把对话录进去的时刻。盆腔检查的时候,没有人希望录音还在跑。一位充满敌意、要求我把"任何在监听的东西"都收起来的患者,得到的就是一台合上的电脑和一支笔。
正确的视角不是"AI 临床助手取代写笔记"。而是"AI 临床助手是一件工具——它有用时我拿起来,没用时我放下"。
诚实的算账
我没有用科学的方法去测量"睡衣时间",但它已经下降到原来的大约 20%。我回到家就又是一个家长了。这才是真正重要的改变。职业倦怠不只关乎文档——它也关乎人手、患者数量、计费的复杂程度、值班,以及在一个并非为我们实际工作设计的系统中经营一家诊所所带来的缓慢消耗。AI 临床助手解决不了这些问题中的任何一个。
但它解决了文档这一部分。而对我来说,文档这一部分正是一份"我可以再做三十年"的工作和一份"我打算辞掉"的工作之间的差别。
我会对一位持怀疑态度的同行说什么
试用两周。挑选适合的就诊场景——常规复诊、健康婴儿就诊、慢性病管理。先不要选择难的。仔细阅读每一份笔记,不是因为这个工具会向你撒谎,而是因为你需要培养一种感觉,去理解它会以怎样的方式出错——就像你培养出对实验室数值会怎样出错的感觉一样。
如果它适合你,十次就诊之内你就会知道。如果不适合,就走开。试用的代价是一个周末的入驻时间。不去试的代价——如果它本来会适合你的话——是用你生命中的若干年来计算的。