Notes d'une médecin participant à notre programme pilote, révisées et publiées avec sa permission. — L'équipe ActiveScribe

Quand les premiers fournisseurs d'assistants cliniques par IA ont commencé à se présenter aux congrès, j'ai fait ce que la plupart de mes collègues faisaient : j'ai hoché la tête poliment, j'ai pris la brochure, et je l'ai jetée dans le stationnement. J'étais médecin de famille en Ontario depuis onze ans. J'avais vu les télécopieurs de l'OHIP survivre à trois migrations de DME. Je n'allais certainement pas confier l'enregistrement d'une crise de santé mentale d'un patient à une jeune entreprise de la Silicon Valley dont la page de confidentialité contenait une faute de frappe dans le mot « chiffrement ».

Ce qui a changé pour moi, ce n'est pas un argumentaire de vente. C'est une liste de vérification.

Je me suis assise un week-end et j'ai écrit, en termes clairs, les questions auxquelles j'aurais besoin de réponses avant de laisser un quelconque outil écouter une de mes consultations. Pas les questions marketing (« Est-ce sécuritaire ? ») — celles dont la réponse est soit un fait technique précis, soit une tactique d'évitement. Je veux passer en revue cette liste ici, et ce que j'ai appris en la parcourant avec l'équipe qui a bâti ActiveScribe.

Où, exactement, va l'audio ?

C'est la première question, et la plupart des fournisseurs deviennent visiblement mal à l'aise. La réponse honnête pour ActiveScribe : quand j'appuie sur enregistrer dans mon navigateur, l'audio est capté à 48 kHz, sous-échantillonné à 16 kHz sur mon appareil, et acheminé par un WebSocket chiffré jusqu'à leur serveur dorsal dans AWS ca-central-1 — Montréal. De là, il est confié à Deepgram (leur fournisseur de transcription vocale), et le texte résultant est envoyé à AWS Bedrock, qui exécute les modèles Claude d'Anthropic pour générer la note.

Ce qui comptait pour moi ici, ce n'était pas qu'ils utilisaient l'infonuagique — c'est qu'ils pouvaient me dire quel infonuagique, dans quelle région, opéré par quelle entreprise, à quelle étape. Les fournisseurs qui ne peuvent pas vous dessiner ce schéma sur une serviette de table ne devraient pas toucher à des données de patients.

Qu'est-ce qui est conservé, et qu'est-ce qui est jeté ?

C'est ici qu'ActiveScribe a répondu à une question que je ne savais même pas que je devais poser. Leur contrat avec Deepgram contient une clause de rétention nulle des données : l'audio que je leur envoie n'est pas conservé, n'est pas utilisé pour entraîner le modèle de qui que ce soit, et ne survit pas à l'appel d'API qui a produit la transcription. Du côté d'AWS Bedrock, c'est la même chose — les modèles d'Anthropic sur Bedrock ne s'entraînent pas sur les données d'inférence.

Le fichier audio lui-même, du côté d'ActiveScribe, est chiffré sur mon appareil avec AES-256 avant de quitter mon navigateur, et la clé est encapsulée avec leurs clés KMS dans AWS. La transcription et la note sont stockées dans leur base de données avec un chiffrement au niveau du champ — pas au niveau de la ligne, pas au niveau de la table, mais au niveau du champ, sur chaque colonne contenant des renseignements sur les patients.

Je leur ai demandé ce qui se passe si un développeur de leur entreprise exécute SELECT * FROM encounters. La réponse est « ils obtiennent du texte chiffré ». C'est la bonne réponse.

Puis-je vraiment voir qui a touché à mes données ?

Le journal d'audit est le test qui distingue les fournisseurs sérieux des autres. Chaque action sur une consultation — visualisation, modification, exportation, suppression — est enregistrée avec l'identifiant d'utilisateur, l'horodatage et le type d'action. En tant que clinicienne, je peux extraire cet historique pour n'importe quelle note. En tant que régulateur, je pourrais (en principe) poser les mêmes questions et obtenir les mêmes réponses.

Ce qui m'importait, ce n'était pas que le journal d'audit existe dans une brochure. C'était que je puisse le voir.

La promesse de « pas d'entraînement »

Tous les fournisseurs d'IA promettent en ce moment qu'ils n'entraîneront pas leurs modèles sur vos données. La promesse vaut exactement ce que vaut le contrat qui la soutient. La promesse d'ActiveScribe est appliquée de deux façons : l'entente d'associé commercial (BAA) avec Deepgram (rétention nulle, pas d'entraînement), et l'invocation BAA-éligible des modèles Bedrock (pas d'entraînement sur les données d'inférence). Il n'existe aucun scénario, dans leur architecture, où l'audio de mon patient se retrouve dans le modèle de prochaine génération de quelqu'un. Ce n'est pas une affirmation marketing — c'est une affirmation contractuelle, et j'ai demandé à voir les clauses pertinentes avant de m'inscrire.

Ce que je ne comprends toujours pas (et c'est correct)

Je suis médecin, pas ingénieure en sécurité. Il y a des parties de cette pile technique que je ne comprendrai jamais complètement — chiffrement par enveloppe KMS, consommateurs de flux Redis, mandataires de base de données authentifiés par IAM. Je n'ai pas besoin de les comprendre. Ce dont j'ai besoin, c'est que l'équipe qui bâtit l'outil soit capable de les expliquer à quelqu'un qui les comprend, et d'appuyer ces explications avec de vrais fichiers de configuration que je pourrais demander à un tiers d'auditer.

L'équipe qui bâtit ActiveScribe est certifiée ISO/IEC 27001:2022, ce qui signifie que des auditeurs indépendants ont fait exactement cela. Cela ne rend pas l'outil parfait. Cela signifie qu'il ne s'agit pas d'un gars avec une carte de crédit et un compte Vercel.

Ce que je dirais à un autre médecin

Ne demandez pas aux fournisseurs s'ils sont « sécuritaires ». Demandez-leur où va l'audio, ce qui est conservé, qui y a accès et comment vous sauriez si quelque chose tournait mal. Les réponses devraient être précises et tenir sur une seule feuille de papier. Si un fournisseur ne peut pas vous dire exactement quels sous-traitants touchent à la voix de votre patient, partez.

Personne ne me paie pour écrire ceci. Je suis médecin de famille dans une province où mon collège régulateur peut suspendre mon permis si je me trompe sur ce sujet. J'ai choisi l'outil dont les ingénieurs étaient prêts à s'asseoir à un appel et à répondre aux questions ennuyeuses.

Bâtir une IA axée sur la confidentialité pour les soins de santé : ce qui m'a vraiment convaincue