Techniek

Hoe AI een consult verwerkt tot een dossiernotitie.

De belofte is eenvoudig: je praat, de AI schrijft. De werkelijkheid is een keten van stappen die allemaal goed moeten gaan voordat het resultaat bruikbaar is in een medisch dossier. Deze pagina legt die keten uit, inclusief waar het fout kan gaan.

Vijf stappenMet de arts in de lus
De pipeline

Van spraak naar SOEP

Vijf stappen, in dertig seconden, met menselijke goedkeuring als sluitstuk.

Pipeline van consult naar FHIR R401Consultaudio in02Transcriptiewhisper, NL03StructuurSOEP + ICPC04FR4FHIR R4HeyDoc HISVerwerking in Nederland · GCP europe-west4 · NEN 7510:2024

Stap 1: audio-opname

Alles begint met geluid. Een microfoon in de spreekkamer neemt het gesprek op. De kwaliteit van die opname bepaalt voor een groot deel de kwaliteit van alles daarna. Achtergrondgeluid, de afstand tot de microfoon, de manier waarop de patiënt praat, of de arts zacht spreekt: het maakt allemaal verschil.

Ik kijk naar dedicated microfoons die voor dit doel zijn ontwikkeld, en naar integratie met de hardware die al in een spreekkamer aanwezig is. Een smartphone werkt in principe ook, maar is gevoeliger voor variatie in audiokwaliteit.

Wat ik niet doe: de arts verplichten een specifiek apparaat te kopen als dat niet nodig is.

Stap 2: spraakherkenning

De audio gaat naar een spraakherkenningsmodel dat het omzet naar tekst. Dit is een technisch rijp gebied. De grote modellen presteren goed voor standaard Nederlands. Voor medisch Nederlands, met medicatienamen, ICPC-termen en afkortingen, is specifieke aandacht nodig.

Ik evalueer modellen op nauwkeurigheid voor medisch taalgebruik, verwerkingssnelheid, en de mogelijkheid om te verwerken zonder audio buiten Nederland te sturen. Dat laatste is geen nice-to-have: patiëntgesprekken zijn bijzondere persoonsgegevens en mogen niet zonder meer naar servers in de VS.

Het resultaat van deze stap is ruwe tekst: alles wat er gezegd is, inclusief de patiënt, inclusief “even wachten hoor, ik zoek het even op.”

Stap 3: structurering door een taalmodel

De ruwe transcriptie wordt aangeboden aan een groot taalmodel met de opdracht er een SOEP-notitie van te maken. Die opdracht is zorgvuldig geformuleerd: het model krijgt context over hoe een Nederlandse huisartsnotitie eruitziet, welke ICPC-structuur wordt verwacht, en wat de grenzen zijn van wat het mag invullen.

Het model kan goed overweg met duidelijke, gestructureerde consulten. Het heeft moeite met consulten die onduidelijk beginnen, met patiënten die moeilijk te volgen zijn, of met consulten waarbij de huisarts impliciet diagnostiseert zonder het hardop te zeggen. Die gevallen zijn ook de gevallen waarbij een menselijke transcribent moeite zou hebben.

Het resultaat is een conceptnotitie. Geen definitieve notitie.

Stap 4 · ICPC

Een suggestie, geen uitspraak.

Op basis van de conceptnotitie wordt een ICPC-code gesuggereerd. Het model matcht de probleemomschrijving aan de meest waarschijnlijke code. Aanvullende context — een relevante NHG-standaard, interacties met bekende medicatie — wordt aangeboden, niet opgelegd.

ICPC-hoofdstukken: voorgestelde codering door spreekuur.aiICPC-1 · NL · VOORSTELAAlgemeenBBloedDSpijsv.FOogHOorKCardioLBewegenNNeuroPPsycheRLuchtSHuidTEndoUUrineWZwschXVrouwYManZSoc.L72Distorsie enkel

Stap 5: beoordeling en committering door de arts

De arts ziet een conceptnotitie met een gesuggereerde ICPC-code. Hij leest, past aan waar nodig, en keurt goed. Pas dan wordt de notitie opgeslagen in het dossier.

Er is geen automatische opslag. Er is geen optie om die beoordelingsstap over te slaan. Dat is een bewuste keuze, niet een technische beperking die ik later nog wil weghalen.

De reden is simpel: een taalmodel hallucineert. Niet altijd, niet veel, maar het gebeurt. Een enkele fout in een medisch dossier kan consequenties hebben die jaren later zichtbaar worden. De arts blijft eindverantwoordelijk. Dat is niet alleen juridisch het geval, het is ook medisch-ethisch het enige verdedigbare standpunt.

Wat er mis kan gaan, en hoe ik daarmee omga

Slechte audiokwaliteit leidt tot een slechte transcriptie. Een slechte transcriptie leidt tot een slechte notitie. Ik werk aan herkenningsmechanismen die de arts waarschuwen als de audiokwaliteit onder een drempel zakt.

Een taalmodel kan iets invullen wat niet is gezegd. Dat noemen we hallucinatie. Ik evalueer modellen op hoe vaak dit voorkomt voor medische notities, en werk aan promptstrategieën die het risico verkleinen.

Privacy-incidenten zijn mogelijk als data de verkeerde kant op stroomt. Elk onderdeel van de technische keten wordt gekozen en geconfigureerd met AVG-compliance als harde eis, niet als bijzaak. Meer hierover op Beveiliging.

FAQ

Veelgestelde vragen

Hoe lang duurt de verwerking van een consult?
De verwachting is dat een standaard consult van tien minuten binnen dertig seconden na het einde van het gesprek een conceptnotitie oplevert. Dat is afhankelijk van de gekozen architectuur en het gebruikte model.
Kan het systeem ook overweg met dialecten of accenten?
Moderne spraakherkenningsmodellen zijn redelijk robuust voor accenten, maar er zijn grenzen. Sterk afwijkende uitspraken of zeldzame regionale dialecten geven meer fouten. Dat is een bekend en deels onopgelost probleem in de sector.
Wat gebeurt er als het model een fout maakt?
De arts ziet de conceptnotitie en kan corrigeren. Er is geen systeem dat fouten automatisch doorlaat. Maar: als de arts de notitie niet zorgvuldig leest, kan een fout worden goedgekeurd. Dat risico is reëel en de verantwoordelijkheid voor het eindresultaat ligt bij de arts.
Is het systeem offline te gebruiken?
Dat is technisch complex en afhankelijk van de keuze van spraakherkennings- en taalmodel. Lokale verwerking is privacyvriendelijker maar vergt meer rekenkracht aan de kant van de praktijk. Ik houd dit als optie open.
Werkt spreekuur.ai samen met alle HIS-systemen?
In eerste instantie alleen met HeyDoc via native FHIR R4-integratie. Koppeling met andere HIS-systemen via FHIR is in principe mogelijk maar staat niet op de korte termijn roadmap.