Hoe lang duurt de verwerking van een consult?

De verwachting is dat een consult van tien minuten binnen dertig seconden na het einde een conceptnotitie oplevert, afhankelijk van de gekozen architectuur.

Kan het systeem ook overweg met dialecten of accenten?

Moderne modellen zijn redelijk robuust voor accenten, maar sterk afwijkende uitspraken geven meer fouten. Dat is een bekend en deels onopgelost probleem in de sector.

Wat gebeurt er als het model een fout maakt?

De arts ziet altijd eerst een conceptnotitie en kan corrigeren voor committering. Er is geen automatische opslag. De eindverantwoordelijkheid ligt bij de behandelend arts.

Is het systeem offline te gebruiken?

Lokale verwerking is technisch complex maar privacyvriendelijker. Ik houd dit als optie open, afhankelijk van de gekozen modellen en infrastructuur.

Werkt spreekuur.ai samen met alle HIS-systemen?

In eerste instantie alleen met HeyDoc via native FHIR R4-integratie. Koppeling met andere systemen via FHIR is mogelijk maar staat niet op de korte termijn roadmap.

Van spraak naar notitie in het huisartsenconsult

De pipeline

Van spraak naar SOEP

Vijf stappen, in dertig seconden, met menselijke goedkeuring als sluitstuk.

Stap 1: audio-opname

Alles begint met geluid. Een microfoon in de spreekkamer neemt het gesprek op. De kwaliteit van die opname bepaalt voor een groot deel de kwaliteit van alles daarna. Achtergrondgeluid, de afstand tot de microfoon, de manier waarop de patiënt praat, of de arts zacht spreekt: het maakt allemaal verschil.

Ik kijk naar dedicated microfoons die voor dit doel zijn ontwikkeld, en naar integratie met de hardware die al in een spreekkamer aanwezig is. Een smartphone werkt in principe ook, maar is gevoeliger voor variatie in audiokwaliteit.

Wat ik niet doe: de arts verplichten een specifiek apparaat te kopen als dat niet nodig is.

Stap 2: spraakherkenning

De audio gaat naar een spraakherkenningsmodel dat het omzet naar tekst. Dit is een technisch rijp gebied. De grote modellen presteren goed voor standaard Nederlands. Voor medisch Nederlands, met medicatienamen, ICPC-termen en afkortingen, is specifieke aandacht nodig.

Ik evalueer modellen op nauwkeurigheid voor medisch taalgebruik, verwerkingssnelheid, en de mogelijkheid om te verwerken zonder audio buiten Nederland te sturen. Dat laatste is geen nice-to-have: patiëntgesprekken zijn bijzondere persoonsgegevens en mogen niet zonder meer naar servers in de VS.

Het resultaat van deze stap is ruwe tekst: alles wat er gezegd is, inclusief de patiënt, inclusief “even wachten hoor, ik zoek het even op.”

Stap 3: structurering door een taalmodel

De ruwe transcriptie wordt aangeboden aan een groot taalmodel met de opdracht er een SOEP-notitie van te maken. Die opdracht is zorgvuldig geformuleerd: het model krijgt context over hoe een Nederlandse huisartsnotitie eruitziet, welke ICPC-structuur wordt verwacht, en wat de grenzen zijn van wat het mag invullen.

Het model kan goed overweg met duidelijke, gestructureerde consulten. Het heeft moeite met consulten die onduidelijk beginnen, met patiënten die moeilijk te volgen zijn, of met consulten waarbij de huisarts impliciet diagnostiseert zonder het hardop te zeggen. Die gevallen zijn ook de gevallen waarbij een menselijke transcribent moeite zou hebben.

Het resultaat is een conceptnotitie. Geen definitieve notitie.

Stap 4 · ICPC

Een suggestie, geen uitspraak.

Op basis van de conceptnotitie wordt een ICPC-code gesuggereerd. Het model matcht de probleemomschrijving aan de meest waarschijnlijke code. Aanvullende context — een relevante NHG-standaard, interacties met bekende medicatie — wordt aangeboden, niet opgelegd.

Stap 5: beoordeling en committering door de arts

De arts ziet een conceptnotitie met een gesuggereerde ICPC-code. Hij leest, past aan waar nodig, en keurt goed. Pas dan wordt de notitie opgeslagen in het dossier.

Er is geen automatische opslag. Er is geen optie om die beoordelingsstap over te slaan. Dat is een bewuste keuze, niet een technische beperking die ik later nog wil weghalen.

De reden is simpel: een taalmodel hallucineert. Niet altijd, niet veel, maar het gebeurt. Een enkele fout in een medisch dossier kan consequenties hebben die jaren later zichtbaar worden. De arts blijft eindverantwoordelijk. Dat is niet alleen juridisch het geval, het is ook medisch-ethisch het enige verdedigbare standpunt.

Wat er mis kan gaan, en hoe ik daarmee omga

Slechte audiokwaliteit leidt tot een slechte transcriptie. Een slechte transcriptie leidt tot een slechte notitie. Ik werk aan herkenningsmechanismen die de arts waarschuwen als de audiokwaliteit onder een drempel zakt.

Een taalmodel kan iets invullen wat niet is gezegd. Dat noemen we hallucinatie. Ik evalueer modellen op hoe vaak dit voorkomt voor medische notities, en werk aan promptstrategieën die het risico verkleinen.

Privacy-incidenten zijn mogelijk als data de verkeerde kant op stroomt. Elk onderdeel van de technische keten wordt gekozen en geconfigureerd met AVG-compliance als harde eis, niet als bijzaak. Meer hierover op Beveiliging.

Hoe AI een consult verwerkt tot een dossiernotitie.