gms | German Medical Science

54. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

07. bis 10.09.2009, Essen

Semantische Anreicherung natürlichsprachlicher Inhalte in elektronischen Gesundheitsakten

Meeting Abstract

  • Stefan Schulz - Institut für Medizinische Biometrie und Medizinische Informatik, Freiburg
  • Philipp Daumke - Averbis GmbH, Freiburg
  • Michael Poprat - Averbis GmbH, Freiburg
  • Kornél Markó - Averbis GmbH, Freiburg

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 54. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds). Essen, 07.-10.09.2009. Düsseldorf: German Medical Science GMS Publishing House; 2009. Doc09gmds253

doi: 10.3205/09gmds253, urn:nbn:de:0183-09gmds2536

Published: September 2, 2009

© 2009 Schulz et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Semantische Interoperabilität in elektronischen Gesundheitsakten [1], [2], [3] erfordert strukturierte Daten. Bisher jedoch sind weitaus größere Anteile klinischer Behandlungsdaten lediglich in textueller, unstrukturierter Form vorhanden.

Die Verwendung natürlicher Sprache in elektronischen Gesundheitsakten ist kein „Auslaufmodell“, sondern ein der medizinischen Dokumentation und Kommunikation inhärentes Phänomen, dem in semantisch interoperablen EHR-Architekturen Rechnung getragen werden muss.

Die bisherige Praxis einer weitgehend parallelen Erfassung strukturierter und textueller Informationen ist für Ärzte unbefriedigend und wirkt sich negativ auf die Dokumentationsqualität aus. Präzise kodiert werden selektiv oft nur die Sachverhalte, welche über ein pauschaliertes Entgeltsystem direkte Auswirkungen auf die Ertragssituation haben. Wenn standardisierte Erhebungen kein direktes Feedback erbringen (z.B. bei klinischen Registern), ist die strukturierte Dokumentation tendenziell nachlässig. Strukturierte Daten fehlen in weiten Bereichen, die für Patientensicherheit und klinische Epidemiologie interessant sind, und nachträgliche Kodierung. Da systematische Auswertungen textueller Inhalte erfolgen nur punktuell.

Die maschinelle Erschließung des Inhalts freitextlicher Dokumente und deren Abbildung der darin enthaltenen Informationen auf eine semantisch interoperable Informationsarchitektur bleibt eine wissenschaftliche und technologische Herausforderung [4]. Sie wird im medizinischen Umfeld erschwert durch Schreibvarianten, orthografische Mängel, ungrammatischen Telegrammstil, vieldeutige Abkürzungen usw. Natürlichsprachliche Äußerungen sind weiterhin nur in ihrem jeweiligen Kontext zu verstehen. So ist die korrekte Abbildung einer Aussage wie "Throbozyptopenie" auf einen Klassifikationskode wenig hilfreich, wenn nicht zugleich der Kontext der Aussage korrekt identifiziert wird. Hierbei spielen Kontexte wie Negation ("Kein Anhalt für Thrombozytopenie"), Unsicherheit ("Verdacht auf Thrombozytopenie"), Hypothese ("Im Falle einer Thrombozytopenie sollte…"), Personenbezug ("Vater litt an Thrombozytopenie") eine Rolle.

Eine vollautomatische und umfassende Extraktion strukturierter Information aus klinischen Routinedokumenten ist derzeit bis auf weiteres nicht möglich. Jedoch sind Methoden der maschinellen Verarbeitung von Sprache inzwischen so ausgereift, dass sie im Routineeinsatz die Erstellung medizinischer Dokumente bei gleichzeitiger Erhebung strukturierter Daten unterstützen können. Wir diskutieren hier das Konzept der sogenannten "semantischen Anreicherung" [5], [6] natürlichsprachlicher Inhalte der Gesundheitsakte als Zusammenspiel von Dokumentationsprozess, simultane Inhaltsanalyse und Computerdialog.


Literatur

1.
Rossi-Mori A, Consorti F. Exploiting the terminological approach from CEN/TC251 and GALEN to support semantic interoperability of healthcare record systems. Int J Med Inform. 1998;48(1-3):111-124.
2.
Ingenerf J, Reiner J, Seik B. Standardized Terminological Services Enabling Semantic Interoperability between Distributed and Heterogeneous Systems. Int J Med Inform. 2001;64(2-3):223-40.
3.
Garde S, Knaup P, Hovenga E, Herd S. Towards Semantic Interoperability for Electronic Health Records. Method Inf Med. 2007;46(3):332-343.
4.
Meystre SM, Savova GK, Kipper-Schuler KC, Hurdle JF. Extracting information from textual documents in the electronic health record: a review of recent research. Yearb Med Inform. 2008:128-144.
5.
Fink L. Word add-in for ontology recognition. http://ucsdbiolit.codeplex.com/Wiki/View.aspx, Last Accessed: April 2009. External link
6.
De Waard A. Science Publishing and the Semantic Web, or: why are you reading this on paper? European Conference on the Semantic Web 2005, Industry Forum, Alain Léger (ed.). 2005. http://labs.elsevier.com/resources/adw/changingdoc/papers/deWaardECSW2005.pdf External link