Hintergrund: In Sekundärdaten existieren oftmals unstrukturierte Freitexte. In dieser Arbeit wird ein Text-Mining-System validiert, um unstrukturierte medizinische Daten für Forschungszwecke zu extrahieren.

Methoden: Aus einer radiologischen Klinik wurden aus 7102 CT-Befunden 1000 zufällig ausgewählt. Diese wurden von 2 Medizinern manuell in definierte Befundgruppen eingeteilt. Zur automatisierten Verschlagwortung und Klassifizierung wurde die Textanalyse-Software Averbis Extraction Platform (AEP) eingesetzt. Besonderheiten des Systems sind u. a. eine morphologische Analyse zur Zerlegung zusammengesetzter Wörter sowie die Erkennung von Nominalphrasen, Abkürzungen und negierten Aussagen. Anhand der extrahierten standardisierten Schlüsselwörter werden Befundberichte mithilfe maschineller Lernverfahren den vorgegebenen Befundgruppen zugeordnet. Zur Bewertung von Reliabilität und Validität des automatisierten Verfahrens werden die automatisierten und 2 unabhängige manuelle Klassifizierungen in mehreren Durchläufen auf Übereinstimmungen hin verglichen.

Ergebnisse: Die manuelle Klassifizierung war zu zeitaufwendig. Bei der automatisierten Verschlagwortung stellte sich in unseren Daten die Klassifizierung nach ICD-10 als ungeeignet heraus. Ebenfalls zeigte sich, dass die Stichwortsuche keine verlässlichen Ergebnisse liefert. Computerunterstütztes Textmining in Kombination mit maschinellem Lernen führte zu verlässlichen Klassifizierungen. Die Inter-Rater-Reliabilität der beiden manuellen Klassifizierungen, sowie der maschinellen und der manuellen Klassifizierung war sehr hoch. Beide manuelle Klassifizierungen stimmten in 93% aller Befunde überein. Der Kappa-Koeffizient beträgt 0,89 [95% Konfidenzintervall (KI) 0,87-0,92]. Die automatische Klassifizierung stimmte in 86% aller Befunde mit der unabhängigen, zweiten manuellen Klassifizierung überein (Kappa-Koeffizient 0,79 [95% KI 0,75-0,81]).

Diskussion: Die Klassifizierung der Software AEP war sehr gut. In unserer Studie folgte sie allerdings einem systematischen Muster. Die meisten falschen Zuordnungen finden sich in Befunden, die auf ein erhöhtes Krebsrisiko hinweisen. Die Freitextstruktur der Befunde lässt Bedenken hinsichtlich der Machbarkeit einer rein automatisierten Analyse aufkommen. Die Kombination aus menschlichem Intellekt und einer intelligenten, lernfähigen Software erscheint als zukunftsweisend, um unstrukturierte aber wichtige Textinformationen der Forschung zugänglich machen zu können.

Download full-text PDF

Source
http://dx.doi.org/10.1055/a-1007-8540DOI Listing

Publication Analysis

Top Keywords

die
13
der
11
automatisierten verschlagwortung
8
manuelle klassifizierungen
8
klassifizierung war
8
die klassifizierung
8
manuellen klassifizierung
8
war sehr
8
aller befunde
8
klassifizierung
7

Similar Publications

Climatically Specialized Lineages of Batrachochytrium dendrobatidis, and its Likely Asian Origins.

Ecohealth

January 2025

Guangxi Key Laboratory for Forest Ecology and Conservation, College of Forestry, Guangxi University, Nanning, Guangxi, 530000, People's Republic of China.

Chytridiomycosis is a wildlife disease that has caused significant declines in amphibian populations and species extinctions worldwide. Asia, where the causal pathogens Batrachochytrium dendrobatidis (Bd) and B. salamndrivorans (Bsal) originated, has not witnessed mass die-offs.

View Article and Find Full Text PDF

[Diagnosis of pediatric melanocytic tumors].

Dermatologie (Heidelb)

January 2025

Universitäts-Hautklinik Tübingen, Liebermeisterstr. 25, 72076, Tübingen, Deutschland.

The histological diagnosis of pediatric melanocytic tumors is challenging, as benign nevi often resemble aggressive tumors. Accurate diagnosis is crucial for the early detection of rare pediatric melanomas. Recent advancements have established a classification based on genetic backgrounds.

View Article and Find Full Text PDF

[The intestinal microbiota in inflammatory bowel diseases].

Inn Med (Heidelb)

January 2025

Lehrstuhl für Ernährung und Immunologie, School of Life Sciences, Technische Universität München, Gregor-Mendel-Straße 2, 85354, Freising, Deutschland.

Background: The intestinal microbiota comprises all living microorganisms in the gastrointestinal tract and is crucial for its function. Clinical observations and laboratory findings confirm a central role of the microbiota in chronic inflammatory bowel diseases (IBD). However, many mechanistic details remain unclear.

View Article and Find Full Text PDF

[Molecularly defined renal cell carcinomas].

Pathologie (Heidelb)

January 2025

Institut für Pathologie, Universitätsklinikum Erlangen, Friedrich-Alexander-Universität Erlangen-Nürnberg (FAU), Krankenhausstraße 8-10, 91054, Erlangen, Deutschland.

Background: The latest edition of the WHO classification of urinary and male genital tumours was published in 2022. The revision was based on the newest scientific literature. This article summarizes the updated recommendations regarding the classification of molecularly defined tumours.

View Article and Find Full Text PDF

[Treatment with TOPS for short femoral stump].

Oper Orthop Traumatol

January 2025

Klinik für Unfall‑, Hand und Wiederherstellungschirurgie, Universitätsmedizin Rostock, Schillingallee 35, 18057, Rostock, Deutschland.

Objective: Treatment with transcutaneous osseointegrated prosthesis systems (TOPS) for short femoral amputation stumps aims to restore independent walking ability after proximal femoral amputation by direct bone-guided prosthesis anchorage. This cannot be safely achieved with conventional socket prostheses due to the mechanically inadequate socket contact surface.

Indications: Treatment of patients with short transfemoral stumps who cannot be mobilized sufficiently with conventional socket prostheses.

View Article and Find Full Text PDF

Want AI Summaries of new PubMed Abstracts delivered to your In-box?

Enter search terms and have AI summaries delivered each week - change queries or unsubscribe any time!