gms | German Medical Science

GMDS 2013: 58. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

01. - 05.09.2013, Lübeck

Ableiten statistischer Signifikanz für den Net Reclassification Improvement – Theorien und Konzepte

Meeting Abstract

  • Kristin Mühlenbruch - Deutsches Institut für Ernährungsforschung Potsdam-Rehbrücke, Nuthetal, DE
  • Olga Kuxhaus - Deutsches Institut für Ernährungsforschung Potsdam-Rehbrücke, Nuthetal, DE
  • Hannelore Liero - Universität Potsdam; Institut für Mathematik, Potsdam, DE
  • Matthias Schulze - Deutsches Institut für Ernährungsforschung, Nuthetal, DE

GMDS 2013. 58. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Lübeck, 01.-05.09.2013. Düsseldorf: German Medical Science GMS Publishing House; 2013. DocAbstr.190

doi: 10.3205/13gmds187, urn:nbn:de:0183-13gmds1873

Published: August 27, 2013

© 2013 Mühlenbruch et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Einleitung und Fragestellung: Der Net Reclassification Improvement (NRI) [1], [2] hat sich zu einem populären Maß für die Evaluation von Verbesserung bei Risikoprädiktionsmodellen entwickelt [3]. Der NRI stellt ein einfach zu berechnendes Maß dar, allerdings gibt es keinen Grenzwert, der den Umfang der Verbesserung einordnet [4]. Aus diesem Grund wird häufig der p-Wert bzw. das Vorliegen statistischer Signifikanz als Entscheidungskriterium für das Vorliegen einer Verbesserung herangezogen. Das Ziel dieser Untersuchung war zum einen, die Abhängigkeit der statistischen Signifikanz des NRI vom Stichprobenumfang sowie von Gewichtungen darzustellen, und zum anderen alternative statistische Testverfahren mit variierender Nullhypothese und Tests für die einzelnen Komponenten des NRI zu untersuchen. Außerdem wird der Gebrauch von Konfidenzintervallen vorgeschlagen und eine Konfidenzellipse für die beiden Komponenten entwickelt.

Material und Methoden: Zur Illustration der verschiedenen Konzepte wird eine Analyse in der European Investigation into Cancer and Nutrition (EPIC)-Potsdam Studie durchgeführt. Es handelt sich um eine prospektive Kohortenstudie mit 27.548 Teilnehmern im Alter von 35-65 Jahren zur Baseline-Erhebung. In die Analyse werden 25.167 Teilnehmer eingeschlossen, von denen 849 einen inzidenten Typ-2-Diabetes nach einem mittleren Follow-up-Zeitraum von 7 Jahren entwickelten. Der NRI wird anhand eines Vergleichs des Deutschen Diabetes Risiko Scores mit einem um Familienanamnese erweiterten Modell berechnet. Dies ist die Basis für weitere methodische Analysen zum statistischen Testen.

Ergebnisse: Die statistische Signifikanz des aus den Daten berechneten NRIs von 0.0998 wird deutlich von der Stichprobengröße beeinflusst. Eine unterschiedliche Gewichtung zeigte ebenfalls starken Einfluss auf die statistische Signifikanz. Eine unterschiedliche Wahl der Nullhypothese, gegen die der NRI getestet wird, konnte diese Abhängigkeit in sinnvoller Weise modifizieren. Auch für die Einzelkomponenten scheint eine einzelne Testung mit Anwendung unterschiedlicher Nullhypothesen sinnvoll zu sein. Durch die Berechnung eines Konfidenzintervalls kann für die Einzelkomponenten und auch den gesamten NRI eine Aussage über Präzision und statistische Signifikanz getroffen werden. Die Verwendung einer neu entwickelten Konfidenzellipse bietet die Möglichkeit simultan beide Komponenten zu betrachten und zahlreiche Nullhypothesen zu überprüfen.

Diskussion: Die Anwendung unterschiedlicher Nullhypothesen für den Signifikanztest des NRI und auch der Einzelkomponenten scheint eine hilfreiche Ergänzung zum Konzept des NRI zu sein. Die Konstruktion einer Konfidenzellipse ermöglicht weiterhin, eine übergreifende Aussage zu beiden Komponenten gleichzeitig zu treffen, welches sowohl Präzision als auch Signifikanz einschließt.


Literatur

1.
Pencina MJ, D'Agostino RB Sr, D'Agostino RB Jr, Vasan RS. Evaluating the added predictive ability of a new marker: from area under the ROC curve to reclassification and beyond. Stat Med. 2008;27(2):157-72. DOI: 10.1002/sim.2929 External link
2.
Pencina MJ, D'Agostino RB Sr, Steyerberg EW. Extensions of net reclassification improvement calculations to measure usefulness of new biomarkers. Stat Med. 2011;30(1):11-21. DOI: 10.1002/sim.4085. External link
3.
Tzoulaki I, Liberopoulos G, Ioannidis JP. Use of reclassification for assessment of improved prediction: an empirical evaluation. Int J Epidemiol. 2011;40(4):1094-105. DOI: dyr013 [pii]10.1093/ije/dyr013. External link
4.
Mühlenbruch K, Heraclides A, Steyerberg E, Joost H-G, Boeing H, Schulze M. Assessing improvement in disease prediction using net reclassification improvement: impact of risk cut-offs and number of risk categories. Eur J Epidemiol. 2012. DOI: 10.1007/s10654-012-9744-0. External link