Advertisement

Möglichkeiten und Grenzen der Risikoadjustierung von Qualitätsindikatoren aus Krankenhausabrechnungsdaten - ein Werkstattbericht

Open AccessPublished:May 19, 2021DOI:https://doi.org/10.1016/j.zefq.2021.04.003

      Zusammenfassung

      Hintergrund

      Die Qualitätsindikatoren der Initiative Qualitätsmedizin e.V. (IQM) sind als Aufgreifkriterien zur Identifikation möglicher Verbesserungspotentiale in den teilnehmenden Krankenhäusern konzipiert worden. Durch die teils mediale Nutzung der veröffentlichten Qualitätsergebnisse für externe Qualitätsvergleiche entstand das Anliegen der Mitgliedskrankenhäuser, eine weitergehende Risikoadjustierung in der Berechnung der Qualitätsindikatoren zu prüfen. In Folge eines Expertenanhörungsverfahrens wurde eine Arbeitsgruppe zur Durchführung von Proberechnungen zur Risikoadjustierung gegründet.

      Methode

      Spezifische Risikoadjustierungsmodelle wurden in der bundesweiten DRG-Statistik des Jahres 2016 entwickelt für die Indikatoren Sterblichkeit bei Herzinfarkt, Herzinsuffizienz, Hirninfarkt, Pneumonie, und Kolonresektion bei kolorektalem Karzinom. Mittels dieser Modelle wurde die standardisierte Sterblichkeit (standardized mortality ratio - SMR) je Indikator in einer Stichprobe von 172 IQM Mitgliedskrankenhäusern anhand der Daten des Jahres 2018 ermittelt. Diese wurde mit der SMR auf Basis einer Alters- und Geschlechtsstandardisierung, welche der IQM-Standard ist, bzgl. der mittleren Tendenz sowie korrelativ verglichen. Die Bewertung der Versorgungsqualität erfolgte a) als deskriptive Abweichung vom SMR-Wert 1 um mindestens |0,1|, sowie b) durch signifikante Abweichung von 1 anhand des 95%- Konfidenzintervalls. Der Einfluss der spezifischen Risikoadjustierung auf die Veränderung der Bewertung im Vergleich zur Standardmethode wurde für beide Ansätze (a und b) untersucht.

      Ergebnisse

      Die spezifischen Risikomodelle zeigten eine area under the curve zwischen 0,72 und 0,84. Differenzen der medianen SMR zwischen Alters- und Geschlechtsadjustierung und spezifischer Risikoadjustierung je Indikator fielen gering aus (0 bis 0,04), die Spearman-Korrelationen lagen zwischen 0,90 und 0,99. Bzgl. der Bewertung der Versorgungsqualität als besser, schlechter oder gleich zum Bundesdurchschnitt änderte sich die Bewertung ohne Berücksichtigung der statistischen Signifikanz für zwischen 3,9% (Sterblichkeit bei Pneumonie) und bis zu 20,6% der Krankenhäuser (Sterblichkeit bei Herzinsuffizienz). Bei Berücksichtigung der Konfidenzintervalle wechselten zwischen 1,6% (Sterblichkeit bei Kolonresektion) und 17,4% (Sterblichkeit bei Herzinsuffizienz) der Krankenhäuser zwischen Bewertungskategorien.

      Diskussion

      Die Implementierung der Risikoadjustierung hat geringe Auswirkungen auf die Verteilung der risikoadjustierten Sterblichkeit in den untersuchten Häusern im Vergleich zur etablierten Methodik; die Bewertung der Versorgungsqualität als auffällig kann sich jedoch für einzelne Indikatoren für bis zu ein Fünftel der Häuser ändern. Vor dem Hintergrund methodischer wie anwendungspraktischer Überlegungen empfiehlt die Arbeitsgruppe die Entwicklung einer weitergehenden Risikoadjustierung für ausgewählte Indikatoren. Dies sollte von Forschungsarbeiten zur Prüfung der Validität der Abrechnungsdaten für Qualitätssicherung sowie Bestrebungen zur Verbesserung der Nutzbarkeit dieser Daten für diese Zwecke begleitet sein.

      ABSTRACT

      Introduction

      The quality indicators of the Initiative Qualitätsmedizin e. V. (IQM) have been developed as triggers to examine treatment processes for opportunities for improvement. Published quality results have partly been used for external quality comparisons in the media. Therefore, member hospitals of IQM demanded to investigate if methods of risk adjustment should be applied in the calculation of the quality indicators. After a hearing of experts had been held, a task force was founded to conduct test calculations on risk adjustment methods.

      Methods

      Specific risk adjustment models for mortality in myocardial infarction, heart failure, stroke, pneumonia, and colectomy in colorectal cancer were developed in the database of national German DRG data of the year 2016. These models were used to calculate standardized mortality ratios (SMR) per indicator in a sample of 172 member hospitals of IQM based on the data of the year 2018. Median SMR per indicator were compared to median SMR based on a standardization by age and gender, which is the standard procedure in IQM. Correlations between the different SMR were calculated. Quality of care was judged by two different approaches: a) a descriptive discrepancy of |0.1| from the SMR value of 1, and b) a significant discrepancy from 1 using the 95% confidence limits. The effect of using the specific risk adjustment in relation to the standard procedure was investigated for both approaches (a and b).

      Results

      The specific risk adjustment methods showed an area under the curve between 0.72 and 0.84. The median differences between the SMR based on standardization by age and gender and the SMR based on specific risk adjustment were small (between 0 and 0.4); Spearman's correlations were between 0.90 and 0.99. Changes in the judgement of quality of care in comparison to the national average occurred in 3.9% (mortality from pneumonia) to 20.6% of the hospitals (mortality from heart failure) in descriptive comparisons. When the judgement was based on confidence limits changes were observed in 1.6% (mortality after colectomy) to 17.4% of the hospitals (mortality from heart failure).

      Discussion

      Implementing specific risk adjustment models had only minor effects on the distribution of risk-adjusted mortality compared to the standard procedure, but the judgement of quality of care could change for a fifth of the hospitals in individual indicators. Concerning methodological and practical reasons, the task force recommends further development of risk adjustment methods for selected indicators. This should be accompanied by studies on the validity of inpatient administrative data for quality management as well as by efforts to improve the usefulness of these data for such purposes.

      Schlüsselwörter

      Keywords

      Einleitung

      Die Initiative Qualitätsmedizin e.V. (IQM) ist mit über 500 teilnehmenden Krankenhäusern die größte freiwillige Qualitätsinitiative zur Verbesserung der stationären Versorgung in Deutschland. Die Qualitätsmethodik der IQM beruht auf drei Grundprinzipien: a) Qualitätsmessung auf Basis von Routinedaten, b) Transparenz der Ergebnisse durch deren Veröffentlichung, und c) Qualitätsverbesserung durch Peer-Reviews [
      • Eberlein-Gonska M.
      • Martin J.
      • Zacher J.
      eds. Handbuch IQM: Konsequent transparent – Qualität mit Routinedaten! 2. ed.
      ]. Die Qualitätsmessung bei IQM nutzt die Krankenhausabrechnungsdaten, welche im Rahmen des deutschen Diagnosis-Related-Groups (DRG) Systems in allen deutschen Krankenhäusern entstehen. Auf dieser Basis werden die German Inpatient Quality Indicators (G-IQI) und für die Schweizer Mitgliedsspitäler analog die CH-IQI (Swiss Inpatient Quality Indicators) zu über 60 Krankheitsbildern und Behandlungen berechnet, deren Ergebnisse den beteiligten Krankenhäusern halbjährlich zur Verfügung gestellt werden [
      • Nimptsch U.
      • Mansky T.
      G-IQI | German Inpatient Quality Indicators Version 5. 2 - Bundesreferenzwerte für das Auswertungsjahr.
      ]. Die Indikatoren werden als Aufgreifkriterien zur Durchführung gezielter Fallanalysen im Rahmen von Mortalitäts- und Morbiditätskonferenzen oder von IQM-Peer-Reviews mit dem Ziel der kontinuierlichen Qualitätsverbesserung eingesetzt [

      Nimptsch, U. and T. Mansky. G-IQI Version 5.0 - Messen, um zu verbessern, in Handbuch IQM: Kosequent transparent - Qualität mit Routinedaten!, M. Eberlein-Gonska, J. Martin, and J. Zacher, Editors. 2017, Medizinisch Wissenschaftliche Verlagsgesellschaft: Berlin.

      ]. Im G-IQI/CH-IQI System kommen derzeit Verfahren der Risikodifferenzierung und -stratifizierung, sowie, für ausgewählte Sterblichkeitsindikatoren, eine Standardisierung nach Alter und Geschlecht zur Anwendung [
      • Mansky T.
      • Nimptsch U.
      Medizinische Qualitätsmessung im Krankenhaus – Worauf kommt es an?. Zeitschrift für Evidenz.
      ].
      Die G-IQI wurden zum Zweck des internen Qualitätsmanagements, jedoch nicht zum Zwecke des Vergleiches der Versorgungsqualität zwischen Krankenhäusern entwickelt. Dies unterscheidet sie wesentlich von Ansätzen, die auf ähnlicher Datengrundlage, jedoch explizit zum Zweck eines Qualitätsvergleichs durch Behörden oder Versicherer in den USA etabliert wurden [
      • Suter L.G.
      • et al.
      National Patterns of Risk-Standardized Mortality and Readmission After Hospitalization for Acute Myocardial Infarction, Heart Failure, and Pneumonia: Update on Publicly Reported Outcomes Measures Based on the 2013 Release.
      ]. Da die Qualitätsergebnisse der IQM Mitgliedskrankenhäuser durch die Mitglieder selbst veröffentlicht werden, besteht jedoch die Möglichkeit, dass diese medial durch Dritte für Versorgervergleiche genutzt werden können, obwohl dies nicht dem eigentlichen Verwendungszweck entspricht.
      Vor dem Hintergrund dieser möglichen externen Nutzung zu Vergleichszwecken entstand bei IQM das Bedürfnis, eine Etablierung methodischer Ansätze zur Verbesserung der Vergleichbarkeit der Indikatorergebnisse zu prüfen. Dies betraf in erster Linie die statistische Adjustierung von Unterschieden im Case-Mix, sowie die adäquate Berücksichtigung der Zufallsvarianz zwischen Krankenhäusern in den Indikatorergebnissen [
      • Normand S.L.T.
      • Shahian D.M.
      Statistical and clinical aspects of hospital outcomes profilling.
      ,
      • Krumholz H.M.
      • et al.
      Standards for statistical models used for public reporting of health outcomes - An American Heart Association scientific statement from the quality of care and outcomes research interdisciplinary writing group - Cosponsored by the Council on Epidemiology and Prevention and the Stroke Council - Endorsed by the American College of Cardiology Foundation.
      ,
      • Iezzoni L.I.
      Risk adjustment, in Performance measurement for health system improvement: Experiences, challenges and prospects, P.C. Smith, et al..
      ]. Ziel dieses Manuskriptes ist es, die Arbeit eines im Rahmen der IQM gegründeten Expertengremiums vorzustellen, welches die Anwendung dieser methodischen Prinzipien an ausgewählten Indikatoren prüfte und auf dieser Basis Handlungsempfehlungen für die IQM ableitete.

      Methode

      Zur Bearbeitung des Themas veranstaltete die IQM am 1. Februar 2019 unter dem Titel „Qualitätsmessung in der Medizin - Risikoadjustierung und Risikoadjustierungsmodelle“ ein Anhörungsverfahren für Fachexperten. Das Anhörungsverfahren richtete sich an alle relevanten, nationalen Einrichtungen, Behörden, medizinischen Fachgesellschaften und Interessensverbände. Hier wurden unterschiedliche Verfahren der Risikoadjustierung mit dem Ziel einer möglichen Anwendung im G-IQI Indikatorensystem vorgestellt [
      Initiative Qualitätsmedizin (IQM)
      ]. In seiner Folge wurde seitens des IQM Vorstandes der Entschluss zur Gründung einer Arbeitsgruppe „Risikoadjustierung“ unter Einbeziehung ausgewählter externer Experten beschlossen.
      Die Methodik der im Folgenden dargestellten Analysen wurde in der Arbeitsgruppe abgestimmt. Zur Prüfung der Auswirkung von Risikoadjustierungsverfahren zur Korrektur von Unterschieden im Case-Mix wurden in einem ersten Schritt Risikoadjustierungsmodelle für mehrere Qualitätsindikatoren auf Basis der bundesweiten Krankenhausabrechnungsdaten ermittelt. In einem zweiten Schritt wurden diese Risikomodelle dann zur Berechnung der risikoadjustierten Krankenhaussterblichkeit für ausgewählte Indikatoren in einer Stichprobe von IQM Mitgliedskrankenhäusern zur vergleichenden Berechnung der Indikatorergebnisse angewendet.

      Datenbasis

      Basis der Untersuchung sind Abrechnungsdaten im Format gemäß §21 KHEntgG. Diese bilden die Datengrundlage der Vergütung von Krankenhausbehandlungen in Deutschland im Rahmen des G-DRG-Systems. Die Abrechnungsdaten enthalten zu jedem stationären Behandlungsfall u.a. Alter und Geschlecht, Diagnosen (kodiert nach der ICD-10-GM), Prozeduren (kodiert nach dem Operationen- und Prozedurenschlüssel -OPS), den Aufnahmeanlass (u.a. Verlegung aus anderem Akutkrankenhaus) und den Entlassungsgrund (u. a. Tod).
      Alle IQM Krankenhäuser liefern ihre §21-Daten zweimal jährlich an den Kooperationspartner 3M Health Information Systems GmbH als Datentreuhänder und Auswertungsstelle. Dort werden die G-IQI/CH-IQI in der aktuellen Version berechnet und die Ergebnisreports den einzelnen Mitgliedskrankenhäusern zurückgeschickt. Daten für die gesamte IQM -Gruppe liegen lediglich in aggregierter Form vor. Für das IQM-Datenanalyseverfahren besteht ein umfassendes Datenschutzkonzept, welches auch für den hier untersuchten Datensatz Anwendung fand. Für die Analyse wurden die Daten der Krankenhäuser genutzt, die freiwillig dazu ihr Einverständnis gegeben haben. Wie im Datenschutzkonzept der IQM vorgesehen, wurden alle Datenanalysen durch 3M vorgenommen.
      Zur Ermittlung der Koeffizienten für die Risikoadjustierungsmodelle wurden die Mikrodaten der bundesweiten DRG-Statistik des Jahres 2016 analysiert [
      Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder
      ]. Der Zugriff erfolgte über das Forschungsdatenzentrum des Statistischen Bundesamtes im Wege der kontrollierten Datenfernverarbeitung. Die Anwendung der Risikoadjustierungsmodelle zur Berechnung der Indikatorergebnisse erfolgte anschließend in den Daten der Stichprobe von IQM-Mitgliedskrankenhäusern auf Basis des Jahres 2018.

      Stichprobe

      Krankenhäuser

      Von zum Zeitpunkt der Analyse 486 Mitgliedskrankenhäusern stellten 172 (35,4%) ihre Abrechnungsdaten für diese Analysen zur Verfügung (zwei Schweizer Universitätsklinken und 170 Krankenhäuser aus Deutschland). Unter den teilnehmenden Krankenhäusern waren 123 (72,4%) Krankenhäuser der Grund- und Regelversorgung, 15 (8,8%) Fachkliniken, 23 (13,5%) nichtuniversitäre Maximalversorger, und 9 (5,3%) Universitätskliniken.

      Behandlungsfälle

      Zur Analyse wurden sowohl in der bundesweiten DRG-Statistik als auch in den Daten der teilnehmenden Krankenhäuser alle vollstationären Behandlungsfälle identifiziert, die einer der folgenden Indikatordefinitionen der G-IQI Version 5.2 [
      • Nimptsch U.
      • Mansky T.
      G-IQI | German Inpatient Quality Indicators Version 5. 2 - Bundesreferenzwerte für das Auswertungsjahr.
      ] zugeordnet werden konnten: Hauptdiagnose Herzinfarkt (Indikator 1.1), Hauptdiagnose Herzinsuffizienz (Indikator 2.1), Hauptdiagnose Hirninfarkt (Indikator 9.3), Pneumonie ohne Zuverlegungen, Tumor, Mukoviszidose (Indikator 14.2), Kolonresektion bei kolorektalem Karzinom ohne komplizierende Diagnose (Indikator 21.311). Es wurden ausschließlich Fälle von Patienten mit einem Alter ab 20 Jahren berücksichtigt. Die genaue Definition der G-IQI Indikatoren findet sich im technischen Report [
      • Nimptsch U.
      • Mansky T.
      G-IQI | German Inpatient Quality Indicators Version 5. 2 - Bundesreferenzwerte für das Auswertungsjahr.
      ].

      Statistische Analysen

      Auswahl von Risikoadjustierungsmodellen

      Zwei alternative Risikoadjustierungsverfahren wurden angewendet. Als Standardverfahren kommt für die ausgewählten Sterblichkeitsindikatoren eine indirekte Standardisierung nach 5-Jahres-Altersgruppen und Geschlecht zum Einsatz. Die entsprechenden Tabellen sind dem technischen Report zu den G-IQI zu entnehmen [
      • Nimptsch U.
      • Mansky T.
      G-IQI | German Inpatient Quality Indicators Version 5. 2 - Bundesreferenzwerte für das Auswertungsjahr.
      ]. Eine Ausnahme bildet der Indikator Kolonresektion, bei dem aufgrund der umfassenden Risikodifferenzierung über Ein- und Ausschlusskriterien keine Standardisierung der Sterblichkeit nach Alter und Geschlecht erfolgt.
      Als alternatives Risikoadjustierungsverfahren zur detaillierteren Berücksichtigung des Case-Mixes wurde auf indikatorspezifische Risikoadjustierungsmodelle zurückgegriffen, die in vorangegangenen Arbeiten entwickelt wurden, um in Analysen von Mengen-Ergebnis-Beziehungen Effekte von Kovariablen zu kontrollieren [
      • Nimptsch U.
      • Mansky T.
      Hospital volume and mortality for 25 types of inpatient treatment in German hospitals: observational study using complete national data from 2009 to 2014.
      ,
      • Bolczek C.
      • et al.
      Versorgungsstrukturen und Mengen-Ergebnis-Beziehung beim akuten Herzinfarkt – Verlaufsbetrachtung der deutschlandweiten Krankenhausabrechnungsdaten von 2005 bis 2015.
      ]. Neben ausgewählten Begleiterkrankungen berücksichtigen diese Modelle die Erkrankungsschwere sowie das Alter und das Geschlecht. Zusätzlich wurde der Zuverlegungsstatus als Risikofaktor berücksichtigt. Die Variablendefinitionen und die auf Bundesebene ermittelten Odds-Ratios der spezifischen Modelle werden in Tabelle 1 ausgewiesen. Die Risikomodelle wurden mittels logistischer Regressionen berechnet. Die Berechnungen in der DRG-Statistik wurden mit SAS Version 9.3 vorgenommen.
      Tabelle 1Definition der indikatorspezifischen Risikoadjustierungsmodelle und zugehörige Odds Ratios, DRG-Statistik 2016.
      VariablenDefinitionIndikator (G-IQI 5.2), Sterblichkeit bei
      1.1

      Herzinfarkt
      2.1

      Herzinsuffizienz
      9.3

      Hirninfarkt
      14.2

      Pneumonie
      21.311

      Kolorektale Resektion
      Alter in Jahren1,07 [1,07–1,07]1,05 [1,05–1,06]1,07 [1,07–1,07]1,06 [1,06–1,06]1,07 [1,06–1,08]
      Weibliches Geschlecht1,09 [1,05–1,14]0,82 [0,80-0,83]1,13 [1,09–1,17]0,86 [0,83-0,88]0,78 [0,70-0,88]
      Zuverlegung aus anderem KrankenhausAufnahmeanlass A, V0,93 [0,89-0,98]1,48 [1,42–1,55]1,15 [1,10–1,21]-2,20 [1,65–2,93]
      HerzrhythmusstörungND I442 I48 Z450 Z950-0,83 [0,82-0,85]-0,96 [0,93-0,99]1,42 [1,24–1,61]
      Herzinsuffizienz/KardiomyopathieND I50 I110 I130 I132 I420 I426 I427 I428 I429--1,63 [1,56–1,70]1,37 [1,32–1,41]2,13 [1,86–2,45]
      Chronische ischämische HerzkrankheitND I25-0,75 [0,74-0,77]1,06 [1,02–1,11]0,92 [0,89-0,96]1,17 [1,01–1,36]
      Hypertonie (ohne Herz- oder Niereninsuffizienz)ND I10 I119 I129 I139 I150,41 [0,40-0,43]0,71 [0,70-0,73]0,53 [0,51-0,55]0,61 [0,59-0,62]0,73 [0,65-0,83]
      Aorten-/MitralklappenvitienND I340 I342 I350 I351 I352 I050 I051 I052 I060 I061 I062 Q231 Q232 Q2330,72 [0,68-0,77]0,70 [0,68-0,73]0,66 [0,61-0,72]0,75 [0,69-0,81]0,84 [0,64-1,09]
      Nicht-signifikante Effekte.
      Atherosklerose der ExtremitätenarterienND I702-1,17 [1,12–1,22]1,17 [1,08–1,27]1,13 [1,05–1,21]1,45 [1,12–1,89]
      Chronische LungenerkrankungND J41 J42 J44 J45 J470,97 [0,91-1,03]
      Nicht-signifikante Effekte.
      0,99 [0,96-1,02]
      Nicht-signifikante Effekte.
      1,13 [1,06–1,20]-1,31 [1,10–1,56]
      Chronische LebererkrankungND B18 I864 I982 K70 K73 K74 K760 K761 K765 K766 K767 Q446 Q4471,27 [1,10–1,45]1,38 [1,31–1,44]1,23 [1,06–1,42]1,02 [0,93-1,12]
      Nicht-signifikante Effekte.
      1,99 [1,59–2,49]
      Schwere Nierenerkrankung oder chronische NiereninsuffizienzND I120 I131 I132 N03 N04 N05 N07 N08 N11 N12 N14 N15 N16 N18 N19 Z992-0,99 [0,97-1,01]
      Nicht-signifikante Effekte.
      1,02 [0,98-1,07]
      Nicht-signifikante Effekte.
      0,97 [0,93-1,00]
      Nicht-signifikante Effekte.
      1,29 [1,13–1,49]
      Chronische NiereninsuffizienzND I120 I131 I132 N18 N19 Z9920,93 [0,89-0,97]----
      Diabetes mellitusND E10 E11 E12 E13 E141,09 [1,05–1,13]0,96 [0,94-0,98]1,08 [1,04–1,12]1,08 [1,05–1,12]1,06 [0,93-1,21]
      Nicht-signifikante Effekte.
      AdipositasND E66-0,64 [0,61-0,67]0,70 [0,64-0,77]0,55 [0,50-0,61]1,02 [0,85-1,24]
      Nicht-signifikante Effekte.
      Kachexie/MangelernährungND R64 R634 E43 E44-1,53 [1,43–1,63]1,25 [1,13–1,39]1,41 [1,32–1,51]1,25 [1,03–1,51]
      GerinnungsstörungND D66 D67 D680 D681 D682 D684 D685 D686 D688 D689 D691 D693 D694-3,51 [3,32–3,71]3,14 [2,80–3,52]3,03 [2,77–3,30]3,89 [3,38–4,47]
      Bösartige NeubildungHD oder ND C00-C972,00 [1,81–2,21]1,72 [1,63–1,80]2,45 [2,28–2,63]--
      STEMIHD I210 I211 I212 I2131,46 [1,40–1,52]----
      Rezidivierender AMIHD I221,41 [0,97-2,05]
      Nicht-signifikante Effekte.
      ----
      Kardiogener SchockND R57022,98 [21,98–24,02]----
      Folgen einer zerebrovaskulären KrankheitND I69-1,39 [1,32–1,46]---
      Linksherzinsuffizienz NYHA Stadium 4HD oder ND I5014-3,26 [3,19–3,34]---
      Metastasierende NeubildungHD oder ND C77 C78 C79----1,53 [1,36–1,73]
      Erweiterte KolonresektionOPS 54540 54541 54542 54543 54544 54545 54546 5501 5502 5437 5436 5454x 5454y----2,17 [1,87–2,52]
      Fläche unter der Kurve (c-Statistik)0,8430,7350,7350,7240,810
      Ausgewiesen werden Odds Ratios mit 95% Konfidenzintervall. HD: Hauptdiagnose; ND: Nebendiagnose.
      a Nicht-signifikante Effekte.

      Berechnung der risikoadjustierten Sterblichkeit

      Die Berechnung der risikoadjustierten Sterblichkeit erfolgte mittels indirekter Standardisierung an der bundesweiten DRG-Statistik [

      Nimptsch, U. and T. Mansky. G-IQI Version 5.0 - Messen, um zu verbessern, in Handbuch IQM: Kosequent transparent - Qualität mit Routinedaten!, M. Eberlein-Gonska, J. Martin, and J. Zacher, Editors. 2017, Medizinisch Wissenschaftliche Verlagsgesellschaft: Berlin.

      ,
      • DeLong E.R.
      • et al.
      Comparing risk-adjustment methods for provider profiling.
      ]. Hierfür wurde für jeden analysierten Behandlungsfall der teilnehmenden Krankenhäuser das zu erwartende Sterberisiko (=Erwartungswert) jeweils gemäß des Alters und Geschlechts bzw. gemäß der vorliegenden Risikofaktoren berechnet. Der Quotient aus der Summe beobachteter Verstorbener und der Summe erwarteter Sterberisiken ergibt das standardisierte Sterblichkeitsverhältnis (standardized mortality ratio - SMR). Für den Indikator Sterblichkeit bei Kolonresektion wurde die in der DRG-Statistik beobachtete Sterblichkeit von 4,7% als erwartete Sterblichkeit in der Berechnung der SMR verwendet. Die Berechnungen der Fallzahlen, beobachteten und erwarteten Sterblichkeit sowie der SMR auf der Ebene der teilnehmenden Krankenhäuser erfolgten mit der Analysesoftware 3M FileInspector und MS SQL.

      Vergleich der risikoadjustierten Sterblichkeit nach Risikoadjustierungsverfahren

      Für jeden Indikator wurden die SMR nach Alters- und Geschlechtsadjustierung und nach spezifischer Risikoadjustierung deskriptiv verglichen. Bivariate Zusammenhänge zwischen den SMR-Werten innerhalb jedes Indikator wurden mittels Spearman Korrelationen quantifiziert und grafisch durch Streudiagramme und Glättungslinien, welche die Zusammenhänge ohne Annahme der Linearität darstellen (locally-weighted scatterplot smoother – LOESS) [
      • Cleveland W.S.
      • Grosse E.
      • Shyu W.M.
      Local regression models, in Statistical Models in S.
      ], visualisiert.
      Der SMR-Wert von 1 entspricht der Sterblichkeit im Bundesdurchschnitt, ein Wert über 1 einer höheren Sterblichkeit, ein Wert unter 1 einer niedrigeren Sterblichkeit. Bei Nicht-Berücksichtigung der Zufallsvarianz wurde ein Intervall von ± 0,1 um den Wert 1 als „praktisch unauffällig“ gewertet, um minimale Abweichungen nicht als potentielles Aufgreifkriterium anzusehen. Zur Berücksichtigung der Zufallsvarianz der SMRs wurden 95% Konfidenzintervalle mittels der Byar-Approximation berechnet, eine Bewertung als unauffällig erfolgte, sofern das Konfidenzintervall den Wert 1 einschloss. Die Veränderung in der Bewertung der Indikatoren bei Berücksichtigung der verschiedenen Risikoadjustierungsmethoden wurde deskriptiv und grafisch mittels geschichteter Balkendiagramme dargestellt [
      • Jones M.
      • et al.
      Visualising and modelling changes in categorical variables in longitudinal studies.
      ].
      Geplante Subgruppenanalysen erfolgten für Fachkliniken, Grund- und Regelversorger, Maximalversorger und Universitätsklinika. Diese Analysen erfolgten mittels des statistischen Programmes R (Version 3.5.3).

      Ergebnisse

      Übersicht über die Risikoadjustierungsmodelle auf Basis der DRG-Statistik

      Die in die indikatorspezifischen Risikoadjustierungsmodelle einbezogenen Risikofaktoren basierend auf der DRG-Statistik von 2016 sind mit den jeweiligen Odds-Ratios (OR) in Tabelle 1 dargestellt. Die Diskrimination der Modelle gemessen an der area under the curve (AUC) lag zwischen 0,724 und 0,843.
      Es zeigt sich, dass einzelne als Risikofaktoren konzeptualisierte Variablen im Modell mit einer geringeren Sterblichkeit assoziiert waren (Aorten-/Mitralklappenviten mit einem OR zwischen 0,66 und 0,84 und Hypertonie mit einem OR zwischen 0,41 und 0,71 in allen Modellen; chronische Niereninsuffizienz mit OR von 0,93 für den Indikator Herzinfarkt). Eine Zuverlegung aus einem anderen Krankenhaus war für alle Indikatoren mit einer höheren Sterblichkeit verbunden, abgesehen vom Indikator Herzinfarkt (OR = 0,93). Im Indikator Herzinfarkt zeichnet sich der Risikofaktor kardiogener Schock durch einen auffällig hohen Effekt aus (OR = 22,98).

      Vergleich der Behandlungsfälle zwischen DRG-Statistik und teilnehmenden IQM-Krankenhäusern

      Tabelle 2 stellt die Merkmale der Behandlungsfälle für die einzelnen Indikatoren in den teilnehmenden IQM-Krankenhäusern im Vergleich zu den entsprechenden Fällen in der bundesweiten DRG-Statistik dar. Bei den Indikatoren Sterblichkeit bei Herzinfarkt und Hirninfarkt sind die Fallzahlen pro Krankenhaus in der Gruppe der teilnehmenden IQM Krankenhäuser deutlich höher als im Bundesdurchschnitt. Bei allen Indikatoren lässt sich beobachten, dass in den teilnehmenden IQM-Krankenhäusern mehr Nebendiagnosen als im Bundesdurchschnitt kodiert wurden. Betrachtet man die Prävalenz der Kodierung einzelner in den Modellen berücksichtigten Risikofaktoren zeigen sich jedoch keine systematischen Unterschiede (Appendix A, Tabellen A1 bis A5). Abgesehen vom Indikator Sterblichkeit bei Hirninfarkt fiel die beobachtete Krankenhaussterblichkeit für alle Indikatoren in der IQM-Stichprobe geringer als im Bundesdurchschnitt aus.
      Tabelle 2Merkmale der Behandlungsfälle in den teilnehmenden IQM-Krankenhäusern im Vergleich zur bundesweiten DRG-Statistik.
      Teilnehmende IQM KrankenhäuserBundesweite DRG-Statistik, 2016
      Herzinfarkt
       Anzahl Krankenhäuser mit mindestens einem Behandlungsfall1521.153
       Anzahl Behandlungsfälle35.000219.201
       Fallzahl pro Klinik Median (1. Quartil – 3. Quartil)180 (43 - 325)100 (36 - 284)
       Anteil Alter ab 65 Jahre64,6%65,0%
       Anteil Frauen31,8%33,5%
       Anteil zuverlegt aus anderem Krankenhaus13,9%13,8%
       Anzahl Nebendiagnosen pro Behandlungsfall Median (1. Quartil – 3. Quartil)10 (8 - 12)7 (5 - 12)
       Anteil Todesfälle7,1%8,1%
      Herzinsuffizienz
       Anzahl Krankenhäuser mit mindestens einem Behandlungsfall1551.187
       Anzahl Behandlungsfälle67.374468.530
       Fallzahl pro Klinik Median (1. Quartil – 3. Quartil)399 (201 - 607)334 (179 - 554)
       Anteil Alter ab 65 Jahre87,1%88,8%
       Anteil Frauen50,0%51,1%
       Anteil zuverlegt aus anderem Krankenhaus3,5%4,7%
       Anzahl Nebendiagnosen pro Behandlungsfall Median (1. Quartil – 3. Quartil)13 (11 - 15)11 (7 - 15)
       Anteil Todesfälle6,7%8,0%
      Hirninfarkt
       Anzahl Krankenhäuser mit mindestens einem Behandlungsfall1501.213
       Anzahl Behandlungsfälle38.562257.644
       Fallzahl pro Klinik Median (1. Quartil – 3. Quartil)113 (15 - 433)78 (20 - 307)
       Anteil Alter ab 65 Jahre76,9%77,3%
       Anteil Frauen47,9%48,3%
       Anteil zuverlegt aus anderem Krankenhaus8,3%14,4%
       Anzahl Nebendiagnosen pro Behandlungsfall Median (1. Quartil – 3. Quartil)12 (10 - 14)9 (6 - 14)
       Anteil Todesfälle6,6%6,2%
      Pneumonie
       Anzahl Krankenhäuser mit mindestens einem Behandlungsfall1541.188
       Anzahl Behandlungsfälle30.611207.497
       Fallzahl pro Klinik Median (1. Quartil – 3. Quartil)192 (106- 268)151 (83 - 240)
       Anteil Alter ab 65 Jahre76,1%74,1%
       Anteil Frauen44,0%44,1%
       Anteil zuverlegt aus anderem Krankenhaus
      Im Indikator zur Sterblichkeit der Pneumonie werden zuverlegte Fälle generell ausgeschlossen.
      --
       Anzahl Nebendiagnosen pro Behandlungsfall Median (1. Quartil – 3. Quartil)11 (10 - 13)9 (5 - 13)
       Anteil Todesfälle8,5%9,2%
      Kolorektale Resektion bei Karzinom
       Anzahl Krankenhäuser mit mindestens einem Behandlungsfall128967
       Anzahl Behandlungsfälle3.94529.019
       Fallzahl pro Klinik Median (1. Quartil – 3. Quartil)25 (16 - 41)26 (14 - 40)
       Anteil Alter ab 65 Jahre72,2%73,6%
       Anteil Frauen46,0%47,6%
       Anteil zuverlegt aus anderem Krankenhaus1,2%1,9%
       Anzahl Nebendiagnosen pro Behandlungsfall Median (1. Quartil – 3. Quartil)13 (10 - 16)9 (5 - 15)
       Anteil Todesfälle3,9%4,7%
      IQM: Initiative Qualitätsmedizin
      a Im Indikator zur Sterblichkeit der Pneumonie werden zuverlegte Fälle generell ausgeschlossen.

      Auswirkung der Risikoadjustierung auf die Indikatorergebnisse bei IQM Mitgliedskrankenhäusern

      Vergleich der Verteilung der SMRs

      Der Vergleich der Verteilung der SMR ist in Tabelle 3 dargestellt. Die auf Basis spezifischer Risikomodelle berechneten SMR zeigten im Median keine bis geringe Abweichungen von den SMR auf Basis einer Alters- und Geschlechtsadjustierung; die Verteilungen der SMR weichen nur geringfügig voneinander ab (Appendix A, Abbildung A1). Bei den Universitätskliniken verringerten sich die SMR-Werte tendenziell unter der spezifischen Risikoadjustierung bei den Indikatoren Sterblichkeit bei Herzinfarkt und Herzinsuffizienz, während beim Indikator Sterblichkeit bei Hirninfarkt eine tendenzielle Erhöhung zu beobachten war.
      Tabelle 3Vergleich der standardisierten Sterblichkeitsverhältnisse zwischen verschiedenen Risikoadjustierungsansätzen.
      Krankenhaustypen
      Alle KrankenhäuserFachklinikenGrund- und RegelversorgerMaximalversorgerUniversitätskliniken
      Herzinfarkt
      Anzahl Krankenhäuser1527113239
      Fallzahl224.89013.028122.48959.85929.514
      SMR: Median (1. Quartil - 3. Quartil)
       Alters- und Geschlechtsadjustierung0,78 (0,43 - 1,03)1,03 (0,84 - 1,36)0,64 (0,38 - 0,93)0,95 (0,83 - 1,08)1,21 (0,9 - 1,62)
       Spezifische Risikoadjustierung0,78 (0,5 - 1,04)0,94 (0,84 - 1,81)0,67 (0,41 - 0,97)0,91 (0,78 - 1,13)0,92 (0,67 - 1,25)
      Korrelation zwischen SMRs0,90,820,910,790,83
      Herzinsuffizienz
      Anzahl Krankenhäuser1559115238
      Fallzahl460.89612.206308.519113.11827.053
      SMR: Median (1. Quartil - 3. Quartil)
       Alters- und Geschlechtsadjustierung0,82 (0,57 - 1,08)0,43 (0,1 - 0,81)0,8 (0,57 - 1,04)0,97 (0,71 - 1,23)1,01 (0,65 - 1,15)
       Spezifische Risikoadjustierung0,82 (0,59 - 1,2)0,51 (0,14 - 0,95)0,82 (0,58 - 1,13)1,16 (0,66 - 1,37)0,8 (0,76 - 0,84)
      Korrelation zwischen SMRs0,920,930,920,930,86
      Hirninfarkt
      Anzahl Krankenhäuser1505113239
      Fallzahl254.0241.303121.58992.53338.599
      SMR: Median (1. Quartil - 3. Quartil)
       Alters- und Geschlechtsadjustierung0,81 (0,48 - 1,24)0,79 (0,17 - 4,06)0,72 (0,31 - 1,01)1,19 (1,04 - 1,35)1,45 (1,09 - 1,55)
       Spezifische Risikoadjustierung0,8 (0,39 - 1,25)0,88 (0,17 - 3,51)0,66 (0,26 - 1,04)1,27 (0,94 - 1,42)1,65 (1,07 - 1,68)
      Korrelation zwischen SMRs0,9910,980,860,95
      Pneumonie
      Anzahl Krankenhäuser1545117239
      Fallzahl149.9631.15097.29438.73412.785
      SMR: Median (1. Quartil - 3. Quartil)
       Alters- und Geschlechtsadjustierung0,83 (0,51 - 1,08)0,44 (0 - 1,18)0,79 (0,49 - 1,01)1,01 (0,86 - 1,28)1,08 (0,72 - 1,13)
       Spezifische Risikoadjustierung0,82 (0,52 - 1,06)0,47 (0 - 1,12)0,75 (0,5 - 1)1,02 (0,83 - 1,21)0,99 (0,77 - 1,12)
      Korrelation zwischen SMRs0,9910,990,960,95
      Kolonresektion
      Anzahl Krankenhäuser128097238
      Fallzahl27.257016.6187.9242.715
      SMR: Median (1. Quartil - 3. Quartil)
       Ohne Risikoadjustierung0,62 (0 - 1,16)-0,51 (0 - 1,06)0,78 (0,62 - 1,37)1,08 (0,92 - 1,67)
       Spezifische Risikoadjustierung0,66 (0 - 1,25)-0,52 (0 - 1,14)0,79 (0,44 - 1,46)1,11 (1,03 - 1,47)
      Korrelation zwischen SMRs0,97-0,970,960,81
      SMR: Standardisiertes Sterblichkeitsverhältnis (standardized mortality ratio); Korrelationen ermittelt als Spearmans ρ.
      Die Korrelationen zwischen den nach den verschiedenen Risikoadjustierungsmethoden ermittelten SMRs fielen in der Gesamtstichprobe der Häuser sehr hoch aus (Spearmans ρ zwischen 0,9 und 0,99). Die Zusammenhänge sind in Abbildung 1 visualisiert.
      Figure thumbnail gr1
      Abbildung 1Streudiagramme zum Vergleich der standardisierten Sterblichkeitsverhältnisse zwischen verschiedenen Methoden der Risikoadjustierung.
      SMR: Standardisiertes Sterblichkeitsverhältnis (standardized mortality ratio); LOESS: lokal gewichteter Regression-Streudiagramm-Glätter (locally weighted scatterplot smoother)
      Zu besseren Visualisierung wurden Krankenhäuser mit SMR-Werten >3 nicht dargestellt (Herzinfarkt: 3 Krankenhäuser, Hirninfarkt: 9 Krankenhäuser, Kolonresektion: 7 Krankenhäuser).
      Anmerkung: Für eine bessere Visualisierung der in dieser Abbildung verwendeten Farben siehe: https://doi.org/10.1016/j.zefq.2021.04.003.

      Auswirkungen auf die Bewertung der Versorgungsqualität

      Die Bewertung der SMR im Sinne eines Aufgreifkriteriums für Qualitätsverbesserungsmaßnahmen ist in Abbildung 2 in der linken Spalte verdeutlicht. Der Anteil der Häuser, deren SMR-Wert außerhalb des Intervalls [0,9; 1,1] lag, unterschied sich zwischen den Risikoadjustierungsverfahren nur um 0% bis 5,4% (Appendix A, Tabelle A6). Die Zahl an Krankenhäusern, die unter spezifischer Risikoadjustierung die Bewertungskategorie wechselten variierte je nach Indikator: Hirninfarkt: 29 von 152 Krankenhäuser (19,1%), Herzinsuffizienz: 32/155 (20,6%), Hirninfarkt: 11/150 (7,3%), Pneumonie: 6/154 (3,9%), kolorektale Resektion bei Karzinom: 20/128 (15,6%). Verschlechterungen und Verbesserungen der Bewertungskategorie hielten sich hierbei in etwa die Waage, abgesehen vom Indikator Herzinsuffizienz, in dem sich 24 Häuser (15,5%) relativ verschlechterten, jedoch nur 8 Häuser (5,2%) relativ verbesserten.
      Figure thumbnail gr2
      Abbildung 2Veränderungen in der inhaltlichen Bewertung des standardisierten Sterblichkeitsverhältnisses bei Anwendung verschiedener Risikoadjustierungsverfahren
      Linkes Panel: Deskriptive Bewertung des standardisierten Sterblichkeitsverhältnisses (SMR) ohne Berücksichtigung der Signifikanz (Standardmethode in IQM).
      Rechtes Panel: Bewertung des standardisierten Sterblichkeitsverhältnisses unter Berücksichtigung der Signifikanz der Abweichung von 1 (95% Konfidenzintervall schließt Wert 1 nicht mit ein).
      Der jeweils linke geschichtete Balken zeigt Bewertung unter Risikoadjustierung nach Alter und Geschlecht (bzw. keiner Risikoadjustierung für die Kolonresektion). Der jeweils rechte Balken zeigt die Veränderung der Bewertung innerhalb der jeweiligen Kategorie, wenn anstelle der Alters- und Geschlechtsadjustierung eine spezifische Risikoadjustierung zum Einsatz kommt.
      Anmerkung: Für eine bessere Visualisierung der in dieser Abbildung verwendeten Farben siehe: https://doi.org/10.1016/j.zefq.2021.04.003.
      Die Mehrheit der Häuser zeigte sowohl unter Alters- und Geschlechtsadjustierung sowie unter spezifischer Risikoadjustierung in der SMR keine signifikante Abweichung vom Wert 1 (63,2 bis 100%, bzw. 60% bis 98,4% je Indikator); der Anteil der Häuser, die signifikant vom Wert 1 abwichen, unterschied sich nur um 1,6% bis 3,9% der Häuser (Appendix A, Tabelle A6). Zwischen 1,6% (Kolonresektion) und 17,4% (Herzinsuffizienz) zeigten einen Wechsel der Bewertungskategorie. Verschlechterung und Verbesserung der Bewertung hielten sich wiederum die Waage – abgesehen vom Indikator Herzinsuffizienz, bei dem sich 22 Häuser (14,2%) verschlechterten, und 5 (3,2%) verbesserten. Appendix A, Abbildung A2, verdeutlicht, dass sich in der Verteilung der p-Werte des Tests auf Abweichung der SMR von 1 kaum Unterschiede zwischen den Risikoadjustierungsmethoden zeigten.

      Diskussion

      Dem Konzept der Messung und Beurteilung eines Qualitätsindikators unterliegt implizit die Annahme, dass eine beobachtete Auffälligkeit eines Krankenhauses im Indikator durch eine (verhältnismäßig) schlechtere Versorgungsqualität zu Stande kommt. Die Validität dieser Annahme kann durch verschiedene Verzerrungen beeinträchtigt werden. Die Ergebnisse der vorgestellten Untersuchung sollen vor dem Hintergrund verschiedener Verzerrungsquellen [
      • Normand S.L.T.
      • Shahian D.M.
      Statistical and clinical aspects of hospital outcomes profilling.
      ,
      • Iezzoni L.I.
      Risk adjustment, in Performance measurement for health system improvement: Experiences, challenges and prospects, P.C. Smith, et al..
      ], und im Hinblick auf den Anwendungszweck der Qualitätsmessung bei IQM [
      • Mansky T.
      • Nimptsch U.
      Medizinische Qualitätsmessung im Krankenhaus – Worauf kommt es an?. Zeitschrift für Evidenz.
      ,
      • Mansky T.
      • Völzke T.
      • Nimptsch U.
      Improving outcomes using German Inpatient Quality Indicators in conjunction with peer review procedures.
      ] eingeordnet werden, um auf diese Weise begründete Empfehlungen zur Anpassung der Methodik der Qualitätsmessung bei IQM abzuleiten. Die systematische Erprobung der Risikoadjustierung in Krankenhausabrechnungsdaten an einer so großen Stichprobe von Krankenhäusern ist bisher in Deutschland einzigartig.

      Verzerrung durch nicht berücksichtigte Störgrößen

      Für die betrachteten Indikationen sind patientenseitige Einflussfaktoren auf die Sterblichkeit – wie Begleiterkrankungen und Indikatoren der Erkrankungsschwere - vielfach in epidemiologischen und klinischen Studien nachgewiesen worden. Ihre Nichtberücksichtigung bei der Berechnung von Qualitätsindikatoren der stationären Versorgung führt zu einer Verzerrung durch Störgrößen, sofern sich Krankenhäuser in der Verteilung dieser Merkmale ihrer Patienten (Case-Mix) unterscheiden [
      • Normand S.L.T.
      • Shahian D.M.
      Statistical and clinical aspects of hospital outcomes profilling.
      ,
      • Iezzoni L.I.
      Risk adjustment, in Performance measurement for health system improvement: Experiences, challenges and prospects, P.C. Smith, et al..
      ]. Die spezifischen Risikomodelle unter Berücksichtigung entsprechender in den DRG-Daten kodierter Merkmale zeigten eine Modellgüte anhand der Diskrimination mit ähnlichen sowie teils höheren Werten wie publizierte Risikomodelle auf Basis von Abrechnungsdaten zur Sterblichkeit bei Herzinfarkt, Herzinsuffizienz und Pneumonie, welche im Rahmen des US-Amerikanischen Hospital-Compare zum Einsatz kommen [
      • Krumholz H.M.
      • et al.
      An administrative claims model suitable for profiling hospital performance based on 30-day mortality rates among patients with an acute myocardial infarction.
      ,
      • Krumholz H.M.
      • et al.
      An administrative claims model suitable for profiling hospital performance based on 30-day mortality rates among patients with heart failure.
      ,
      • Bratzler D.W.
      • et al.
      An Administrative Claims Model for Profiling Hospital 30-Day Mortality Rates for Pneumonia Patients.
      ]. Dass die Häuser der IQM-Stichprobe auch bei Berücksichtigung spezifischer Risikofaktoren im Schnitt eine geringere Sterblichkeit als der Bundesdurchschnitt zeigten, könnte die Annahme einer besseren Versorgungsqualität in den an der Untersuchung teilnehmenden IQM Krankenhäusern bestärken. Zugleich muss berücksichtigt werden, dass es sich bei diesen Häusern um eine Positivauswahl mit erhöhtem Anteil besonders engagierter Häuser handeln könnte, und dass allgemeine Verbesserungen der Versorgung zwischen 2016 und 2018 den Unterschied erklären könnten. Bei Anwendung spezifischer Risikoadjustierung zeigte sich im Schnitt über die Indikatoren keine Verbesserung oder Verschlechterung der beteiligten IQM-Krankenhäuser. Dies ist methodisch zu erwarten, da in einem Risikomodell auf Basis einer logistischen Regression die Gesamtzahl der beobachteten Ereignisse der Gesamtzahl der erwarteten Ereignisse entspricht, sofern die IQM-Krankenhäuser hinsichtlich der Verteilung der Risikofaktoren in etwa repräsentativ sind. Dies bestätigte sich, da die einbezogenen spezifischen Risikofaktoren in dieser Stichprobe nicht deutlich häufiger kodiert waren als in der bundesweiten DRG-Statistik.

      Informationsverzerrung durch variierende Datenqualität

      Die Nutzung von Routinedaten kennzeichnet den pragmatischen Ansatz von IQM, der die Teilnahme für eine große Zahl von Krankenhäusern attraktiv macht. Die Korrektheit und Vollständigkeit der Kodierung etwa von ICD-Codes sind jedoch unsicher und unterliegen Erlösanreizen; zudem kann die Datenqualität auch zwischen Krankenhäusern variieren [
      • Iezzoni L.I.
      Risk adjustment, in Performance measurement for health system improvement: Experiences, challenges and prospects, P.C. Smith, et al..
      ]. Dies wirkt sich auf die Kodierung möglicher Risikofaktoren aus, da im Rahmen des DRG-Systems ein Anreiz zur Kodierung nur so lange gegeben ist, wie diese zu einem höheren Erlös führt. Internationale Studien, welche die Kodierung von Komorbiditäten in Abrechnungsdaten anhand von Aktensichtungen validierten, fanden im Schnitt eine Unterkodierung, wobei die Sensitivität der Kodierung stark über verschiedene Komorbiditäten variierte [
      • Leal J.R.
      • Laupland K.B.
      Validity of ascertainment of co-morbid illness using administrative databases: a systematic review.
      ,
      • Quan H.
      • Parsons G.A.
      • Ghali W.A.
      Validity of information on comorbidity derived rom ICD-9-CCM administrative data.
      ]. Eine Arbeit aus Deutschland berichtete zeitliche Veränderungen in der Vollständigkeit der Kodierung der Nebendiagnosen sowie Variationen auf der Krankenhausebene [
      • Nimptsch U.
      Disease-Specific Trends of Comorbidity Coding and Implications for Risk Adjustment in Hospital Administrative Data.
      ].
      Als Risikofaktoren sollten nur vorbestehende patientenseitige Merkmale verwendet werden und nicht solche, welche selbst durch die Qualität der Versorgung beeinflusst sein könnten [
      • Krumholz H.M.
      • et al.
      Standards for statistical models used for public reporting of health outcomes - An American Heart Association scientific statement from the quality of care and outcomes research interdisciplinary writing group - Cosponsored by the Council on Epidemiology and Prevention and the Stroke Council - Endorsed by the American College of Cardiology Foundation.
      ,
      • Iezzoni L.I.
      Risk adjustment, in Performance measurement for health system improvement: Experiences, challenges and prospects, P.C. Smith, et al..
      ]. Eine Adjustierung nach (potenziellen) Komplikationen ist im Rahmen einer Qualitätsmessung nicht zielführend, da so eventuelle Qualitätsprobleme „wegadjustiert“ würden [
      • Mansky T.
      • Nimptsch U.
      Medizinische Qualitätsmessung im Krankenhaus – Worauf kommt es an?. Zeitschrift für Evidenz.
      ]. Ein Beispiel wäre die Nebendiagnose einer Lungenembolie bei kolorektaler Resektion, welche als Risikofaktor vorbestehend sein kann, jedoch postoperativ als Komplikation auftreten könnte. In einer US-amerikanischen Untersuchung der zeitlichen Zuordnung schwerer Sekundärdiagnosen bei chirurgischen Fällen mittels Aktensichtung zeigte sich, dass tiefe Venenthrombosen oder Lungenembolien nur in 22% der Fälle bereits bei Aufnahme bestanden [
      • Lawthers A.G.
      • et al.
      Identification of In-Hospital Complications From Claims Data: Is It Valid?.
      ]. Eine Berücksichtigung ungeeigneter Variablen als Risikofaktoren würde zwar die statistische Vorhersagegüte eines Risikomodells erhöhen, zugleich aber die Validität der Folgerungen über die Versorgungsqualität verringern [
      • Iezzoni L.I.
      Risk adjustment, in Performance measurement for health system improvement: Experiences, challenges and prospects, P.C. Smith, et al..
      ]. Während einige Länder Abrechnungsdaten systematisch für die Nutzung zur Qualitätssicherung verbessert haben – etwa durch die Einführung einer present on admission Kodierung [
      • Iezzoni L.I.
      Risk adjustment, in Performance measurement for health system improvement: Experiences, challenges and prospects, P.C. Smith, et al..
      ,
      • Zhan C.
      • et al.
      Modifying DRG-PPS to include only diagnoses present on admission: financial implications and challenges.
      ], gibt es in Deutschland bisher keine entsprechenden Bestrebungen auf Seiten der regulatorischen Instanzen.
      Ähnliche Validierungsstudien wie die oben zitierten, in denen die Kodierungen in Abrechnungsdaten anhand von Informationen auf Basis von Krankenaktensichtungen validiert wurden, können auch in Deutschland wichtige Informationen zur Nutzbarkeit von Abrechnungsdaten für Qualitätssicherung erbringen [
      • Leal J.R.
      • Laupland K.B.
      Validity of ascertainment of co-morbid illness using administrative databases: a systematic review.
      ,
      • Quan H.
      • Parsons G.A.
      • Ghali W.A.
      Validity of information on comorbidity derived rom ICD-9-CCM administrative data.
      ,
      • Lawthers A.G.
      • et al.
      Identification of In-Hospital Complications From Claims Data: Is It Valid?.
      ]. Beispielgebend kann hierfür das Innovationsfonds-geförderte Projekt „OPTIMISE“ sein, welches die Validität der Kodierung von Sepsis und von Risikofaktoren für sepsisassoziierte Letalität in deutschen DRG-Daten prüft [
      • Schwarzkopf D.
      • et al.
      Validation study of German inpatient administrative health data for epidemiological surveillance and measurement of quality of care for sepsis: the OPTIMISE study protocol.
      ].

      Verzerrung durch absichtliche Fehlkodierung

      Die Berücksichtigung spezifischer Risikofaktoren könnte einen Anreiz schaffen, mehr (und ggf. real gar nicht vorliegende) Risikofaktoren in Abrechnungsdaten zu kodieren, um in risikoadjustierten Indikatoren besser abzuschneiden. Solche Effekte sind insbesondere im Rahmen von Pay-for-Performance-Systemen zu erwarten, in denen ein schlechteres Abschneiden mit monetären Konsequenzen verbunden ist [
      • Bastani H.
      • Goh J.
      • Bayati M.
      Evidence of Upcoding in Pay-for-Performance Programs.
      ]. Jedoch könnten Krankenhäuser auch bei Qualitätsmessungen zu anderen Zwecken einen Anreiz haben, Behandlungsfälle mit hohem Sterberisiko durch „Umkodierung“ aus dem Indikationsbereiches eines Qualitätsindikators zu verschieben, oder ganz aus (freiwilligen) Qualitätssicherungsprogrammen auszuscheiden, sofern sie sich durch Nicht-Berücksichtigung des Case-Mix systematisch benachteiligt fühlen [
      • Iezzoni L.I.
      Risk adjustment, in Performance measurement for health system improvement: Experiences, challenges and prospects, P.C. Smith, et al..
      ].

      Zufallsfehler

      Je kleiner die Fallzahl behandelter Patienten in einem Indikationsbereich, umso höher ist die Wahrscheinlichkeit rein zufälliger Abweichungen der Indikatorergebnisse von der Erwartung (z.B. vom SMR-Wert von 1). Durch die Berücksichtigung von Konfidenzintervallen kann dieser Zufallsfehler eingeschätzt werden. In Abhängigkeit von der durchschnittlichen Fallzahl veränderte sich die Zahl an Häusern, deren SMR-Wert „auffällig“ von 1 abwich, sofern das Konfidenzintervall als Kriterium des Urteils verwendet wurde. Hierbei fiel die Zahl auffälliger Werte für alle betrachteten Indikatoren ab. Dies zeigte sich am deutlichsten im Indikator Kolonresektion, der die geringste Fallzahl je Krankenhaus sowie die geringste Sterblichkeit unter den Indikatoren zeigte, was in den breitesten Konfidenzintervallen resultiert. Im Rahmen des Aufgreifkriteriums für kontinuierliche Qualitätsanalyse und -verbesserung kann der Verzicht auf Konfidenzintervalle sinnvoll sein, da vermieden werden soll, dass statistisch nicht signifikante aber klinisch relevante Auffälligkeiten bei Häusern mit kleiner Fallzahl gar keiner Analyse unterzogen werden. Für die (öffentliche) Bewertung und Vergleiche von Qualitätsindikatoren ist die Verwendung von Konfidenzintervallen zu empfehlen, da vermieden werden soll, dass rein zufällige Abweichungen bzw. Unterschiede als Anzeichen mangelnder Versorgungsqualität fehlinterpretiert werden. Bei Indikatoren mit im Schnitt hohen Fallzahlen könnten jedoch auch kleine und ggf. klinisch nicht relevante Unterschiede relativ häufig signifikant von 1 abweichen. Hier sollte das Kriterium einer signifikanten Überschreitung eines als klinisch relevant erachteten Schwellenwertes (z.B. von SMR > 1,1) im Rahmen von Veröffentlichungen in Betracht gezogen werden.

      Eignung als Aufgreifkriterien für weitergehende Fallanalysen

      Aufgrund des damit verbundenen Aufwands kann in der Regel nur eine kleine Zahl von Fällen im Rahmen von Peer-Reviews oder M&M Konferenzen detailliert analysiert werden. Dies wirft die Frage der optimalen Auswahl der zu analysierenden Fälle zum Auffinden relevanter Verbesserungspotentiale der Versorgung auf. Die Implementierung einer Risikoadjustierung im Aufgreifkriterium durch Auswahl der Fälle mit geringstem Sterberisiko könnte hierbei den Anteil von Fällen mit möglichem Versorgungsdefiziten mit Zusammenhang zur Sterblichkeit erhöhen (höherer positiver prädiktiver Wert). Zugleich zeigen Erfahrungen aus Peer-Reviews jedoch, dass auch Fälle mit hohen vorbestehenden Risiken wertvolle Informationen – z.B. in Zusammenhang mit der Indikationsstellung oder dem perioperativen Management liefern können [

      Burgard, G., Low-risk-Operationen bei High-risk-Patienten, in Peer Review - sicher ist besser, W. Krahwinkel, A. Meier-Hellmann, and J. Zacher, Editors. 2013, Medizinisch Wissenschaftliche Verlagsgesellschaft: Berlin.

      ]. Der Nutzen der Risikoadjustierung im Rahmen des Fallaufgriffes muss darum indikatorspezifisch und nach der konkreten Zielstellung der Fallanalyse kritisch abgewogen werden. Hier könnten empirische Untersuchungen - etwa im Rahmen verblindeter, randomisierter Vergleiche der Nutzenbewertung der Fallanalysen zwischen verschieden Methoden des Fallaufgriffs – zur Weiterentwicklung der Verfahren beitragen.

      Zusammenfassung der Pro- und Contra-Argumente für die Anpassung der IQM-Methodik

      Box 1 stellt die Pro- und Contra-Argumente für eine Anpassung der bestehenden IQM-Methodik vor dem Hintergrund der ausgeführten Verzerrungsquellen dar. Die Contra-Argumente stellen hierbei letztlich keine generellen Gegenargumente dar, sondern unerwünschte Konsequenzen, die bei einer inadäquaten Implementierung einer Risikoadjustierung eintreten könnten. Sie sollten darum in die Konzeptualisierung der Risikoadjustierung einfließen.
      Tabled 1
      Nutzung indikator-spezifischer Risikoadjustierung für die Bewertung der Versorgungsqualität
      ProContra
      • Nichtberücksichtigung relevanter patientenseitiger Risikofaktoren führt zu Fehlschlüssen• Es sollten nur sicher valide kodierte Risikofaktoren wie Alter und Geschlecht verwendet werden, um Fehlschlüsse auf Basis variierender Kodierpraxis zu vermeiden
      • Nichtberücksichtigung des Case-Mix könnte zum Versuch des Ausschließens von Hochrisikopatienten aus bestimmten Qualitätsindikatoren oder zum Ausscheiden aus IQM führen, sofern sich Krankenhäuser systematisch benachteiligt fühlen• Berücksichtigung von Risikofaktoren wie Komorbiditäten lädt zur aktiven Beeinflussung der risikoadjustierten Qualitätsindikatoren durch gezielte Kodierung ein
      Nutzung von Konfidenzintervallen für die Bewertung der Versorgungsqualität
      ProContra
      • Zufällige Abweichungen sollen nicht als Versorgungsdefizit fehlinterpretiert werden• Auch statistisch nicht signifikante mögliche Versorgungsdefizite sollen aufgegriffen und analysiert werden
      Nutzung indikator-spezifischer Risikoadjustierung im Aufgreifkriterium für tiefergehende Einzelfallanalysen
      ProContra
      • Berücksichtigung der Risikoadjustierung im Aufgreifkriterium könnte zur besseren Allokation knapper Ressourcen für Fallanalysen führen• Berücksichtigung von Risikoadjustierung im Aufgreifkriterium könnte zum Ausschluss von Fällen führen, die relevantes Verbesserungspotential aufzeigen

      Limitationen der DRG-Daten

      Neben der angesprochenen Frage der Datenqualität der Abrechnungsdaten stellt auch deren mangelnder klinischer Gehalt eine Einschränkung ihrer Nutzbarkeit für Qualitätssicherungszwecke dar [
      • Iezzoni L.I.
      Risk adjustment, in Performance measurement for health system improvement: Experiences, challenges and prospects, P.C. Smith, et al..
      ] So ist beispielsweise der Bewusstseinszustand bei Aufnahme, der einen relevanten Risikofaktor für das Versterben bei Schlaganfall darstellt [
      • Bray B.D.
      • et al.
      Derivation and external validation of a case mix model for the standardized reporting of 30-day stroke mortality rates.
      ], nicht in der ICD-10-GM kodierbar und somit nicht in DRG-Daten abbildbar. Amerikanische Studien, die SMR auf Basis von Abrechnungsdaten mit solchen auf Basis von elektronischen Patientenakten abglichen, zeigten jedoch sehr hohe Korrelationen, was die grundsätzliche Eignung auch von Abrechnungsdaten zur Nutzung für risikoadjustierte Versorgervergleiche nahelegt [
      • Krumholz H.M.
      • et al.
      An administrative claims model suitable for profiling hospital performance based on 30-day mortality rates among patients with an acute myocardial infarction.
      ,
      • Krumholz H.M.
      • et al.
      An administrative claims model suitable for profiling hospital performance based on 30-day mortality rates among patients with heart failure.
      ]. Entsprechende Untersuchungen müssten natürlich in Deutschland indikatorspezifisch wiederholt werden, was durch die mangelnde Nutzung elektronischer Patientenakten und mangelnde Datenintegration erheblich erschwert wird. Die Medizininformatik-Initiative gibt mit der Etablierung eines Kerndatensatzes zumindest einen ersten Ausblick auf zukünftige Möglichkeiten [
      • Ganslandt T.
      • et al.
      Der Kerndatensatz der Medizininformatik-Initiative: Ein Schritt zur Sekundärnutzung von Versorgungsdaten auf nationaler Ebene.
      ].
      Eine weitere Einschränkung der DRG-Daten ist das Fehlen von Vor- und Nachbeobachtungszeiträumen, da nur Daten eines einzigen Krankenhausaufenthaltes verfügbar sind. Dies schränkt die Identifikation vorbestehender Risikofaktoren wie Komorbiditäten oder vorangegangene Krankheitsereignisse ein. Zudem können Qualitätsergebnisse durch den Einfluss von Verlegungen systematisch verzerrt sein, da deutsche DRG-Daten keine Endpunkte nach standardisierten Zeiträumen (etwa 90-Tage-Sterblichkeit) beinhalten. Diesem Problem kann durch die Kontrolle des Zuverlegungsstatus im Risikomodell begegnet werden. Hierbei kann jedoch nicht unterschieden, werden, ob es sich um Aufwärtsverlegungen kritisch kranker Patienten, oder Anschlussbehandlung nach der kritischen Phase handelt, was zu spezifischen Verzerrungen führen kann. Die Stratifizierung nach Zu- bzw. Wegverlegungsstatus– wie sie in der IQM für die Indikatoren Herzinfarkt, Herzinsuffizienz und Hirninfarkt bereits umgesetzt wird – könnte hier sinnvoller sein. Indikatorspezifische Validierungsstudien im Abgleich mit anderen Datenquellen, welche Vorbeobachtungszeiträume und Verlegungsketten nachvollziehbar machen – etwa Krankenkassendaten – können hierzu wichtige Informationen liefern. Angesichts der beschriebenen Einschränkungen sollten für externe Vergleiche von Qualitätsergebnissen einzelner Krankenhäuser Qualitätsmessungen herangezogen werden, die auf Daten beruhen, welche die Langzeitperspektive beinhalten - wie beispielsweise das QSR-Verfahren des WIdO [
      Wissenschaftliches Institut der AOK (WIdO)
      ].

      Empfehlungen der Expertengruppe

      Das Expertengremium empfiehlt nach Abwägung aller Argumente die Einführung einer weitergehenden Risikoadjustierung in den G-IQI. Die in Box 1 benannten Contra-Argumente verdeutlichen die möglichen Probleme und Ergebnisverzerrungen, die durch inadäquate Risikoadjustierung entstehen können. Die zu etablierende Risikoadjustierungsmethodik sollte diese Argumente darum aufgreifen. Der zusätzliche Forschungsbedarf, zum besseren Verständnis der Validität und Nutzbarkeit der Abrechnungsdaten zur Qualitätssicherung wurde mit Verweis auf verschiedene Studien dargelegt. Das Expertengremium hat darum konkrete methodische Empfehlungen zur Entwicklung weitergehender Risikoadjustierung sowie zu Forschungsarbeiten zur Prüfung und Verbesserung der Validität der Datengrundlage formuliert (Box 2). Die spezifischen Risikoadjustierungsmodelle, die in dieser Arbeit Verwendung fanden, entsprechen selbst nicht vollumfänglich diesen Empfehlungen, da sie auf vorbestehenden Arbeiten mit anderen Zwecken beruhen [
      • Nimptsch U.
      • Mansky T.
      Hospital volume and mortality for 25 types of inpatient treatment in German hospitals: observational study using complete national data from 2009 to 2014.
      ,
      • Bolczek C.
      • et al.
      Versorgungsstrukturen und Mengen-Ergebnis-Beziehung beim akuten Herzinfarkt – Verlaufsbetrachtung der deutschlandweiten Krankenhausabrechnungsdaten von 2005 bis 2015.
      ]. Auch für die dargestellten Indikatoren muss folglich eine systematische Modellentwicklung und Validierung zur Verwendung im Rahmen der G-IQI erst noch erfolgen.
      Tabled 1
      • Die Entwicklung einer weitergehenden Risikoadjustierung für ausgewählte G-IQI Indikatoren, welche den Endpunkt der Krankenhaussterblichkeit beinhalten, wird empfohlen.
      • Risikomodelle sollten systematisch im Hinblick auf die Anforderungen einer Qualitätsmessung entwickelt und statistisch validiert werden.
      • Für die optimale Interpretierbarkeit, auch von Veränderungen über die Zeit, sollten beobachtete Sterblichkeit, auf Basis der Risikofaktoren erwartete Sterblichkeit, und risikoadjustierte Sterblichkeit in den Qualitätsberichten dargestellt werden.
      • Veränderungen in der Kodierung von Risikofaktoren in den IQM-Mitgliedskrankenhäusern nach der Einführung von entsprechender Risikoadjustierung sollten zentral validiert und interpretiert werden.
      • Für IQM-interne Aufgreifkriterien zur kontinuierlichen Analyse und Verbesserung der Qualität sollten auch zukünftig keine Konfidenzintervalle Verwendung finden.
      • Um fehlerhafte Interpretationen von Qualitätsindikatoren sowie Rankings in der Öffentlichkeit vorzubeugen, sollten ggf. für sensible Indikatoren in der Veröffentlichung in Zukunft Konfidenzintervalle angegeben werden.
      • Sofern in Indikatoren aufgrund hoher Fallzahlen vermehrt signifikante, aber klinisch nicht relevante Abweichungen vom Erwartungswert der SMR von 1 auftreten, kann als alternatives Kriterium das signifikante Überschreiten eines kritischen Schwellenwertes zur Abbildung klinischer Relevanz in Betracht gezogen werden.
      • Der Nutzen der Risikoadjustierung im Aufgreifkriterium für Fallanalysen und Peer-Reviews muss indikatorspezifisch abgewogen und empirisch erprobt werden.
      • Im Rahmen der IQM sollten Forschungsprojekte zur Prüfung der Validität der DRG-Daten für Qualitätssicherung angestoßen und befördert werden.
      • Auf Basis von Prüfungen der Validität der einzelnen G-IQI sollte die Veröffentlichungsfähigkeit jeweils bewertet und ggf. einzelne Indikatoren von der Veröffentlichungspflicht ausgenommen werden
      • Für externe Vergleiche von Qualitätsergebnissen einzelner Krankenhäuser sollten dafür konzipierte Qualitätsmessungen auf Basis besser geeigneter Daten herangezogen werden, wie beispielsweise das QSR-Verfahren des WIdO.
      • Die IQM sollte sich weiterhin für die Verbesserung der Nutzbarkeit von Krankenhausabrechnungsdaten für Qualitätsverbesserung einsetzen, vor allem durch die Forderung der Einführung einer present on admission Kennzeichnung.

      Interessenkonflikt

      Dr. Schwarzkopf hat keine Interessenkonflikte. Dr. Nimptsch berichtet persönliche Honorare von der 3 M Deutschland GmbH, unabhängig von der eingereichten Arbeit. Herr Graf hat die durch ihn verantworteten Analysen im Rahmen dieser Studie im Auftrag der IQM - Initiative Qualitätsmedizin e. V. durchgeführt. Prof. Schmitt hat keine Interessenkonflikte. Prof. Zacher hat keine Interessenkonflikte. Prof. Kuhlen berichtet nicht-finanzielle Unterstützung durch Fresenius während der Durchführung der Studie.

      Literatur

        • Eberlein-Gonska M.
        • Martin J.
        • Zacher J.
        eds. Handbuch IQM: Konsequent transparent – Qualität mit Routinedaten! 2. ed.
        Medizinisch Wissenschaftliche Verlagsgesellschaft, Berlin2017
        • Nimptsch U.
        • Mansky T.
        G-IQI | German Inpatient Quality Indicators Version 5. 2 - Bundesreferenzwerte für das Auswertungsjahr.
        Technische Universität Berlin, Berlin2016 2018
      1. Nimptsch, U. and T. Mansky. G-IQI Version 5.0 - Messen, um zu verbessern, in Handbuch IQM: Kosequent transparent - Qualität mit Routinedaten!, M. Eberlein-Gonska, J. Martin, and J. Zacher, Editors. 2017, Medizinisch Wissenschaftliche Verlagsgesellschaft: Berlin.

        • Mansky T.
        • Nimptsch U.
        Medizinische Qualitätsmessung im Krankenhaus – Worauf kommt es an?. Zeitschrift für Evidenz.
        Fortbildung und Qualität im Gesundheitswesen. 2014; 108: 487-494
        • Suter L.G.
        • et al.
        National Patterns of Risk-Standardized Mortality and Readmission After Hospitalization for Acute Myocardial Infarction, Heart Failure, and Pneumonia: Update on Publicly Reported Outcomes Measures Based on the 2013 Release.
        Journal of General Internal Medicine. 2014; 29: 1333-1340
        • Normand S.L.T.
        • Shahian D.M.
        Statistical and clinical aspects of hospital outcomes profilling.
        Statistical Science. 2007; 22: 206-226
        • Krumholz H.M.
        • et al.
        Standards for statistical models used for public reporting of health outcomes - An American Heart Association scientific statement from the quality of care and outcomes research interdisciplinary writing group - Cosponsored by the Council on Epidemiology and Prevention and the Stroke Council - Endorsed by the American College of Cardiology Foundation.
        Circulation. 2006; 113: 456-462
        • Iezzoni L.I.
        Risk adjustment, in Performance measurement for health system improvement: Experiences, challenges and prospects, P.C. Smith, et al..
        Cambridge University Press, New York2009: 251-285
        • Initiative Qualitätsmedizin (IQM)
        IQM Hearing „Qualitätsmessung in der Medizin - Risikoadjustierung und Risikoadjustierungsmodelle“. 2019; (Available from: https://www.initiative-qualitaetsmedizin.de/fileadmin/downloads/presse/Abstracts_IQM_Hearing_gesamt_WEB_20190221.pdf.)
        • Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder
        Fallpauschalenbezogene Krankenhausstatistik (DRG-Statistik), eigene Analysen. 2016;
        • Nimptsch U.
        • Mansky T.
        Hospital volume and mortality for 25 types of inpatient treatment in German hospitals: observational study using complete national data from 2009 to 2014.
        BMJ Open. 2017; 7
        • Bolczek C.
        • et al.
        Versorgungsstrukturen und Mengen-Ergebnis-Beziehung beim akuten Herzinfarkt – Verlaufsbetrachtung der deutschlandweiten Krankenhausabrechnungsdaten von 2005 bis 2015.
        Gesundheitswesen. 2020; 82: 777-785
        • DeLong E.R.
        • et al.
        Comparing risk-adjustment methods for provider profiling.
        Statistics in Medicine. 1997; 16: 2645-2664
        • Cleveland W.S.
        • Grosse E.
        • Shyu W.M.
        Local regression models, in Statistical Models in S.
        in: Chambers J.M. Hastie T.J. Wadsworth & Brooks. Cole, 1992
        • Jones M.
        • et al.
        Visualising and modelling changes in categorical variables in longitudinal studies.
        BMC Medical Research Methodology. 2014; 14: 32
        • Mansky T.
        • Völzke T.
        • Nimptsch U.
        Improving outcomes using German Inpatient Quality Indicators in conjunction with peer review procedures.
        Zeitschrift für Evidenz, Fortbildung und Qualität im Gesundheitswesen. 2015; 109: 662-670
        • Krumholz H.M.
        • et al.
        An administrative claims model suitable for profiling hospital performance based on 30-day mortality rates among patients with an acute myocardial infarction.
        Circulation. 2006; 113: 1683-1692
        • Krumholz H.M.
        • et al.
        An administrative claims model suitable for profiling hospital performance based on 30-day mortality rates among patients with heart failure.
        Circulation. 2006; 113: 1693-1701
        • Bratzler D.W.
        • et al.
        An Administrative Claims Model for Profiling Hospital 30-Day Mortality Rates for Pneumonia Patients.
        Plos One. 2011; 6
        • Leal J.R.
        • Laupland K.B.
        Validity of ascertainment of co-morbid illness using administrative databases: a systematic review.
        Clinical Microbiology and Infection. 2010; 16: 715-721
        • Quan H.
        • Parsons G.A.
        • Ghali W.A.
        Validity of information on comorbidity derived rom ICD-9-CCM administrative data.
        Med Care. 2002; 40: 675-685
        • Nimptsch U.
        Disease-Specific Trends of Comorbidity Coding and Implications for Risk Adjustment in Hospital Administrative Data.
        Health Serv Res. 2016; 51: 981-1001
        • Lawthers A.G.
        • et al.
        Identification of In-Hospital Complications From Claims Data: Is It Valid?.
        Medical Care. 2000; 38
        • Zhan C.
        • et al.
        Modifying DRG-PPS to include only diagnoses present on admission: financial implications and challenges.
        Med Care. 2007; 45: 288-291
        • Schwarzkopf D.
        • et al.
        Validation study of German inpatient administrative health data for epidemiological surveillance and measurement of quality of care for sepsis: the OPTIMISE study protocol.
        BMJ Open. 2020; 10: e035763
        • Bastani H.
        • Goh J.
        • Bayati M.
        Evidence of Upcoding in Pay-for-Performance Programs.
        Management Science. 2018; 65: 1042-1060
      2. Burgard, G., Low-risk-Operationen bei High-risk-Patienten, in Peer Review - sicher ist besser, W. Krahwinkel, A. Meier-Hellmann, and J. Zacher, Editors. 2013, Medizinisch Wissenschaftliche Verlagsgesellschaft: Berlin.

        • Bray B.D.
        • et al.
        Derivation and external validation of a case mix model for the standardized reporting of 30-day stroke mortality rates.
        Stroke. 2014; 45: 3374-3380
        • Ganslandt T.
        • et al.
        Der Kerndatensatz der Medizininformatik-Initiative: Ein Schritt zur Sekundärnutzung von Versorgungsdaten auf nationaler Ebene.
        Forum der Medizin_Dokumentation und Medizin_Informatik. 2018; 1_2018: 17-21
        • Wissenschaftliches Institut der AOK (WIdO)
        QSR-Verfahren - Indikatorenhandbuch - Verfahrensjahr. 2020 2020;