Suivi de l’analyse

Analyse Descriptive

Données manquantes

Variables autour de 20% manquantes: Les variables Durée d’hospitalisation, Mise sur marchine de perfusion, Hématurie du donneur et les immunisations HLA et DSA présentent des proportions de données manquantes entre 15 et 30% dans chaque groupe, ne contre-indiquant a priori pas leur utilisation dans les modèles, à l’exception d’un potentiel risque de biais.

Variables mal renseignées: Les variables Antécédent de dyslipidémie du donneur (40% de données manquantes), Sérologie AcHBs du donneur (33%) et antécédents de grossesse (36% chez les femmes) sont mal renseignées avec plus d’un tiers de données manquantes. Ces variables devraient être exclues des analyses.

Autres données manquantes: La plupart des autres variables présentent des proportions de données manquantes plus restreintes On pourra proposer, en analyse de sensibilité, d’évaluer l’effet de ces problèmes de reseignement sur le modèle. Aucune donnée manquante n’a été relevée sur les variables descriptives du suivi (évènement, temps d’évènement).

Partition apprentissage/ validation

La partition aléatoire entre l’échantillon d’apprentissage et l’échantillon de validation semble avoir produit deux échantillons comparables en termes de distribution pour l’ensemble des variables de la base. De petits écarts de distribution semblent toutefois apparaître sur les indicatrices des immunisations anti-HLA.

Variables quasi-séparées

Plusieurs variables catégorielles sont presque exclusivement unimodales, et ne pourraient donc être exclues des analyses faute d’apport d’information (et pouvant potentiellement entraver le calcul des modèles):

  • Sérologies HCV, AgHBs, HIV donneur/receveur
  • Traitements par inhibiteurs de mTOR et apparentés CNI
  • Immunisation DSA
  • Incompatibilité ABO (unimodale)

Descriptif des données

Au sein de l’échantillon d’apprentissage (N=4844), la population des receveurs répond aux caractéristiques démographiques de l’insuffisance rénale chronique, avec une nette majorité masculine (64%) et deux tiers de la population âgée d’entre 39 et 67 ans, pour un âge moyen de 53.2 ans. 25.2% des receveurs présentent une étiologie récidivante d’IRC. Au global, une majorité des patients ont reçu un traitement par hemodialyse (78.5%) ou par dialyse péritonéale (10.6%). Seuls 10.7% bénéficient d’une greffe préemptive et ne sont pas passés par la dialyse, correspondant à la tendance nationale rapportée par le réseau REIN en 2019 (10.9%). 80.4% des receveurs présentent des antécédents d’hypertension, 39.4% des antécédents de maladies cardiovasculaires, un tiers (33.7%) des antécédents de dyslipidémie et 18.9% des antécédents de diabète. Les antécédents de néoplasie et de maladies urologiques présentent des prévalences plus faibles, autour de 10%.

Les temps passés sur liste d’attente et en dialyse sont très hétérogènes, témoignant de disparités géographiques et démographiques importantes en termes d’accès à la greffe. Cependant, ces durées restent globalement longues, avec une durée d’attente moyenne de 703 jours (près de 2 ans) et 1157 jours en dialyse (3 ans et 2 mois). De plus, 75% des receveurs ont attendu plus de 221 jours (plus de 7 mois) et 75% d’entre deux ont passé plus de 495 jours (1 an et 4 mois) en dialyse.

Les donneurs répondent à de caractéristiques similaires en termes d’âge (âge moyen de 53.1 ans) mais sont plus hétérogènes (écart-type de 17.2 ans contre 14.4 ans, du fait de la présence de donneurs mineurs, pédiatriques et de donneurs âgés) et également majoritairement masculins (59.7%). 8.3% des donneurs ont été prélevés à coeur arrêté et 49.1% ont subi un décès de cause cardiovasculaire. Les antécédents médicaux des donneurs correspondaient davantage aux propriétés de la population générale française, avec une prévalence des antécédents d’hypertension de 28.7% et une prévalence du diabète de 6.8%. La prévalence de la protéinurie sont nettement plus élevées que les estimations populationnelles (38.3%), ce qui était attendu pour des donneurs cadavériques. Au regard de leurs caractéristiques, 42.1% des donneurs sont considérés marginaux par le critère historique ECD.

D’un point de vue immunologique, 50% des couples donneur-receveur présentent entre 3 et 4 incompatibilités HLA ABDR et aucun ne présente d’incompatibilité de groupe sanguin. Concernant les immunisations des receveurs, 18.5% (classe I) et 15.4% (classe II) sont positifs à l’immunisation anti-HLA.

Les sérologies des donneurs et receveurs sont pour la plupart soit très majoritairement positives (EBV) ou très majoritairement négatives (HCV, AgHBs, HIV) et ont été exclues des analyses en conséquence.

Les variables relatives à la greffe correspondent aux attentes au vu des pratiques courantes en transplantation dans le pays. Ainsi, le temps d’ischémie froide était inférieur à 1 jour pour plus de 75% des partients (Q3=21) et une très forte majorité des patients ont reçu des traitements par antiprolifératifs et corticoïdes, ainsi qu’au tacrolimus à partir de 2009 (87.2%). Près d’un greffon sur trois (29.1%) a été placé sous machine de perfusion.

On note par ailleurs la présence d’un écart-type important par rapport à la moyenne sur la variable urée du donneur. Cette valeur s’explique par la présence d’outliers, 6 donneurs présentant des valeurs d’urée au-dessus de 200 mmol/L alors que la quasi-totalité des valeurs sont inférieures à 50 mmol/L.

Missing (learning sample) Learning sample (N=4844) Missing (validation sample) Validation sample (N=2778)
Quantitative characteristics - mean ± SD (Q1-Q3)
Recipient age (years) 0 53.2 ± 14.4
(43-64)
0 53.8 ± 14.5
(44-65)
Recipient BMI kg/m² 38 25.1 ± 4.6
(21.8-28)
23 25.4 ± 4.6
(21.9-28.6)
Time on waiting list (days) 145 703.4 ± 635.5
(221.5-1023.5)
88 745.8 ± 649.2
(250-1062.2)
Time on dialysis (days) 540 1157.2 ± 1014.1
(495-1526.2)
317 1210.8 ± 1055.4
(546-1606)
CIT (hours) 13 17.5 ± 7.3
(12.3-21)
11 17.4 ± 7.3
(12.3-20.8)
Donor age (years) 26 53.1 ± 17.2
(43-66)
14 53.9 ± 17.1
(44-67)
Donor height (cm) 575 169.1 ± 11.2
(163-176)
295 169.3 ± 11.7
(163-177)
Donor weight (kg) 574 73.7 ± 16.8
(63-83.5)
295 73.8 ± 17.3
(62-84)
Last donor diuresis (mL) 411 176.1 ± 202.3
(70-200)
231 175 ± 190.2
(65-200)
Donor urea (mmol/L) 198 6.9 ± 25.1
(3.6-7.4)
115 6.5 ± 18.8
(3.6-7.3)
Donor creatinine (µmol/L) 13 91.3 ± 60.1
(58-104)
10 89.1 ± 56.6
(57-101)
HLA A-B-DR incompatibilities 97 3.4 ± 1.2
(3-4)
52 3.4 ± 1.2
(3-4)
Categorical characteristics - N (%)
Recipient men 0 3112
(64.24)
0 1712
(61.63)
Relapsing initial nephropathy 0 1220
(25.19)
0 689
(24.8)
Preemptive transplantation 12 518
(10.69)
11 308
(11.09)
Peritoneal dialysis 12 514
(10.61)
11 286
(10.3)
Hemodialysis 12 3800
(78.45)
11 2173
(78.22)
Post-transplant dialysis 217 1267
(26.16)
120 706
(25.41)
History of smoking 0 1844
(38.07)
0 961
(34.59)
History of diabetes 0 914
(18.87)
0 578
(20.81)
History of Dyslipidemia 0 1633
(33.71)
0 898
(32.33)
History of hypertension 0 3895
(80.41)
0 2234
(80.42)
History of cardiovascular disease 0 1906
(39.35)
0 1040
(37.44)
History of neoplasia 0 534
(11.02)
0 290
(10.44)
History of urological disease 0 537
(11.09)
0 302
(10.87)
Positive recipient CMV serology 38 2863
(59.1)
32 1713
(61.66)
Positive recipient AcHBs serology 87 3126
(64.53)
60 1765
(63.53)
Positive donor CMV serology 8 2510
(51.82)
15 1475
(53.1)
Donor men 5 2891
(59.68)
7 1644
(59.18)
Donor after cardiac death 4 402
(8.3)
7 239
(8.6)
Donor death vascular etiology 0 2379
(49.11)
0 1338
(48.16)
Donor history of hypertension 335 1390
(28.7)
169 852
(30.67)
Donor history of diabetes 663 328
(6.77)
348 225
(8.1)
Donor history of cardiac arrest 75 1448
(29.89)
60 839
(30.2)
Donor proteinuria positive 451 1853
(38.25)
226 1049
(37.76)
Depleting induction therapy 20 2553
(52.7)
25 1440
(51.84)
Pre-transplantation anti-HLA immunization of class I 595 894
(18.46)
396 673
(24.23)
Pre-transplantation anti-HLA immunization of class II 888 746
(15.4)
540 557
(20.05)
Transplanted before 2012 0 2249
(46.43)
0 1141
(41.07)

Descriptif de la survie

Kaplan-Meier global

Kaplan-Meier par centre

Indicateurs descriptifs de la survie

Echantillon d’apprentissage

Nombres d’évènements: 977 retours en dialyse, 1010 décès dont 757 avec greffon fonctionnel, 3110 censures

Personnes-années: 28797 personnes-années

Incidence en personne-année: 0.03 retours en dialyse par personne-année, 0.04 décès par personne-année

Follow-up médian: 11.7 ans

Probas de survie:

  • 5 ans: 78% [77%-79%]
  • 10 ans: 56% [54%-58%]
  • 15 ans: 39% [37%-42%]
  • 20 ans: 26% [23%-29%]

Echantillon de validation

Nombres d’évènements: 510 retours en dialyse, 507 décès dont 375 avec greffon fonctionnel, 1893 censures

Personnes-années: 15079 personnes-années

Incidence en personne-année: 0.03 retours en dialyse par personne-année, 0.03 décès par personne-année

Follow-up médian: 12 ans

Probas de survie:

  • 5 ans: 79% [77%-80%]
  • 10 ans: 58% [56%-61%]
  • 15 ans: 40% [37%-43%]
  • 20 ans: 25% [21%-29%]

Analyse univariée

Liens entre variables du donneur et du receveur

Les liens potentiels entre les variables du donneur et du receveur ont été testés afin d’identifier des interactions candidates à la prise en compte dans le modèle et repérer des candidats au statut de facteur de confusion. Pour cette étape, le lien entre les variables quantitatives et entre les paires quantitatives-qualitatives a été évalué par des modèles de régression linéaire, et le lien entre les variables qualitatives a été évalué par des tests du \(\chi2\).

Quanti-Quanti
Quanti-Quali
Quali-Quali

Sélection des variables

Vérification des hypothèses

L’examen des résidus de modèles univariés et des graphiques (disponibles dans le dossier à télécharger) log-log n’ont pas relevé d’effraction majeure aux hypothèses du modèle de Cox à risques proportionnels. Seule la variable centre a été considérée comme enfreignant la proportionnalité des risques.

Modèles de Cox univariés

Des modèles de Cox univariés ont été réalisés afin d’identifier les variables à injecter dans le modèle à chaque étape, avec \(\alpha=0.2\).

Variables du donneur

11 variables du donneur ont été retenues dans un modèle multivarié sur lequel a été appliqué une sélection descendante à \(\alpha=0.05\). 6 variables ont été conservées pour la suite des analyses.

Variables de la greffe

3 variables de la greffe ont été retenues dans un modèle multivarié ajusté sur les variables du donneur retenues sur lequel a été appliqué une sélection descendante à \(\alpha=0.05\). 2 de ces variables ont été conservées.

Variables du receveur

12 variables du receveur ont été retenues dans un modèle multivarié ajusté sur les variables du donneur et de la greffe retenues sur lequel a été appliqué une sélection descendante à \(\alpha=0.05\). 6 de ces variables ont été conservées.

Interactions

La sélection des interactions s’est faite en deux étapes: d’abord, on a testé les interactions entre variables dans le modèle significatives en univarié, puis injecté dans le modèles les interactions qui y étaient significatives à \(\alpha=0.2\), puis on a appliqué une procédure descendante retenant les interactions âge-âge et âge receveur-décès par AVC.

Ensuite, on a forcé les interactions conservées et répété cette procédure avec les interactions comprenant une variable hors du modèle.

Amélioration du modèle

On a ensuite testé l’ajout des variables rejetées auparavant dans le modèle, permettant de retenir le temps d’ischémie froide et la créatininémie. Puis on a appliqué une sélection descendante en ne forcant que les interactions afin d’éliminer des variables superflues, permettant d’écarter les antécédents de néoplasie et l’indicatrice de récidive. On a ensuite testé l’ajout de nouvelles interactions au modèle, sans en conserver de nouvelles à la fin.

Effet centre/ période

On a comparé le profil de vraisemblance du modèle à celle du modèle de fragilité avec un effet aléatoire sur le centre, ne conduisant pas à sa conservation.

Des indicatrices avant-après allant de 2007 à 2012 ont été testées successivement, conduisant à la conservation de l’effet avant-après 2012 dans le modèle.

Modèle final

Finalement, on a vérifié que les variables non significatives restantes pouvaient être supprimées, et conservé les variables provoquant une variation des coefficients d’une variable du donneur de plus de 10% ou dont la suppression. On a ensuite répété l’étape d’amélioration du modèle de façon itérative jusqu’à ce que ce dernier n’évolue plus. Cela a conduit à l’ajout de l’IMC du receveur au modèle et à la suppression du temps d’ischémie froide.

Validation du modèle

Calibration du modèle

La graphe de calibration du modèle semble présenter de bonnes propriétés pour la calibration. Le lissage non paramétrique loess ne permet pas d’écarter l’hypothèse de linéarité, que ce soit avec un lissage souple (\(\alpha=0.4\)) ou rigide (\(\alpha=1\)). La régression linéaire confirme la suspiscion de bonne calibration, avec un intercept non significativement différent de 0 et une pente significativement non nulle mais non significativement différente de 1.

Discrimination du modèle

Discrimination du modèle complet

Discrimination du score

Discrimination par strates

Risque faible vs. élevé

Risque faible

Risque élevé