Grâce à la liberté dans les communications, des groupes d’hommes de même nature pourront se réunir et fonder des communautés. Les nations seront dépassées.
Friedrich Nietzsche (Fragments posthumes XIII-883)

00 - ADN, empreinte génétique et LCN





Comment fonctionne un test d'ADN ?

Qu'est l'ADN ?
La molécule d'ADN transporte notre code génétique et détermine ce que nous sommes, de la couleur des yeux aux aspects de la personnalité. Chaque cellule de notre corps, du coeur à la peau, du sang aux os, contient notre ADN complet. La double hélice ressemble à une échelle enroulée sur elle-même. Les barreaux de l'échelle sont faits de paires de 4 molécules appelées nucléotides. L'adenine (A) et la thymine (T) sont toujours liées en paire, comme la  cytosine (C) et la guanine (G). Notre code génétique est fait de 3 milliards de paires. 99,9% de l'ADN de deux personnes est identique et permet la fabrication des protéines.
0.1% de l'ADN sont des séquences non codantes, elles sont appelées microsatellites et minisatellites et sont très polymorphes, donc très variables d'un individu à l'autre, ce sont elles qui permettent d'établir les empreintes génétiques.
Ces séquences sont appelées couramment des marqueurs génétiques. Les jumeaux homozygotes sont les seuls individus qui ont des marqueurs génétiques identiques. Cependant, plus deux individus sont proches généalogiquement, plus leurs marqueurs génétiques sont similaires. La clef dans le test de l'ADN est de savoir où chercher dans les milliards de lettres du code génétique pour trouver les marqueurs qui permettront d'identifier les similarités ou les différences importantes entre les individus.

Comment teste-t-on ?

Que le test ait une finalité parentale, forensique ou génétique, il s'agit de chercher des similarités entre deux prélèvements biologiques. Parce que toutes les cellules du corps contiennent exactement le même ADN, des prélèvements peuvent être faits pratiquement partout sur le corps, peau, salive, folicule pileux... L'ADN est d'abord isolé des cellules et des millions de copies sont faites en recourant à la méthode appelée  réaction de polymérisation en chaîne ("polymerase chain reaction"). Cette technique utilise une enzyme naturelle pour copier une séquence donnée d'ADN encore et encore. Une fois que l'on a beaucoup d'ADN, il est plus facile d'analyser le code génétique.
Les molécules d'ADN sont ensuite scindées en fragments par électrophorèse et des points spécifiques sont analysés pour créer l'empreinte génétique. Les empreintes génétiques de deux prélèvements différents sont alors comparés pour voir s'ils "matchent".
Les tests ADN sont-ils fiables ? 
La fiabilité est une question importante car ces tests sont parfois le seul élément probant concernant un crime, ou à charge ou à décharge. Il est facile de dire si deux prélèvements biologiques ne matchent pas, mais s'ils matchent, il n'est pas totalement sûr que les deux prélèvements proviennent de la même personne.
Il y a toujours une infime chance que les marqueurs génétiques de deux individus soient identiques, en particulier si les individus sont des siblings. Pour réduire le risque d'erreur, les scientifiques testent plus d'un marqueur génétique. Plus il y a de marqueurs identiques, plus le test a de chances d'être fiable. Cependant, tester plus de marqueurs prend plus de temps et est plus coûteux. Les tests forensiques d'ADN examinent normalement 6 à 10 marqueurs. La chance que deux individus sans lien familial aient des profils identiques est est inférieure à une sur un miliard.  


Le LCN (Low Copy Number)  
Cette technique a été développée par les laboratoires du FSS (Forensic Science Service) pour analyser des échantillons contenant un très petit nombre de molécule d'ADN. Le principe de base est, pour augmenter la sensibilité, d'augmenter le nombre de cycles de la PCR afin d'obtenir d'importantes quantités d'une séquence d'ADN spécifique. 
Cette technique présente deux inconvénients majeurs : 
1) elle produit des profils déséquilibrés pour l'un ou l'autre marqueur, avec disparition possible d'un allèle dû à l'effet stochastique. 
2) elle conduit à la détection de l'un ou l'autre allèle dans les contrôles négatifs d'origine non déterminée. 
Le premier inconvénient conduit à l'obtention d'un profil incomplet, partiellement erroné et non reproductible. Ce peu de fiabilité va à l'encontre de l'exigence de qualité. 
Le deuxième nécessite obligatoirement de travailler dans des conditions particulières pour éviter les contaminations inhérentes aux conditions ambiantes et provenant notamment de l'ADN humain présent dans les poussières de l'atmosphère ou sur les surfaces des objets. 
Vu les limitations de cette technique, les conclusions émises pourraient être facilement attaquées et annulées lors d'un jugement.  Cela explique la prudence de John Lowe. Bien que cette technique ait été utilisée dans des milliers d'affaires au Royaume-Uni, et particulièrement dans des "cold cases", elle a été questionnée par Mr Justice Weir au cours du Omagh bombing trial, car, malgré une validation interne par le FSS et la publication d'articles, la technique souffrait d'un manque de validation externe par la communauté scientifique élargie. Ce jugement fit suspendre l'usage du LCN en décembre 2007, pendant trois semaines, afin de procéder à une révision demandée par le Crown Prosecution Service. À l'issue de cette révision, la suspension fut levée en janvier 2008, avec la caution du CPS. 
3 semaines ! Évidemment il y avait des questions de gros sous derrière tout ça (la recherche coûte cher, etc.). Les critiques n'allaient pas manquer de pleuvoir, à commencer du Forensic Institute. Professor Allan Jamieson and Dr Rhonda Wheate soulignent que l'extrême sensibilité de la technique 1) empêche de savoir comment une si minime quantité d'ADN s'est trouvée là où on l'a découverte et 2) rend difficile d'obtenir des résultats reproductibles et même alors de savoir ce que les résultats signifient en termes de profils contributeurs. Le premier problème est dû au fait que chaque corps humain compte environ 1014 cellules (100 mille milliards), chacune avec un ADN complet empaqueté à l'intérieur. Où que nous allions nous laissons notre ADN et notre ADN va dans des endroits où nous n'avons jamais été. Notre ADN peut être transféré sur quelqu'un d'autre et de ce dernier sur quelqu'un d'autre ou dans un endroit où nous n'avons jamais mis les pieds. C'est ce qu'on appelle le "transfert". Il faut encore établir son extension possible et selon quels sont les facteurs et influence. La technique LTDNA ("Low Template"autre nom de LCN) est donc très susceptible d'identifier de l'ADN qui est pas vraiment lié au crime sur lequel on enquête. Par ailleurs, si les prélèvements faits sur la scène de crime ne sont pas précautionnement manipulés, le risque de contamination par l'ADN d'une autre scène de crime, par la police, par les techniciens forensiques ou quiconque peut avoir eu un contact parfaitement innocent avec la scène de crime ou le prélèvement est extrêmement élevé. 
Selon AJ, la technique LCN a étiré la fiabilité de la preuve ADN.  "La technique standard est très fiable", dit-il, "mais nous avons maintenant poussé la technologie jusqu'à ses limites absolues and nous utilisons toujours la même certitude. Malheureusement, le travail expérimental ne nous permet pas de savoir dans quelle mesure cette technique est fiable.

La polémique FSS
Avec bien des remerciements pour les schémas et suggestions d'analyse de Richard Philips publiés sur le blog "My McCann Thoughts", qu'il fut rapidement "invité" à fermer par des hommes "en noir".

Un peu partout sur la planète, pas seulement au Portugal, il y a des gens qui sont convaincus que Madeleine n'a pas été enlevée et pas seulement parce qu'il n'est pas plausible qu'on ait silencieusement  pénétré dans un appartement obscur, emporté une petite fille dans le froid sans la réveiller et sans laisser la moindre trace. La plupart des gens croient que Madeleine est morte dans l'appartement où elle a été vue pour la dernière fois et qu'il n'est pas plausible qu'un prédateur ou cambrioleur surpris l'ait tuée et ait enlevé son cadavre. Il n'y a aucun indice d'enlèvement de l'enfant, vive ou morte. Les parents de Madeleine auraient-ils caché son corps ? Le mobile est inconnu, mais il semble exclu qu'un homicide volontaire ait été commis.

Les 13 locus CODIS permettant la réalisation d'empreintes génétiques
Parmi les prélèvements envoyés au FSS de Birmingham, deux retinrent l'attention et sont évoqués ici. L'un provenait de derrière un sofa du G5A (là où le chien EVRD, puis la chienne CSI avaient alerté) et l'autre du coffre de la voiture louée par les MC 3 semaines après la disparition de Madeleine, où la chienne CSI avait alerté. 
Quant au premier, il présentait un ADN incomplet, mais montrait qu'il y avait deux contributeurs. Toutefois tous les allèles confirmés "matchaient" les allèles correspondants du profil de MMC. La technique LCN ne permettait pas d'identifier le type de fluide corporel d'où provenait le prélèvement.
Quant au second, les enquêteurs pensèrent, à la lecture de ce qui vient ci-après, que s'il y avait de l'ADN de Madeleine dans la voiture, c'est qu'on avait utilisée celle-ci pour transporter le corps de l'enfant.
Rien n'est dit de la taille du prélèvement, probablement très réduite. Une quantité substantielle indiquerait qu'il ne s'agit pas de contamination accidentelle.
La question de savoir si le profil génétique obtenu à partir des prélèvements effectués dans le coffre contenait l'ADN de Madeleine ou non fit et fait toujours l'objet de débats intenses. Le rapport du FSS (Forensic Science Service), aujourd'hui démantelé, dit clairement qu'il est impossible d'en être sûr et c'est à peu près tout. Malheureusement il n'essaie pas d'évaluer la probabilité que l'ADN vienne ou non de Madeleine : 1%, 50%, or 99%. ? Tout ce que l'on sait, c'est que ce n'est ni 0% ni 100%. Richard Philips explique pourquoi il est dommage que des recherches plus poussées n'aient pas été entreprises.
L'ADN de chaque individu a une combinaison unique de marqueurs ("allèle" est réservé aux parties codantes de la molécule d'ADN) appelée de ce fait "profil" ou "empreinte génétique".  Pour identifier une combinaison de 20 marqueurs, il faut étudier 10 loci. Un locus est un emplacement physique précis et invariable sur un chromosome. À chaque locus correspond deux versions du même gène, l'un provenant du père, l'autre de la mère. Les "versions" sont en général différentes mais peuvent être identiques. Étudier 10 loci revient donc à identifier un maximum de 20 versions. Dans l'ADN de Madeleine MC il n'y en a que 19 car à un locus les deux versions sont identiques. 
  
L’ADN de Madeleine a été prélevé chez elle, sur son oreiller. Si la brosse à cheveux et la brosse à dents sont de bons fournisseurs d’ADN nucléaire, la probabilité que ces objets aient été utilisés par son frère et sa soeur était assez grande et rendait l’opération d’extraction difficile.
Le temps, la chaleur, le degré de dilution, etc. sont des facteurs de dégradation de l’ADN et expliquent l’existence d’échantillons mixtes.

En fait d'ADN en mauvais état, les résultats certains sont rares, la plupart du temps ils sont décevants, permettent d’orienter les recherches mais ne constituent pas une preuve. A fortiori lorsqu’il s’agit d’ADN LCN. Il aurait été miraculeux que le laboratoire détermine de quelle sorte de fluide corporel provenait l’échantillon. 

L'affaire FSS controversée s’est probablement déroulée de la manière suivante : quelqu’un a analysé l'ADN LCN et a rédigé un rapport disant que, bien que les résultats ne permettaient pas de conclure parce qu’il y avait 37 marqueurs dans le prélèvement provenant du coffre de la voiture de location, il y avait néanmoins une forte probabilité que l’ADN de Madeleine soit mélangé dans ce prélèvement, puisque 15/15 des marqueurs (sur 8 loci) matchaient son profil génétique. Ce rapport préliminaire a été envoyé à Stuart Prior (LC), fébrilement en attente des résultats. Mais ensuite ce rapport a été examiné avec un regard critique, afin de ne pas commettre d’impair, eu égard à la notoriété de l'affaire et aux problèmes encourus par le FSS lors du procès de l'attentat d'Omagh. Mr Lowe a donc rédigé un rapport plus prudent, ne prenant pas de risque, qui est celui figurant dans le dossier. Si on lui demandait "Est-il possible que Madeleine ait contribué au prélèvement ?", la réponse était que c'était possible, mais pas du tout certain.
Basique
Les marqueurs sont représentés, dans le schéma ci-dessous, par des pastilles ayant une couleur propre et numérotées de 1 à 10 suivant celui des dix loci sur lequel elles se trouvent. Le profil d'un individu est décrit par deux pastilles au loci numéro 1, deux au numéro 2 et ainsi de suite jusqu'aux deux pastilles du dixième locus. La probabilité que deux personnes aient exactement la même combinaison de marqueurs est pratiquement nulle.  Dix marqueurs proviennent du père et dix de la mère, ce qui signifie que l'on partage la moitié de son profil ADN avec sa mère et l'autre moitié avec son père. 


Seul le hasard détermine lequel des marqueurs de la mère et du père va échoir à l'enfant. Ceci signifie que bien que deux enfants (éventuellement jumeaux, mais hétérozygotes) aient les mêmes parents, ils ont des profils ADN très différents. 


15/19 ou 15 sur 37 ?
L'analyse du prélèvement effectué dans la voiture de location des MC, de très mauvaise qualité, n'a permis de distinguer que 8 loci. Autrement dit les marqueurs de deux des loci n'ont pu être identifiés. Un marqueur identifié à l'un des 8 loci et deux dans chacun des 7 autres correspondaient à l'ADN de Madeleine. 15 des 19 marqueurs du profil génétique de MMC  étaient donc présents dans le prélèvement. 
Cela serait probant et suffisant si l'analyse s'arrêtait là.
Or l'analyse a décelé la présence d'autres marqueurs sur les loci, indiquant que plusieurs ADN sont mélangés dans le prélèvement. Il est impossible de savoir quel marqueur appartient à qui, à moins de connaître l'ADN des individus contributeurs. Ainsi force est de relativiser l'affirmation que 15 marqueurs sur 19 correspondent au profil de Madeleine. 
Tout ce que l'on peut dire avec certitude, c'est que 15 des 37 marqueurs présents dans le prélèvement correspondent à l'ADN de Madeleine. 
Voici ce qu'écrit John Lowe à Stuart Prior, le 3 septembre 2007, courriel renvoyé au DIC de Portimão le 4 septembre  :
Is there DNA from Madeline on the swab ?
It would be very simple to say "yes" simply because of the number of components within the result that are also in her reference sample.
What we need to consider, as scientists, is whether the match is genuine and legitimate; because Madeline (sic) has deposited DNA as a result of being in the car or whether Madeline merely appears to match the result by chance. The individual components in Madeline's profile are not unique to her, it is the specific combination of 19 components that makes her profile unique above all others. Elements of Madeline's profile are also present within the profiles of many of the scientists here in Birmingham, myself included. it's important to stress that 50% of Madeline's profile will be shared with each parent. It is not possible in a mixture of more than two people, to determine or evaluate which specific DNA components pair with each other. Namely, we cannot separate the components out into 3 individual DNA profiles.
Therefore, we cannot answer the question: is the match genuine or is it a chance match.
JL indique ensuite ce que la technique LCN ne peut déterminer : quand le dépôt d'ADN a été effectué, comment il l'a été, de quel type de fluide corporel il provient. Il ajoute, est-ce ironique ?, la nature du crime commis. 
On "est d'accord", mais pourquoi le labo n'a-t-il pas cherché les sources des 22 marqueurs du prélèvement qui ne proviennent pas de MMC ? Richard Philips explique plus bas ce que JL aurait pu faire.

Une correspondance à 100% ou non ?
15 des composants du profil génétique de MMC sont présents sur 8 loci, c'est une correspondance de 15/15, donc  de 100%. S'il n'y en avait que 14 présents, la correspondance serait de 93,33% et l'on pourrait dire avec une assez grande certitude que le prélèvement ne contient pas l'ADN de Madeleine. Mais, comme le prélèvement contient l'ADN de plusieurs individus, on ne peut pas assurer à 100% que tous les marqueurs qui correspondent au profil génétique de MMC proviennent d'elle. Donc, malgré une correspondance à 100% on ne peut être sûr qu'il y ait dans le prélèvement l'ADN de Madeleine.

Ce schéma montre qu'il est théoriquement possible pour le profil à 37 marqueurs d'être produit par l'ADN de Madeleine mélangé à celui de deux ADN étrangers ou par l'ADN de Kate MC mélangé à l'ADN de deux étrangers. 

L'ADN de MMC dans la voiture ?
John Lowe (FSS) a donc clairement répondu qu'on ne pouvait pas établir avec certitude que le prélèvement effectué dans le coffre de la Scenic contenait de l'ADN de MMC. 
Toutefois il pourrait en avoir dit plus, beaucoup plus.
JL dit que le prélèvement pouvait contenir les ADN d'au moins 3 et peut-être 4 ou 5 personnes. Il n'explique pas comment il est arrivé à cette conclusion, mais elle se fonde probablement sur le fait que quelques loci contiennent 5 ou 6 marqueurs différents. Pour qu'un locus contienne 5 marqueurs, il faut la contribution d'au moins 3 personnes (un individu apporte au moins un et au maximum deux marqueurs).
Il semble que JL assume que, parce qu'il n'a pas trouvé plus de 5 marqueurs présents à un locus, un maximum de 5 personnes ont contribué à l'échantillon, chacun apportant un composant. Cela est théoriquement possible, mais il n'est guère probable que les ADN mélangés de 5 personnes aient produit le maximum de 5 marqueurs à chaque locus.
Il serait intéressant de savoir si les contributeurs étaient 3, 4, 5 ou plus. Si le maximum d'allèles présents à un locus était 5, il est probable que seulement 3 personnes ont contribué au profil du prélèvement, sans pourtant pouvoir éliminer la possibilité qu'il y ait eu plus de contributeurs.
Chaque marqueur apparaît plus ou moins fréquemment dans une population donnée.
Nous ne savons pas si les contributeurs étaient apparentés ni s'ils étaient proches.
Nous ne savons pas combien de loci avaient 5 marqueurs.
Par conséquent on peut dire tout au plus qu'"il y avait probablement 3 contributeurs".

Le rapport de JL laisse entendre que l'ADN du prélèvement pourrait avoir appartenu à n'importe qui. Ce n'est pas vrai. L'ADN peut seulement provenir d'un nombre limité de personnes, en contact avec la voiture ou l'échantillon après le prélèvement.
Il aurait été très utile de prélever plusieurs échantillons dans plusieurs parties du véhicule. Il était facile de faire le tri parmi les gens ayant été en contact avec la voiture, un seul marqueur absent à un locus du prélèvement étant suffisant pour éliminer quelqu'un. Tous ceux dont les marqueurs étaient présents aux 8 loci étaient de potentiels contributeurs. Si Kate et Gerald MC s'avéraient être de potentiels contributeurs, la présence de l'ADN de MMC était hautement improbable, la combinaison des ADN respectifs des parents correspondant aux 15 marqueurs du profil génétique de Madeleine. En revanche si Kate et Gerald n'étaient pas contributeurs, les chances que l'ADN de Madeleine fût présent augmentaient.
Toutes les combinaisons possibles de 3 personnes du groupe des potentiels contributeurs seraient générées par ordinateur. Toutes celles (la plupart) qui ne reproduiraient pas l'exact profil du prélèvement seraient rejetées. 



Quand le rapport du FSS indique que beaucoup de personnes sont des contributeurs potentiels de l'échantillon, à commencer par l'auteur du rapport, JL, il est délusoire, car s'il est possible que ce soit vrai, ce que le rapport ne dit pas n'en est pas moins vrai  : un très petit nombre de combinaisons de 3 personnes ayant accès au véhicule ou à l'échantillon produiraient le profil exact qui a été obtenu. Si aucun groupe ne rendait compte du profil du prélèvement, il faudrait en déduire qu'au moins un individu manque ou bien que le prélèvement contenait les ADN de plus de 3 personnes. 
Si des groupes rendent compte du profil du prélèvement, trois possibilités existent :
1. Tous les groupes incluent Madeleine. Les chances de présence de son ADN sont alors grandes. Cette grande probabilité inciterait à soupçonner les parents d'avoir transporté le corps de Madeleine dans la voiture.
2. Quelques groupes incluent Madeleine, d'autres non. Les chances de présence de son ADN sont moindres, mais on aurait une claire et évidente explication pour la présence des 15 allèles de Madeleine alors qu'elle a disparu depuis trois semaines. Le soupçon s'éloignerait des parents.
3. Aucun des groupes n'inclut Madeleine. Seuls les groupes n'incluant pas Madeleine rendent compte du prélèvement. Cela est hautement improbable, mais si cela était, on serait à peu près certain que l'ADN de Madeleine n'était pas dans le prélèvement.
Si le seul groupe élucidant le profil du prélèvement était Madeleine + un membre de la police scientifique portugaise + un membre du FSS, alors on aurait la preuve que l'ADN de Madeleine était présent dans l'auto. En revanche si ce seul groupe comprenait Sean + Amelie + John MC, il est très probable que l'ADN de Madeleine n'était pas présent. 





L'ADN de MMC dans l'auto sans son corps ?

Oui, il est théoriquement possible que son ADN ait été transféré d'un bagage ou d'un vêtement qu'elle avait utilisé. Mais cela est peu probable. Il faut aussi remarquer que l'échantillon d'ADN a été prélevé à l'endroit où la chienne CSI a alerté. Donc, le transfert ne peut être éliminé, mais il est improbable.
Si le profil d'ADN avec les 37 marqueurs n'a pas été détruit*, il est possible de faire l'analyse proposée ci-dessus en analysant l'ADN de tous les individus ayant été en contact avec la Scenic.
* Le profil a peut-être été préservé, mais les prélèvements ont été détruits, très peu de temps après l'analyse. Le FSS avait très formellement  informé que cela pouvait se produire, malheureusement sans insister, aussi la PJ ne s'y est-elle pas opposée à temps.

Qu'aurait-on encore pu faire quant à la Scenic ? 
On aurait pu analyser d'autres morceaux du tapis du coffre et on aurait pu faire des prélèvements à d'autres endroits de la Scenic (poignées, fenêtre, sièges, etc. On aurait pu savoir si :
– il y avait de l'ADN à d'autres endroits du véhicule – si oui, alors on pouvait utiliser ces profils pour montrer comment les marqueurs du profil génétique de MMC pouvaient être réunis dans le premier prélèvement du coffre.
– les 15 ou plus, ou moins marqueurs du profil génétique de MMC étaient présents ailleurs dans le véhicule – si oui alors les profils montreraient si ces marqueurs étaient présents dans un ou plusieurs endroits ou dispersés. Leur présence à un seul endroit serait une forte indication que son corps s'y était trouvé. Leur dispersion indiquerait que les marqueurs venaient d'autres personnes.
– il y avait des endroits du véhicule avec le profil ADN d'une seule personne – tout ADN d'une seule personne identifierait quelqu'un ayant été dans le véhicule (ou son ADN transféré). De tels profils pourraient être soustraits des analyses d'autres prélèvements.
– les 15 marqueurs du profil génétique de MMC étaient présents dans d'autres morceaux du tapis du coffre – si oui, l'aspect de ces emplacements pourrait être significatif (essai de nettoyage, écoulement...)
– la présence des autres 22 marqueurs (37-15) dans d'autres prélèvements, surtout si l'on trouve un ADN individuel, permet de les soustraire de l'analyse du premier prélèvement.
– il y avait des prélèvements incluant des allèles différents des 37 – il serait utile de savoir si le premier prélèvement contenait tous les marqueurs présents dans la Scenic ou non.
– il y avait un endroit du tapis du coffre significativement pauvre en ou sans ADN – cela pourrait indiquer un nettoyage.