La nature égoïste des systèmes de restriction
Les systèmes de restriction et modification de type II et la défense cellulaire
Premières études sur le rôle évolutif des systèmes de restriction et modification de type II
Un schéma expérimental in silico
La nature égoïste des systèmes de restriction
Les systèmes de restriction et modification de type II et la défense cellulaire
Les Systèmes de Restriction et Modification (SMR) sont propres aux procaryotes et à leurs phages (Roberts & Macelis 1997). Leur présence rend les bactéries temporairement immunes aux phages à ADN double brin. Puisque cette caractéristique a été à lorigine de lidentification des SMR, on a cru pendant longtemps que leur rôle évolutif essentiel était la protection cellulaire contre l'ADN allogène. En effet, pour protéger la cellule il faut être capable de distinguer lADN propre de lADN allogène. Ceci est réalisé de deux façons différentes. Certains systèmes identifient lADN de la cellule par la méthylation de séquences spécifiques. Au contraire, d'autres systèmes, moins classiques, reconnaissent lADN cellulaire par l'absence de certaines modifications. Dans ce cas, lADN de la cellule est protégé par labsence de marquage. On ne connaît qu'un nombre réduit de ces derniers cas dont le mécanisme est encore assez mal compris (Redaschi & Bickle 1996).
Les systèmes de restriction et modification classiques sont normalement divisés en trois groupes, parmi lesquels le groupe 2 est le plus abondant et le plus étudié. Les systèmes de ce groupe sont constitués par deux enzymes qui reconnaissent la même séquence d'ADN, mais possèdent activités enzymatiques différentes. Lenzyme de restriction est une endodéoxyribonucléase qui coupe lADN si les séquences de reconnaissance (sites de restriction) ne sont pas méthylés. Lenzyme de modification est une ADN méthyltransférase qui méthyle spécifiquement les bases A ou C dans la séquence de reconnaissance. Ainsi, lactivité de la méthylase rend lADN résistant à lactivité de la nucléase. Les SMR du groupe 1 sont constitués par un seul gène avec un domaine méthylase, un domaine nucléase et un domaine de reconnaissance (Redaschi & Bickle 1996). Ces systèmes, ainsi que ceux du groupe 3, nont été trouvés que dans les enterobactéries (Roberts & Macelis 1997). Dans la suite de ce chapitre, nous noterons par SMR les SMR du type 2.
Les SMR sont très répandus chez les procaryotes. Près de 3 000 systèmes ont été identifiés chez plus de 150 espèces différentes, dans presque tous les domaines taxonomiques (Roberts & Macelis 2000). Chez Escherichia coli et S. typhimurium on connaît plus de 150 types différents de SMR (Roberts & Macelis 2000). Les différentes souches dune même espèce possèdent souvent des SMR très différents en termes de similarité entre les séquences de reconnaissance. En conséquence les arbres phylogénétiques basés sur ces systèmes nont rien à voir avec les arbres classiques du monde bactérien en particulier ceux qui sont basés sur les ARNr (Lauster 1989) (Jeltsch et al. 1995). La seule explication de cette observation est le transfert inter-espèce permanent de SMR au cours de lhistoire évolutive (Jeltsch & Pingoud 1996) (Kita et al. 1999). Ainsi, le transfert horizontal constitue le véhicule privilégié de dissémination de ces systèmes, ce qui constitue une originalité parmi les systèmes de la machinerie qui gère linformation chez les bactéries (Rivera et al. 1998).
L'invasion de lendonucléase peut être fatal pour la cellule si lADN nest pas convenablement méthylé. Ainsi, les SMR sont finement régulés de manière à ce que lacquisition du système par une cellule vierge soit suivie de lexpression initiale exclusive de la méthylase. Ce nest quensuite que la nucléase est exprimée (Redaschi & Bickle 1996). La plupart des séquences de restriction reconnues par les SMR sont des palindromes de 4 à 8 nucléotides. Les cas les plus fréquents sont ceux des palindromes de taille 4 et 6 nucléotides (Roberts & Macelis 1997). Les séquences de restriction des différents SMR sont tellement diverses quil ny a quun seul palindrome de taille 4 pour lequel aucun système de reconnaissance n'est connu (AATT). Tant la coupure que la méthylation sont réalisées symétriquement par rapport au centre du palindrome. Cette précision, alliée à lexistence de systèmes aussi variés, a fait des SMR un des outils les plus populaires de la biologie moléculaire.
Premières études sur le rôle évolutif des systèmes de restriction et modification de type II
Les systèmes de restriction ont été initialement identifiés par la difficulté dinfection de certaines souches de Escherichia coli par des phages l produits à partir dautres souches (Arber 1965). Deux observations ont été à lorigine de lhypothèse d'un système de défense. Premièrement il est devenu évident que les SMR permettent la discrimination entre lADN de la cellule et lADN allogène. Deuxièmement, les SMR rendent difficile linvasion de la cellule par les phages. Lhypothèse que les SMR seraient larme de défense bactérienne contre linvasion des phages est donc longtemps restée un paradigme des études évolutives sur ces systèmes (Levin 1993) (Redaschi & Bickle 1996).
Cette idée sajustait parfaitement au courant adaptationiste des années 60 et 70 (Maynard-Smith 1978) (Gould & Lewontin 1979). Néanmoins, personne navait réussi à démontrer que lutilité de ces systèmes était suffisante pour justifier leur universalité (Korona & Levin 1993). Vers la moitié des années 80 on connaissait déjà la spécificité de quelques centaines de systèmes de restriction et les premières preuves que les phages évitaient les sites de restriction sont apparues (Krüger & Bickle 1983). Plus tard, lanalyse de la fréquence des sites de restriction a révélé que lévitement des sites de restriction était caractéristique de plusieurs phages à ADN (Sharp 1986). Ces observations étaient prévues par lhypothèse de défense. Les phages utilisent plusieurs stratégies pour échapper aux défenses bactériennes : (i) linhibition de laction des enzymes de restriction (Krüger & Bickle 1983) (Belogurov & Delver 1995) ; (ii) l'utilisation de bases modifiées (Krüger & Bickle 1983) ; (iii) la méthylation codée par le phage (Birge 1994) ; (iv) l'évitement des sites de restriction (Sharp 1986). Létude disolats naturels de coliphages a néanmoins révélé que lévitement des sites de restriction est la forme privilégiée de contournement de la barrière des SMR (Korona et al. 1993).
La question de la fréquence des sites de restriction a souvent été abordée lors des travaux sur le biais des mots (Karlin & Macken 1991) (Karlin et al. 1992) (Burge et al. 1992). Ces travaux montrent que tous les palindromes de taille 4 et 6 sont très évités chez les phages. Ceci est la conséquence de la diversité des SMR présents au sein dune même espèce. Pendant son évolution, le phage est soumis à des pressions de sélection différentes suivant le SMR qu'il rencontre. Ainsi pendant son histoire évolutive le phage a successivement évité des sites de restriction différents. En résumé, si pour échapper aux défenses bactériennes il faut éviter les sites de restriction et si différentes souches reconnaissent des sites différents, la meilleure stratégie est déviter systématiquement tous les sites de restriction possibles. Puisque la plupart des palindromes sont des sites de restriction potentiels, il en résulte lévitement général des palindromes.
A ce moment sont apparues les premières difficultés dans lhypothèse de défense. La même analyse appliquée aux génomes bactériens révèle également l'évitement des palindromes et des sites de restriction (Karlin et al. 1992). On a suggéré que ceci serait dû à d'éventuelles erreurs de restriction du SMR. La probabilité de destruction par erreur du chromosome bactérien serait ainsi minimisée par lévitement des sites de restriction. Les SMR sont continuellement en cours de transfert horizontal (Jeltsch & Pingoud 1996) (Bujnicki 2000), en conséquence les bactéries possèdent au cours de leur histoire évolutive de nombreux systèmes différents. Ainsi, elles aussi auraient tendance à éviter presque tous les palindromes.
Dans une tentative d'établissement dun modèle évolutif des SMR, Levin et collègues ont rencontré une autre difficulté inattendue (Korona et al. 1993). La barrière contre linvasion, constituée par les systèmes de restriction, est en fait defficacité très limitée. La probabilité de méthylation du phage avant sa destruction par la nucléase varie entre 10-1 et 10-8. Dans une population typique de 1010 bactéries et phages, la probabilité dune invasion réussie par au moins un phage est donc très proche de 1. Or, après cette première invasion, les copies de ce phage deviennent immunes au SMR et, puisqu'elles sont correctement méthylés, elles envahissent la population clonale rapidement (Korona et al. 1993). Ainsi le système de restriction a au plus comme effet un léger retardement de linvasion de la population. Ceci est probablement insuffisant pour expliquer le maintien de ces systèmes de façon si généralisée dans le monde bactérien.
A lépoque où le modèle de défense commençait à montrer quelques faiblesses Kobayashi et collègues proposaient un modèle alternatif basé sur la théorie des "gènes égoïstes". Cest ce modèle que nous discutons dans la prochaine section.
La sélection à plusieurs niveaux
Darwin a considéré que la sélection nagit que sur les organismes et cette idée a perduré pendant une bonne partie du XXème siècle. Plus récemment ce paradigme a été mis en question en raison de son incapacité croissante à expliquer la sélection de groupe des comportements sociaux et la dissémination "égoïste" de certains gènes (Depew & Weber 1995) (Sober 1995). En conséquence, on assiste aujourdhui au développement de théories cherchant à concilier ces différents niveaux de sélection. La base dune théorie de sélection multi-niveaux à ainsi été proposé par Wilson et Sober (Wilson & Sober 1994). Ces auteurs ont déplacé lunité causale de lévolution des réplicateurs vers les interacteurs. Les interacteurs sont des individus Darwiniens et existent potentiellement à plusieurs niveaux de sélection (e.g. gènes, organismes, espèces). Le concept dinteracteur permet l'établissement dune théorie de lévolution structurée de telle façon que les niveaux se suivent hiérarchiquement. Les interacteurs sont des individus qui interagissent avec lenvironnement de telle façon quune ou plusieurs de leurs parties présentent un succès reproductif différentiel, c'est à dire un transfert sélectif de leur matériel héréditaire à la génération suivante (Gould & Lloyd 1999). Wilson et Sober suggèrent que l'identification des interacteurs soit faite à partir des concepts de cohésion structurelle et de design fonctionnel (Wilson & Sober 1994), mais ceci n'est pas encore consensuel (Gould & Lloyd 1999). Il y a donc une distinction fondamentale entre réplicateur et interacteur. Le réplicateur est une entité qui produit des copies de lui-même, e.g. lhomme ou les séquences dinsertion. Linteracteur est une entité qui interagit directement, comme un tout, avec lenvironnement de telle façon que sa réplication devient différentielle (Hull 1980). Dans le cadre de cette théorie, la sélection naturelle devient un processus dans lequel lextinction et la prolifération dinteracteurs sont les causes de perpétuation différentielle des réplicateurs qui les produisent ou les contiennent.
Cette théorie postule que le gène peut être un niveau de sélection sil se reproduit de façon différentielle dans les organismes. Ceci est clairement le cas des éléments mobiles tels que les séquences dinsertion et, de lavis de I. Kobayashi, c'est également le cas des systèmes de restriction.
Légoïsme des systèmes de restriction
Les cellules constituent des environnements dans lesquels les séquences dADN peuvent se répliquer, muter et évoluer (Orgel & Crick 1980). Les séquences dADN peuvent contribuer à l'adaptation dun individu, mais elles peuvent aussi augmenter leurs propres chances de préservation. De fait, la seule pression que lADN supporte directement est la pression de subsistance dans les cellules (Doolittle & Sapienza 1980). Si une mutation peut augmenter la probabilité de subsistance, sans effet sur le phénotype de lorganisme, alors des séquences dont la seule raison d'être est leur propre préservation vont inévitablement apparaître et se maintenir par sélection non-phénotypique (Doolittle & Sapienza 1980). De plus, si un groupe de gènes développe une stratégie pour augmenter leur probabilité de survie, alors aucune explication phénotypique additionnelle n'est nécessaire pour justifier son origine et son existence (Williams 1966) (Dawkins 1976). Ainsi le système persistera dans la population tant que sa capacité de reproduction dans les génomes compense son poids phénotypique négatif.
Kobayashi et collègues sont arrivés au modèle égoïste après avoir constaté que la perte des SMR rendaient les cellules non viables (Naito et al. 1995). Cette observation est une conséquence du mode de fonctionnement des SMR. En effet, une bactérie qui perd son SMR conserve pendant quelques générations une population défaillante en méthylase et en nucléase. Or, les nucléases ont un temps de vie plus élevé que les méthylases. En conséquence, après quelques générations, le chromosome ne sera plus protégé par les méthylases et sera détruit par les nucléases restantes.
Des travaux postérieurs ont montré que les SMR forment des "groupes de compatibilité" à limage des plasmides conjugatifs. Les systèmes de restriction qui reconnaissent la même séquence entrent en compétition dans un même génome, ce qui se termine toujours par lextinction de l'un des deux éléments (Kusano et al. 1995). Cette compétition est probablement à lorigine des gènes régulateurs de lexpression de ces systèmes (Nakayama & Kobayashi 1998). On a trouvé des systèmes de restriction qui jouent le rôle de poison et d'antidote dans certains plasmides afin d'éviter leur ségrégation (Kulakauskas et al. 1995). Une fois le système installé, il méthyle lADN et seule la présence du système ou linvasion par un système avec la même spécificité permet la survie de la cellule (Figure 9.1).

Figure 9.1 - Lhypothèse égoïste pour expliquer lexistence des systèmes de restriction. Dans une première étape le système envahit la cellule et exprime la méthylase qui protège le chromosome. Ensuite, si le système est perdu la cellule est tuée par la nucléase. Ceci vient du fait que la durée de vie de la nucléase est plus longue que celle de la méthylase.
Au moment de la publication de lhypothèse égoïste, la théorie de la défense était déjà ébranlée pour plusieurs raisons (Tableau 9.1). La première raison est de nature théorique. Comment expliquer quune bactérie développe des systèmes de restriction pour sa défense et qu'ensuite elle les partage avec toutes les autres bactéries, même celles qui sont phylogénétiquement lointaines ? Ceci ne peut être expliqué par aucune théorie de sélection de groupe connue, sauf si on admet que l'ensemble des bactéries ont une conception de groupe face aux phages, ce qui semble assez douteux. Un deuxième problème évolutif est la courte durée de la protection contre linvasion de phages fournie par les systèmes de restriction ainsi que nous l'avons précédemment mentionné. La compétition entre les systèmes de restriction chez un même hôte est également inexplicable dans le contexte de la théorie de la défense et ramène clairement vers un contexte de gènes égoïstes. Ces difficultés sont à la base de léchec des modèles qui ont été proposés pour décrire lévolution de ces systèmes à partir de leur rôle uniquement défensif (Korona & Levin 1993) (Levin 1993).
Lhypothèse de défense ne peut non plus expliquer lexistence de systèmes qui reconnaissent des sites de restriction à huit nucléotides. Grâce à leur taille, ces sites de restriction sont trop rares (ou même absents) dans la plupart des phages. Néanmoins ils existent dans les génomes des bactéries qui sont beaucoup plus grands. Enfin, les systèmes de restriction sont inefficaces vis à vis des phages à ARN et à ADN simple brin, puisque la nucléase nagit que sur lADN double brin.
La découverte que la plupart des bactéries évitent également les palindromes de façon importante et quasi générale a porté un autre coup à la théorie de la défense. Comment expliquer, en effet, quun système défensif soit si contraignant pour le chromosome de lhôte quil façonne complètement son usage des mots ? Chez Haemophilus influenzae, par exemple, les 7 premiers mots les plus évités de taille 4 sont des palindromes. Le biais imposé par les systèmes de restriction constitue donc un fardeau important. Par ailleurs, la méthylation dun génome nest pas sans conséquences négatives sur lexpressivité des gènes (Reisenauer et al. 1999) et sur le taux de mutation (Lindahl 1993). Ainsi la théorie de la défense ne pourrait se tenir que si les SMR étaient très efficaces, ce qui, apparemment, nest pas le cas.
Tableau 9.1 - Les différences entre lhypothèse de défense et lhypothèse de gène égoïste.
| Phénomène | Hypothèse de défense | Hypothèse gène égoïste |
| Evolution et maintenance : | ||
| Occurrence généralisée des SMR | Défense contre phages et plasmides | Résistance au déplacement par le système de poison-antidote |
| Défense éphémère contre phages | Sélection à la colonisation | La défense est secondaire |
| Spécificité individuelle et diversité collective | Sélection basée sur la fréquence pour une défense efficace | Sélection basée sur la fréquence via la compétition entre séquences |
| Absence dhomologie entre les nucléases | Plusieurs origines indépendantes | Spécialisation précoce des séquences |
| Sites longs | ? | Existent dans les génomes bactériens |
| Organisation des gènes : | ||
| Restriction et modification séparés | ? | Permet le fonctionnement du système poison-antidote |
| Liaison forte entre les deux gènes | Co-régulation | Perte et gain simultanée du SMR |
| Transfert horizontal fréquent | Variation des défenses | Mobilité égoïste (reproduction) |
| Systèmes d'anti-restriction : | ||
| Méthylases solo | ? | Protection contre les SMR |
| Evitement des sites dans les génomes bactériens | Défense contre les erreurs des SMR | Protection contre les SMR |
| Enzyme de restriction methyl spécifique | Défense contre les phages methylés | Protection contre les SMR par induction de apoptose |
Nous avons remarqué, lors de lanalyse de lusage des mots chez Bacillus subtilis, que les sites de restriction dans cet organisme étaient moins évités dans les régions transférées horizontalement (Rocha et al. 1998). Ce moindre évitement des sites de restriction chez Bacillus subtilis est particulièrement visible dans la région du prophage à ADN double brin SPb. Si les systèmes de restriction servent à éviter linvasion des phages, comment expliquer que les régions de moindre biais dans le génome soient justement celles qui ont franchi la barrière de défense ?
Nos résultats préliminaires favorisaient ainsi lhypothèse de Kobayashi. Cependant cette observation restait discutable parce que nous n'avions analysé qu'une seule bactérie et parce que, chez Bacillus subtilis, les régions transférées sont essentiellement localisées autour de la terminaison de la réplication. En conséquence nous avons entrepris une étude plus générale sur lévitement des palindromes dans les génomes bactériens et leurs phages.
Un schéma expérimental in silico
Loriginalité de ce travail, par rapport à nos travaux précédents, a été la définition dune stratégie danalyse très proche de la démarche typique de la biologie expérimentale. Au contraire de la plupart des travaux de bioinformatique nous voulions confronter deux hypothèses et, si possible, trancher en faveur de l'une dentre elles.
La question est de savoir si les systèmes de restriction imposent un fardeau plus grand dans les génomes bactériens ou dans les génomes de phages. Si nous arrivons à la conclusion que les systèmes "pèsent plus" sur les génomes des phages il faudra considérer positivement les hypothèses de défense. Si, au contraire, les systèmes de restriction pèsent plus lourdement sur les génomes bactériens, ces systèmes devront être considérés comme parasitaires. Naturellement nous ne pouvons pas tester cette hypothèse telle que nous lavons énoncé, puisque nous navons pas de mesure directe et objective du "fardeau" que les systèmes imposent sur les génomes. Ainsi, nous devons définir une mesure de ce fardeau qui puisse être obtenu directement à partir de la séquence. Cette mesure est lévitement des mots dans le génome. Elle est directement liée à notre problème puisquelle mesure les forces évolutives qui agissent sur la séquence. Nous supposons donc que les forces évolutives (en dehors des systèmes de restriction) qui agissent sur la fréquence des palindromes sont identiques dans les bactéries et les phages. Ceci paraît acceptable à la lumière des connaissances actuelles. Certains palindromes jouent des rôles importants dans certaines bactéries et certains phages, mais ceci n'est pas le cas de la plupart des palindromes de taille 4 (16 palindromes) et 6 (64 palindromes).
Remise sous une forme testable la question sous-jacente à l'étude devient : étant donnée une paire constituée par une bactérie (hôte) et un phage (parasite), lequel des deux évite le plus les sites de restriction ?
Nos résultats indiquent que le fardeau associé à lexistence de systèmes de restriction semble plus lourd chez les bactéries que chez leurs phages. Ceci est clairement plus en faveur de l'hypothèse égoïste que de l'hypothèse de défense. Néanmoins il reste encore quelques questions en suspens.
Même en acceptant lhypothèse égoïste, il est clair que les systèmes de restriction représentent un obstacle à linvasion de la cellule par les phages. On pourrait spéculer que, dans certaines conditions, les systèmes de restriction présentent un fort avantage sélectif, par exemple pendant la colonisation dun milieu à forte concentration en phages. Dans ces conditions un retard de linvasion peut être suffisant pour gagner la niche écologique (Korona & Levin 1993).
Dans l'hypothèse égoïste, les systèmes de restriction, les bactéries et les phages établissent entre eux un système complexe de relations hôte-parasite. Les phages et les systèmes de restriction entreraient ainsi en compétition pour parasiter les bactéries. Pourtant, les bactéries peuvent se servir des systèmes de restriction pour combattre les phages. Cette dynamique est très intéressante et mériterait une étude sérieuse du point de vue de lécologie évolutive. La facilité dexpérimentation dans ce système nest pas un de ses moindres atouts.