Problématique

Signaux et motifs

Un signal est une portion d'une molécule reconnue spécifiquement par un "effecteur". Nous considérons ici le cas où le signal est une portion d'acide nucléique, et plus particulièrement d'ARN.

Un signal est donc ce que reconnaît l'effecteur (cette définition peut sembler un peu tautologique ; elle l'est). Le signal peut être une séquence, ou une structure spatiale.

Motifs définis par une structure spatiale

Certains motifs sont caractérisés par une forme tridimentionnelle. En fait, un tel motif est défini par sa structure primo-secondo-tertiaire. En effet, dans une telle structure, un nucléotide peut avoir comme rôle :

Exemples de motifs définis par une structure spatiale :

Dans certains cas, la fonction du motif nécessite le passage d'une forme à une autre. La molécule doit alors être capable d'adopter chacune des deux (ou plus) configurations spatiales.

Décrire pour reconnaître

Lors du processus d'analyse d'un génome, il est extrèmement important de repérer les signaux. L'approche classique consiste à écrire un programmes dédié pour chaque structure, programme qui va identifier successivement les différents éléments de la structure. Il existe d'excellents programmes pour trouver les ARNt ou les introns de type I, par exemple. Le problème de ce type d'approche est le manque de souplesse et d'interactivité. En effet, chaque nouvelle structure à rechercher nécessite l'écriture d'un programme complet, comportant d'importantes parties de code consacrées à des tâches telles que la lecture des séquences, le déplacement à l'intérieur de la séquence, etc. Modifier un tel programme, par exemple pour tenir compte des progrès de la connaissance d'un motif, demande beaucoup de précautions (surtout si la personne qui veut effectuer la modification n'est pas celle qui a écrit le programme originel), car un changement sur un paramètre peut avoir des conséquences en n'importe quel point du programme. Il n'est donc pas simple, pour un biologiste qui travaille sur une structure, de faire évoluer un programme, ou de tester directement ses hypothèses.

On aimerait bien disposer d'un logiciel unique, permettant à un non-informaticien de chercher n'importe quelle structure en indiquant seulement quoi chercher, mais pas comment le chercher. La première chose à faire avant de trouver un signal, c'est bien sûr d'être capable de le décrire. Voyons comment est composé un signal spatial :

Il nous faut donc disposer d'un moyen de décrire une structure, qui prenne en compte ces deux aspects. La principale différence avec l'écriture d'un motif en structure primaire est qu'une structure spatiale n'est pas toujours représentable sous forme linéaire. Une description sous forme de motifs ou "pattern", avec une construction linéaire, aussi sophistiquée soit elle, n'est donc pas adaptée.