Aller au contenu
Pas de pub non magique pour les membres du Cercle VM. Clique ici pour en savoir plus !

La Cause Animale


Recommended Posts

Pas de pub non magique pour les membres du Cercle VM. Clique ici pour en savoir plus !
Invité bénocard

Hello !

Il y a 17 heures, Melvin a dit :

Exemple : 

construire.gif

Voilà. Typiquement sur cet arbre que représentent les longueurs d'arêtes ? Je voudrais bien le savoir. Et puis on voit qu'ils sont tous sur la même ligne, mais le chemin depuis la racine ne sont pas de longueurs égales...

Donc, résumé du dernier épisode : il y a risque de confusion sur le mot phylogénétique. Ca vient du fait qu'avant l'avènement de la génétique ATCG des biologistes moléculaires, il y a eu la génétique de Mendel (les traits hérités, les caractères morphologiques...) des biologistes "des organismes et populations" comme on les appelait. On utilisait les termes phylogénie et phylogénétique, mais phylogénétique était souvent utilisé par les deux disciplines.

Bon, là je parle d'arbres phylogénétiques des généticiens ATCG.

Il y a peut-être aussi confusion sur le mot évolution. Je vais expliquer mon truc et puis vous jugerez sur pièce.

L'avantage des arbres phylogénétiques, c'est que les longueurs d'arête ont un sens bien défini. On extrait en quelque sorte de chaque espèce sa substantifique moëlle, ce qui fait son "empreinte génétique" (en éliminant les variations intra-espèces), et on la compare avec celle des autres.

Je vais expliquer tout ça simplement. Forcément c'est simplifié à chaque étape, je tenterai à chaque fois de dire en quel sens, de nuancer, de dire ce que je laisse de côté, etc.

Ca demande un peu de réflexion préliminaire. Je vais commencer par expliquer shématiquement comment on peut comparer des séquences d'ADN. Après comment on peut construire un consensus représentant chaque espèce, puis comment comparer les espèces entre elles. Ca sera évidemment pas complet, mais ça donne une idée. C'est un modèle simple pour fixer les idées.

Un petit quizz en attendant ?

toto.thumb.jpg.f7b2eefa8708f1979ff3c9e9a9a761b0.jpg

Modifié par bénocard
Lien vers le commentaire
Partager sur d’autres sites

il y a 39 minutes, bénocard a dit :

Un petit quizz en attendant ?

toto.thumb.jpg.f7b2eefa8708f1979ff3c9e9a9a761b0.jpg

Tu uses de substances hallucinogènes ? ^_^

Au fait, il n'y a qu'un "z" à quiz.

Citation

Et puis on voit qu'ils sont tous sur la même ligne, mais le chemin depuis la racine ne sont pas de longueurs égales...

Heu... tu es sérieux ? La carte n'est pas le territoire, n'oublie pas. C'est juste une représentation où les "longueurs" n'ont pas à être proportionnelles au temps (ou autre facteur). Ce qui compte dans celle-ci n'est pas la longueur des chemins mais qu'il y ait des chemins, des embranchements.

 

Modifié par Christian Girard
Lien vers le commentaire
Partager sur d’autres sites

C'est à dire qu'à partir d'un nœud (= ancêtre commun à deux espèces A et B actuelles), il y a forcément autant de temps qui le sépare de l'espèce A actuelle et de l'espèce B actuelle (voir schéma ci-dessous). La plupart du temps les dessins des arbres phylogénétiques ne sont pas fait à l'échelle.

Sans titre-Numérisation-08.jpg

Melvin

Lien vers le commentaire
Partager sur d’autres sites

Invité bénocard
il y a une heure, Christian Girard a dit :

Tu uses de substances hallucinogènes ? ^_^

C'est pas la question xD

C'est à cause de google images, sinon c'est trop facile...

il y a 20 minutes, Melvin a dit :

C'est à dire qu'à partir d'un nœud (= ancêtre commun à deux espèces A et B actuelles), il y a forcément autant de temps qui le sépare de l'espèce A actuelle et de l'espèce B actuelle (voir schéma ci-dessous). La plupart du temps les dessins des arbres phylogénétiques ne sont pas fait à l'échelle.

D'accord, donc les longueurs d'arêtes représentent le temps. Mais certaines espèces ont arrêté d'évoluer en tant qu'espèces bien avant que l'homme apparaisse... Il faudrait raccourcir les branches !

Ensuite que se passe-t-il pendant ce temps ? Toutes les mutations ne se valent pas, il y en a même qui provoquent la disparition de l'espèce. Tu parles d'une évolution ! Et puis il y a des mutations inutiles, qui produisent plein de variantes d'un même gène ou qui tapent dans des parties non codantes... Toutes les régions du génome ne sont pas équivalentes.

Lien vers le commentaire
Partager sur d’autres sites

Invité bénocard

Bon je me lance.

Basiquement, on compare les séquences de nucléotides (ATCG, les quatre molécules qui forment l'ADN) grâce à une simple distance d'édition. La distance d'édition entre deux suites de lettres, c'est le nombre de modifications, suppressions et insertions qu'il faut pour passer de l'une à l'autre.

Exemples : merde-mrede distance 2, mrede-meder distance 2, meder-medor distance 1, merde-medor distance 3

A partir de là, on cherche à aligner les séquences en minimisant les distances :

Sequence+alignment(2)+EX.+Global+alignme

Après on peut aligner ensemble plusieurs séquences et trouver un alignement global optimal :

alignm6.gif

Vous voyez qu'il y a en bas une séquence consensus. Cette séquence représente l'ensemble des séquences alignées une fois qu'on a mis de côté les variations individuelles.

En vrai évidemment la distance utilisée est un peu plus complexe que la distance d'édition, on accorde des poids différents aux éditions élémentaires, mais c'est le principe.

Ca, c'est pour la partie "traitement de texte". Ce sont des programmes bio-informatiques qui font ça, c'est tout à fait bien compris et maîtrisé depuis des dizaines d'années.

Ca va donner des papiers du genre :

https://www.scribd.com/document/344525360/FASTA

Citation

Finding Protein and Nucleotide Similarities with FASTA

William R. Pearson

University of Virginia School of Medicine, Charlottesville, Virginia

William R. Pearson: [email protected]

Abstract

The FASTA programs provide a comprehensive set of rapid similarity searching tools (fasta36, fastx36, tfastx36, fasty36, tfasty36), similar to those provided by the BLAST package, as well as programs for slower, optimal, local and global similarity searches (ssearch36, ggsearch36) and for searching with short peptides and oligonucleotides (fasts36, fastm36). The FASTA programs use an empirical strategy for estimating statistical significance that accommodates a range of similarity scoring matrices and gap penalties, improving alignment boundary accuracy and search sensitivity (Unit 3.5). The FASTA programs can produce “BLAST-like” alignment and tabular output, for ease of integration into existing analysis pipelines, and can search small, representative databases, and then report results for a larger set of sequences, using links from the smaller dataset. The FASTA programs work with a wide variety of database formats, including mySQL and postgreSQL databases (Unit 9.4). The programs also provide a strategy for integrating domain and active site annotations into alignments and highlighting the mutational state of functionally critical residues. These protocols describe how to use the FASTA programs to characterize protein and DNA sequences, using protein:protein, protein:DNA, and DNA:DNA comparisons.

 

Modifié par bénocard
Lien vers le commentaire
Partager sur d’autres sites

Rejoins la conversation !

Tu peux publier maintenant et t'enregistrer plus tard. Si tu as un compte, connecte-toi maintenant pour publier avec ton identité.

Invité
Répondre à ce sujet…

×   Vous avez collé du contenu avec mise en forme.   Restaurer la mise en forme

  Only 75 emoji are allowed.

×   Votre lien a été automatiquement intégré.   Afficher plutôt comme un lien

×   Votre contenu précédemment saisis, a été restauré..   Effacer le contenu

×   You cannot paste images directly. Upload or insert images from URL.




×
×
  • Créer...