CGM - Département Dynamique et Stabilité des Génomes
Analyse du génome : plus sur l'équipe
Responsable : Claude THERMES
MàJ : 03/08/11
Thèmes scientifiques
L'écriture des génomes résulte non seulement de contraintes associées à l'information génétique proprement dite (signaux de transcription, régions traduites, etc.) mais aussi de contraintes associées à des mécanismes cellulaires tels que la réplication ou la dynamique de la chromatine. Nous étudions comment ces mécanismes se traduisent par des propriétés particulières d'écriture des génomes et comment celles-ci sont reliées aux données expérimentales récentes, comme par exemple l'expression des gènes, l'état de condensation de la chromatine ou la chronologie de la réplication. Ces thématiques mettent en œuvre des approches multi-échelles relevant non seulement de la bioinformatique mais aussi de la physique. Elles présentent ainsi un caractère multidisciplinaire qui se concrétise depuis plusieurs années par une collaboration étroite avec des physiciens (A. Arneodo, ENS, Lyon).
L'étude des hétérogénéités de composition (contenu en GC, asymétries de brin) nous permet d'étudier, à grande échelle, les liens entre la réplication, l’expression des gènes et leur organisation dans le génome. Durant l'évolution, l'asymétrie des processus de mutation-réparation entre les deux brins d'ADN entraine des biais de composition nucléotidique. L'étude de ces biais le long des génomes permet, chez les procaryotes, de détecter les origines de réplication. Chez les eucaryotes, nous avons montré que transcription et réplication engendrent des biais de composition nucléotidique qui se superposent en formant le long des génomes des profils complexes que nous sommes parvenu à distinguer les uns des autres. L’étude des biais associés à la réplication, qui s’inversent de part et d’autre des sites de démarrage (origines de réplication), nous a permis d’identifier in silico un millier d’origines de réplication dans le génome humain. Chez l'homme, l’identification de ces origines est très difficile et après plus de vingt ans d’efforts, à peine plus d’une dizaine d’entre-elles ont été bien caractérisées sur un total estimé à plus de dix mille. Ces prédictions offrent des possibilités nouvelles pour des recherches expérimentales et bioinformatiques de la réplication. Elles permettent d’entreprendre l’étude d’un grand nombre d’origines à l’échelle de génomes entiers, apportant ainsi un éclairage nouveau sur l’organisation spatiale et temporelle de la réplication chez les eucaryotes supérieurs. Afin de poursuivre l’étude de la réplication chez les eucaryotes à l’échelle de génomes entiers, nous travaillons en association avec des expérimentateurs pour valider et étudier les origines prédites in silico par analyse par peignage moléculaire, puces à ADN et études in situ (http://replicor.cgm.cnrs-gif.fr/index.html) (collaborations avec O. Hyrien, ENS Paris ; F. Mongelard, ENS, Lyon).
Nous étudions les corrélations à longue portée dans les génomes entre des motifs présentant des propriétés particulières de courbure afin de déterminer le rôle de ces corrélations dans la formation et la dynamique des nucléosomes. Les résultats déjà obtenus indiquent que les corrélations à longue portée observées chez les eucaryotes dans la gamme 1-200 bp sont un élément important de l'organisation de la chromatine contribuant à la structure de l'ADN dans les nucléosomes ainsi qu'à leurs propriétés dynamiques. Dans les gammes d'échelles au delà de 200 bp, on observe des corrélations entre sites de courbure de l'ADN dans les trois règnes, eucaryotes, eubactéries et archaebactéries. Nous proposons que les corrélations à longue portée à grande échelle (jusqu'à des distances de l'ordre de milliers de paires de bases) constituent un mode d'écriture des génomes impliqué dans des processus universels d'organisation de la chromatine. Cette écriture se superposerait à l'écriture des gènes (parties codantes et signaux de contrôle) et présenterait des propriétés particulières d'invariance d'échelle que nous pouvons observer à l'aide du "microscope mathématique" de l'analyse en ondelettes.
Un autre de nos thèmes de recherche porte sur l'identification et l'étude in silico de nouveaux gènes d'ARNs ne codant pas pour des protéines (ARNs non codants). Les données récentes montrent toute l'importance de cette classe d'ARNs qui, chez l'homme, représentent plus de la moitié de la totalité des transcrits et dont un partie est impliquée dans de nombreux mécanismes de régulation génétique comme l'interférence par l'ARN ou les modifications de la chromatine. Nous identifions de tels gènes in silico (http://www.isv.cnrs-gif.fr/mc/ riboreg/index.php). Ces gènes sont ensuite étudiés expérimentalement afin d'explorer leurs rôles et d'analyser leurs mécanismes d'action et leur impact sur la différentiation cellulaire et sur les pathologies (collaboration avec M. Crespi, ISV, Gif-sur-Yvette).
Collaborations
Alain Arneodo (ENS, Lyon)
Martin Crespi (ISV, Gif-sur-Yvette)
Richard Lavery (IBPC, Paris)
Olivier Hyrien (ENS, Paris)
Fabien Mongelard (ENS, Lyon)
Sophie Schbath (MIG, Jouy-en-Josas)
Thèses
Guillaume Guilbaud
"Etude du programme de réplication du génome humain par peignage moléculaire de l’ADN et séquençage massif" (2010) Thèse de l'Université Denis Diderot, Paris VII
Maxime Huvet
"Rôle de la réplication dans l'évolution et l'organisation du génome humain" (2008) Thèse de l'Université Denis Diderot, Paris VII
Marie Touchon
"Asymétries compositionnelles chez les eucaryotes" (2005) Thèse de l’Université Paris VII.
Nicolas
Charlet-Berguerand
"Etude de la régulation de l'épissage alternatif des pré-messagers RET, GFRa1, cTNT et ClC1" (2003) Thèse de l'Université Paris VII.
Hervé le Hir
"Etude de l'epissage alternatif des ARN pré-messagers du gène RET et du gène de la tyrosine hydroxylase dans les phéochromocytomes" (1998) Thèse de l'Université Paris VII.
Stagiaires
- Marc Descrimes, Master2 (2010)
- Philippe Alexandre, Master2 (2008)
- Pauline Pardieu, Master2 (2007)
- Emna Marrakchi, Master2 (2005-2007)
- Samuel Plessis-Fraissard EPITA (2003)
- Solen Deudé DESS (2002-2003)
- Pierre Kubiak (2002)
- Elodie Guillaume DESS (2001-2002)
- Ludovic Cottret (2000-2001)
Ingénieurs
- Anne Aubert (2011), ingénieur rattachée à la plateforme de séquençage haut débit
- Marc Descrimes (2010)
- Lauranne Duquenne (2007-2008)
- Antoine Lucas (2006)
- Vincent Lefort CDD (2003)
- Ludovic Cottret (2002)
Publications
2011
- Guilbaud, G., Rappailles, A., Baker, A., Chen, CL., Arneodo, A., Goldar, A., d'Aubenton-Carafa, Y., Thermes, C., Audit, B., Hyrien, O. (2011) Evidence for Sequential and Increasing Activation of Replication Origins along Replication Timing Gradients in the Human Genome.
PLoS Comput Biol, 7(12):e1002322.
- Arneodo, A., Vaillant, C., Audit, B., Argoul, F., d'Aubenton-Carafa, Y., Thermes, C. (2011) Multi-scale coding of genomic information: From DNA sequence to genome structure and function.
Physics Reports-Review Section of Physics Letters, 498 (2-3) 45-188.
- Dubarry, M., Loïodice, I., Chen, C. L., Thermes, C. and Taddei, A. (2011) Tight protein-DNA interactions favor gene silencing.
Genes Dev, 25 (13) 1365-70.
- Van Dijk, E.L., Chen, C.L. , d'Aubenton-Carafa, Y., Gourvennec, S., Kwapisz, M., Roche, V., Bertrand, C., Silvain, M., Legoix-Né, P., Leoillet, S., Nicolas, A., Thermes, C. and Morrillon, A. (2011) XUT, a novel class of antisense regulatory ncRNA in yeast.
Nature, 475 (7354) 114-7.
- Chen, CL., Duquenne, L., Audit, B., Guilbaud, G., Rappailles, A., Baker, A., Huvet, M., d'Aubenton-Carafa, Y., Hyrien, O., Arneodo, A., Thermes, C. (2011) Replication-associated mutational asymmetry in the human genome.
Mol Biol Evol, 28 (8) 2327-37.
2010
- Oulion, S., Debiais-Thibaud, M., D'Aubenton-Carafa, Y., Thermes, C., Da Silva, C., Bernard-Samain, S., Gavory, F., Wincker, P., Mazan, S. and Casane, D. (2010) Evolution of Hox gene clusters in gnathostomes: insights from a survey of a shark (Scyliorhinus canicula) transcriptome.
Mol Biol Evol, Epub ahead of print.
- Chen, C.-L., Rappailles, A., Duquenne, L., Huvet, M., Guilbaud, G., Farinelli, L., Audit, B., d'Aubenton-Carafa, Y., Arneodo, A., Hyrien, O. and Thermes, C. (2010) Impact of replication timing on non-CpG and CpG substitution rates in mammalian genomes.
Genome Res, 20 (4) 447-57.
- Vaillant, C., Palmeira, L., Chevereau, G., Audit, B., d'Aubenton-Carafa, Y., Thermes, C. and Arneodo, A. (2010) A novel strategy of transcription regulation by intra-genic nucleosome ordering.
Genome Res, 20 (1) 59-67.
2009
- Chevereau, G., Palmeira, L., Thermes, C., Arneodo, A. and Vaillant, C. (2009) Thermodynamics of nucleosome ordering by genomic confinement.
Phys Rev Letters, 103 (18) 188103.
- Audit, B., Zaghloul, L., Vaillant, C., Chevereau, G., d'Aubenton-Carafa, Y., Thermes, C. and Arneodo, A. (2009)
Open chromatin encoded in DNA sequence is the signature of 'master' replication origins in human cells.
Nucleic Acids Res, 37 (18) 6064-75.
- Guérin, A., d'Aubenton-Carafa, Y., Marrakchi, E., Da Silva, C., Wincker, P., Mazan, S., Rétaux, S. (2009) Neurodevelopment genes in lampreys reveal trends for forebrain evolution in craniates.
PLoS ONE, 4 (4) e5374.
- Neil, H. , Malabat, C., d’Aubenton-Carafa, Y., Xu, Z. Steinmetz, L.M. and Jacquier, A. (2009) Widespread bidirectional promoters are the major source of cryptic transcripts in yeast.
Nature, 457 (7232) 1038-42.
- Ben Amor, B., Wirth, S., Merchan, F., Laporte, P., d'Aubenton-Carafa, Y., Hirsch, J., Maizel, A., Mallory, A., Lucas, A., Deragon, J.-M., Vaucheret, H., Thermes, C. and Crespi, M. (2009) Novel long non-protein coding RNAs involved in Arabidopsis differentiation and stress responses.
Genome Res, 19 (1) 57-69.
2008
- Miele, V., Vaillant, C., d'Aubenton-Carafa, Y., Thermes, C. and Grange, T. (2008) DNA physical properties determine nucleosome occupancy from yeast to fly.
Nucleic Acids Res, 36 (11) 3746-56.
- Arneodo, A., Audit, B., Faivre-Moskalenko, C., Moukhtar, J., Vaillant, C., Argoul, F., d'Aubenton Carafa, Y. and Thermes, C. (2008) "From DNA sequence to chromatin organization: the fundamental role of genomic long-range correlations".
in Bulletin de l’Académie Royale de Belgique, Classe des Sciences, Académie Royale de Belgique, TomeXXVIII, n° 2049, 107p.
2007
Audit, B., Nicolay, S., Huvet, M., Touchon, M., d'Aubenton-Carafa, Y., Thermes, C. and Arneodo, A. (2007) DNA replication timing data corroborate in silico human replication origin predictions.
Physical Review Letters, 99 (24) 248102.
Huvet, M., Nicolay, S., Touchon, M., Audit, B., d'Aubenton-Carafa, Y., Arneodo, A. and Thermes, C. (2007) Human gene organization driven by the coordination of replication and transcription.
Genome Res, 17 (9) 1278-1285.
Nicolay, S., Brodie of Brodie, E.B., Touchon, M., Audit, B., d'Aubenton-Carafa, Y., Thermes, C. and Arneodo, A. (2007) Bifractality of human DNA strand-asymmetry profiles results from transcription.
Physical Review E, 75 (3-1) 032902.
Arneodo, A., d'Aubenton Carafa, Y., Audit, B., Brodie of Brodie, E.B., Nicolay, S., Saint-Jean, P., Thermes, C., Touchon, M. and Vaillant, C. (2007)
DNA in chromatin: from genome wide sequence analysis to the modeling of replication in mammals
Adv Chem Phys 135 203-225
Arneodo, A., Audit, B., Brodie of Brodie, E.-B., Nicolay, S., St Jean, P., d'Aubenton-Carafa, Y., Thermes, C. and Touchon, M. (2007) DNA in Chromatin: from genome-wide sequence analysis to the modeling of replication in mammals.
in Special Volume in Memory of Ilya Prigogine: Advances in Chemical Physics 135, S.-A. Rice (Ed.), John Wiley & Sons,
Arneodo, A., Audit, B., Brodie of Brodie, E.-B., Nicolay, S., Touchon, M., d'Aubenton Carafa, Y., Huvet, M.. and Thermes, C. (2007) Fractals and Wavelets: what can we learn on transcription and replication from wavelet-based multifractal analysis of DNA sequences?
in Encyclopedia of Complexity and System Science in press.
Arneodo, A., Audit, B., Faivre-Moskalenko, C., Moukhtar, J., Vaillant, C., Argoul, F., d'Aubenton Carafa, Y. and Thermes, C. (2007) From DNA sequence to chromatin organization: the fundamental role of genomic long-range correlations.
in Bulletin de l’Académie Royale de Belgique, Classe des Sciences in press.
Arneodo, A., Vaillant, C., Audit, B., d'Aubenton Carafa, Y. and Thermes, C. (2007) What Can We Learn from the Analysis of Scale Invariance and Long-range Correlation Properties of DNA Sequences Using Wavelet Techniques?
in Modern Mathematical Models, Methods and Algorithms for Real World Systems, A.-H. Siddiqi, I.-S. Duff and O. Christensen (Ed.), Anamaya, New Delhi. in press.
2006
Arneodo, A., d’Aubenton-Carafa, Y., Audit, B., Brodie of Brodie, E. B., Nicolay, S., Saint-Jean, P., Thermes, C., Touchon, M. and Vaillant, C. (2006)
Large-scale analysis of the human genome : from DNA sequence analysis to the modelling of replication in higher eucaryotes.
14 th EUSIPCO. Florence, Italy.
Hirsch, J., Lefort, V., Vankersschaver, M., Boualem, A., Thermes, C., d'Aubenton Carafa, Y. and Crespi, M. (2006)
Characterization of 43 non-protein coding mRNA genes in Arabidopsis reveals the miR162a primary transcript.
Plant Phys., 140 1192-1204.
Vaillant, C., Audit, B., Thermes, C. and Arneodo, A. (2006)
Formation and positioning of nucleosomes: effect of sequence dependent long-range correlated structural disorder.
Eur. Phys. J. E ,19, 263-277.
Guédon, Y., d'Aubenton Carafa, Y. and Thermes, C. (2006)
Constructing lumped processes from Markov chains with an application to DNA sequence analysis.
J. Appl. Math. , 52 , 343-372.
2005
Touchon, M., Nicolay, S., Audit, B., Brodie of Brodie, E.B., d'Aubenton-Carafa, Y., Arneodo, A. and Thermes, C. (2005)
Replication-associated strand asymmetries in mammalian genomes: Toward detection of replication origins.
Proc. Natl. Acad. Sci. USA , 102, 9836-9841.
Brodie of Brodie, E.B., Nicolay, S., Touchon, M., Audit, B., d'Aubenton-Carafa, Y., Thermes, C. and Arneodo, A. (2005)
From DNA Sequence Analysis to Modeling Replication in the Human Genome.
Phys. Rev. Lett. , 94, 248103.
2004
Touchon, M., Arneodo, A., d'Aubenton-Carafa, Y. & Thermes, C. (2004)
Transcription-coupled and splicing-coupled strand asymmetries in eukaryotic genomes.
Nucleic Acids Res. 32: 4969-4978.
Nicolay S, Argoul, F, Touchon, M, d'Aubenton-Carafa, Y, Thermes C & Arneodo A (2004)
Low frequency rhythms in human DNA sequences: a key to the organization of gene location and orientation?
Phys. Rev. Lett. 93: 108101.
Nicolay S, Brodie of Brodie EB, Touchon M, d'Aubenton Carafa Y, Thermes C & Arneodo A (2004)
From scale invariance to deterministic chaos in DNA sequences: towards a deterministic description of gene organization in the human genome.
Physica A 342: 270-280.
Audit, B., Vaillant, C., Arneodo, A., d'Aubenton-Carafa, Y. and Thermes, C. (2004)
Wavelet analysis of DNA bending profiles reveals structural constraints on the evolution of genomic sequences.
J. Biol. Phys. 30: 33-81.
Charlet-Berguerand, N., Le Hir, H., Incoronato, M., Di Porzio, U., Yu, Y., Jing, S., De Franciscis, V. and Thermes, C (2004). Expression of GFRalpha1 receptor splicing variants with different biochemical properties is modulated during kidney development.
Cell Signal 16: 1425-1434.
2003
Touchon, M., Nicolay, S., Arneodo, A., d'Aubenton-Carafa, Y. & Thermes, C. (2003)
Transcription-coupled TA and GC strand asymmetries in the human genome.
FEBS Lett. 555: 579-582.
Vaillant, C., Audit, B., Thermes, C. and Arneodo, A. (2003)
Influence of the sequence on elastic properties of long DNA chains.
Phys. Rev. E Stat. Nonlin. Soft Matter Phys. 67: 032901.
Arneodo, A., Audit, B., Vaillant, C., d'Aubenton-Carafa, Y. and Thermes, C. (2003)
Extracting structural and dynamical informations from wavelet-based analysis of DNA sequences.
In J-P. Gazeau, R. K., J-P. Antoine, S. Metens and J-Y. Thibon (ed.), GROUP 24: Physical and Mathematical Aspects of Symmetries. IOPP Publishing, Bristol.
Crespi, M., Campalans, A., Thermes, C. & Kondorosi, A. (2003)
New Perspectives on Noncoding or Short ORF-Encoding RNAs.
In Plant Noncoding RNAs: Molecular Biology and Molecular Medicine, pp. 193-202.
Raux E., Leech HK., Beck ., Schubert HL., Santander PJ., Roessner CA., Scott A.I., Martens J.H., Jahn D., Thermes C et al. (2003).
Identification and functional analysis of enzymes required for precorrin-2 dehydrogenation and metal ion insertion in the biosynthesis of sirohaem and cobalamin in Bacillus megaterium.
Biochem. J. 370: 505-516.
2002
Audit, B., Vaillant, C., Arneodo, A., d'Aubenton-Carafa, Y. and Thermes, C. (2002)
Long-range correlations between DNA bending sites: relation to the structure and dynamics of nucleosomes.
J. Mol. Biol. 316: 903-918.
Vermat, T., Vandenbrouck, Y., Viari, A. and d'Aubenton Carafa, Y. (2002)
Prediction, distribution and evolution of intrinsic transcription terminators in bacterial genomes.
In Nicolas J and Thermes C (eds.), JOBIM Proceedings, pp. 137-142.
Le Hir, H., Charlet-Berguerand, N., de Franciscis, V. & Thermes, C. (2002)
5'-End RET splicing: absence of variants in normal tissues and intron retention in pheochromocytomas.
Oncology 63: 84-91.
Publications antérieures (1998-2001)
Audit, B., Thermes, C., d'Aubenton-Carafa, Y., Vaillant, C., Muzy, J.F. and Arneodo, A. (2001) Long-range corrélations in genomic DNA : a signature of nucleosomal DNA. Phys. Rev. Let. 86, 2471-2474.
Le Hir, H., Charlet-Berguerand, N., Gimenez-Roqueplo, A.P., Mannelli, M., Plouin, P.F., de Franciscis, V. and Thermes, C. (2000). Relative expression of the RET9 and RET51 isoforms in human pheochromocytomas. Oncology 58, 311-318.
Le Hir, H., Colucci-D'Amato, GL., Charlet-Berguerand, N., Plouin, PF., Bertagna, X., de Franciscis, V. and Thermes, C. (2000). High levels of tyrosine phosphorylated proto-Ret in sporadic pheochromocytomas. Canc. Res. 1365-1370.
Menaa, F., Charlet, N. and Thermes, C. (2000) Etude de l'épissage alternatif des transcrits du co-récepteur du GDNF. L'année Gérontologique 14, 121-123.
Vignal, L., Lisacek, F., Quinqueton, J., d'Aubenton-Carafa, Y. and Thermes, C. (1999). A multi agent system simulating splice site recogntion. Comp. Chem. 23, 219-231.
Charrier, B., Foucher, F., Kondorosi, E., d'Aubenton-Carafa, Y., Thermes, C., Kondorosi, A. and Ratet, P. (1999). Bigfoot: a new family of MITE elements characterized from the Medicago genius. The Plant J. 18, 431-441.
Arneodo, A., d'Aubenton-Carafa, Y., Audit, B., Bacry, E., Muzy, J.F., and Thermes, C. (1998) What can we learn with wavelets about DNA sequences ? Physica A 249, 439-448.
Arneodo, A., d'Aubenton-Carafa, Y., Audit, B., Bacry, E., Muzy, J.F., and Thermes, C. (1998). Nucleotide composition effects on the long-range correlations in human genes. Eur. Phys. J. B 1, 259-263.
![]()