nornenes physiques qu'il est possible de quantifier dans certaines conditions. Lorsqu'une structure, constituee d'un serni-conducteur (Si) (12) recouvert d'un dielectrique (Si0 2 ) ou sont fixees des sondes, est placee dans des conditions de polarisation adequates, un courant, sensible aux modifications de charges du serni-conducteur, circule normalement de la source vers Ie drain. Or, l'hybridation des sondes entraine une modification de la densite de charges du semi-conducreur a l'interface Si/Si0 2 • Une mesure de la variation de la tension, etablie entre la grille et la source afin de maintenir constante la valeur du courant, permet done de reperer les associations specifiques entre sondes et acides nucleiques cibles. La sensibilite de ce systerne mis au point a l'Ecole centrale de Lyon et denornme GENFET (GEN field effect transistor) se situe dans une fourchette allant de 10.6 a 10.9 grammes d'ADN par millilitre d'echantillon, De leur cote, les chercheurs du GenoSensor Consortium et la societe Beckman Instruments s'interessent, pour Ie developpernent de leur puce electronique, ou Permittivity Chips ™ (14), a la dispersion dielectrique due aux charges negatives des groupements phosphates constitutifs du squelette sucre-
phosphate des acides nucleiques. Ce phenomene, dependant de la longueur de la molecule d' ADN, peut etre quantifie par la frequence de relaxation de la molecule. Cette grandeur varie, en effet, d'un facteur 100 lorsque la taille de I'ADN varie d'un facteur 10. C'est, par exemple, Ie cas lorsqu'un fragment simple brin de 100 bases s'hybride avec une sonde 10 mers. En pratique, un analyseur d'irnpedance permet de mesurer l'energie absorbee par les sondes: celle-ci prenant une valeur maximale differente - respectivement 5 et 10 Mhz - selon qu'elles sont appariees ou non, il est possible de reperer electroniquernent les hybridations.
Autres approches Des puces constituees d'une surface CCD ou chaque pixel correspond a une sonde fixee sur un support de verre, permettent Ie reperage des hybridations, aussi bien par simple illumination que par detection de fluorescence ou d'emissions radioactives (dans Ie cas de marquage). L'avantage d'un tel systerne en est la rapidite : une surface de 420 x 420 pixels (pouvant potentiellement porter 176 400 sondes) est lue en une seconde (9).
Les applications actuelles
CD
es puces a ADN constituent des outils permettant la realisation de trois categories d'analyse : Ie sequencage par hybridation (SPH), I'analyse de sequences/mutations et l'analyse de I'expression des genes. Comme on Ie verra par la suite, Ie sequencage par hybridation se heurte encore a plusieurs problernes techniques. En theorie, il peut etre realise sur des puces portant un ensemble complet de sondes d'une longueur donnee. La taille du plus grand fragment sequencable, avec un tel systerne, est approximativement egale a la racine carree du nombre de sondes portees. Ainsi, avec une matrice des 65 536 octarneres, il devrait etre possible de sequencer des fragments d'environ 200 paires de bases. Un projet de sequencage par puce a ADN tres ambitieux a ete lance par la societe Hyseq (Califomie), dont les vice-presidents, X Drmanac et Y Crkvenjakov sont parmi les initiateurs du SPH. Leur puce denommee SuperChips'" pourrait sequencer 64 000 bases en une seule reaction. Actuellement, ce sont les analyses de mutation et d'expression de genes qui ont abouti aux utilisations les plus probantes et les plus mediatisees des puces a ADN.
V.ANAL,Y$E..P.E..rv1.LJTATIQt':J
Elle repose sur la constitution de puces capables d'analyser chaque base d'une sequence deja connue. Les sondes sont organisees en ensembles au sein desquels une sequence est homologue a celie de type sauvage alors que les autres sont caracterisees par une modification (substitution, deletion, addition) toujours localisee en milieu de sequences afin de standardiser les conditions d'hybridations. Dans Ie cas d'une analyse de substitution de base, les sondes sont organisees en tetrades, ensembles de quatre elements. Une des quatre sondes possede en position centrale la base homologue a celie se trouvant dans la sequence sauvage a la position analysee
(c'est, en quelque sorte, une « sonde sauvage »), Les trois autres sondes contiennent, en position centrale, les trois autres bases possibles (elles constituent les « sondes rnutees »). Selon cette approche, une sequence cible de L nucleotides est analysee in extenso par 4xL sondes (26). L'analyse des intensites de fluorescence relatives a chaque tetrade permet de determiner si la sequence cible correspond au type sauvage ou com porte une mutation. Dans Ie premier cas, un spot « attendu » est allurne la ou la sonde sauvage est situee, Dans Ie second, un spot apparait localise a l'un des sites correspondant aux sequences mutees, De plus, ce phenornene s'accompagne d'une diminution de l'intensite d'hybridation (Ia base mutee est a I'origine de mesappariements) au niveau des tetrades permettant l'analyse des bases qui flanquent la mutation. L'analyse des differentes intensites d'hybridation est realisee par un logiciel specifiquement developpe dans ce but. Les travaux de MJ Kozal (San Diego, Californie) et de JG Hacia (Bethesda, Maryland), portant respectivement sur Ie polymorphisme du gene de la protease du VIH-1 et la detection de mutants heterozygotes du gene BRCA1, sont des illustrations brillantes de la puissance de cette technique emergente. La protease du VIH-1 est une proteine homodimerique cornposee de deux monomeres de 99 acides amines essentiels a la maturation des precurseurs de polypeptides viraux (27). Proteine essentielle du cycle viral, elle constitue la cible de plusieurs medicaments (les inhibiteurs de proteases). Des analyses du polymorphisme ont permis de demontrer que, sous la pression de selection deterrninee par I'utilisation des antiproteases, environ 20 des 99 acides amines pouvaient subir une mutation qui, dans certains cas, pouvait reduire la sensibilite virale aux traitements, L'equipe de MJ Kozal a utilise une puce a ADN afin de realiser des analyses genotypiques de la sequence du LE TECHNOSCOPE OE BIOFUTUR 166 eAvril1997 11
ITECH NOSCOPEI gene de la protease sur 167 echantillons viraux provenant de patients ri'ayant jamais ete traites aux antiproteases, Le systerne employe est constitue d'une puce de verre de 1,28 ern- de surface portant 12 224 oligonucleotides differents : chaque oligonucleotide present est fixe par son extrcmite 3', a raison de 10 8
copies Iocalisecs sur des sites de 93 x 95 urn. II permet l'analyse d'un fragment de 382 paires de bases (18 nucleorides du gene gag, 297 du gene pr, 67 du gene rt) du genome du VIH-l. Chaque base du gene viral est determinee par hybridation a quatre ensembles d'oligonucleotides de taille 11, 14, 17 et 20. Chaque ensemble constitue une tetrade comme decrit ci-dessus. Le materiel a etudier (les sequences cibles) est obtenu a partir d' ADN viral amplifie. Les produits d'amplification sont soumis a une etape de transcription in vitro au cours de laquelle est realisee I'incorporation d'UTP marque a la fluoresceine, Les ARN ainsi marques sont fragmenres en sequences de 20 a 100 nucleotides puis hybrides sur la puce (dans un milieu de composition precise) pendant 30 minutes a 22°C. La surface de cette derniere est ensuite lue par un scanner (voir La lecture des puces a AnN. La mesure des signaux fluorescents) en deux eta pes, consecutivernent a deux lavages a faible puis haute stringences. Les resultars de cette analyse montrent que 47,5 % des acides arnines de la protease sont variables, chiffre superieur a l'estirnarion admise jusqu'a present (40 %). De plus, ces changements, qui concourent a l'acquisition d'une resistance, resulrent de polymorphismes naturels. Selon un protocole fonde sur un principe proche de celui precedernment decrir, l'equipe de JG Hacia (28) (Bethesda, Maryland) a etudie la possibilite de mettre en ceuvre une puce a ADN afin de detecter des mutations heterozygotes dans l'exon 11 du gene BRCAl (29), un fragment de 3,45 kb representant environ 60 % de la partie codante du gene. Le systeme est compose de 96 600 oligonucleotides permettant la detection des substitutions et insertions de base unique ainsi que des deletions longues d'un a cinq nucleotides. Chaque base du fragment est analysee sur les brins sens et antisens, de facon redondante, par un ensemble de 14 sondes, longues de 20 nucleotides, dont deux correspondent au type sauvage, trois a une substitution de base en position centrale, quatre a une insertion en position centrale, et cinq a une deletion en position centrale. Le systeme d'analyse des hybridations est fonde sur un marquage en deux couleurs a I'instar de celui utilise en hybridation genornique comparative (30). Dans Ie cas present, un ARN de reference (type sauvage) est marque en vert par la fluoresceine, Les ARN tests sont marques en rouge, par une association de phycoerythrine et streptavidine. Les deux types d'ARN sont hybrides simulranement sur la puce. L'analyse de l'empreinte d'hybridation permet de me surer pour chaque oligonucleotide les quantites relatives d' ARN de reference et d' ARN test hybrides et ainsi de determiner les differences de sequence entre les deux categories d'ARN. Sur les 15 echantillons testes, 14 mutations connues ont pu etre mises en evidence ainsi que 8 nouveaux polymorphismes.
ANALYSE DE L'EXPRESSION DESc:;ENES L'analyse de l'expression de genes se fonde sur l'utilisation de puces OU sont presentes des sondes choisies pour leur specificite a caracteriser un gene 12 LE TECHNOSCOPE DE BIOFUTUR 166 • Avril 1997
donne. Dans Ie cadre des travaux de recherche de DJ Lockhart (31) (Cambridge, Michigan), une matrice constituee de 65 000 sondes a permis l'analyse des niveaux d'expression de 118 genes differents (114 genes murins, 3 genes bacteriens et 1 gene de phage). A chaque gene correspondent environ 300 paires de sondes de 20 nucleotides, ce qui signifie que l'analyse est me nee de facon redondanteo La paire est composee d'une sonde correspondant parfaitement a un fragment du gene analyse, I'autre sonde etanr mutce en position centrale afin de servir de contr61e d'hybridation, Les sondes sont constituees a partir de 600 bases situees en position 3' terminale des transcripts des genes etudies. Les experiences sont conduites comme precedernment par hybridation sur la puce de fragments (longs de 50 a 100 bases) d'ARN marques, puis balayage de la surface hybridee et analyse informatique de l'ernpreinte d'hybridation. Resultats : la technique permet de detecter et de quantifier sans ambiguite des ARN presents a des taux de 11300 000 (une quanrite d'ARN de l'ordre d'une a trois copies par cellule). Les chercheurs de cette equipe travaillent actuellement sur un ensemble de quatre puces permettant I'analyse de 6 500 genes humains par des sondes de 25 nucleotides. Se referant aux dernieres avancees de la photolithoghraphie, ils estiment possible la constitution de puces de 1,6 em- portant 400 000 sondes, des systernes qui permettraient l'analyse de I'expression de 10 000 genes. Dans les deux cas, la reussirc des etudes rnenees tient a la parfaite adequation entre les puces constituees et Ie but de l'analyse. Ces puces analytiques ne sont pas des outils d'analyse universels, e1les ne lisent que ce qu'elles peuvent lire: des sequences connues dont on sait qu'elles sont potentiellement presentes dans les echantillons testes. Cette idee est d'ailleurs particuIierernent bien illustree par les travaux de Daniel D Shoemaker (32) (Stanford, Etats-Unis) qui utilise une puce portant 4 500 sondes de 20 nucleotides comme un lecteur a code-barres. Dans cette etude, des levures (Saccharomyces cerevisiae) sont deletees d'un gene (11 genes au total ont ete erudies) dont la phase ouverte de lecture est rernplacee par un marqueur de resistance a la kanamycine lie a une sequence specifique de 20 nucleotides ou sequence signature (tag sequence). Ces sequences signatures constituent Ie code-barres qui sera lu par la puce. Les levures rendues auxotrophes par la deletion sont cultivees en conditions cornperitives sur un milieu selectif. L'hybridation des sequences signatures arnplifiees a partir de I' ADN genomique des cellules developpees, permet de quantifier les proportions des diffcrcntes souches deletees, Cette strategic, ou etiquetage des genes, appliquee a un organisme dont on a sequence l'inregralite du genome demontre la capacite des puces a ADN a correler information genetique et fonction biologique.
LE SEqUENQAGiE Le sequencage par hybridation (SPH) a ete propose quasi simultanement a la fin des annees 80 par trois equipes de chercheurs russe, yougoslave et britannique. Alors que la methode enzymatique par les didesoxynucleotides ou methode de Sanger (33) peut etre consideree comme une epellation de la sequence, c'est-a-dire une lecture base par base, Ie SPH procede par lecture de petits blocs. Dans cette derniere
_T T_ _T
_Til
IIT_
_Til
IITIIT
FIG 6 - La sequence inconnue (AATGCGATCT) est reconstruite partir de 7 sondes (parmi les 4' testees) chevauchantes, qui lui sont parfaitement cornplernentaires.
a
approche, une sequence linea ire est en fait considerce comme un ensemble de so us-sequences chevauchantes (34) (voir figure 6) dont la determination simultanee et Ie reassemblage, au moyen d'un programme informatique specifique, permet la " reconstruction » de la sequence etudiee. La reaction d'hybridation peut etre realisee selon deux approches differentes, soit par la fixation de la sequence cible sur une membrane sur laquelle seront realisees les hybridations d'oligonucleotides marques, soit en inversant ce schema : fixation des oligonucleotides et hybridation de I'ADN marque a analyser (35). Cette deuxieme methode est beaucoup plus appropriee lorsqu'un rres grand nombre d'oligonucleotides doit etre mis en ceuvre, par exemple dans le cas du sequencage d'un fragment sur lequel on ne possede que tres peu d'informations. Cependant, la synthese d'un grand nombre d'oligonucleotides reste une operation longue et couteuse. De ce fait, les puces a ADN apparaissent particulierement adaptees a l'elaboration de systemes de sbh. En effet, la possibilite d'adresser en parallele des milliers d'oligonucleotides sur des supports, en un nombre limite d'etapes, consritue une technologie particulierernent perforrnante de la synrhese en masse des sondes. Son industrialisation, accompagnec de la mise en place d'un contr61e de la qualite strict des oligonucleotides, pourrait abourir a la production en routine de « puces a sequencage ". De nombreux auteurs (34, 36) voient d'ailleurs dans Ie sequencage par puces une alternative prometteuse a la methode classique de sequencage, en termes d'auromatisation, de reduction des cours et des durces d'execution. Cependant, plusieurs problemes techniques restent encore a resoudre, Le sequencage par hybridation ne peut pas s'appliquer aux sequences presentant un nombre de repetitions de taille superieure a n-1 (n etanr la longueur en bases des sondes oligonucleotidiques), egal ou superieur a trois. Cette limitation rend problematique l'application de la technique aux sequences
d'ADN naturelles, dont la frequence de repetitions peut etre importante. Plusieurs solutions peuvent toutefois etre envisagees. L'allongement des sondes, directement correle a une plus grande complexite (37) de la puce, en est une. La revelation par double hybridation en est une autre. II s'agit de l'ajout, apres la premiere hybridation sonde/cible (non marquee), d'une seconde sonde qui, reagissant avec les hybrides formes a la premiere etape, accroit la taille et la stabilite de ceux-ci (voir figure 5b). De meme, disposer d'informations complementaires sur la nature du fragment a sequencer - entre autres, sa longueur approximative et les sequences de ces extremites -, permet d'augmenter la capacite du sbh a traiter de grandes sequences. En fait, si l'utilisation des puces pour Ie sequencage de fragments inconnus, Ie sequencage de novo, n'a pas apporte de resultats probants, Ie resequencage - la verification des sequences deja connues - pourrait grandement en profiter. Les travaux de Mark Chee et de ses collegues (26) sont representatifs d'une utilisation des puces a la croisee du sequencage et de l'analyse de mutations. Les auteurs ont elabore une puce specifique du genome mitochondrial humain contenant environ 136 000 sondes de 25 nucleotides. Une lecture realisee en environ 10 minutes et I'analyse informatique qui la suit permettent le sequencage integral du genome avec une precision de 98 %. Le systeme employe a ainsi permis l'identification, sans ambiguite, de 505 polymorphismes par hybridation des genornes de dix individus d'origine africaine. Dans Ie cadre de telles applications, cette technique pourrait, d'apres ses auteurs, permettre Ie sequencage de 50 genornes dans Ie temps requis pour en sequencer deux par la methode classique.
CONCLUSION Les resultats de ces differents travaux positionnent les puces a ADN com me une technique d'avenir et laissent entrevoir un vaste champ d'applicarions, notamment dans Ie domaine de la sante. La societe leader dans Ie domaine, Affymetrix, a d'ailleurs la ferme volonte d'etablir son systerne GeneChipH l comme une plate-forme d'acquisition et de traiternent de l'information genetique pour en faire un outil permettant Ie developpernent de nouvelles approches analytiques, rant dans Ie domaine de la recherche pharmaceutique que dans celui du diagnostic. D'importantes entreprises de ces differents secteurs sont deja impliquees dans des accords de partenariat avec Affymetrix ou d'autres societes. Incyte Pharmaceuticals et Merck & Co testent la capacite du materiel Affymetrix a analyser l'expression de certains genes impliques dans differentes pathologies. biolvlerieux s'est engagee, via sa filiale arnericaine biolvlerieux Vitek, dans un accord de collaboration devant etre finalise par Ie developpement de nouveaux sysrernes diagnostiques. Ceux-ci, fondes sur l'utilisation de sondes specifiques des ARN ribosomaux bacteriens, pourraient s'averer particulierement uriles a l'identification de souches bacteriennes dans les secteurs hospitalier (determination rapide des germes resistants aux antibiotiques) et agroalimentaire. La cyrogenetique (30) n'est pas en reste et pourrait prochainement s'enrichir de nouveaux outils d'analyse. En effet, la societe OncorMed (Gaitherburg, Maryland) a, elle aussi, engage un accord de collaboration avec Affymetrix afin de developper et de tester LE TECHNOSCOPE DE BIOFUTUR 166 -Avril 1997 13
ITECHNOSCOPEI Sites recommandes pour en savoir plus sur les puces it AON Affymetrix : http://www.affymetrix.coml bioMerieux Vitek: http://www.biomerieux-vitek.com/ CEAlLeti: http://www-dta.cea.fr/ Glaxo Wellcome : http://www.glaxowellcome.co.ukl Hyseq (et Ie sequen9898 par hybridatlon) = http://www.orml.gov/hgmis!publicaV94santalsequencinglcrkvenjakov.html Incyte: http://www.incyte.com/ MIT: http://rleweb.mit.edulP-holl.htm Nanogen: http://mcdermott.swmed.edulmcd-center/garnerlab/projects! OncorMed : http://www.oncormed.coml
Stanford University : http://cmgm.stanford.edulpbrown Synteni: http://www.synteni.com/ Vysis: http://www.vysis.com/
une puce permettant I'analyse des mutations du gene p53 implique dans plus de 50 % des cancers. De son
cote, la societe Vysis (Napperville, Illinois) travaille a l'elaboration d'un outil de diagnostic miniaturise base sur l'hybridation genomique comparative (CGH) (30). Cette puce, intitulee Genosensor CGH d'environ 6 em" sera constituee de 625 sondes representatives du genome humain et permettra la determination de plusieurs centaines d'aberrations genetiques. Si l'attention des medias est aujourd'hui focalisee sur la societe Affymetrix, sa technologie Genef.hipP'n'est cependant pas encore exempte de tout probleme. D'une part, la constitution des puces doit encore etre amelioree, les sondes synthetisees par les methodes photochimiques contenant des impuretes qui reduisent l'efficacite de l'etape d'analyse d'hybridations (24). D'autre part, Genef.hip?' met en ceuvre un materiel de detection et de traitement des donnees qui, bien que deja disponible dans une version integree a un prix comparable a celui d'un sequenceur d'ADN automatique (120 000 dollars) (38), est encore relativement lourd. De plus, la sensibilite du systeme rend encore necessaire une etape d'amplification des echantillons que l'on doit supprimer afin de constituer des systernes totalement integres. En fait, si Ie developpement de la technologie Gene Chip'?' peut deboucher sur des applications ambitieuses - l'abaissement de la taille des sites de synthese des sondes a un micrometre, permettrait la constitution de puces de 2 em' capables d'analyser simultanernent 100 000 genes -Ies projets rnenes par d'autres societes ou organismes ne doivent pas etre negliges. Ainsi les recherches portant sur de nouvelles 14 LE TECHNOSCOPE DE BIOFUTUR 166 • Avril 1997
methodes de detection des hybridations par mesure electronique pourraient faire effectuer aux puces a ADN un bond prodigieux. 11 serait alors possible d'envisager la realisation de nouveaux systemes d'analyse de taille reduite pour des analyses complexes sur Ie terrain. (1) J Hodgson (1995) Bio/technology 13, 231-233. (2) Un seul mesapparlement peut entrainer une diminution de 10 ·C de latemperature defusion d'un hybride. A Chetverin etal (1994)
BiolTechnology 12.1093·1099. (3) U Maskos etal (1992) Nucleic Acids Res 20 (7),1675-1678. (4) P Merel (1995) Biofutur 142,46-47. (5) Le Dot-blot estune technique d'hybrldation entre un acide nuclelque fixe sur unfiltreet une sonde libre. Le Dot-blat inverse estevidemment tonde surIeschema inverse, I'acide nucleique est" Iibre » et lasonde fixee. (6) R S Matson etal (1994) Analytical Biochemistry 217.306-310. (7) T Huynh-Dinh (1993) Synthese etutilisation des oligonucleotides. Technique et Documentation, Lavoisier, Paris. (8) EL Sheldon (1993) Clin Chern 39 (4), 718-719. (9) P Merel (1994) De la PCR aux puces aADN. Biofutur139, 58. (10) GYershov eta/ (1996) Proc Nat! Acad SciUSA 93,4913-4918. (11) T Livache etal (1994) Nucleic Acids Res 22 (15), 2915-2921. (12) E Souteyrand etal (1995) Lettre des sciences chimiques 54, 9-11. (13) Unserni-conducteur estdope parI'introduction dans sastructure cristalline d'atomes dontlavalence estdifferente decelie du silicium (valence du silicium = 4). Si l'element introduit estdevalence interieure (parexemple Iebore dontlavalence estegaIe a3), c'est-a-dire s'il possede moins d'electrons Iibres que Iesilicium, Iesemi-conducteur est dope p. En revanche, lorsque I'element estdevalence superieure (par exemple Iephosphore devalence 5) Iesilicium estdope n. (14) K Beattie etal (1993) Clin Chern 39 (4), 719-721. (15) SPA Fodor etal (1991) Science 251, 767-771. (16) JWJacobs etal (1994) Trends Biotechnol12, 19-26. (17) Nature Genet (1996) 14 (4), 367-370. (18) EM Southern etal (1994) Nucleic Acids Res 22 (8), 1368-1373. (19) J Weiler etal (1996) Anal Biochem 243,218-227. (20) MJ O'Donell-Maloney (1996) Trends Biotechnol14, 401-407. (21) J Derisi etal (1996) Nature Genet 14,457-460. (22) S Borman (1996) Chern Eng News 74 (50),42-43. (23) RJ Lipshutz etal (1995) Biotechniques 19 (3), 442-447. (24) A Goffeau (1997) Nature 385, 202-203 (25) AD Mirzabekov (1994) Trends Biotechno/12, 27-32. (26) M Chee etal (1996) Science 274,610-613. (27) MJKozal etal(1996) Nature Med2. 7, 753-758. (28) JG Hacia etal (1996) Nature Genet 14, 441-447. (29) Les individus caractenses pardes mutations heterozygotes du gene BRCA 1 (gene du cancer hereditaire du sein et deI'ovaire) presententune predisposition marquee audeveloppernent du cancer du sein et deI'ovaire. (30) Cytogenetique etfluorescence (1997) Biofutur 165 Letechnoscope 90. (31) DJLockhart eta/ (1996) Nature Biotechno/14, 1675-1680. (32) DD Shoemaker etal (1996) Nature Genet 14,450-456. (33) Les outils du sequencage (1996) Biofutur 158, Letechnoscope 85. (34) AB Chetverin etal (1994) Bio/Techno/12, 1093-1099. (35) EM Southern etal (1992) Genomics 13,1008-1017. (36) R Drmanac etal (1993) Science 260, 1649-1652. (37) Une augmentation d'une unite dela longueur des sondes s'accornpagne du quadruplement du nombre desondes. (38) Leprixd'une puce Affymetrix estd'environ 50 dollars (285 francs).
L'auteur remercie madame Eliane Souteyrand et messieurs PMerel etT Livache pourI'aide qu'ils ontapportee laconstitution dece Technoscope.
a