Informations

G6. Proteomics Problem Set 1 - Biologie

G6. Proteomics Problem Set 1 - Biologie



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Vous étudierez une protéine de transduction du signal et ses domaines d'interaction à l'aide de divers programmes de protéomique basés sur le Web. Pour la plupart de ces programmes, vous devrez saisir la séquence d'acides aminés au format FASTA. Vous pouvez également utiliser ces programmes pour étudier n'importe quelle protéine de la PDB.

Obtenir la séquence FASTA
1. Allez d'abord dans l'APB. Saisissez le nom de votre protéine (qui a un domaine d'interaction) dans le champ de recherche. Limiter la recherche à homo sapiens. Choisissez dans la liste des fichiers de structure de protéines le plus approprié. L'exemple ci-dessous concerne le code pdb 2YYN.

2. Sélectionnez la liste déroulante Télécharger les fichiers et enregistrez la séquence FASTA dans votre répertoire personnel. Téléchargez le fichier au format Wordpad. Vous devrez peut-être supprimer des sections récurrentes qui ne correspondent pas à la séquence d'acides aminés à une seule lettre ou à des séquences identiques si la structure se compose de sous-unités identiques. Pour voir si cela pourrait être le cas, sélectionnez JSmol (voir la figure ci-dessus), faites pivoter la structure avec votre souris pour voir s'il y a plusieurs chaînes, et passez la souris sur les chaînes pour voir comment les acides aminés de cette chaîne sont étiquetés. Vous pouvez voir [TRP]33A : par exemple, où A indique une chaîne A distincte. Passer à d'autres chaînes. Passez ensuite à la version Wordpad des séquences FASTA. Vous pouvez examiner les chaînes pour voir si les chaînes sont identiques. Si c'est le cas, supprimez tout sauf le premier. Voir le lien FASTA ci-dessus pour obtenir de l'aide.

I. Prédiction des propriétés des protéines à partir des données de séquence
Utilisez les programmes suivants pour obtenir des informations sur votre protéine. Snip (avec l'outil de capture par exemple) et collez un peu d'informations pertinentes de chaque programme (à l'aide de l'outil de capture) dans ce fichier DOCX et enregistrez-le dans le dossier et téléchargez-le dans Sharepoint. Nommez le fichier Lastname_LastName_FirstInitial_WebInteraction. Si vous rencontrez un problème avec l'un des programmes (beaucoup de messages d'erreur), ignorez ce programme particulier. Plusieurs d'entre eux font le même type d'analyses. Comparez le résultat. Coupez et collez suffisamment de contenu pour montrer que vous avez répondu à la question. Écrivez les réponses lorsqu'on vous demande d'interpréter la sortie.

une. Suite de manipulation de séquence : Déterminez le poids moléculaire de la protéine.

b. Motif linéaire eucaryote: Les motifs linéaires sont une section courte et intrinsèquement désordonnée de protéines régulatrices et fournissent des interfaces d'interaction de faible affinité. Ces modules compacts jouent un rôle central dans la médiation de chaque aspect de la fonctionnalité régulatrice de la cellule. Ils sont particulièrement importants dans la médiation de la signalisation cellulaire, le contrôle du renouvellement des protéines et la direction de la localisation des protéines. Le motif linéaire eucaryote (ELM) fournit à la communauté biologique une base de données complète de motifs connus validés expérimentalement et un outil d'exploration pour découvrir des motifs linéaires putatifs dans des séquences de protéines soumises par l'utilisateur. Coupez et collez le haut de la sortie qui montre l'IUPRED montrant le graphique de désordre/ordre.

c. TargetP 1.1 : prédit la localisation subcellulaire de la protéine eucaryote. Coupez et collez les résultats. Interprétez-les à partir de ce lien. Où se trouve probablement votre protéine ?

ré. NET-NES 1.1 Server :: prédit les signaux d'exportation nucléaire riches en leucine (NES) dans la protéine eucaryote Ce lien vous aidera à expliquer le résultat. Est-ce que le vôtre?

e. NLSdb -- Base de données des signaux de localisation nucléaire : Recherche d'informations sur les signaux de localisation nucléaire (NLS) et les protéines nucléaires. Sélectionnez Requête. Saisissez le code PDB et sélectionnez NL. Est-ce que le vôtre?

F. Serveur NetPhos 2.0 : produit des prédictions de réseau neuronal pour les sites de phosphorylation de la sérine, de la thréonine et de la tyrosine dans les protéines eucaryotes. (autres programmes de prédiction sympas de ce site)

g. TMPRED : Le programme TMpred fait une prédiction des régions transmembranaires et de leur orientation. L'algorithme est basé sur l'analyse statistique de TMbase, une base de données de protéines transmembranaires naturelles. La prédiction est faite en utilisant une combinaison de plusieurs matrices de poids pour la notation. Collez votre séquence FASTA mais supprimez l'en-tête avant de lancer. A-t-il une hélice transmembranaire ?

h. TopPred 1.1 – Prédicteur de topologie des protéines membranaires à l'Institut Pasteur. Vous devrez saisir votre adresse e-mail. Collez l'intégralité du fichier FASTA. A-t-il des hélices transmembranaires ? (Fait partie de Mobyle)

Enregistrez le premier graphique (fichier graphique PNG) de la sortie, ouvrez-le avec Adobe Photoshop et collez l'image dans votre rapport. Le graphique montre-t-il une alternance de sections hydrophobes (+ valeurs)/hydrophiles (valeurs -) cohérentes avec des hélices transmembranaires (par exemple, vous vous attendriez à voir 7 tronçons hydrophobes pour GPCR) ?

je. PFAM – analyses multiples de Protein FAMilies. Ce programme examine l'organisation des domaines d'une séquence protéique. Saisissez le code pdb. Une fois terminé, sélectionnez « séquences » dans la liste ci-dessous.


Sélectionnez ensuite la séquence humaine. Snip le diagramme résultant et la légende montrant la structure du domaine de la protéine. Vous pouvez également cliquer sur chaque domaine dans le diagramme pour obtenir plus d'informations sur le domaine. La protéine a-t-elle le domaine suggéré dans le tableau de début ?

j. Prosite : saisissez votre séquence FASTA en mode Quick Scan. Sélectionnez Exclure les motifs à forte probabilité d'occurrence de l'analyse. Coupez et collez la structure du domaine Hits by Proifle. Parfois, vous aurez peut-être besoin d'un numéro de code différent, l'UniProtKB : numéro d'accession. Obtenez ceci à partir de la page Web PDB comme indiqué ci-dessous :

k. eFindSite : est un algorithme de prédiction de site de liaison de ligand et de criblage virtuel qui détecte les sites de liaison de ligand communs. Insérez le code PDB puis le fichier pdb que vous avez téléchargé.

l. eFindSitePPI : détecte les sites de liaison aux protéines et les résidus à l'aide du méta-threading. Il prédit également la géométrie interfaciale et les interactions spécifiques stabilisant les complexes protéine-protéine, tels que les liaisons hydrogène, les ponts salins, les interactions aromatiques et hydrophobes

m. NCBI Standard Protein BLAST : saisissez le fichier FASTA. La sortie montre le domaine et la superfamille des domaines suivis d'autres séquences de protéines presque identiques à votre protéine. Les résultats sont graphiques suivis d'un descriptif. Structure du domaine Snip avec les séquences alignées les plus proches. Sélectionnez ensuite sous Structures PDB le code pdb (exemple ci-dessous 1xww).
Vous verrez une fenêtre similaire à ci-dessous. Sélectionnez sous le domaine 1xwwwA00 (à titre d'exemple). :

Sélectionnez ensuite le numéro d'accession UniProtKB. Confirmez les nombreuses prédictions que vous avez faites ci-dessus.

n.m. Predict Protein Open : Propriétés physicochimiques de votre protéine. Vous devrez fournir votre adresse e-mail. Une fois terminé, vous pouvez accéder à une grande partie de ce que vous avez appris ci-dessus grâce aux liens situés à gauche sous le tableau de bord.

II. Visualiser les interactions protéiques

Il est important de pouvoir visualiser les interactions de liaison entre le domaine ciblé et le ligand (petite molécule, protéine modifiée PTM, protéine ou ADN). Voici quelques programmes qui le permettent. Remarque : le programme que vous sélectionnez dépendra du fait que votre protéine est liée à un petit ligand ou à une autre protéine ou à une autre macromolécule, auquel cas vous devez explorer les interfaces d'interaction des protéines.

LIGAND : INTERACTIONS PROTÉINES

Tâche : Vous étudierez l'interaction de la protéine kinase C (PKC) avec le ligand phorbal ester, qui est un imitateur du 2ème messager diacylglycéride avec deux programmes : Ligand Explorer et Protein-Ligand Interaction Profilers

une. Ligand Explorer est un programme basé sur Java. Cela ne fonctionnera probablement PAS sur un Mac exécutant Safari. Vous aurez besoin de la dernière version de Java pour l'exécuter. Essayez également les différents laboratoires informatiques du campus. Allez à la page PDB pour votre protéine. Après avoir entré le code pdb, faites défiler jusqu'à la section Petites molécules au milieu de la page affichée pour ce complexe. Il existe des liens pour la visualisation 2D et 3D des interactions. .

Sélectionnez le tracé 2D montrant les interactions. La sélection Jsmol pour voir le ligand avec une surface de liaison) interagir avec les résidus de contact dans la protéine. Vous pouvez sélectionner un fond blanc et activer et désactiver les liaisons H. COUPER et COLLER.

Sélectionnez maintenant Ligand Explorer pour une vue plus détaillée. Assurez-vous de sélectionner le bon ligand (voir tableau ci-dessous). Vous pouvez être invité à autoriser les fenêtres contextuelles du site. Si oui, permettez-le. Vous devrez peut-être resélectionner Ligand Explorer à nouveau pour démarrer le programme. Continuez à donner des autorisations et à suivre les invites jusqu'à ce que Ligand Explorer soit ouvert. Une fois lancé, sélectionnez ouvrir ce lien dans un nouvel onglet ou une nouvelle fenêtre et les instructions s'ouvriront dans un navigateur. Utilisez la souris pour aider à trouver la meilleure vue des interactions.
Sélectionnez tour à tour la liaison hydrogène, hydrophobe, la liaison H pontée (médiée par une molécule d'eau) et l'interaction métallique (affichée sur le côté gauche. Sélectionnez Étiqueter les interactions par distance. Prenez une capture d'écran recadrée de chaque interaction (voir les instructions ci-dessous).
Pour le rendu final, déplacez la bascule sur les surfaces sélectionnées vers opaque. Modifiez ensuite la distance de la meilleure façon pour montrer la cavité dans laquelle le ligand se lie. Couleur par hydrophobie qui donne deux couleurs représentant les parties non polaires et polaires de la cavité. Sélectionner des surfaces solides

b. Profileurs d'interaction protéine-ligand : saisissez le nom de votre fichier PDB. Une fois l'analyse terminée, sélectionnez SMALL MOLECULE puis le ligand approprié. Vous obtiendrez une représentation 2D que vous pouvez couper et coller. Sélectionnez ensuite Pymol 3D view (les 5 premiers ordinateurs de l'ASC 135). Vous verrez un rendu interactif d'un petit ligand lié et des résidus protéiques avec lesquels il entre en contact dans le complexe. Vous pouvez obtenir un téléchargement étudiant gratuit de Pymol pour votre propre ordinateur. Capturez et collez les informations pertinentes.

PROTÉINES : INTERACTIONS DE SURFACE DE MACROMOLECULE

Vous étudierez les interactions protéine:protéine entre un domaine Src et un petit peptide phospho-Tyr en utilisant InterProSurf et COCOMAPS.

une. InterProSurf : indique le nombre d'atomes de surface et enfouis pour chaque chaîne et les zones pour chaque résidu considéré comme étant dans l'interface. Sélectionnez PDB Complex dans les onglets du menu supérieur et saisissez votre fichier pdb. Cela ne donne que des données numériques. Capturez et collez les informations pertinentes.

b. COCOMAPS : analyse et visualise les interfaces dans les complexes biologiques (tels que les complexes protéine-protéine, protéine-ADN et protéine-ARN). Saisissez le nom du fichier PDB, puis les chaînes du fichier PDB dont vous souhaitez voir la surface d'interaction. Insérez la lettre de l'une des chaînes d'interaction que vous avez sélectionnées dans la première zone de saisie et la deuxième lettre dans la deuxième zone. Les résultats détaillés apparaîtront sous forme graphique et tabulaire.

Un excellent moyen de visualiser l'interface de liaison est de télécharger les nouveaux fichiers .pdb et .pml et d'ouvrir le fichier pdb dans Pymol . Une fois le fichier PDB ouvert dans Pymol, sélectionnez file -> run -> script_name.pml. Capturez et collez les informations pertinentes.

Tableau : Protéines de signalisation pour l'analyse

Domaines dans les molécules de signalisation

Domaine

Cible de liaison

Processus cellulaire

Exemple de protéine

fichier pdb

Bromo

Acétyl-Lys

Chromatine reg.

BRD4

2YYN

C1

diacylglycérol

Recrutement de membres plasma

Raf-1

3OMV

C2

Phospholipide (Ca dépendant)

Ciblage membranaire, trafic de vésicules

PRKCA

3IW4

CARTE

Interactines homotypiques

apoptose

CRADD

3CRD

Chromo

Méthyl-Lys

Chromo reg, gène txn

CBX1

3F2U

Décès (JJ)

Inter homotypique.

Apoptose

Fas

3EZQ

DED

Inter homotypique.

Apoptose

Caspase 8

1F9E

DEP

Membre, GPCR

Sig trans, trafic de prot

Dsh

humain échevelé 2

2REY

SAISIR

Arf/Art G prot

Trafic de Golgi

Golgin-97 (Golga5)

1R4A

PDZ

Motifs peptidiques à terme C

Divers, échafaudage

PSD-95

Ou disques gros homologue 4

1L6O

PH

Phospholipides

Membrane recuire

Akt

1O6L

3CQW

PTB

Phosphore-Y

Signalisation de la kinase Y

Chc 1

Protéine transformant SHC 1

1UEF

1irs

L'Europe 

RGS

Pochette de fixation GTP de Galpha

Sig trans

RGS4

1EZT

SH2

phosphoY

signalisation pY

Src

4U5W

SH3

Séquence pro-riche

Divers, cytosquelette

Src

2PTK

TIR

Homo/Hétérotypique

Cytokine et immunitaire

TLR4

3VQ2

TRAF

Signalisation TNF

Survie cellulaire

TRAF-1

3ZJB

VHL

hydroxyPro

ubiquitinylation

VHL

1VCB

Interactions protéine-ligand et protéine-protéine

Protéine (PKC) :Ligand (imitateur d'ester phorbal du 2e diacylglycéride messager avec Ligand Explorer et
Profileurs d'interaction protéine-ligand

1PTR

Protéine (Fragment de chaîne E-Src) : Protéine (Chaîne I – phospho-peptide) avec COCOMAPS

1QG1

H-Ras-GppNHp lié au domaine de liaison Ras (RBD) de Raf Kinase

Liaison GppNHp avec Ligand Explorer et les profileurs d'interaction protéine-ligand

Protéine (Ras, chaîne A) : Interactions des protéines (RBD-Raf, chaîne B) avec COCOMAPS

4G0N


Schémas de compression numérique pour les données de spectrométrie de masse protéomique

Le format XML ouvert mzML, utilisé pour la représentation des données MS, est essentiel pour le développement de logiciels d'analyse MS indépendants de la plate-forme. Bien que la conversion des formats fournisseurs en mzML doive avoir lieu sur une plate-forme sur laquelle les bibliothèques fournisseurs sont disponibles (c'est-à-dire Windows), une fois les fichiers mzML générés, ils peuvent être utilisés sur n'importe quelle plate-forme. Cependant, le format mzML s'est avéré moins efficace que les formats des fournisseurs. Dans de nombreux cas, la représentation mzML naïve est quatre fois ou même jusqu'à 18 fois plus grande que le fichier du fournisseur d'origine. Dans les configurations d'E/S de disque limitées, un fichier de données plus volumineux entraîne également des temps de traitement plus longs, ce qui est un problème compte tenu des taux de production de données des spectromètres de masse modernes. Pour tenter de réduire ce problème, nous présentons ici une famille d'algorithmes de compression numérique appelés MS-Numpress, destinés à une compression efficace des données MS. Pour faciliter l'adoption, les algorithmes ciblent les données binaires dans la norme mzML et la prise en charge des principaux outils de protéomique est déjà disponible. À l'aide d'un ensemble de tests de 10 fichiers de données MS représentatifs, nous démontrons des diminutions typiques de la taille des fichiers de 90 % lorsqu'elles sont combinées à une compression traditionnelle, ainsi que des diminutions du temps de lecture allant jusqu'à 50 %. Il est prévu que ces améliorations seront bénéfiques pour le traitement des données au sein de la communauté MS.

© 2014 par la Société américaine de biochimie et de biologie moléculaire, Inc.


Protéomique : Recherche sur les hautes protéines

L'effort de catalogage des protéines va plus loin dans le but de faire en sorte que la recherche génétique offre des avantages pratiques.

Lorsque Michael Snyder a utilisé les outils de « -omique » sur lui-même, il a eu des surprises. En séquençant son génome, par exemple, il a découvert qu'il avait une prédisposition génétique au diabète de type 2, même s'il n'avait aucun des facteurs de risque standard, tels que l'obésité ou les antécédents familiaux de la maladie. Au cours des 14 mois suivants, Snyder, un généticien moléculaire à l'Université de Stanford en Californie, s'est testé à plusieurs reprises pour surveiller son activité d'ARN et sa production de protéines 1 .

Lorsqu'il a contracté un virus respiratoire à mi-chemin de l'étude, il a observé l'évolution de l'expression de ses protéines et l'activation des voies biologiques. Ensuite, on lui a diagnostiqué un diabète – il lui semblait que l'infection avait déclenché la maladie. Il a également vu ses protéines changer pendant un épisode de la maladie de Lyme.

"Je n'avais aucune idée que je deviendrais intéressant", explique Snyder, dont le corps a produit jusqu'à présent un demi-pétaoctet (500 000 gigaoctets) de données. "C'était juste une preuve de principe."

Il a depuis étendu son étude à 100 personnes, collectant des mesures du protéome et de 13 autres « -omes », y compris le protéome et le transcriptome des micro-organismes qui habitent leur corps. Il espère que lui et d'autres pourront collecter ces profils approfondis auprès d'un million de patients et appliquer les outils des mégadonnées pour identifier les différences qui prédisent la maladie et fournir une compréhension plus fine de diverses conditions. Il espère également qu'ils pourront décomposer les conditions en sous-types par leurs profils protéomiques. "Il existe probablement 100 types différents de diabète", dit Snyder.

L'expérience de Snyder montre la puissance de l'utilisation de « -omiques » pour améliorer notre compréhension de la biologie, explique William Hancock, chimiste des protéines à la Northeastern University de Boston, dans le Massachusetts.

Les gènes fournissent le manuel d'instructions pour les processus biologiques, mais ce sont les protéines qu'ils créent qui transforment ces instructions en réalité. D'énormes efforts internationaux sont en cours pour identifier les protéines, cartographier leur emplacement dans les tissus et les cellules, compter combien sont produites dans des circonstances particulières et décrire les différentes formes qu'elles peuvent prendre. Et les océans de données de ces recherches découvriront des biomarqueurs de maladies et fourniront des cibles pour les médicaments pour traiter diverses affections. En combinant la protéomique avec la génomique, la transcriptomique, la métabolomique et d'autres « -omiques », les scientifiques peuvent approfondir leur compréhension de la biologie au niveau moléculaire.

La protéomique apporte l'information génétique à un niveau pratique, déclare Gilbert Omenn, bioinformaticien à l'Université du Michigan à Ann Arbor et président du Global Human Proteome Project (HPP). L'idée du projet est de créer une "liste complète des parties" du corps humain, dit-il, "pour combler les nombreux blancs entre savoir qu'un gène a quelque chose à voir avec un processus pathologique et savoir comment il fonctionne vraiment". .

C'est toute une liste de pièces. Le corps humain contient environ 20 000 gènes capables de produire des protéines. Chaque gène peut produire de multiples formes d'une protéine, et celles-ci peuvent à leur tour être décorées avec plusieurs modifications post-traductionnelles : elles peuvent avoir des groupes phosphate ou méthyle attachés, ou être liées à des lipides ou des glucides, qui affectent toutes leur fonction. "Le nombre de molécules potentielles que vous pouvez fabriquer à partir d'un gène est énorme", déclare Bernhard Küster, qui étudie la protéomique à l'Université technique de Munich en Allemagne. « C'est très difficile à estimer, mais je ne serais pas surpris d'avoir dans un même type de cellule 100 000 protéines différentes ou plus. »

La recherche en protéomique est une entreprise internationale. La Human Proteome Organization a créé deux projets HPP complémentaires, qui utilisent tous deux la spectrométrie de masse. L'un, le HPP basé sur les chromosomes, a divisé les 24 chromosomes entre 19 pays. Le Japon, par exemple, s'attaque au chromosome 3 et au chromosome X, et l'Iran étudie le Y. Le second, le HPP Biologie/Maladie, recherche des protéines dans des tissus et organes spécifiques, en se concentrant sur celles qui sont pertinentes pour les maladies. comme le diabète et le cancer du côlon. Un projet mondial distinct, l'Atlas des protéines humaines, s'appuie sur des anticorps avec des molécules fluorescentes ou d'autres étiquettes attachées qui se lient à des protéines spécifiques pour les identifier.

Il y a aussi des efforts nationaux importants. La Chine investit massivement dans la recherche en protéomique, par exemple un nouveau laboratoire national appelé PHOENIX, qui devait ouvrir ses portes en octobre avec un financement annuel de 10 millions de dollars.

Quelle que soit l'approche technique, cartographier le protéome humain n'est pas une tâche facile.Le génome est simple en comparaison - il est assemblé avec seulement quatre acides nucléiques et change peu au cours de la vie d'une personne, sauf dans le cas particulier du cancer. Les protéines, quant à elles, varient dans le temps, changeant pendant l'exercice, la maladie et les cycles menstruels, par exemple. Une autre complication est que la protéine la plus abondante peut être environ 10 milliards de fois plus courante que la moindre. "Vous avez un génome et vous avez un milliard de protéomes, selon la situation environnementale", explique Hancock, coprésident du HPP basé sur les chromosomes.

« Il n'existe pas de protéome humain chez une personne, et encore moins chez de nombreuses personnes », déclare Küster. L'année dernière, son groupe a publié un projet de carte 2 d'un protéome humain basé sur 16 857 mesures de spectrométrie de masse de tissus humains, de lignées cellulaires et de fluides corporels. Ils ont également créé une base de données, ProteomicsDB, pour fournir une analyse des données.

Il est difficile de savoir comment gérer le volume de données protéomiques. L'Atlas des protéines humaines, par exemple, recueille des images de tissus avec des anticorps marqués. Chaque image occupe des dizaines de mégaoctets et des fichiers jpeg compressés d'environ 10 mégaoctets sont disponibles pour une distribution en ligne.

Pendant ce temps, l'Institut européen de bioinformatique (EBI) à Hinxton, au Royaume-Uni, crée ELIXIR, une infrastructure informatique distribuée conçue pour partager des données de protéomique et d'autres données biologiques entre les instituts de recherche en Europe. « ELIXIR ne veut pas créer une énorme base de données - ils veulent relier différents groupes et différents pays », explique Mathias Uhlén, microbiologiste à l'Institut royal de technologie KTH de Stockholm, en Suède. L'EBI est déjà le référentiel de la base de données des identifications de protéines (PRIDE), qui collecte les données de spectrométrie de masse générées par plusieurs groupes de recherche.

Mais les scientifiques sont souvent en désaccord sur l'opportunité de conserver les données brutes ou de les jeter. "Les méthodes d'identification des protéines à partir de données brutes s'améliorent constamment, il est donc logique de conserver les données brutes si vous le pouvez, mais cela prend beaucoup de place", explique Conrad Bessant, bioinformaticien à l'Université Queen Mary de Londres. L'argument de l'autre côté, dit-il, est que « le domaine avance si rapidement que pourquoi regarderiez-vous un ensemble de données vieux de cinq ans ? Vous pourriez aussi bien relancer l'analyse, car les instruments sont tellement meilleurs.

Cependant, les données sur le protéome sont loin d'être parfaites. Dans la question de La nature En mai dernier, dans lequel le groupe de Küster rapportait ses résultats, un autre groupe de scientifiques des États-Unis et de l'Inde a publié un projet de carte 3 qui couvrirait environ 84 % des gènes codant pour les protéines dans le génome humain. Les deux cartes étaient basées sur la spectrométrie de masse : une enzyme digère les protéines et produit des séquences peptidiques d'environ 7 à 30 acides aminés, et la masse de ces peptides est utilisée pour déduire la composition de la protéine. Et les deux projets ont fini par réduire le nombre de protéines qu'ils prétendaient avoir trouvées, après que d'autres scientifiques eurent remis en question certaines de leurs interprétations 4 . La spectrométrie de masse est une méthode probabiliste, dit Omenn, et il n'y a aucun moyen d'exclure la possibilité que deux protéines différentes aient produit la même séquence peptidique.

La détection basée sur les anticorps de l'Atlas des protéines humaines, en revanche, n'est pas probabiliste, car elle marque des protéines individuelles. L'avantage de cette approche, soutient Uhlén, l'un des créateurs de l'Atlas, est qu'elle montre précisément dans quels organes, tissus et même cellules se trouvent les protéines. "Ce que nous fournissons, c'est une carte de l'emplacement des protéines", explique Uhlén. "Cela vous donne des indices sur la fonction des protéines."

Ces dernières années ont vu une poussée pour développer des puces microfluidiques sur lesquelles effectuer une protéomique unicellulaire à base d'anticorps. Cette approche est particulièrement importante lorsque les cellules d'intérêt sont rares, comme dans le cas des cellules tumorales circulantes. Il permet également aux chercheurs d'étudier les différences entre les populations d'un même type cellulaire. Par exemple, si une cellule tumorale fait beaucoup plus de copies d'une protéine particulière que sa voisine, ou si les protéines d'une cellule ont un groupe méthyle attaché alors que celles d'une autre cellule ne le font pas, cela pourrait expliquer comment la tumeur développe une résistance aux médicaments, conduisant à cibles possibles pour la thérapeutique.

« Lorsqu'il s'agit de données volumineuses, il est plus facile de générer des données que d'en tirer des connaissances. »

Cependant, même l'approche des anticorps a des limites, car certains anticorps peuvent se lier à plus d'une protéine, créant des résultats trompeurs. « Un problème encore plus difficile est de savoir quelles données sont de bonne qualité et celles qui ne le sont pas », explique Uhlén. « Lorsqu'il s'agit de données volumineuses, il est plus facile de générer des données que d'en tirer des connaissances. »

Ensuite, il y a les protéines manquantes. Environ 15 % des gènes humains qui devraient coder des protéines n'ont eu aucune protéine associée identifiée 5 - cela signifie qu'il y a près de 3 000 protéines manquantes. Dans certains cas, cela peut être dû au fait qu'ils se produisent en petites quantités ou dans seulement de minuscules zones de tissu. Sans un catalogue complet de protéines, l'image globale de la protéomique humaine reste floue.

Le calcul avec des données incomplètes ou inexactes pourrait égarer les chercheurs, s'inquiète Hancock. « Réunir la biologie et les mathématiques est une alliance faite en enfer », dit-il. "La biologie est humide, sale et désordonnée."

Mais à mesure que les techniques de mesure s'améliorent et que les scientifiques amassent de plus en plus de découvertes, "l'image va devenir de plus en plus nette", ajoute Hancock. Et le volume de données disponibles à passer au crible continuera de monter en flèche à mesure que les techniques de mesure s'amélioreront. "Nous obtenons toutes sortes de données à partir de nombreuses expériences différentes", explique Bessant. « Il ne faut pas longtemps pour obtenir des centaines de gigaoctets ou de téraoctets de données. »


Applications de la protéomique

M Abhilash. Applications de la protéomique. Le Journal Internet de la génomique et de la protéomique. 2008 Tome 4 Numéro 1.

Résumé

La protéomique est l'étude à grande échelle des protéines, en particulier de leurs structures et fonctions. Les protéines sont des parties vitales des organismes vivants, car elles sont les principaux composants des voies métaboliques physiologiques des cellules. Le terme « protéomique » a été inventé pour faire une analogie avec la génomique, l'étude des gènes. Le mot "protéome" est un mélange de "protéine" et de "génome". Le protéome est l'ensemble des protéines, y compris les modifications apportées à un ensemble particulier de protéines, produites par un organisme ou un système. Cela variera avec le temps et les exigences distinctes, ou les contraintes, qu'une cellule ou un organisme subit.

Introduction

Le mot «protéome» est dérivé de PROTÉines exprimées par un génOME, et il fait référence à toutes les protéines produites par un organisme, tout comme le génome est l'ensemble des gènes. La protéomique est l'étude à grande échelle des protéines, en particulier de leurs structures. et fonctions. Ce terme a été inventé pour faire une analogie avec la génomique, et bien qu'il soit souvent considéré comme la « prochaine étape », la protéomique est beaucoup plus compliquée que la génomique. Plus important encore, alors que le génome est une entité assez constante, le protéome diffère d'une cellule à l'autre et change constamment à travers ses interactions biochimiques avec le génome et l'environnement. Un organisme a une expression protéique radicalement différente dans différentes parties de son corps, à différentes étapes de son cycle de vie et dans différentes conditions environnementales.

L'intégralité des protéines présentes dans un organisme tout au long de son cycle de vie, ou à une plus petite échelle, l'intégralité des protéines présentes dans un type de cellule particulier sous un type de stimulation particulier, sont respectivement appelées protéome de l'organisme ou type de cellule. Étant donné que les protéines jouent un rôle central dans la vie d'un organisme, la protéomique joue un rôle déterminant dans la découverte de biomarqueurs, tels que les marqueurs qui indiquent une maladie particulière.

Avec l'achèvement d'un brouillon du génome humain, de nombreux chercheurs examinent maintenant comment les gènes et les protéines interagissent pour former d'autres protéines. Une découverte surprenante du Human Genome Project est qu'il y a beaucoup moins de gènes codant pour des protéines dans le génome humain que de protéines dans le protéome humain (

1 000 000 de protéines). On pense que la grande augmentation de la diversité des protéines est due à l'épissage alternatif et à la modification post-traductionnelle des protéines. Cet écart implique que la diversité des protéines ne peut pas être entièrement caractérisée par l'analyse de l'expression génique seule, faisant de la protéomique un outil utile pour caractériser les cellules et les tissus d'intérêt.

Branches de la protéomique

Séparation des protéines. Toutes les technologies protéomiques reposent sur la capacité de séparer un mélange complexe afin que les protéines individuelles soient plus facilement traitées avec d'autres techniques.

Identification des protéines. Des méthodes bien connues comprennent le séquençage à faible débit par dégradation d'Edman. Les techniques protéomiques à haut débit sont basées sur la spectrométrie de masse, généralement l'empreinte de masse peptidique sur des instruments plus simples, ou le séquençage de détection de répétition de novo sur des instruments capables de plus d'un cycle de spectrométrie de masse. Des dosages basés sur les anticorps peuvent également être utilisés, mais sont uniques à un motif de séquence.

Quantification des protéines. Des méthodes à base de gel sont utilisées, y compris la coloration différentielle des gels avec des colorants fluorescents (électrophorèse sur gel de différence). Les méthodes sans gel comprennent diverses méthodes de marquage ou de modification chimique, telles que les étiquettes d'affinité à codage isotopique (ICAT), les étiquettes d'affinité à codage métallique (MeCAT) ou la chromatographie diagonale fractionnée combinée (COFRADIC). La recherche moderne sur l'électrophorèse sur gel utilise souvent des outils d'analyse d'images basés sur des logiciels principalement pour analyser les biomarqueurs en quantifiant l'individu, ainsi que pour montrer la séparation entre un ou plusieurs « spots » de protéines sur une image numérisée d'un produit 2-DE. De plus, ces outils font correspondre les points entre les gels d'échantillons similaires pour montrer, par exemple, les différences protéomiques entre les stades précoces et avancés d'une maladie.

Analyse de séquence de protéines. Il s'agit davantage d'une branche bioinformatique, dédiée à la recherche de bases de données pour d'éventuelles correspondances de protéines ou de peptides, mais aussi à l'attribution fonctionnelle de domaines, à la prédiction de la fonction à partir de la séquence et aux relations évolutives des protéines.

Protéomique structurale. Il s'agit de la détermination à haut débit des structures protéiques dans l'espace tridimensionnel. Les méthodes courantes sont la cristallographie aux rayons X et la spectroscopie RMN.

Protéomique d'interaction. Cela concerne l'étude des interactions protéiques aux niveaux atomique, moléculaire et cellulaire. voir l'article connexe sur la prédiction d'interaction protéine-protéine.

Modification des protéines. Presque toutes les protéines sont modifiées à partir de leur séquence d'acides aminés traduite pure, ce qu'on appelle la modification post-traductionnelle. Des méthodes spécialisées ont été développées pour étudier la phosphorylation (phosphoprotéomique) et la glycosylation (glycoprotéomique).

Protéomique cellulaire. Une nouvelle branche de la protéomique dont l'objectif est de cartographier l'emplacement des protéines et des interactions protéine-protéine dans des cellules entières lors d'événements cellulaires clés. Centres autour de l'utilisation de techniques telles que la tomographie aux rayons X et la microscopie optique à fluorescence.

Bioinformatique expérimentale. Une branche de la bioinformatique, telle qu'elle est appliquée en protéomique, inventée par Mathias Mann. Cela implique la conception mutuelle de méthodes expérimentales et bioinformatiques pour créer (extraire) de nouveaux types d'informations à partir d'expériences en protéomique.

Technologies clés utilisées en protéomique

L'électrophorèse sur gel unidimensionnelle et bidimensionnelle est utilisée pour identifier la masse relative d'une protéine et son point isoélectrique.

La cristallographie aux rayons X et la résonance magnétique nucléaire sont utilisées pour caractériser la structure tridimensionnelle des peptides et des protéines. Cependant, des techniques à faible résolution telles que le dichroïsme circulaire, la spectroscopie infrarouge à transformée de Fourier et la diffusion des rayons X aux petits angles peuvent être utilisées pour étudier la structure secondaire des protéines.

La spectrométrie de masse en tandem combinée à la chromatographie en phase inverse ou à l'électrophorèse 2-D permet d'identifier (par séquençage peptidique de novo) et de quantifier tous les niveaux de protéines présentes dans les cellules.

La spectrométrie de masse (no-tandem), souvent MALDI-TOF, est utilisée pour identifier les protéines par empreinte de masse peptidique. Moins couramment, cette approche est utilisée avec la chromatographie et/ou la spectrométrie de masse à haute résolution.

Cette technique est de moins en moins utilisée et le monde scientifique n'accepte plus l'identification absolue d'une protéine basée uniquement sur les données d'empreintes de masse peptidique.

La chromatographie d'affinité, les techniques hybrides de levure, le transfert d'énergie par résonance de fluorescence (FRET) et la résonance plasmonique de surface (SPR) sont utilisés pour identifier les réactions de liaison protéine-protéine et protéine-ADN.

La tomographie aux rayons X est utilisée pour déterminer l'emplacement de protéines ou de complexes protéiques marqués dans une cellule intacte. Fréquemment corrélé avec des images de cellules provenant de microscopes basés sur la lumière.

L'analyse d'image basée sur un logiciel est utilisée pour automatiser la quantification et la détection de taches dans et parmi les échantillons de gel. Bien que cette technologie soit largement utilisée, l'intelligence n'a pas encore été perfectionnée. Par exemple, les principaux outils logiciels dans ce domaine ont tendance à s'accorder sur l'analyse de taches de protéines bien définies et bien séparées, mais ils fournissent des résultats et des tendances différents avec des taches moins définies et moins séparées, ce qui nécessite une vérification manuelle des résultats.

Application de la protéomique à la découverte de biomarqueurs protéiques

Les biomarqueurs de l'efficacité et de la toxicité des médicaments deviennent un besoin clé dans le processus de développement de médicaments. Les technologies protéomiques basées sur le spectre de masse sont parfaitement adaptées à la découverte de biomarqueurs protéiques en l'absence de toute connaissance préalable des changements quantitatifs des niveaux de protéines. Le succès de tout effort de découverte de biomarqueurs dépendra de la qualité des échantillons analysés, de la capacité à générer des informations quantitatives sur les niveaux de protéines relatifs et de la capacité à interpréter facilement les données générées. Cet examen se concentrera sur les forces et les faiblesses des technologies actuellement utilisées pour résoudre ces problèmes.

Application de la protéomique à l'étude des métastases tumorales.

Les métastases tumorales sont la principale cause de décès chez les patients cancéreux. Cependant, les mécanismes moléculaires et cellulaires sous-jacents aux métastases tumorales sont encore insaisissables. L'identification de molécules protéiques avec leurs expressions corrélées au processus métastatique aiderait à comprendre les mécanismes métastatiques et ainsi faciliterait le développement de stratégies pour les interventions thérapeutiques et la prise en charge clinique du cancer. La protéomique est une approche de recherche systématique visant à fournir la caractérisation globale de l'expression et de la fonction des protéines dans des conditions données. La technologie protéomique a été largement utilisée dans la découverte de biomarqueurs et les études pathogéniques, y compris les métastases tumorales. Cet article fournit une brève revue de l'application de la protéomique dans l'identification des facteurs moléculaires dans le processus de métastase tumorale. La combinaison de la protéomique avec d'autres approches expérimentales en biochimie, biologie cellulaire, génétique moléculaire et chimie, ainsi que le développement de nouvelles technologies et l'amélioration des méthodologies existantes, continueront d'étendre son application à l'étude des métastases cancéreuses.

Application de la technologie protéomique au domaine du neurotraumatisme

La quasi-achèvement du projet du génome humain a stimulé les scientifiques à commencer à chercher la prochaine étape pour démêler les fonctions normales et anormales au sein des systèmes biologiques. Par conséquent, un nouvel intérêt est porté au rôle des protéines dans ces processus. La protéomique est un domaine en plein essor qui peut fournir une approche précieuse pour évaluer le système nerveux central (SNC) post-traumatique. Bien que nous ne puissions pas fournir une évaluation complète de toutes les méthodes d'analyse des protéines, ce rapport résume certaines des technologies protéomiques les plus récentes qui ont propulsé ce domaine sous les projecteurs et qui sont disponibles pour la plupart des chercheurs en neurotraumatisme.

Trois approches techniques (électrophorèse sur gel bidimensionnelle, analyse directe par spectrométrie de masse, y compris la chromatographie bidimensionnelle couplée à la spectrométrie de masse et aux marqueurs d'affinité isotopiques, et technologies d'anticorps) sont passées en revue, et leurs avantages et inconvénients présentés. Une discussion sur la technologie protéomique dans le contexte des traumatismes du cerveau et de la moelle épinière suit, abordant les défis actuels et futurs. La protéomique sera probablement très utile pour développer des prédicteurs diagnostiques après une lésion du SNC et pour cartographier les changements dans les protéines après une lésion afin d'identifier de nouvelles cibles thérapeutiques. Les neurotraumatismes entraînent des altérations complexes des systèmes biologiques au sein du système nerveux, et ces changements évoluent avec le temps. L'exploration du « nouveau système nerveux » qui suit une blessure nécessitera des méthodes qui peuvent à la fois pleinement évaluer et simplifier cette complexité.

Application de la protéomique au diagnostic des maladies rénales.

La protéomique est largement considérée comme jouant un rôle important dans la traduction de la génomique en applications cliniquement utiles, en particulier dans les domaines du diagnostic et du pronostic. Dans le diagnostic et le traitement des maladies rénales, une priorité majeure est l'identification de biomarqueurs associés à la maladie. La protéomique, avec son approche à haut débit et impartiale de l'analyse des variations des modèles d'expression des protéines (expression phénotypique réelle de la variation génétique), promet d'être la plate-forme la plus appropriée pour la découverte de biomarqueurs. La combinaison de techniques analytiques classiques telles que l'électrophorèse sur gel bidimensionnelle avec des techniques plus sophistiquées, telles que la SEP, a permis de réaliser des progrès considérables dans le catalogage et la quantification des protéines présentes dans l'urine et divers compartiments du tissu rénal dans les états physiologiques normaux et pathologiques.

Malgré ces réalisations, il reste un certain nombre de défis importants qui devront être relevés afin d'ouvrir la voie à l'acceptation universelle de la protéomique en tant qu'outil de diagnostic cliniquement pertinent. Nous discutons des problèmes liés à trois de ces tâches de développement critiques comme suit : (i) définir complètement le protéome dans les différents compartiments biologiques (egtissus, sérum et urine) à la fois pour la santé et la maladie, ce qui représente un défi majeur compte tenu de la gamme dynamique et de la complexité de ces protéomes (ii) obtenir la capacité de routine de quantifier avec précision et de manière reproductible les profils d'expression protéomique et

(iii) développer des plates-formes de diagnostic qui sont facilement applicables et techniquement réalisables pour une utilisation dans le cadre clinique qui dépendent des fruits des deux tâches précédentes pour profiler plusieurs biomarqueurs de maladies.

L'application de la protéomique en neurologie

Les techniques protéomiques qui progressent rapidement ont été largement adoptées dans la plupart des domaines de la biologie et de la médecine. En neurologie et en neurosciences, de nombreuses applications de la protéomique ont impliqué la neurotoxicologie et le neurométabolisme, ainsi que la détermination d'aspects protéomiques spécifiques de zones cérébrales individuelles et de fluides corporels dans la neurodégénérescence.L'étude des groupes de protéines cérébrales dans la neurodégénérescence, tels que les enzymes, les protéines du cytosquelette, les chaperons, les protéines synaptosomales et les protéines antioxydantes, est en cours en tant que protéomique liée au phénotype. La détection concomitante de plusieurs centaines de protéines sur un gel fournit des données suffisamment complètes pour déterminer un réseau protéique physiopathologique et ses représentants périphériques. La diffusion rapide de la technologie de la protéomique, qui consiste principalement en une électrophorèse sur gel bidimensionnelle (2-DE) avec digestion protéique dans le gel de taches protéiques et identification par spectrométrie de masse, a fourni une quantité explosive de résultats. Un avantage supplémentaire est que des protéines jusqu'ici inconnues ont été identifiées comme des protéines du cerveau. Les méthodes actuelles de protéomique présentent cependant des défauts et des inconvénients. Nous soulignons l'échec à séparer les protéines hydrophobes comme un problème majeur. Jusqu'à présent, nous n'avons pas été en mesure d'analyser la grande majorité de ces protéines dans des gels sur 2-DE. Il existe plusieurs autres problèmes analytiques qui doivent également être surmontés et, une fois résolus, permettront une analyse plus complète du processus de la maladie individuelle. Ici, nous avons passé en revue les progrès récents de la recherche en protéomique sur la neurodégénérescence, en référence à son utilité technologique et aux problèmes d'application clinique.

Application de la protéomique à la médecine fœtale et maternelle

L'élucidation récente de la séquence du génome humain a fourni une mine d'informations utiles mais ne fournit pas d'informations sur les maladies causées par des changements au niveau des protéines. La protéomique comprend la caractérisation et l'analyse fonctionnelle de toutes les protéines qui sont exprimées par le génome à un certain moment, dans certaines conditions. Étant donné que les niveaux d'expression de nombreuses protéines dépendent fortement de systèmes de régulation complexes mais bien équilibrés, le protéome, contrairement au génome, est très dynamique. Cette variation dépend de la fonction biologique d'une cellule, mais aussi des signaux de son environnement. Dans la recherche (bio)médicale, il est devenu de plus en plus évident que les processus cellulaires, en particulier dans les maladies, sont déterminés par de multiples protéines. Par conséquent, il est important de ne pas se concentrer sur un seul produit génique (une protéine), mais d'étudier l'ensemble complet des produits géniques (le protéome). De cette façon, les relations multifactorielles sous-jacentes à certaines maladies peuvent être démêlées en identifiant potentiellement des cibles thérapeutiques. Pour de nombreuses maladies, la caractérisation du protéome fonctionnel est cruciale pour élucider les altérations de l'expression et des modifications des protéines. Lorsque les protéines subissent des altérations non déterminées génétiquement telles qu'un épissage alternatif ou des modifications post-traductionnelles, par ex. phosphorylation ou glycosylation, cela peut affecter leur fonction. Bien que des anomalies dans l'épissage ou des modifications post-traductionnelles puissent provoquer un processus pathologique, elles peuvent également en être une conséquence. Un exemple est que les patients diabétiques ont une glycémie élevée qui glycosyle des centaines voire des milliers de protéines, y compris l'HbA1c qui est utilisée pour surveiller le contrôle du diabète.

Protéomique dans la recherche sur le cancer urologique

L'analyse protéomique permet la comparaison des protéines présentes dans un échantillon de tissu malade avec les protéines présentes dans un échantillon de tissu normal. Toutes les protéines qui ont été altérées soit quantitativement soit qualitativement entre l'échantillon normal et malade sont susceptibles d'être associées au processus pathologique. Ces protéines peuvent être identifiées et peuvent être utiles en tant que marqueurs diagnostiques pour la détection précoce de la maladie ou marqueurs pronostiques pour prédire l'issue de la maladie ou elles peuvent être utilisées comme cibles médicamenteuses pour le développement de nouveaux agents thérapeutiques. Le but de cette revue est de décrire les principales technologies impliquées dans l'analyse du protéome et d'indiquer les applications actuelles et futures potentielles de l'analyse protéomique dans la recherche sur le cancer urologique.

Application de la protéomique au profilage des auto-anticorps pour l'étude et le traitement des maladies auto-immunes.

Les technologies de protéomique permettent le profilage des réponses d'auto-anticorps à l'aide de fluides biologiques dérivés de patients atteints d'une maladie auto-immune. Ils fournissent un outil puissant pour caractériser les réponses autoréactives des lymphocytes B dans des maladies telles que la polyarthrite rhumatoïde, la sclérose en plaques, le diabète auto-immun et le lupus érythémateux disséminé. Le profilage d'auto-anticorps peut servir à des fins telles que la classification de patients individuels et de sous-ensembles de patients en fonction de leur « empreinte digitale d'auto-anticorps », l'examen de la propagation des épitopes et de l'utilisation des isotypes d'anticorps, la découverte et la caractérisation d'auto-antigènes candidats et l'adaptation d'un traitement spécifique à l'antigène. Au cours des prochaines décennies, les technologies protéomiques élargiront notre compréhension des mécanismes sous-jacents et renforceront notre capacité à diagnostiquer, pronostiquer et traiter les maladies auto-immunes.

Application de la protéomique à la recherche cardiovasculaire.

Le développement de la protéomique arrive à point nommé pour la recherche cardiovasculaire. Des analyses au niveau des organes, sous-cellulaires et moléculaires ont révélé des processus intracellulaires dynamiques, complexes et subtils associés aux maladies cardiaques et vasculaires. La puissance et la flexibilité des analyses protéomiques, qui facilitent la séparation, l'identification et la caractérisation des protéines, devraient accélérer notre compréhension de ces processus au niveau des protéines. Correctement appliquée, la protéomique fournit aux chercheurs des « inventaires » de protéines cellulaires à des moments précis, ce qui la rend idéale pour documenter la modification des protéines due à une maladie, un état ou un traitement particulier. Ceci est accompli grâce à l'établissement de bases de données de protéines spécifiques aux espèces et aux tissus, fournissant une base pour les études protéomiques ultérieures.

L'évolution des techniques protéomiques a permis une étude plus approfondie des mécanismes moléculaires sous-jacents aux maladies cardiovasculaires, facilitant l'identification non seulement des protéines modifiées mais aussi de la nature de leur modification. Le développement continu devrait conduire à des études protéomiques fonctionnelles, dans lesquelles l'identification de la modification des protéines, en conjonction avec les données fonctionnelles des méthodes biochimiques et physiologiques établies, a la capacité d'approfondir notre compréhension de l'interaction entre le changement du protéome et les maladies cardiovasculaires.

Application de la protéomique à la recherche sur le diabète.

La protéomique est l'étude de toutes les protéines et de leurs diverses modifications qui composent un système, qu'il s'agisse d'une cellule, d'un tissu ou d'un organisme. Les techniques impliquées dans la protéomique permettent le criblage global d'échantillons complexes de protéines et fournissent des preuves qualitatives et quantitatives de l'expression altérée des protéines. Cela se prête à l'étude des mécanismes moléculaires qui sous-tendent les processus de la maladie et les effets du traitement. Cette revue décrit les principales techniques de protéomique et comment elles ont commencé à être appliquées à la recherche sur le diabète.

Rôle de la protéomique dans la recherche en nutrition

Il existe environ 100 000 protéines chez l'homme avec diverses fonctions physiologiques. Le complément de protéines dans l'organisme ainsi que leurs interactions est défini comme le protéome. Son analyse (protéomique) par MS hautement spécifique, sensible et précise a été rendue possible grâce à l'ionisation par désorption laser assistée par matrice ou à l'ionisation par électrospray de protéines et de gros peptides. Actuellement, les technologies de protéomique les plus couramment utilisées impliquent soit une digestion spécifique des protéines (l'approche ascendante utilisant l'électrophorèse bidimensionnelle sur gel de polyacrylamide et

technologie d'identification des protéines) ou analyse directe des protéines intactes après leur séparation chromatographique (approche descendante et ionisation par désorption laser à surface augmentée).

La protéomique est très prometteuse pour les découvertes dans la recherche en nutrition, y compris les profils et les caractéristiques des protéines alimentaires et corporelles digestion, absorption et métabolisme des nutriments fonctions des nutriments et autres facteurs alimentaires dans la croissance, la reproduction et la santé biomarqueurs de l'état nutritionnel et de la maladie et individualisé besoins en nutriments. L'analyse du protéome devrait jouer un rôle important dans la résolution des principaux problèmes liés à la nutrition chez les humains et les animaux, tels que l'obésité, le diabète, les maladies cardiovasculaires, le cancer, le vieillissement et le retard fœtal intra-utérin.

Défis de la protéomique au regard de la physiologie végétale

Bien que des progrès significatifs dans le profilage complet, l'analyse fonctionnelle et la régulation des protéines aient eu lieu chez des organismes modèles tels que la levure (Saccharomyces cerevisiae) et chez l'homme, la recherche en protéomique chez les plantes n'a pas progressé au même rythme. La disponibilité du génome complet d'Arabidopsis (Arabidopsis thaliana), qui est petit par rapport à celui d'autres plantes, ainsi qu'un catalogue de plus en plus complet d'informations de codage des protéines provenant d'expériences de séquençage d'ADNc à grande échelle et de cartographie des transcrits, le distinguent comme un complexe mais un organisme modèle accessible pour étudier la protéomique des plantes. L'application des approches protéomiques aux plantes pose trois défis majeurs :

Identification complète des protéines, de leurs isoformes et de leur prévalence dans chaque tissu.

Caractériser les fonctions biochimiques et cellulaires de chaque protéine.

L'analyse de la régulation des protéines et sa relation avec d'autres réseaux de régulation.


Profilage cible de petites molécules par protéomique chimique

Les communautés médicales et pharmaceutiques sont confrontées à un besoin urgent de nouvelles cibles médicamenteuses, alors que, paradoxalement, les cibles de certains médicaments en cours d'utilisation ou de développement clinique restent insaisissables. De nombreux composés se sont avérés plus proches que prévu initialement, ce qui peut potentiellement entraîner des effets secondaires, mais qui peut également ouvrir des utilisations médicales supplémentaires. À mesure que nous nous dirigeons vers la biologie des systèmes et la médecine personnalisée, il deviendra de plus en plus nécessaire de déterminer de manière exhaustive les profils d'interaction petite molécule-cible et de les cartographier sur les voies de signalisation et métaboliques. La protéomique chimique est une puissante approche de chromatographie d'affinité basée sur la spectrométrie de masse pour identifier les interactions petites molécules-protéines à l'échelle du protéome. Ici, nous fournirons un aperçu critique des concepts de base et des avancées récentes en protéomique chimique et passerons en revue les applications récentes, avec un accent particulier sur les inhibiteurs de kinases et les produits naturels.


La protéomique élargit les perspectives de la multiomique

BGI Americas propose des services de caractérisation protéomique et biologique pour accélérer les programmes de recherche en sciences de la vie de ses clients. Le laboratoire de service de spectrométrie de masse de la société à San Jose, en Californie, est composé de scientifiques possédant une vaste expérience dans les méthodes analytiques basées sur la chromatographie en phase liquide et la spectrométrie de masse. Sur cette image, l'un des scientifiques du laboratoire utilise un Orbitrap Eclipse Tribrid, un spectromètre de masse de Thermo Fisher Scientific.

Le séquençage de l'ADN a ouvert la recherche et des perspectives translationnelles d'une portée à couper le souffle, mais nous avons finalement commencé à reprendre notre souffle. Au fil du temps, les points de vue offerts par le séquençage de l'ADN ont commencé à se sentir limités et incapables de nous donner un aperçu de bon nombre des questions les plus convaincantes sur les maladies humaines. Pour élargir nos perspectives, nous avons combiné des enquêtes génomiques et des enquêtes transcriptomiques, et encore la vue peut sembler, bien, œillère. Ainsi, nous commençons maintenant à envisager un horizon encore plus large, une vision multiomique qui inclut non seulement les séquences d'ADN et les transcrits d'ARN, mais aussi les protéines.

Garder un œil sur les protéines, c'est-à-dire effectuer une analyse protéomique, est extrêmement difficile. Les protéines de notre corps peuvent augmenter ou diminuer en abondance ou modifier leurs structures et leurs fonctions selon notre âge, notre état de santé et d'autres contingences.

Le plus souvent, les protéines sont vues à travers la lentille de la spectrométrie de masse. Avec les progrès de la spectrométrie de masse qui ont eu lieu au cours des 10 à 20 dernières années, la protéomique est devenue plus sensible, plus rapide et plus haute résolution. Aujourd'hui, la protéomique s'ajoute à ce que nous pouvons voir avec la génomique, la transcriptomique et la métabolomique, nous donnant une image plus complète (et plus dynamique) des processus et voies biologiques ainsi que des cibles et mécanismes des médicaments.

Cartographier les mécanismes médicamenteux

Les mécanismes d'action des composés médicamenteux dans le corps ne sont souvent pas clairs. Cependant, ces mécanismes peuvent être clarifiés si une approche protéomique est utilisée pour identifier quelles protéines sont affectées par les composés médicamenteux. Des informations sur des milliers de protéines peuvent être capturées grâce à la protéomique traditionnelle basée sur la spectrométrie de masse, mais des informations supplémentaires pourraient être capturées grâce à une approche encore plus puissante, suggère Benjamin Ruprecht, PhD, scientifique principal associé, Merck & Co. Il a en tête une approche qui est capable d'un débit plus élevé et de trouver des associations entre les médicaments et les éléments du protéome et du transcriptome.

Les chercheurs de Merck & Co. ont développé un flux de travail de protéomique basé sur la spectrométrie de masse pour profiler rapidement les protéomes de cinq lignées cellulaires de cancer du poumon et évaluer comment les lignées cellulaires réagissent à différents médicaments. Plus de 50 médicaments ont été testés. Les chercheurs ont découvert que leur flux de travail les aidait à améliorer leur compréhension de l'action des médicaments, des dégradeurs, de l'homéostasie des protéines et du trafic des protéines à l'intérieur des cellules.

Les protéines à l'intérieur d'une cellule sont constamment transformées. Bien que les techniques transcriptomiques puissent montrer la présence de transcrits spécifiques, elles en disent peu sur les protéines qui correspondent à ces transcrits. Par exemple, ces techniques sont silencieuses en ce qui concerne l'abondance, l'emplacement dans la cellule ou le destin d'une protéine, qu'elle soit sécrétée, par exemple. La mesure directe des protéines offre une image potentiellement beaucoup plus précise de la biologie de la cellule et de ses réponses à des composés spécifiques. Comme preuve de principe, Ruprecht et ses collègues ont utilisé des techniques avancées de spectrométrie de masse pour créer une carte du protéome des effets des médicaments dans les lignées cellulaires du cancer du poumon. 1

L'étude de Ruprecht a confirmé que les changements au niveau des protéines et des transcrits en réponse au traitement médicamenteux ne sont pas identiques. Il a également montré que l'agrégation des changements au niveau des protéines induits par les médicaments dans les lignées cellulaires fournissait des informations importantes pour caractériser le mécanisme d'action des médicaments à petites molécules.

« Notre ensemble de données nous a permis d'annoter quelles protéines répondent à la majorité des médicaments », explique Ruprecht. « Supprimer ces « répondeurs fréquents » améliore fortement notre capacité à déterminer les changements protéiques sélectifs causés par un composé individuel. » Il ajoute que ce type d'expérience révèle également des cibles médicamenteuses directes pour un quart des petites molécules étudiées tout en révélant de nouveaux mécanismes et voies potentielles de résistance aux médicaments.

Bien que cette étude de preuve de principe ait été couronnée de succès et ait fourni des informations importantes, elle a indiqué que la technologie de protéomique basée sur la spectrométrie de masse doit encore être améliorée. Ruprecht note que les domaines nécessitant des améliorations comprennent la sensibilité des instruments, la préparation et le traitement des échantillons et l'analyse des données.

Augmentation de la sensibilité pour une protéomique plus profonde

Les études multiomiques reposent sur des ensembles de données qui reflètent l'utilisation de plusieurs approches omiques différentes. Au cours des 4 à 5 dernières années, bon nombre de ces études ont intégré des approches protéomiques, observe Diarmuid Kenny, PhD, chef de groupe pour la biologie intégrée aux Laboratoires Charles River. Il note que la protéomique du fusil de chasse, également connue sous le nom d'acquisition dépendante des données (DDA), a longtemps été la méthode de choix pour l'identification et la quantification des protéines à partir de mélanges complexes, mais que récemment l'acquisition indépendante des données (DIA) a émergé pour exploiter l'augmentation la vitesse et la sensibilité des nouveaux spectromètres de masse.

Dans le DDA, les peptides du mélange sont présélectionnés pour l'identification, tandis que dans le DIA, tous les peptides de l'échantillon sont fragmentés, ce qui entraîne moins de valeurs manquantes et donc une couverture protéomique beaucoup plus profonde. Lorsque la spectrométrie de mobilité ionique à forme d'onde asymétrique à champ élevé (FAIMS) est utilisée, les ions de fond peuvent être préfiltrés à partir d'échantillons extrêmement complexes, abaissant les limites de détection et améliorant la qualité globale des données.

« L'incorporation de FAIMS dans la dernière génération de spectromètres de masse à haute résolution a permis d'améliorer considérablement la couverture globale du protéome », a déclaré Kenny. "En outre, FAIMS a la capacité de séparer les isomères de peptides modifiés post-traductionnellement, offrant des opportunités intéressantes pour développer de nouvelles méthodologies spécifiquement axées sur l'identification de nouvelles modifications post-traductionnelles."

Les applications innovantes de la spectrométrie de masse dans l'analyse protéomique impliquent généralement des améliorations de la sensibilité des instruments, souligne Andreas Hühmer, PhD, directeur principal, omique et spectrométrie de masse, Thermo Fisher Scientific. Il affirme que le spectromètre de masse Orbitrap Eclipse Tribrid de Thermo Fisher représente la technologie disponible la plus sensible pour mesurer les changements cellulaires subtils tels que les interactions protéine-protéine ou les interactions médicament-protéine.

Par exemple, avec une instrumentation de protéolyse limitée et de spectrométrie de masse (LiP-MS) hautement sensible, les chercheurs « peuvent voir si un changement structurel particulier de la protéine provoque des changements dans le métabolisme », souligne Hühmer. "Dans ce cas particulier, vous pouvez utiliser l'approche protéomique pour expliquer la métabolomique."

Il ajoute qu'une approche similaire serait applicable à la protéogénomique, où la connaissance de la génomique informe l'analyse protéomique du même échantillon. « La protéomique devient de plus en plus fonctionnelle et démocratisée », affirme Hühmer. Il s'attend à ce que les scientifiques qui ne sont pas des experts en spectrométrie de masse trouvent plus facile d'appliquer la technologie dans leurs domaines spécialisés. « Un domaine qui sera très important pour la démocratisation est ce que nous appelons la spectrométrie de masse intelligente », note-t-il. « Ici, « intelligent » fait référence à la façon dont un instrument peut être conscient de la question posée par l'utilisateur. En outre, l'instrument peut connaître les meilleurs réglages et paramètres pour optimiser les résultats.

La sensibilité accrue de l'instrument en spectrométrie de masse facilite l'étude des protéines présentes en faible abondance ou qui doivent être recherchées dans de très petits échantillons. De telles protéines échappent typiquement aux méthodes traditionnelles de détection. Alors que les études de génomique et de transcriptomique unicellulaires sont bien avancées, le domaine de la protéomique est sur le point d'atteindre la sensibilité unicellulaire.

La production de protéines dans les cellules eucaryotes est une affaire compliquée, comme le suggère cette image, même si elle omet des détails tels que les différents types de modifications post-transcriptionnelles et post-traductionnelles qui peuvent survenir. Pour obtenir une véritable lecture de la production de protéines, il n'y a donc pas de substitut à l'analyse du protéome, qui repose désormais sur des technologies combinant des instruments de séparation et de spectrométrie de masse. [Nicolle Rager, Fondation nationale des sciences]

Approche de l'analyse à cellule unique

« En termes de nouvelles avancées de la spectrométrie de masse pour la protéomique et de la façon dont la protéomique peut être combinée avec d'autres technologies omiques, je pense que l'émergence de la génomique spatiale et l'application des tests monocellulaires sont très importantes », déclare Guanghui Han, PhD, directeur, San Centre de spectrométrie de masse Jose, BGI Americas. Il pense que la combinaison de ces technologies permettra de révéler des modèles autrefois cachés.

Par exemple, des cellules présentant des profils de protéome différents peuvent être distribuées à travers des tissus ou des organes dans des arrangements tridimensionnels significatifs. En outre, les profils de protéome au niveau d'une seule cellule peuvent changer au fil du temps en réponse à un stimulus ou à une perturbation.

À ce jour, la plupart des études de protéomique ont généré des profils de protéines pour des échantillons qui ont été homogénéisés et qui contiennent du matériel provenant de nombreuses cellules. Dans ces études, l'hétérogénéité cellulaire est perdue ou "moyennée". Pour préserver les informations sur l'hétérogénéité cellulaire, BGI propose un service de protéomique unicellulaire « approximatif » appelé nanoprotéomique.

À l'aide de l'instrument Orbitrap Eclipse MS de Thermo Fisher, BGI effectue une analyse protéomique quantitative sur environ 100 cellules en combinant un clivage in situ avec une technologie d'acquisition indépendante des données sans marquage.

Dans la poursuite de la protéomique unicellulaire et quasi unicellulaire, les développeurs de technologies doivent se concentrer sur la préparation des échantillons. Contrairement à l'ADN ou à l'ARN, les protéines ne peuvent pas être amplifiées.

Dans la préparation traditionnelle d'échantillons de protéines, il existe de nombreuses étapes au cours desquelles l'échantillon est traité et transféré d'un tube à l'autre. Au fur et à mesure que l'échantillon passe d'une étape à l'autre, les protéines de l'échantillon deviennent de moins en moins abondantes. Toutes les protéines dans l'échantillon qui étaient initialement présentes en quantités extrêmement faibles, c'est-à-dire en quantités inférieures à 300 picogrammes, deviennent si rares qu'elles sont indétectables par le test de profilage.

Han suggère que ce problème peut être surmonté par les protocoles rationalisés en protéomique unicellulaire. Ces protocoles limitent le nombre d'étapes et minimisent la perte d'échantillon.

Certaines avancées technologiques sont encore nécessaires pour que la protéomique rattrape la génomique en termes d'échelle et de granularité des données qu'elle peut renvoyer. Un autre obstacle sérieux est la perception dépassée selon laquelle la protéomique repose sur une technologie limitée à faible débit.

Bien que la technologie à haut débit soit déployée en protéomique, le domaine n'a pas encore connu un moment galvanisant comme celui que la génomique a connu avec le projet du génome humain. L'année dernière, peu de temps après l'apparition d'un plan très rigoureux du protéome humain dans Communication Nature, 2 un éditorial dans le Journal de recherche sur le protéome ont noté que la phase de finition ou de polissage du protéome humain devrait être plus difficile que celle du génome humain. 3

"Pour accomplir cette tâche, nous avons besoin d'une nouvelle technologie pour une couverture améliorée, une sensibilité plus élevée pour la protéomique unicellulaire et une bioinformatique assistée par apprentissage automatique", a expliqué l'éditorial. « La communauté de la protéomique a besoin d'une sensibilisation gouvernementale et institutionnelle pour fournir un soutien et des ressources à ces défis de recherche essentiels. » Selon Han, une campagne pour accélérer la phase de finition n'a pas encore été organisée.

Analyse multiomique à partir d'un seul essai

Dalton Bioanalytics pousse l'approche multiomique un peu plus loin en combinant l'analyse des protéines, des métabolites, des lipides, des électrolytes et d'autres petites molécules en un seul test. « Nous gardons tout dans l'échantillon », déclare Austin Quach, PhD, co-fondateur et CSO de Dalton. « [Notre approche est] en quelque sorte contre-intuitive, car le pétrole et l'eau ne coexistent normalement pas dans la même solution. »

Quach ajoute que la société prend des macromolécules, telles que des protéines, des glucides et des ARN, et les digère en petits morceaux. Ensuite, d'autres constituants de l'échantillon, tels que les ions métalliques, les électrolytes et les lipides, sont complexés avec des réactifs solubilisants et ionisants. Ces préparations permettent à chaque composant de se prêter à une analyse dans un seul test de chromatographie en phase liquide et de spectrométrie de masse qui donne des lectures sur les protéines, les lipides, les métabolites et les électrolytes. Les sucres et les oligosaccharides sont également visibles dans le dosage, tandis que les analyses des glucides complexes et des ARN sont encore en cours de développement.

Quach explique que si vous ne faites qu'une seule analyse omique, vous risquez de passer à côté d'importants canaux d'informations biologiques. Il suggère que travailler avec une image de données plus complète peut donner des informations inattendues.

"Dans une récente étude client, nous avons trouvé des événements étranges", note Quach, ajoutant que certains effets sur les métabolites ont été observés qui étaient associés à des changements "dramatiques" dans la teneur en protéines. "Nous n'aurions pas vu ces changements majeurs dans le côté protéomique des échantillons si nous nous concentrions uniquement sur les métabolites."

Au-delà de l'analyse au fusil de chasse

La sensibilité accrue des flux de travail d'analyse par spectrométrie de masse va de pair avec des ensembles de données plus volumineux et plus complexes. Alors que dans le passé, une analyse protéomique ambitieuse au fusil de chasse pouvait capturer 2 000 à 3 000 protéines, une seule injection peut désormais quantifier 10 000 protéines. C'est selon Oliver Rinner, PhD, co-fondateur et PDG de Biognosys. Il dit que la complexité de ces analyses de protéines en profondeur nécessite une bioinformatique avancée pour traiter les données.

Une grande partie de l'activité de Biognosys est la découverte de biomarqueurs pour la recherche à un stade précoce, mais la société se dirige vers des applications de stade ultérieur, telles que les essais cliniques. Rinner dit qu'à mesure que les analyses s'approfondissent, c'est-à-dire qu'elles absorbent plus de protéines, les chances de trouver les bons candidats biomarqueurs augmentent. D'un autre côté, l'analyse des données reste difficile pour les scientifiques qui ne sont pas familiers avec les données protéomiques. Par conséquent, la société fournit une analyse et une interprétation avancées des données en plus des résultats de mesure.

Le flux de travail de spectrométrie de masse de Biognosys acquiert des données de manière hautement parallèle et les analyse à l'aide de spectres de référence via un algorithme propriétaire. Le résultat est une mesure complète au niveau des peptides de toutes les protéines détectables dans l'échantillon.

Rinner déclare que la protéomique a un vaste potentiel pour transformer les sciences de la vie en raison du rôle des protéines en tant qu'unité fonctionnelle du corps : « Le génome nous donne essentiellement une lecture unidimensionnelle. C'est une séquence avec des mutations ou des variations. Le protéome nous donne une vision dynamique de la fonction à tous les niveaux : quantité, modification et même structure. Si nous pouvons lire cela à grande échelle, avec des données de haute qualité, nous obtiendrons une vision très différente de la fonction biologique. »


Une introduction à la protéogénomique : apprécier la complexité du dogme central

Un modèle simplifié du dogme central de la biologie moléculaire.

Le dogme central de la biologie moléculaire vous est probablement connu si vous lisez cette publier sur cette site Internet. Mais pour ceux qui ont besoin d'un rappel rapide, l'ADN représente le manuel d'instructions du corps, à partir de ces instructions, des transcriptions d'ARN sont produites, qui à leur tour sont traduites en protéines. Les protéines effectuent alors une grande partie du travail de la cellule.

Ce qui est amusant avec le dogme central, c'est qu'il ne s'agit pas d'un flux en tête-à-tête. Cela signifie que votre gène préféré (YFG) ne produit pas nécessairement un seul YFG Transcription d'ARN puis une protéine YFG. En fait, un gène, grâce au processus d'épissage alternatif, peut produire plusieurs transcrits d'ARN variants. Chaque transcrit variant peut ensuite produire plusieurs copies d'une protéine variant résultante qui sont modifiées de manière unique, créant finalement une augmentation exponentielle du nombre de gènes au produit protéique.

Pour compliquer encore les choses, il existe des réglementations supplémentaires au niveau transcriptionnel par les microARN et autres produits d'ARN fonctionnels, et au niveau traductionnel, y compris par les ARN circulaires.

Le nombre total estimé de protéines dans le protéome humain est supérieur à 1 million, tandis que le nombre total de gènes codant pour les protéines est estimé entre 20 000 et 25 000 et le transcriptome est estimé à 300 000. En bref, le processus de l'ADN à la protéine, tel que nous le comprenons maintenant, est vraiment complexe - un point que les chercheurs peuvent oublier d'apprécier.

Modifications post-traductionnelles : régulation au niveau des protéines

En plus de tout ce qui a un impact sur la synthèse des protéines au niveau génomique, les protéines traduites subissent un autre ensemble de régulations appelées modifications post-traductionnelles (PTM). Les PTM transforment une protéine nouvellement formée en une entité mature entièrement «décorée», modifiant radicalement sa fonction biologique en réponse aux besoins d'une cellule. Ces protéines matures peuvent alors effectuer une myriade de tâches nécessaires à la cellule, telles que se déplacer dans la cellule ou activer une cascade de signalisation.

Avec des estimations de plus de 200 types, les PTM sont les mécanismes clés qui augmentent la diversité protéomique bien au-dessus de la diversité génomique et transcriptomique.

Les PTM impliquent l'ajout covalent de groupes fonctionnels à des acides aminés spécifiques ou des liaisons peptidiques, le repliement de protéines assisté par enzyme ou le traitement protéolytique d'une protéine. Beaucoup de ces modifications sont médiées par des enzymes - qui sont elles-mêmes des protéines - telles que les kinases, les phosphatases, les transférases et les ligases, qui ajoutent ou suppriment des groupes fonctionnels, des protéines, des lipides ou des sucres aux chaînes latérales d'acides aminés.

Des études récentes sur PD-L1, une protéine centrale dans la suppression immunitaire du cancer, suggèrent que les PTM telles que la glycosylation, la phosphorylation, l'ubiquitination, la sumoylation et l'acétylation jouent toutes un rôle important dans la régulation de la stabilité de la protéine, la translocation et les interactions protéine-protéine. Tout changement PTM influence directement la résistance immunitaire médiée par PD-L1.

« Les PTM, les interactions protéine-protéine, la localisation subcellulaire des protéines et leurs mécanismes dynamiques de repliement et de dépliage, etc., contribuent tous aux états pathologiques », commente le Dr Emily Boja, directrice de programme du programme Clinical Proteogenomic Tumor Analysis Consortium (CPTAC) à l'Office of Cancer Clinical Proteomics Research (OCCPR) du NCI. « Par conséquent, il est essentiel de comprendre toutes les facettes des protéines et leurs rôles fondamentaux dans l'évolution de maladies telles que le cancer. »

La génomique ou la protéomique ne peuvent être seules dans la recherche de médicaments efficaces contre le cancer

Bien que les chercheurs aient travaillé vaillamment pour trouver de nouveaux médicaments contre le cancer, de nombreux médicaments expérimentaux sont en proie à une faible efficacité. Par exemple, les chercheurs ont essayé de tirer parti du fait que de nombreux cancers ont des génomes de plus en plus instables, une « caractéristique habilitante » qui favorise les mutations soutenant la tumeur. Malheureusement, de nombreux médicaments expérimentaux ciblant l'instabilité ont eu de faibles taux de réponse des patients, n'étant efficaces que dans un sous-ensemble de la population.

Il existe deux mécanismes d'action généraux largement utilisés que les médicaments utilisent. En éliminant le problème là où il commence, les chercheurs peuvent développer des médicaments pour cibler une mutation particulière dans le génome tumoral, l'empêchant de déclencher un effet en aval, comme avec les médicaments d'interférence ARN, les médicaments à saut d'exon, les thérapies géniques à médiation virale, l'ARNm- les médicaments à base de médicaments et les thérapies CRISPR de modification du génome. D'autres médicaments sont développés pour cibler des protéines, généralement celles qui résultent d'un gène muté.

Malheureusement, ces deux méthodes ont montré une efficacité médicamenteuse modérée, alors pourquoi ? Une possibilité est la complexité imprévue du processus du gène à la protéine et la régulation à chaque étape. Beaucoup de ces gènes et protéines ciblés s'avèrent n'avoir aucun effet sur la survie d'une tumeur, font partie de voies redondantes ou périphériques qui n'ont aucun effet direct sur la tumeur lorsqu'ils sont ciblés seuls, affectent des voies imprévues ou font face à une régulation protéique imprévue qui la rend inefficace .

« La stratégie de ciblage d'un seul gène ne tient pas compte de la complexité du cancer », déclare le Dr Mehdi Mesri, coordinateur du programme CPTAC et directeur du programme à l'OCCPR. « Comprendre le contexte biologique d'une mutation particulière est essentiel pour trouver une thérapie efficace. »

Entrez dans la protéogénomique : une approche globale

Avant de cibler une extrémité ou l'autre du dogme central, les chercheurs ont besoin d'un moyen d'examiner attentivement tout ce qui se passe entre les deux, afin de prendre en compte toutes les variations génomiques et la régulation protéomique, et comment celles-ci changent d'un patient à l'autre. patient et de cancer à cancer. La combinaison des informations recueillies à partir de la génomique avec la transcriptomique et la protéomique, une stratégie que nous appelons protéogénomique, permet aux chercheurs d'avoir un regard plus complet sur chaque altération d'une tumeur, y compris l'identification, la localisation et l'analyse fonctionnelle des protéines résultantes et leur relation avec le environnement tumoral plus large.

La protéogénomique vise à améliorer notre compréhension de la biologie du génome du cancer en aidant à hiérarchiser les altérations génomiques, en sous-typant les tumeurs avec des caractéristiques protéomiques, en éclairant les altérations des PTM responsables du dérèglement des réseaux de signalisation du cancer et en améliorant la compréhension de la réponse aux médicaments et de la résistance aux thérapies.

Le programme CPTAC du NCI fait exactement cela, en glanant des informations puissantes sur le développement et la progression du cancer. Grâce à l'étude du microenvironnement tumoral et du paysage immunitaire, les chercheurs du CPTAC ont pu caractériser protéogénomiquement de nombreux types de cancer à l'aide d'analyses protéomique, phosphoprotéomique, méthylomique, acétylomique et glycomique en conjonction avec les approches de séquençage bien établies. Les chercheurs ont découvert de nouveaux sous-types de tumeurs, des variations du micro-environnement tumoral et de nouvelles protéines potentielles pour une thérapie médicamenteuse ciblée. Dans notre prochain article, nous vous expliquerons comment ce type de recherche est effectué !


Résumé

La spectrométrie de masse de surveillance de réactions sélectionnées est une technologie émergente de protéomique ciblée qui permet l'étude d'échantillons de protéines complexes avec une sensibilité et une efficacité élevées. Cela nécessite une connaissance approfondie de l'échantillon pour que les nombreux paramètres nécessaires à la réalisation de l'expérience soient définis de manière appropriée. La plupart des études reposent aujourd'hui sur l'estimation de paramètres à partir d'études antérieures, de bases de données publiques ou de la mesure de peptides synthétiques. C'est efficace et solide, mais en l'absence de données préalables, une estimation des paramètres de novo est nécessaire. Des méthodes informatiques peuvent être utilisées pour créer un cadre automatisé pour résoudre ce problème. Cependant, le nombre d'applications disponibles est encore faible. Cette revue vise à donner une orientation sur les différents défis bioinformatiques. À cette fin, nous exposons les problèmes en termes classiques d'apprentissage automatique et d'exploration de données, donnons des exemples de solutions mises en œuvre et laissons place à des alternatives. Cela conduira, espérons-le, à un élan accru pour le développement d'algorithmes et répondra aux besoins de la communauté en matière de méthodes de calcul. Nous notons que la combinaison de ces méthodes dans un flux de travail assisté facilitera à la fois l'utilisation de la protéomique ciblée dans les études expérimentales ainsi que le développement ultérieur d'approches informatiques.


L'intelligence artificielle stimule la recherche sur le protéome

Grâce à l'intelligence artificielle, des chercheurs de l'Université technique de Munich (TUM) ont réussi à rendre l'analyse de masse des protéines de n'importe quel organisme beaucoup plus rapide qu'auparavant et presque sans erreur. Cette nouvelle approche est appelée à provoquer un changement considérable dans le domaine de la protéomique, car elle peut être appliquée à la fois en recherche fondamentale et clinique.

Le génome de tout organisme contient les plans de milliers de protéines qui contrôlent presque toutes les fonctions de la vie. Des protéines défectueuses entraînent des maladies graves, telles que le cancer, le diabète ou la démence. Par conséquent, les protéines sont également les cibles les plus importantes pour les médicaments.

Pour mieux comprendre les processus de la vie et les maladies et développer des thérapies plus adaptées, il est nécessaire d'analyser simultanément le plus de protéines possible. Actuellement, la spectrométrie de masse est utilisée pour déterminer le type et la quantité de protéines dans un système biologique. Cependant, les méthodes actuelles d'analyse des données continuent de produire de nombreuses erreurs.

Une équipe de l'Université technique de Munich dirigée par le scientifique en bio-informatique Mathias Wilhelm et le biochimiste Bernhard Küster, professeur de protéomique et de bioanalyse à l'Université technique de Munich, a maintenant réussi à utiliser des données protéomiques pour former un réseau neuronal de manière à ce qu'il soit capable de reconnaître les protéines beaucoup plus rapidement et presque sans erreur.

Une solution à un problème grave

Les spectromètres de masse ne mesurent pas directement les protéines. Ils analysent des parties plus petites constituées de séquences d'acides aminés avec jusqu'à 30 blocs de construction. Les spectres mesurés de ces chaînes sont comparés à des bases de données afin de les attribuer à une protéine spécifique. Cependant, le logiciel d'évaluation ne peut utiliser qu'une partie des informations que contiennent les spectres. Par conséquent, certaines protéines ne sont pas reconnues ou sont reconnues de manière incorrecte.

"C'est un problème sérieux", explique Küster. Le réseau de neurones développé par l'équipe TUM utilise toutes les informations des spectres pour le processus d'identification. "Nous manquons moins de protéines et faisons 100 fois moins d'erreurs", déclare Bernhard Küster.

Applicable à tous les organismes

"Prosit", comme les chercheurs appellent le logiciel d'IA, est "applicable à tous les organismes du monde, même si leurs protéomes n'ont jamais été examinés auparavant", explique Mathias Wilhelm. "Cela permet des recherches qui étaient auparavant inconcevables."

Avec l'aide de 100 millions de spectres de masse, l'algorithme a été si largement entraîné qu'il peut être utilisé pour tous les spectromètres de masse courants sans aucune formation supplémentaire. "Notre système est le leader mondial dans ce domaine", déclare Küster.

Un marché qui vaut des milliards

Cliniques, sociétés de biotechnologies, sociétés pharmaceutiques et instituts de recherche utilisent des appareils performants de ce genre dont le marché vaut déjà des milliards. Avec "Prosit", il sera possible de développer à l'avenir des instruments encore plus puissants. Les chercheurs et les médecins seront également mieux et plus rapidement en mesure de rechercher des biomarqueurs dans le sang ou l'urine des patients, ou de surveiller l'efficacité des thérapies.

Les chercheurs fondent également de grands espoirs sur la recherche fondamentale. "La méthode peut être utilisée pour traquer de nouveaux mécanismes de régulation dans les cellules", explique Küster. "Nous espérons acquérir ici une somme considérable de connaissances qui, à moyen et long terme, se traduiront dans le traitement des maladies dont souffrent les humains, les animaux et les plantes."

Wilhelm s'attend également à ce que "les méthodes d'IA telles que Prosit changent bientôt le domaine de la protéomique, car elles peuvent être utilisées dans presque tous les domaines de la recherche sur les protéines".


Omics, convergence continue et au-delà

La recherche translationnelle sur les accidents vasculaires cérébraux présente un potentiel énorme, car il s'agit d'une maladie qui se manifeste non seulement par de multiples interactions cellulaires dans le cerveau lui-même, mais également dans le contexte d'interactions multi-organes. C'est là que la technologie omique peut offrir une puissance et une perspective inestimables pour étudier la complexité.

Peut-être, pour susciter la réflexion, devons-nous chercher une définition plus large de la reproductibilité dans le contexte du bruit et de la complexité biologiques ? Étant donné que les changements biologiques intrinsèques sont détectés par la méthodologie omique, l'interprétation nécessite une reconstruction informatique et mathématique innovante et plus complexe pour incorporer une nouvelle dimensionnalité dans l'analyse des données. Bien que la génomique partage beaucoup de similitudes avec la protéomique, il existe des différences fondamentales. Peut-être devons-nous utiliser d'autres moyens pour juger de la “reproductibilité” dans les données protéomiques telles qu'un convergence continue de signaux et de modèles pour mettre en contexte l'équilibre dynamique de l'homéostasie dans le temps et dans l'espace ? De plus, le génome et le protéome peuvent-ils se croiser et donner des informations plus robustes ? Les omiques n'incluent-ils que le génome et le protéome ? Qu'en est-il des autres profils omics—métabolomiques—les produits vivants du génome/protéome ? L'omique nous permet de découvrir les perspectives émergentes et très différentes d'une entité biologique en constante évolution. Notre défi actuel de comprendre et de rationaliser les données multidimensionnelles et de visualiser le paysage complet d'une entité biologique peut être également récompensé par la connaissance de ces nouvelles perspectives ajoutées.


Voir la vidéo: Problem Set 6, Problem 2: Mechanism of Phosphoglycerate Mutase (Août 2022).