Una guida per i metodi e il software di predizione della struttura delle proteine

Per esercitare le loro funzioni biologiche, le proteine ​​si piegano in una o più conformazioni specifiche, dettate da interazioni non covalenti complesse e reversibili. La determinazione della struttura di una proteina può essere ottenuta mediante tecniche che richiedono tempo e relativamente costose come la cristallografia, la spettroscopia di risonanza magnetica nucleare e l'interferometria a doppia polarizzazione. Sono stati sviluppati software di bioinformatica per calcolare e prevedere le strutture proteiche in base alle loro sequenze di aminoacidi.

Un riassunto sulla struttura delle proteine

In alternativa alle tecniche sperimentali, l'analisi della struttura e gli strumenti di previsione aiutano a predire la struttura delle proteine ​​in base alle loro sequenze di aminoacidi. Risolvere la struttura di una data proteina è molto importante in medicina (ad esempio nella progettazione di farmaci) e in biotecnologia (ad esempio nella progettazione di nuovi enzimi). Il campo della predizione della proteina computazionale è quindi in costante evoluzione, in seguito all'aumento della potenza computazionale delle macchine e allo sviluppo di algoritmi intelligenti.

Esistono quattro livelli di struttura proteica (figura 1). Nella previsione della struttura proteica, la struttura primaria viene utilizzata per prevedere le strutture secondarie e terziarie.

Le strutture secondarie di proteine ​​sono ripiegate localizzate all'interno della catena polipeptidica che è stabilizzata dai legami idrogeno. Le strutture proteiche secondarie più comuni sono eliche alfa e fogli beta.

La struttura terziaria è la forma finale della proteina una volta che le diverse strutture secondarie sono state ripiegate in una struttura 3D. Questa forma finale si forma e viene tenuta insieme attraverso l'interazione ionica, i ponti disolfuro e le forze di Van de Waals.

Quattro livelli di struttura proteica. Immagine da Khanacademy.org.

Metodi e software di predizione della struttura proteica

Un gran numero di software di predizione della struttura sono sviluppati per funzioni e particolarità proteiche dedicate, come la predizione del disordine, la predizione della dinamica, la predizione della conservazione della struttura, ecc. Gli approcci includono la modellazione di omologia, il threading delle proteine, i metodi ab initio, la predizione della struttura secondaria e l'elica transmembrana e previsione del peptide del segnale.

La scelta del metodo giusto inizia sempre usando la sequenza primaria della proteina sconosciuta e cercando gli omologhi nel database delle proteine ​​(figura 2).

Grafico decisionale per il metodo di previsione della struttura proteica.

Ecco alcuni metodi dettagliati per la previsione della struttura delle proteine:

  • Strumenti di previsione della struttura secondaria

Questi strumenti prevedono strutture secondarie locali basate solo sulla sequenza aminoacidica della proteina. Le strutture previste vengono quindi confrontate con il punteggio DSSP, che viene calcolato in base alla struttura cristallografica della proteina (ulteriori informazioni sul punteggio DSSP qui).

I metodi di previsione per la struttura secondaria si basano principalmente su database di strutture proteiche note e moderni metodi di apprendimento automatico come reti neurali e macchine vettoriali di supporto.

Ecco alcuni ottimi strumenti per la previsione della struttura secondaria.

  • Struttura terziaria

Gli strumenti di predizione della struttura terziaria (o 3D) si dividono in due metodi principali: Ab initio e modellizzazione comparativa delle proteine.

I metodi di previsione della struttura proteica ab initio (o de novo) tentano di prevedere le strutture terziarie da sequenze basate su principi generali che regolano l'energetica delle proteine ​​e / o le tendenze statistiche delle caratteristiche conformazionali acquisite dalle strutture native, senza l'uso di modelli espliciti.

Tutte le informazioni sulla struttura terziaria di una proteina sono codificate nella sua struttura primaria (cioè nella sua sequenza di aminoacidi). Tuttavia, è possibile prevederne un numero enorme, tra cui solo uno ha la minima energia libera e stabilità necessarie per essere ripiegato correttamente. La previsione della struttura proteica di Ab Initio richiede quindi una grande quantità di potenza computazionale e tempo per risolvere la conformazione nativa di una proteina e rimane una delle maggiori sfide per la scienza moderna.

I server più popolari includono Robetta (utilizzando il pacchetto software Rosetta), SWISS-MODEL, PEPstr, QUARK. Sfoglia un elenco completo qui.

Se una proteina di struttura terziaria nota condivide almeno il 30% della sua sequenza con un potenziale omologo di struttura indeterminata, è possibile utilizzare metodi comparativi che sovrappongono la struttura putativa sconosciuta al noto per prevedere la probabile struttura dell'ignoto. La modellazione dell'omologia e il threading delle proteine ​​sono due strategie principali che utilizzano le informazioni precedenti su altre proteine ​​simili per proporre una previsione di una proteina sconosciuta, in base alla sua sequenza.

Il software per la modellazione dell'omologia e il threading delle proteine ​​include RaptorX, FoldX, HHpred, I-TASSER e altro.

Riferimenti

Previsione della struttura proteica de novo. Wikipedia.

Previsione della struttura proteica. Wikipedia