biologie generalĂ - moleculară şi celulară - curs xiii · metoda sanger, cea ce utilizeză...
Post on 09-Sep-2019
7 Views
Preview:
TRANSCRIPT
BIOLOGIE GENERALĂ
- moleculară şi celulară -
CURS XIIIBLAST
Baze de date cu secvenţe
Metoda Sanger, cea ce utilizeză terminatori marcaţi fluorescenţi şi metodele de nouă generaţie au permis acumularea unui număr foarte mare de secvenţe ceea ce a dus la necesitatea organizării lor şi prelucrării lor computerizate – apare bioinformatica.
Bases SequencesDec 1982 680338 606
Nov 1983 2274029 2427
May 1984 3002088 3665
Sep 1984 3323270 4135
Oct 1984 3368765 4175
Nov 1984 3689752 4393
May 1985 4211931 4954
Sep 1985 5204420 5700
Feb 1986 5925429 6642
May 1986 6765476 7416
Aug 1986 8442357 8823
Nov 1986 9615371 9978
Oct 2014 181563676918 178322253
Dec 2014 184938063614 179295769
Feb 2015 187893826750 181336445
Apr 2015 189739230107 182188746
Bioinformatica – ansamblul de metode şi tehnici ce permit stocarea, manipularea şi interpretarea informaţiei genetice – definiţia restrânsă !!!!
ADN ARN Proteine
Complementaritatea bazelor azotate
universalaCodul Genetic
~universal
Informaţie Informaţie
1. Stocarea informaţiei genetice – baze de date cu secvenţe:A) ADN - GenBank - http://www.ncbi.nlm.nih.gov/genbank/
INSDC - http://www.insdc.org/B) ARN – RNACentral - http://rnacentral.org/
ARNr - Silva - http://www.arb-silva.de/C) proteine: – secveţe de aminoacizi - Protein database http://www.ncbi.nlm.nih.gov/protein- structuri 3D - wwPDB - http://www.wwpdb.org/
NCBI - National Center for Biotechnology Information – baze de date cu secvenţe, structuri, compuşi chimici, literatură, etc
Baze de date cu secvenţe
2. Manipularea informaţiei genetice – informaţia este organizată în bazele de date sub formă de secvenţe. O secvenţă poate fi:● o însiruire de baze azotate ce descrie structura primară a unui fragment dintr-o moleculă de ADN sau
ARN. O secvenţă ADN poate cuprinde un fragment, o genă sau un grup de gene. ● o însiruire de aminoacizi ce descrie structura primară a unei proteine sau a unei porţiuni dintr-o
proteină
Indiferent de tip, o secvenţă este cel mai frecvent stocată sub forma unui fişier FASTA – un fişier text în care:- pe primul rând de text, marcat cu “>“ se află o serie de informaţii cu caracter opţional, precum numărul de ordine în GeneBank, specia sau denumirea genei (proteinei).- pe următoarele rânduri se află secvenţa propriu-zisă, în care nucleotidele/aminoacizii sunt reprezentaţi folosind codul standard IUPAC cu o singură literă
Compararea secvenţelor
3. Interpretarea informaţiei genetice – cunoaşterea secevenţei de nucleotide a unui fragment de ADN sau a unei proteine nu înseamnă obligatoriu şi cunoaşterea rolului (funcţiei moleculei).
Pentru identificarea computerizată a funţiei unei proteine sau gene necunoscute se pleacă de la următoarele premize:
1. toate proteinele au evoluat din alte proteine prin mutaţia aleatoare a aminoacizilor din secvenţa primară
MAAKYRIGYFVGSLATGSINRVLSQALINLAPEDLEFSEIPIRDLPLYSYDYDADFPPEGR
3. Secvenţele de aminoacizi ale proteinelor nu au caracter randomic, ci prezintă mai degrabă un anumit grad de similaritate ceea ce permite compararea lor.
2. înlocuirea unui aminoacid cu altul într-o proteină nu este întoteauna aleatoare ci este rolul aminoacizilor în cadrul proteinei. Au fost 3 categorii distincte:
a) aminoacizi înalt conservaţi - nu sunt înlocuiţi decât extrem rar - sunt aminoacizii din situsul catalitic sau funcţional, responsabili în mod direct de realizarea funcţiei;
b) aminoacizi conservaţi - sunt înlocuiţi destul de rar - sunt aminoacizii implicaţi în
realizarea structurilor secundare şi terţiare; c) aminoacizi puţin conservaţi - sunt înlocuiţi frecvent
- sunt în general aminoacizii de pe suprafaţa proteinelor;
SELECŢIE
ANAAREMERE
ANARREMERE
ANAAREMERE
NNARREMERE
ALMAREESRE
ANCDREMSRE
AN
AA
RE
NE
RE
ANMSAREM
ERE
ANAAREMERE
ANAACRSDERE
BLAST
BLAST (engl.Basic Local Aligment Search Tool) – program compară o secvenţă de interes cu o bibliotecă de secvenţe cu funcţie cunoscută dintr-o bază de date. Prin identificarea în baza de date a secvenţelor cunoscute care prezintă un înalt grad de similaritate cu secvenţa de interes, poate fi precizată funcţia acesteia din urmă.
BLAST utilizează următoarele noţiuni: 1. Alinierea a două sau mai multe secvenţe - fiecare aminoacid (nucleotid) din secvenţa A este comparat cu aminoacidul (nucleotidul) corespunzător din secvenţa B. O orespondenţăîntre doi aminoacizi (nucleotide) din aceeaşi poziţie pe cele două secvenţe poartă numele de identitate, iar o neconcordanţă se numeşte substituţie.
2. Similaritatea la nivel de secvenţă se referă la două secvenţe care prezintă asemănăriuna în raport cu cealaltă datorită unui număr mai mare sau mai mic de aminoacizi identici.
3. Omologia se referă la faptul că două secvenţe se aseamănă una cu cealaltă datorită evoluţiei dintr-un strămoş comun, dar nu sunt obligatoriu similare.
http://blast.ncbi.nlm.nih.gov/Blast.cgi - diverse variante de BLAST – blastn – pentru secvenţe de nucleotide, blastp – pentru secvenţe de aminoacizi
Funcţionarea programului BLAST
Programul BLAST realizează în ordine:● Identificarea din baza de date a secvenţelor similare cu o secvenţă ţintă. Secvenţele
identificate poartă numele de secvenţe “subiect” - De ce nu nu e o singură secvenţă?● Cuantificarea nivelului de similaritate dintre secvenţa ţintă şi cele subiect prin utilizarea
unor matrici de substituţie. O matrice de substituţie arată frecvenţa cu care un aminoacid este înlocuit cu altul şi au la bază observaţiile experimentale.
● Calcularea unui scor al alinierii prin însumarea punctelor pentru fiecare pereche aminoacid-aminoacid şi ierarhizarea secvenţelor ţintă funcţie de valoarea acestui scor. Cu cât scorul este mai mare, cu atât secvenţele sunt mai similare.
Funcţionarea programului BLAST
Realizarea unei căutări folosind BLAST
A – căsuţa text în care a fost inserată secvenţa ţintă înformat FASTA; B – zona cu parametrii utilizaţi pentru restrângerea spaţiului de căutare;C – buton pentru lansarea investigării; D – zona cu parametrii algoritmului de căutare
A – informaţii privind interogarea realizată; B – domeniile înalt conservate identificate;C – prezentarea grafică de ansamblu a rezultatelor; D – tabel cu secvenţele identificate;E – exemplu de aliniere între secvenţa de interes şi o secvenţă subiect identificată prinBLAST.
Bibliografie recomandată
Biology, 6th Edition
Raven, Peter H.; Johnson, George B.
Published by McGraw-Hill, Boston, MA, 2002ISBN 10: 0073031208 / ISBN 13: 9780073031200
Structural Bioinformatics
2nd Edition
Jenny Gu (Editor), Philip E. Bourne (Editor)ISBN: 978-0-470-18105-81096 pagesApril 2009, Wiley-Blackwell
Biologie Moleculară
Metode experimentale
Mihăşan M., Olteanu Z., Ştefan M.,Editura Universităţii Alexandru I CuzaISBN: 978-973-703-816-6
top related