determining ka/ks ratio from aligned molecular sequences

7

Click here to load reader

Upload: somchais

Post on 12-Nov-2014

341 views

Category:

Documents


18 download

DESCRIPTION

This document (in Thai) explains how to determine the Ka, Ks, and its ratio, which is called omega ratio. The ratio is used in the analysis of sequence of an organism. The example is taken from a recently published article in BBRC on the pandemic swine Influenza A virus subtype H1N1.The html version can be found on my website.Please make your comment.

TRANSCRIPT

Page 1: Determining Ka/Ks ratio from aligned molecular sequences

page 1 ©Somchai Saengamnatdej 2009

การวิเคราะห์ลำดับเบสจากการพิจารณาค่าอัตราส่วน Ka/Ks

การหาค่า Ka (non-synonymous nucleotide substitution) และ Ks (synonymous nucleotide substitution) ทำได้ 2 วิธีคือ วิธีประมาณค่า (Approxi- mate method) และวิธีแมกซิมัม-ไลค์ลิฮูด (Maximum-likelihood method) โดยวิธี approximate method จะมี 3 ขั้นตอน คือ (1.) นับจำนวนตำแหน่งที่เป็น syno- nymous และที่เป็น non-synonymous (2.) นับจำนวน การแทนที่ชนิด synonymous และชนิด non-synony- mous และ (3.) ปรับค่า(correcting)สำหรับการแทนที่ ซ้ำหลายครั้ง (multiple substitutions) ส่วนวิธีแมกซิมัม-ไลค์ลิฮูด เป็นวิธีที่ใช้ทฤษฎีความน่าจะเป็นมาใช้

สมชาย แสงอำนาจเดช

การหาค่า Ka และ Ks โดยใช้โปรแกรม PAL2NAL ร่วมกับ PAML

PAL2NAL ของ EMBL เป็นเซริฟเวอร์บริการแปลง การจัด เรียงของสายโปรตีนหลายสายเป็นการจัดเรียงของ โคดอน โปรแกรมนี้สามารถดาวน์โหลดไปติดตั้งใช้งานส่วนตัวได้ ด้วยโดยเวอร์ชั่นล่าสุด v.12.2

Page 2: Determining Ka/Ks ratio from aligned molecular sequences

page 2 ©Somchai Saengamnatdej 2009

ข้อมูลที่ป้อนเข้า การจัดเรียงของสายโปรตีนและลำดับ- ดีเอ็นเอ(หรือmRNA) ของโปรตีนนั้น (โปรแกรมยังออกแบบ ให้สามารถทำงานได้แม้ว่าลำดับดีเอ็นเออาจไม่ตรงกับโปรตีน อาจมีบริเวณที่ไม่แปลรหัส และอาจมีโพลีเอรวมอยู่ด้วย) นอกจากนี้ในข้อมูลที่ป้อนอาจมี stop codon และ frame shift และยังสามารถกำหนดบริเวณภายในการจัดเรียงของ ข้อมูลป้อนเข้า เพื่อที่จะวิเคราะห์โดเมนหรือเอ็กซอนที่สนใจได้

http://www.bork.embl.de/pal2nal

Page 3: Determining Ka/Ks ratio from aligned molecular sequences

page 3 ©Somchai Saengamnatdej 2009

ในโปรแกรม PAL2NAL มีตัวเลือก 6 ตัวเลือก

1. Select a codon table ตารางโคดอน เลือกได้สองแบบ แบบมาตรฐาน (universal) เป็นแบบที่โปรแกรมตั้งค่าไว้ แต่สามารถเปลี่ยนเป็นโคดอน ที่ใช้ในไมโตคอนเดรียของ สัตว์มีกระดูกสันหลัง

2. Remove gaps and inframe stop codons การนำเอาช่องว่างและโคดอนหยุดแปลรหัสออก กรณีที่ต้อง การนำผลไปคำนวณหาค่าอัตราส่วนโอเมกาต่อด้วยโปรแกรม codeml ให้เลือกตัวเลือกนี้ด้วย

3. Calculate Ks & Kaคำนวณค่า Ks และ Ka ถ้าเลือกตัวเลือกข้อสองและข้อมูลเป็น คู่ของลำดับ สามารถเลือกตัวเลือกนี้ได้ จะคำนวณค่า Ks และ Ka ด้วยโปรแกรม codeml ให้ด้วย (โปรแกรมจำกัดให้ วิเคราะห์เป็นคู่ๆของลำดับ เพื่อลดงานคำนวณเพิ่มเติมของ การวิเคราะห์)

4. Remove mismatches เลือกตัวเลือกนี้เพื่อให้โปรแกรมตัดส่วนของโคดอนที่ไม่ตรงกับลำดับโปรตีน

5. Use only selected positionโปรแกรมจะเลือกบางส่วนที่ต้องการเท่านั้น (คือส่วนที่ มีเครื่องหมาย #)

6. Output formatฟอร์แม็ทของผลที่ได้มีให้เลือกสามแบบ คือ CLUSTAL, PAML, และ FASTA

Page 4: Determining Ka/Ks ratio from aligned molecular sequences

page 4 ©Somchai Saengamnatdej 2009

การคำนวณหาอัตราการแทนที่นิวคลีโอไทด์ (synonymous, Ks และ non-synonymous, Ka)

จะใช้ผลการจัดเรียงโคดอนที่ได้จาก PAL2NAL ไปเป็น อินพุทสำหรับโปรแกรม codeml ในชุดโปรแกรม PAML ค่า Ks และ Ka จะอยู่ตอนท้ายของไฟล์ผลจากโปรแกรม codeml

นอกจากนี้ PAL2NAL ยังมีประโยชน์ในการใช้หาชนิด การแทนที่นิวคลีโอไทด์และวิเคราะห์ซูโดยีน (pseudogene)

Page 5: Determining Ka/Ks ratio from aligned molecular sequences

page 5 ©Somchai Saengamnatdej 2009

ตัวอย่างการใช้

ในวิเคราะห์การเกิดไวรัสไข้หวัดใหญ่สายพันธุ์ใหม่ พบว่าการคัดเลือกสายพันธุ์ทำให้เกิดสายพันธุ์ใหม่

นักวิจัยเริ่มจากการสร้างแผนภูมิต้นไม้วงศ์วาน วิวัฒนาการจากลำดับโปรตีน neuraminidase (NA) โดยใช้วิธี Neighbour joining ในโปรแกรม MEGA4 พบว่าสายพันธุ์ที่ระบาดในปี 2009 มีความใกล้ชิดหรือ คล้ายกับสายพันธุ์ที่ระบาดในปี 1918 มากกว่าสายพันธุ์ อื่นๆที่เพิ่งระบาดในไม่กี่ปีที่ผ่านมา (2001, 2002, 2003, 2004, 2005, 2006, 2007 และ 2008) จากนั้นทำการ วิเคราะห์ค่าอัตราส่วนของ Ka/Ks

แปลผลค่าอัตราส่วน Ka/Ks (Omega ratio)

กรณีที่ไม่มีภาวะการคัดเลือก (Neutral evolution) ค่าอัตราส่วนจะเท่ากับ 1 คือ Ks = Ka

ถ้า > 1.0 อาจเนื่องจากการเกิดการคัดเลือกแบบ positive Darwinian selection

ถ้า <1.0 อาจเนื่องจากการเกิดการคัดเลือกแบบ purifying (stabilizing) selection

ในกรณีนี้ทีมนักวิจัยได้กำหนดนิยามเพิ่มเติมให้ อััตราส่วนที่น้อยกว่าหรือเท่ากับ 0.1 เป็น extreme purifying selection และผลการวิเคราะห์ไวรัสไข้หวัด ใหญ่ที่ระบาด 8 ปี (2001-2009) เทียบกับสายพันธุ์ ที่ระบาดในปี 2009 พบว่า 7 ใน 10 ยีนซึ่งประกอบ

Page 6: Determining Ka/Ks ratio from aligned molecular sequences

page 6 ©Somchai Saengamnatdej 2009

ด้วย HA, NA, PB2, PB1, PA, NP, และ M1 เกิด extreme purifying selection ส่วน M2, NS1, และ NS2 มีค่าอัตราส่วนนี้มากกว่า 0.1

คำว่า Purifying selection มีชื่อพ้องว่า stabilizing selection หรือ ambidirectional selection เป็นการ คัดเลือกตามธรรมชาติชนิดที่หลังจากการคัดเลือกความ- หลากหลายทางพันธุกรรม ของสิ่งมีชีวิตชนิดหนึ่งลดลง และประชากรของสิ่งมีชีวิตชนิดนั้นๆมีส่วนใหญ่มีคุณ- ลักษณะ(trait value)อย่างใดอย่างหนึ่ง(คิอมีคุณลักษณะ ที่คงที่หรือเสถียร) หรือกล่าวอีกอย่างคือไม่รับเอาคุณ- ลักษณะชนิดสุดขั้ว กลไกการคัดเลือกตามธรรมชาติแบบ นี้อาจเป็นกลไกที่พบบ่อยมากที่สุด เป็นการคัดเลือกที่ พบมากในประชากรส่วนใหญ่ เป็นวิธีที่ป้องกันความแตก-ต่างออกไป(divergence) ของรูปแบบและหน้าที่ทำให้ ลักษณะกายวิภาคส่วนใหญ่ของสิ่งมีชีวิตบางชนิดไม่เปลี่ยนแปลงเป็นเวลา หลายล้านปี

หมายเหตุ

Page 7: Determining Ka/Ks ratio from aligned molecular sequences

page 7 ©Somchai Saengamnatdej 2009page 7 ©Somchai Saengamnatdej 2009