البرمجة الحيوية bioinformatics

20
ة ي ت وما ل ع م ل ا ة ي و ي ح ل اBIOINFORMATICS ث ح ب سن ي ف ا هذ ل ص ف ل ا ر ي خ الأ ن* م ء ز ج ل ا ي ن ا ث ل ا ي ف ال ج م ة ي ت وما ل ع م ل ا، ة وي ي ح ل ا ة ي ا ش ناص ص< ت خ كا ة ج ب< نA ن ل م كا ت ن*E ي ن ي م ل ع وب س جا ل ا ا ث خ و ل و يO لن وا رب هT ظ. ة ي ن ن ز ج ل اW ر ي ث ك ل ا ن* م اب وب ع ص ل ا اء ث_ ’ت ا ة اي ث ك ذمة ق م ل ا ا هذ ل ها ل و ل. ا ص ف ل ا م ك* ن م ل ث ص ا ق ت ل ا م ز ل ب حاطةp لأ ل ها ي ت ا ع. وب و ض و م ل ا ب كان*ً ا ق ل ت ح م ي ط ع وا زةT ظ ن رب ق ا ن* ع ور ط ن ا هذ ل ق ح ل ا ن* م ث بس ن م. عل ل ا عة تO ب ط ا هذزع لف ا ن* م م عل ل ا اك ث ه ف ر ي ث ك ل ا ن* م وماب ل ع م ل ا رة ق و ي م ل ا ة ي ع ي عل كة ث ش* ن م ض ت ت. ت ن ر يA ي الأ لك ذ وماب ل ع م ة ي ش سا ا ة ي ل ث ص ف ت و ول ح لك وع. لذ ض و م ل ا كان* ذ لأب ن* م* ذراجp ا ’ مة ئ ا ق ع ق وا م ئ ت ن ر يA ي الأ ي لت وا زف ع ت ها ن ا ب صاذر م ر ي غ ة ي م س ر( ULRs ) Uniform Resource Locators ت ل . حاو صار< ت خ اار ك الأ’ ف واب ط خ ل وا ة ي شلأ’ سا ا ة ق ل ع ت م ل ا وع ض و م ل ا بً ذلأ ب ن* م ل ث ص ا ق ت ل ا وذ ح و لW ر ي ث ك ل ا ن* م ع ق وا م ت ن ر يA ي الأ وص ص ت ل وا ة جاوي ل ا ي عل وماب ل ع م ة ي ل ث ص ف ت* ن ع W ة ي ت وما ل ع م ل ا W ة وي ي ح ل ا ي لت وا عذ تً صذرا م ل ول ص ح ل ي عل ة زف مع ذ وح ي. ذة ث خ ي ف ذول ج ل ا9.1 ’ مة ئ ا ق ع ق وا م ل ا ب ي لت ا عذ ت صاذر م ر ي غ، ة ي م س ر ن* ك م ئ م عل ت م ل ل لأق ط ن الأ ة ق زت لظ. وا ها مي ل ص ف الأ م عل ت ل ل ي ه ث ح ب ل ا ي ف مذى ع س و ا ن* م ث ب خ ل ث من ئ، اب اب ثO لن ا ذواب وا ذارةp الأ ي لت وا ول ح ت واعذ ق اب اب ثO لن ا ة وي ي ح ل ا ي لp ا اب وب ي س م* ن م ذ ث ق ع ت ل ا W ولة ه س ل وا ي ف ذام ج ت ش الأ لأم ك لا( ث ح ب سن.) ي ست ن ي ف ا هذ ل ص ف ل ا ي ف الأب ج م W ة ي ت وما ل ع م ل ا ة وي ي ح ل ا ي ف و ث ح ب ل ا ت ل ا ث ل ا وف س زى ن* ن ا ها ل اب ق تO ب ط ن ة ي س ي ن ر ي ف ذ عذب ل ا ن* م الأب ج م م عل، اة ث ح ل ا ل ث م ة ج ل عا م. اب ورب م ل ا ل ك ش ي عل ون* عاذة ك ب ي لت ا ة وي ي ح ل ا وماب ل ع م ل ر ا سي ق ت م و يT ظ ت< ت * وW ن ي ز ج ت ي ف وب س جا ل ذام ا ج ت ش ا ة وي ي ح ل ا ة ي ت وما ل ع م ل ن* ا م ض ت< ت م ل

Upload: mohammed-assalh

Post on 29-Jul-2015

213 views

Category:

Documents


2 download

DESCRIPTION

مقدمة عامة عن البرمجة الحيويةمترجمة من كتابة مقدمة إلى الهندسة الوراثية

TRANSCRIPT

Page 1: البرمجة الحيوية Bioinformatics

الحيوية المعلوماتيةBIOINFORMATICS

المعلوماتية مجال في الثاني الجزء من األخير الفصل هذا في سنبحث والبيولوجيا الحاسوب علمي بين تكامل نتيجة كاختصاص نشأته الحيوية،

الفصل. لهذا المقدمة كتابة أثناء الصعوبات من الكثير الجزيئية. ظهرتC كان بالموضوع. وثانيها لإلحاطة يلزم التفاصيل من كم أولها وأعطى مختلفا

من الفرع هذا طبيعة العلم. بسبب من الحقل هذا تطور عن أقرب نظرة االنترنت. شبكة على عنه المتوفرة المعلومات من الكثير فهناك العلم

من البد كان الموضوع. لذلك حول وتفصيلية أساسية معلومات ذلك يتضمن (ULRs) رسمية غير مصادر بأنها تعرف والتي االنترنت بمواقع قائمة إدراج

Uniform Resource Locatorsاألساسية والخطوات األفكار اختصار . حاولت C بالموضوع المتعلقة االنترنت مواقع من الكثير لوجود التفاصيل من بدال

والتي الحيوية المعلوماتية عن تفصيلية معلومات على الحاوية والنصوصC تعد قائمة9.1 الجدول في جيدة. يوجد معرفة على لحصولل مصدرا

منها. االنطالق للمتعلم يمكن رسمية، غير مصادر تعد التي بالمواقع تمثيل حيث من أوسع مدى في البحث هي للتعلم األفضل والطريقة مستويات إلى الحيوية البيانات قواعد تحول والتي اإلدارة وأدوات البيانات،

هذا في نسبي(. سنبحث )الكالم االستخدام في والسهولة التعقيد من أن نرى سوف الثالث البحث وفي الحيوية، المعلوماتية مجاالت في الفصل

معالجة مثل الحياة، علم مجاالت من العديد في رئيسية تطبيقات لهاالمورثات.

What is bioinformaticsالحيوية: المعلوماتية ماهي 9.1C: استخدام بسيطة بمصطلحات الحيوية المعلوماتية وصف يمكن تقانة مثال

فهي الحيوية، البيانات تحليل فيIT (Information Technology) المعلومات في صعوبة هناك ذلك من الرغم الحاسوب. على علم مع الحياة علم تربط تكامل عن ناتج مجاالت. فهو عدة تداخل عن ناتج فهو للموضوع، حدود وضع سريعا موضوعان مشاركة واالستغراب الدهشة يثير وما اختصاصات، عدة

هي ما تعريف صعوبة الحاسوب. رغم وعلم الحياة علم مثل التطورC السهولة من الحيوية المعلوماتية حيوية، بمعلوماتية هو ليس ما تحديد نسبيا

المتسلسلة، البيانات عن البحث في الحاسوب استخدام البساطة من فليس المجال. هذا تطوير أجل من المستخدمين تعاون المعلومات تقانة تتطلب

الحياة، علم من رئيسي فرع الحيوية المعلوماتية أصبحت الحقيقة في لكن الكائن في والبروتينات المورثات لتحليل المعقدة الطرق من مجموعة مع

الحاسوب. وفي والمخبر الحيC انتشرت تفاعل مع الحيوية، المعلوماتية الماضية األخيرة السنوات في كثيرا وتنظيم تخزين عملية لتحسين تنشأ أن يمكن التي بالتطبيقات وتنبؤ عالمي

المعلومات وتفسير وتنظيم تخزين في الحاسوب استخدام الحيوية المعلوماتية تتضمن . كبير بشكل االنترنت شبكة استخدمت متسلسلة بيانات شكل على عادة تكون التي الحيوية،

. العلمي المجتمع مع المعلومات لتشارك

عالمية، شبكة بوساطة المتسلسلة البيانات وتنظيم تخزين في المعلومات تقانة تستخدم. المعلومات تطوير في دور منها ولكل الحيوية المعلوماتية مجال في متقدمة ومراكز

Page 2: البرمجة الحيوية Bioinformatics

المعلوماتية في الرئيسية العناصر بعض اختصار البيانات. حاولت وتحليل.9.1 الشكل في الحيوية

9.2

The role of computer الحاسوب دور مثل المعقدة، البيانات من مجموعة تحليل في مثالي الحاسوب يعتبر

C ذلك والبروتينات. يتطلب النووية لألحماض المتسلسلة البيانات سلسلة غالباC. سهل منفصل بشكل منها كل يعتبر والتي الحسابية، العمليات من نسبيا

من المرات. لذلك ماليين أو آالف الحسابية العملية تكرار يتطلب حيث جامد القصير التتابع أن من دقيق. بالرغم وبشكل بسرعة ذلك إنجاز المهم

أو التسلسل قراءة في الخطأ إمكانية فهناك بالحاسوب باالستعانة لتحليله بشكل برمجتها تم حال في تخطئ وال تتعب ال فالحواسيب التركيز، فقدان

صيغة شكل على المعلومات من كبيرة كمية تخزين صحيح. وبإمكانها مع مشترك تطور حقيقية كفرضية الجينوم تسلسل ظهور رقمية. تطلب

مشروع في المستوى عالية المخرجات مع للتعامل المعلومات تقانة

موقع: يعتبر وتعتبر NCBIو EBIمالحظة المجال هذا في للجدد بالنسبة للبدء جيدة مواقع . المواقع تتضمن أساسية معلومات يقدم اجتماعي موقع الحيوية المعلوماتية منظمة . المواقع كافة تقدم المعلومات من كثيرة لمصادر المفيدة باالرتباطات قائمة الحيوية

البيانات 9.1الشكل هما الداعمان والفرعان البيانات، قواعد هو الحيوية المعلوماتية مركزالخط يمين على تظهر البيانات وإدارة العمودي الخط يسار على تظهر والتي المدخلة

. تقانات. البيانات جمع يتطلب والبرمجيات األجهزة تطور على البيانات إدارة تعتمد العمودي

Page 3: البرمجة الحيوية Bioinformatics

منجز. كاختصاص الصحيح مكانها الحيوية المعلوماتية أخذت الجينوم. لذلك data المعلومات، مخزنdata warehouse مثل جديدة مصطلحات صيغتminingالمعلوماتية جوانب المختلفة" لوصف البيانات أنماط في "التحقيق

البيانات". قواعد مراجع قائمة من "التحققtext mining و الحيوية، المكتبية الحاسوب أجهزة في مذهل تطور الماضية سنة15-10 خالل حدث

لتسهيل رئيسية حواسيب إلى بحاجة نعد لم أن يعني والمخدمات. وهذاC المنخفضة التكلفة ومع الحيوية، البرمجة عملية المكتبية للحواسيب نسبيا على تحوي التي المختلفة البيانات قواعد إلى للوصول كفاية قوية تعد فهي

التكاليف شروط في محظورة المخدم متطلبات تعد ولم المعلومات األجهزة. حيث من المعلومات الستخدام قيود هناك يعد والصيانة. فلم

والمتطلبات المتوفرة الحاسوبية القوة نتيجة البرمجيات وتطورت من الكثير جمعها. ويلزم يتم التي البيانات مجموعة طبيعة من المفروضة

C متاحة وهي منها والتحقق المعلومات لمعالجة البرامج من للمشاركة مجانا المعلومات شبكة بتشغيل تقوم والتي مختلفة، مضيفة منظمات قبل

تجارية شركات من المشاريع بعض تتوفر ذلك من الرغم الحيوية. علىتجارية. كقواعد مختلفة

Biological Data Sets الحيوية البيانات مجموعات9.3C المناقشة تم مع كانت الحيوية للمعلوماتية الحقيقية االنطالقة أن سابقا

هذه (. حتى3.7 المقطع )انظر السريعةDNAالـ سلسلة طرق ظهور ضغط هناك كان لذلك محدود، متسلسلة بيانات على الحصول كان النقطة

المعلومات. بعد مع للتناسب الشائعة والتحليل التخزين طرق لتطوير قليل سرعة وازدادت كبير، بشكل السلسلة تقنيات إنجاز باإلمكان أصبح ذلك وتنسيقها. البيانات إلدارة أكبر الحاجة فأصبحت واضح، بشكل البيانات جمع

بعض يستخدم الذي البسيط المثال إلى بالنظر الحاجة هذه تفسير يمكن 50 قصير تسلسل الشكل هذا (. يوضح9.2) الشكلDNAالـ تسلسالت

مختلفة. بصيغ تمثيله تم آزوتي، أساس

العالم بين وصل كصلة تعمل منها المكتبية أصبحت إن إلى الحاسوبية األجهزة تطورت . عادة البرامج تكون البرامج من وللتحقق المختلفة بالعمليات وللقيام البيانات وقواعد

. العلمي للمجتمع C مجانا متاحة

وتفسير وتنظيم لتخزين واإلجراءات التنسيق من عالي مستوى البيانات إدارة تتطلب . والذي. الحيوية المعلومات شبكة تطور في مذهل إنجاز الراهنة الحالة تمثل المعلومات

. أهميته في البشري الجينوم مشروع يجاري

الـ )a( 9.2الشكل من قصير تسلسل . DNAيوضح مزدوجة سلسلة شكل يوضح )b(علىالتسلسل لكتابة مختلفة طرق . i.ii.iiiثالث في. فقط واحدة سلسلة تمثيل تم biوكالعادة

كل الترقيم مع الكبيرة األحرف نمط في 10استخدم لفصل biiأسس، فراغ استخدممن المكونه وفي 10المجموعات آزوتيه، مع biiiأسس الصغيرة األحرف نمط استخدم

. بين التمييز في الحاصل االرتباك من لألحرف الصغير النمط �جنب ي الفصل G.Cاستخدامتمييز السهل من بـ c,g. (c)حيث حددت قراءة أطر بثالث للتسلسل مفسر إصدار

RF1,RF2,RF3 . هي. هنا الموضحة المنطقة لذلك الصبغي بداية من األسس األرقام توضح

Page 4: البرمجة الحيوية Bioinformatics

العديد هناك أن الواضح من السابق، التسلسل من القصير الطول مع حتىوهي: المعلومات نموذج لصياغة المتطلبات من

للمعلومات. دقيق واستغالل جمع إلى الحاجةمرئية. صيغة في للتسلسالت ومنطقي واضح تمثيلالخصائص. وتحديد توجيه من لنتمكن التسلسل شرحمختلفين. مستخدمين قبل من للشروح المناسب االستخدامC األسس من الماليين من تسلسالت البيانات قواعد في يوجد من بدال

وتفسير ومقارنة تنظيم هي الرئيسية المهمة أن الواضح فمن المئات، ناحية من المكونات أبسط ذاته بحد التسلسل يعتبر الواقع المعلومات. في

ولذلك المتسلسلة، البيانات تخزين طرق من العدد التنظيمي. هناك التعقيد قواعد تصنيف في التفكير المفيد البيانات. ومن قواعد من الكثير يوجد

بالمعلومات خاصة المؤرشفة: وهي رئيسيتين، فئتين إلى البياناتC، المأخوذة المتسلسلة C تعرف وهي تجريبيا الرئيسية. البيانات بقواعد غالبا

األحماض لتسلسالت البيانات قواعد هي اليوم الرئيسية البيانات قواعد أوائل في مقارنتها تم البروتين تسلسالت أن مالحظة المفيد ومن النووية،

قواعد من مستوى أعلى البروتين بيانات قواعد فإن ولذلك التسعينات، من اشتقت بأنها تختلف الثانوية، البيانات النووية. قواعد األحماض بيانات

يمكن المتسلسلة البيانات مجموعات تمثل ما. فهي بطريقة الرئيسية التعبير وبيانات المشتقة البروتين تسلسالت استخدام مختلف بشكل

)مثل النووية األحماض من خاصة لمجموعة المحددة والبيانات المورثي،الثانوية. البيانات قواعد إلنجاز ( كأساسrRNA تسلسالت

Generation and organization of المعلومات وتنظيم جمع9.3.1information

صلب ويشكل علمي منهج أي في أساسي جزء المعلومات جمع يعتبرC رأينا كما الحيوية، المعلوماتية الخطوة كانتDNAالـ سلسلة فإن سابقا

والمتطلبات وكافية كبيرة بكميات البيانات بجمع للبدء الضرورية األولى مع العلمية الثورة الحيوية. ظهرت البيانات قواعد وتنظيم لتنسيق الكبيرة عام في آزوتي أساسphi-X174( 5386 البكتريوفاج جينومات سلسلة هناك أن الفترة هذه خالل المهتمون (. أدرك48502bp، 1982) ( والمدا1977 من القصوى الفائدة تحقيق أجل من البيانات إلدارة تشاركيه لطريقة حاجة

قواعد في الحاصل التطور تفسير تحديدها. يمكن تم التي التسلسالت اللذين الرئيسيين النمطين في سريعة نظرة طريق عن المتسلسلة البياناتوالبروتينات. النووية لألحماض المتسلسلة البيانات من يتعامالن

Nucleicالنووي))ة األحم))اض بيان))ات قواع))د9.3.2 acid databases عــام فيEMBL بواســطة النوويــة لألحمــاض بيانــات قاعــدة أول إنجــاز تم

بــدأ1986 عــام وفي ،USA في الجيني البنك أنشئ بقليل ذلك . بعد1980DDBIتعــاون البيانــات لقواعــد الثالث المــزودات هــذه كونت البيانات بجمع

. التمييز من بالرغم ثانوية وأخرى أساسية بيانات قواعد إلى الحيوية البيانات قواعد تصنف. C تعقيدا أكثر أصبح التفسير كون البيانات قواعد تقانة تطور مع أهمية أقل أصبح بينهما

الـ سلسلة طرق اكتشاف بعد وذلك ،C تشاركيا البيانات إلدراة حاجة هناك أن الواضح من بداDNA. المتسلسلة البيانات من كافية لكميات وإنتاجها متاحة أصبحت وكونها ،

Page 5: البرمجة الحيوية Bioinformatics

ــذا المفصــلة. لعب النووية األحماض لبيانات الرئيسي المصدر شكل دولي هC النوويــة األحماض تسلسل بيانات لقواعد الدولي الالتحاد اإلشــراف في دورا

ــذا على ــاون، ه ــك إن التع EMBL األوروبي البن Bankــل من مستضــاف قب بواســطة تشــغيله يتمUSA في أمــا الحيويــة، للمعلوماتيــة األوروبي المعهــد

NCBIأما . DDBJأكــثر للوراثــة. إحــدى الوطــني المعهد قبل من مستضاف في الكبــيرة الزيــادة هي النوويــة األحمــاض بيانات لقواعد المميزة السمات

وصـلت والـتي لإلعجــاب المثيرة الزيادة المدخلة. وضحت التسلسالت حجم النقطــة هــذه عنــد الثمانينــات. انتقــل منتصف في250Mb(megabases) إلى

C األكــبر إلى الضــيق المجــال ذات المشــاريع منDNAالـ سلسلة وهــو نســبياC. توضــح البيانــات نســبة ازدادت الجينوم. ولــذلك 9.5 و9.4 األشــكال كثــيرا

9.4 الشـكل األخـيرة. يوضـح العشـرة األعـوام في الحاصلة األخيرة الزيادةGene الجينــات بنــك بواســطة مسجلة هي كما البيانات Bankإلى باإلضــافة C الشكل البيانات. يوضح تسلسل البيانــات. مثــل اســتخدام في التطــور أيضــا

المقــدار هذا متوقع هو وكما البيانات، قواعد في اليومية البحث عمليات ذلكنفسها. البيانات قاعدة في الزيادة يعكس االستخدام من

الرئيسية الثالث القواعد مراقبة في النووية األحماض بيانات لقاعدة الدولي االتحاد يساعدللتسلسالت.

.9.3الشكل النووية األحماض لتسلسالت الدولية البيانات قاعدة مدخالت في األولية الزيادةالفترة ( في المحملة التسلسالت بيانات المدخالت الغيغا) 1994-1982تمثل رتبة من (وهي

gigabases( .

بيانات 9.4الشكل قاعدة في عام Gene Bankالزيادة تسلسل 1995منذ كامل عرض تم . عن, المعلومات استخدام مقدار عرض تم عنه الناتج الجينات بنك بيانات وتسلسل البيانات

. C يوميا الباحثين قبل من المطلوبه البيانات قواعد عدد طريق

Page 6: البرمجة الحيوية Bioinformatics

هي كمــا النوويــة األحمــاض بيانــات قاعــدة في الزيــادة9.5 الشــكل يوضــح كمــا المدخلة الكلية التسلسالت ويوضح األوروبي، الجيني البنك في مسجلة

طريــق عن ركبت والتي البيانات، لقواعد المختلفة اإلصدارات في نشرها تم األمــريكي، "األوروبي، الثالثــة المضــيفات أحــد قبــل من التسلســالت تخزين

بين اليومي البيانات تبادل . إن( Gene Bank, EMBL-Bank, DDBJ)الياباني"ــات لقاعدة دائم تحديث هناك أن يعني الثالث المنظمات ــوفرة وهي البيان مت

في2005 أيلــول في100gb البيانــات قاعـدة وقت. تجاوزت أي في ومتاحة عالميــة" لهـذا "شــهرة واســع انتشـار المـدهش اإلنجاز . تضمن84a اإلصدار بحلول البيانات قاعدة سنة. ضمت25 فترة على طور والذي الدولي االتحاد 273000 حــوالي من مــدخل81 حــوالي في نكليوتيــد بليــون148 2006

حي. كائن

Proteinال)))))))بروتين بيان)))))))ات قواع)))))))د9.3.3 Databases بين التميــيز المهم من البروتينــات تسلســل بيانــات قواعــد عن عامــة بلمحة

الــبروتين وتسلســالت مباشــرة، بطــرق المحــددة البيانــات قواعــد مــدخالتللـــ المتوقعـة الترجمـة طريقـة عن النوويــة األحمـاض قواعـد من المشـتقة

mRNAجمــع مــع النوويــة األحمــاض لسلســلة المباشــرة الطريقــة . تتشــابه C الممكن المصــدر. ومن البروتين من مباشرة البيانات التحاليــل إجــراء غالبــا

المتعلقــة الصــفات كامــل جمــع يتم لــذلك والكيمياحيويــة. نتيجــة الفيزيائيــةــالبروتين ــافة ب ــاط إلى باإلض ــوي النش ــة في الحي ــات حال ــلة البيان المسلس

ال األمينيــة. وبالتــالي األحمــاض في الحاصل التعديل تحديد يمكن ال المشتقة الخليــة. إحــدى في وظيفي غــير أو وظيفي أنــه الــبروتين على الحكم يمكن

أن على التأكيــد هــو البيانــات قواعد مطوري تواجه التي األساسية التحديات

C مدهشة النووية األحماض بيانات قاعدة زيادة أصبحت أيلــول في100Gb تجــاوزت فقـد جدا.2005 عام

األوروبي. البنك في1995 عام منذ النووية األحماض بيانات قاعدة حجم زيادة9.5 الشكل 100Gb و ،Gb(1,10) بـ تمثل . وهي52,65,78,79,85 وهيRLبـ المنشور اإلصدار إلى يشار

) اإلصدارات بين كانت البيانات قاعدة في األسية الزيادة وفترة ،52,65,85 اإلصدارات في الحيوية المعلوماتية "معهد األوروبي البنك بيانات استخدام عن ناتج الشكل . هذا(78-79

األوروبي".

Page 7: البرمجة الحيوية Bioinformatics

البيانــات تحويــل يتجنبــون لــذلك بعضــها مــع تتحدث أن يمكن البيانات قواعدــبروتين المباشرة السلسلة اإلمكان. وجدت قدر المعقدة ــام في لل 1950 عclassical) التقليــدي بالتفســخ وتــدعىEdman بواسطة degradation)على .

بعض دهشــة أقــل كــانت الــبروتين بيانــات قواعد ازدياد سرعة فإن حال كل في الصــعوبات إلى كبــير بشــكل يرجــع النوويــة. وهــذا األحمــاض من الشي فالبروتينــات المورثــات في الحــال هي كما األمينية األحماض تسلسل تحديد

ماعـدا الهيكليــة السـمات على يعتمـد حيــوي ونشـاط معقـدة ثالثيــة بينة لها على الــبروتين سلســلة تقنيــات في األخير التطور األساسي. يزود التسلسل

فقـد الكتلـة ومطيـاف ،Edman طريقـة اسـتخدام عن الناتجـة المثال سبيلC العملية طورت أكــبر بشــكل بالمعلومات المستنسخDNAالـ فسلسلة كثيرا

القيــود من الــرغم الببتيــد. على جــزء في األمينية األحماض بقايا سلسلة من المتـوفرة البيانـات قواعد فإن البروتين تسلسالت جمع عملية في الموجودة

C " للبروتينــات الرئيســي الحيــوي. المصــدر للمجتمــع قيم مصــدر تمثــل حالياUniversal Protein Knowledgebase" UniPro KB، درجة على يحافظ والذي

الــرغم جمعهــا. على تم التي التسلسالت وتفسير والدقة التماسك من عاليةــزا فال المدخالت مصطلح في صغيرة بيانات قواعد مصادفة من مســتوى لي

C الـبروتين تسلسـل عن المتوفرة البيانات الكتابـة وقت لإلعجــاب. في مثــيراــإن ــدد ف ــدخالت ع ــالمي المصــدر في الم ــتي الع إلى وصــلت نشــرها تم ال في إيجادها يمكن التفصيالت من مليون. للمزيدUniProKB 3.5و مليون7.7

. 9.3 الجدول في المدرجة المواقع

Using bioinformatics as a كأداة الحيوية المعلومات استخدام9.4tool نظرة طريق عن الحيوية المعلوماتية مجال توضيح تم

ــريعة ــات على س ــد منظم ــات قواع ــاض البيان ــة لألحم ــات. النووي والبروتين المعلومــات؟ هــذه مثل استخدم أن يمكن بماذا نفسن يطرح الذي والسؤال

C! ومن أصعب األشياء تصبح النقطة هذه عند ذلــك توضــيح الممكن غــير قليال تســتخدم الــتي التطبيقــات لمدى التحليلية األسباب تمثيل أو واحد فصل في

المراحل. بعض في المعلومات من المشتقة الحيوية المعلوماتية

وتطبيقــات تطــورات تنشــأ الحقــل هــذا يتطــور وبينمــا ذلــك إلى باإلضــافة،C بســهولة ليصــل الســابقة المواقــع أحــد في التسجيل للمهتم يمكن أسبوعيا

الــرغم على المجــال، هــذا في متقدمه بحوث لتنفيذ التسهيالت من عدد إلىــا من ــة كونه C مربك ــتخدمين قليال ــبر للمس ــدد. تعت ــبكات الج ــة الش المفتوح

الـ سلسلة سرعة بنفس يتم لم البروتين تسلسالت إنتاج من الرغم فهناك DNAعلى ، بيانات قواعد مختلف في ووظيفته البروتين شكل حول المتوفرة المعلومات من الكثير

البروتين.

Page 8: البرمجة الحيوية Bioinformatics

االكتشـافات ووجـود االختصـاص هـذا لنجـاح الرئيسـية العوامل أحد المصدرالجديدة.

The impact of the internet the WWWاالنترنت دور9.4.1الـ سلسلة في المستخدمه التقانات تاريخ ما بطريقة الحاسوب تاريخ يحاكيDNAالـــ فبنية وتحليلهDNAالفــترة نفس في الخمســينات في تحديــدها تم السبعينات، في باالنترنت اتصال أول الترانزستور. طبق تطوير فيها تم التي

بنفس ابتكارهــا تمDNAالـــ سلســلة وتقنيــات شخصــي حاسوب أول وظهرC، الجينوم سلسلة التسعينات أوائل في المرحلة. أصبح أن نــرى وهكــذا واقعا

الحاســوب. علم في التطــورات من يســتفيد الجزيئيــة البيولوجيا حقل تطور للموضــوع. في مكملــة الحيويــة للمعلوماتيــة الحاليــة الحاســوبية والســمات

C الحقيقة المعلوماتيــة مجــال في التقــدم الحاســوبية التطــورات تقود ما غالباC الحيوية التطــور إلى للموضوع. باإلضــافة التقنية أو الحيوية الجوانب من بدال لالنتشــار ضــروري االنــترنت اســتخدام أصــبح الحاســوب أجهــزة في الفعلي بنــك عن صــادرة قديمــة نســخة اســتالم الحيوية. أتــذكر للمعلوماتية السريع عليه. البيانات إلدخال يحمل أن يجب منها وكل مرن قرص44 على الجينات

والـتي الرئيسـية، البيانـات قاعـدة إلى فـوري وصـول االنـترنت شـبكة توفر والــتي المضيفة المخدمات طرق باستخدام البعيد باستمرار. التخزين تحدثالمحلي. المستوى على مطلوب غير البيانات قواعد تحفظC متوفرة والمقارنة البحث عمليات تكون خالل من أو مجانية كخدمات غالبا إلى الفوري الوصول للعلماء يمكن أن ذلك تحميلها. يعني يمكن برامج

إلى الفوري الوصول تدقيقها. يعتبر أجل من الالزمة واألدوات المعلوماتاالنترنت. على الحيوية المعلومات لشبكة قوة البيانات قاعدة

الحقيقية - التجاربGIGOال) تأثير تجنب9.4.2 Avoiding the GIGO effect-real experiments

في مشهورة عبارة وهيGarbage in-garbage out من مشتقةGIGO إن للبيانات والموثوقة الدقيقة األهمية على للتأكيد صيغت الحاسوب مجال

أية علىGIGO تطبيق المعلومات. يمكن إدخال أو برمجة عند المدخلة وهذا خاطئة، إدخاالت و/أو البيانات لجمع إمكانية هناك أن حيث حالة،

من العديد أن من الحيوية. بالرغم المعلوماتية أخذ عند خاص بشكل مناسب المشوهة، البيانات في زيادة إلى تؤدي أن يمكن الحيوية المعلوماتية سمات

إدخالها البيانات جمع تغطي المسائل، من أنماط3 أساسي بشكل يوجد دقيقة تجريبية طرق توفر على واضح بشكل البيانات جمع ومعالجتها. يعتمد

علىDNAالـ سلسلة تقنيات إنجاز المثال: يمكن سبيل تنفيذها. على يمكن البشري الخطأ حدوث من األتمتة عام. خفضت بشكل الدقة من عالية درجة من الناتجة البيانات دقة تقتربDNAالـ سلسلتي لكال المتعددة القراءة ومع

ذات التسلسالت بعض في الموجود الشذوذ البشري التدخل %. يحل100C العملية دقة من ذلك ويزيد الصعبة، االمتدادات تجميع إنقاصها. بعد من بدال

حيث الحيويـة، المعلوماتيـة شـبكات من أساسـية أجـزاء العنكبوتية والشبكة االنترنت يعتبر مـع للتشـارك متـوفرة بعيـدة. وهي مخدمات على محفوظة الرئيسية البيانات قواعد تكون

االنترنت. مع اتصال لديه شخص أي

Page 9: البرمجة الحيوية Bioinformatics

حيث البيانات، قاعدة إلى السلسلة برنامج من البيانات تنقل التسلسالت البيانات إدخال أيام انتهاء من المسائل. بالرغم بعض إلى النقل عملية تؤدي

تداخل عن الناتجة القضايا بعض فهناك األساسية، التسلسالت لمعظمC ناتج وهذا المختلفة، الحاسوب شبكات أنظمة وإذا التقنية، الطبيعة عن غالبا

مجال في البيانات. يوجد جمع عملية على يؤثر ال أن يجب تصحيحه إعادة تم لمعلومات إمكانية األخطاء. وهناك لحدوث أكبر احتمالية البيانات جمع

C ناتجة خاطئة C عمليات خالل أو البيانات جمع خالل تجريبيا أي اإلدخال. غالبا المعلومات استنتاج طريق عن المشكلة تزيد أن يمكن تنفذ حسابية عملية

كانت حالك في حقيقة قضية البيانات. يوجد قاعدة إلى ورفعها الخاطئة الناس يعتقد لكي صحيح ميل هناك يكون أن يجب لذلك مطبوعة، البيانات

خاطئ يكون أن للتسلسل رسمية. ويمكن المعلومات من جزء هناك أنC معقولة تكون الخاطئة البيانات لكن أن تمييزها. يمكن الصعب ومن جدا

البيانات من مجموعة إلنتاج الخاطئة البيانات من جزء إي يستخدم أسوء. تتضمن المشكلة تجعل أخرى ألغراض أو المشتقة، المتسلسلة

حذر بأداء تتبع دقيقة تصميم وإجراءات تقنيات للتسلسل األفضل المراقبة االمتياز المتسلسلة. يكون البيانات في صارم وتدقيق العمليات مختلف في

في صحيحة غير تكون المتسلسلة. والتي للبيانات وحيد مرور من عادة طريق عن النهائية المتسلسلة البيانات في التناقضات وتزال أماكنها،للتسلسالت. الصارم والتدقيق للتسلسالت متكرر تشغيل

الحاسوبية االختبار- التجارب أنبوب تجنب9.4.3Avoiding the test tube-Computational experimentation

C حصلت التي الكبيرة التحسينات إحدى إنجاز كانت الحياة علم في مؤخرا غير من كان عمل تنفذ التي الحاسوب على تعتمد التي التقنيات من عدد

مستوى إلىGIGO تأثير تخف�ض سنة. حيث20 قبل تحقيقه الممكن الجديدة. الرؤى بعض مع البيانات قواعد فحص إجراء يمكن وبالتالي مقبول،

العمل، من العملي الجزء الحاسوب في التجارب من النمط هذا يستبدل الC سريعة عمل طريقة يقدم ولكن C التجارب تثبته أن يمكن ما إلنجاز جدا غالبا

وتحليل بجمع9.1 الشكل في الدور هذا وقاطعة. يلخص مفيدة بمعلومات الحيوية. المعلوماتية في الرئيسية الدعامة تشكل والتي التجريبية البيانات

تسلسل إلىDNAالـ تسلسل ترجمة الطريقة هذه عن الواضحة األمثلة أحد للبروتين المفتوح القراءة إطار تحديد حال كل المتوقع. على البروتين أن ذلك يعني الحاسب. وال باستخدام التحليل طريق عن يتم المحدد

ذلك يتطلب البروتين هذا مثل وجود الخلية. إلثبات في سينتج البروتين الوظيفة لوصف التجريبية التقنيات من مجموعة واستخدام والتحليل التحدد

للبروتين. الحيوي والنشاط

البيانــات مجموعــات على الحيويــة المعلومــات في الرئيسية المعلومات اعتماد من بالرغم دقيقــة بتجــارب البيانــات ضــمن المعلومــات هــذه تحديــد الضــروري من مختلفة، أنواع من

ألنهــا النهائيــة المتسلســلة للبيانــات عاليــة قيمــة هنــاك فــإن األخطاء. وهكــذا زيادة لتجنببدقة. وثبتت فحصت

والتميــيز البحث من البــاحثين لتمكين الحاســوب طريق عن والتنبؤ التحليل استخدام يمكنــائج فحص إمكانيــة بسهولة. ثم البروتين أو المورث تسلسل في والتعديل في بتجريبهــا النت

الحيوية. وألهمية الفائدة لتحديد المخبر أو الحي الكائن

Page 10: البرمجة الحيوية Bioinformatics

Presentation of databases البيانات قواعد معلومات عرض9.4.4information عرض حول ستكون الفصل هذا في األخيرة اللمحة إن

C. االستخدام محدودة البيانات قاعدة ستكون بدونها والتي البيانات جدا برمجة في مهارات أي العرض واجهات توفر يتطلب ال خاص بشكل

بيانات لقواعد الواسع االنتشار أجل من ضرورية الواجهات وهذه الحاسوب، ببساطة المتسلسلة البيانات تخزين والبروتين. يمكن النووية األحماض الملفات تحويل بروتوكول باستخدام بسهولة تحول والتي بيانات، كملفات

FTP "File Transfer Protocol"الملف. يقدم لتحميل C التسجيل رقم غالبا ومعالجة استخراج من تمك�ن كافية معلومات األساسي التوضيح وبعض

تسلسل مثال: معلومات معروضة، معقدة معلومات البيانات. يوجد ألغراض البيانات "قواعد أو الثانوية البيانات قواعد جمع الجينوم. يتطلب

C واضحة قوانين وضع تم اإلعداد. إذا مرحلة في دقيق تخطيط محددة" أيضا قواعد ومدراء المشاركين قبل من بها والتزم البيانات وعرض لتفسير واجهة طريقة عن بسهولة التنقل للمستخدمين عندئذ� يمكن البيانات

هدف له الواجهات. بعضها لهذه العرض أشكال من العديد المستخدم. يوجد بأنزيمات الخاصة التقطيع مواقع عن البحث أدوات مثل ألجله بنيت محدد

النووية األحماض تسلسل بيانات لترجمة بروتوكالت أو الحصري، التقطيع في البيانات عرض في المستخدمة األمثلة بعض بروتينات. سندرس إلى

استخدامه. يمكن الذي النمط لتوضيح األمينية األحماض تسلسل قواعدC وهذا لدراسته، أهمية األكثر التسلسل البشري الجينوم يعتبر ما بسبب غالبا

أدوات ندرس الحيوية. بينما بالمعلوماتية يتعلق آخر سبب أي من أكثر يمثله، من الجزء هذا لقراءة طريقة أفضل إن االنترنت، على تعتمد التي العرض بنفسك لترى الموقع إلى والدخول الحاسوب، بجانب وضعه هي الكتاب

الجدول في المناسبة المواقع بعض إدراج المختلفة. تم السمات تعمل كيف9.4.

في للوصــول قابلية أكثير الموضحة المستخدم واجهة البيانات ملفات فائدة من الرغم على من رئيسي جزء البيانات قواعد إلدارة السمة هذه . تعتبر المعقدة البيانات مجموعات حالة

الوصــول ســهل مصــدر إلى الموضــوع حــولت أساســية خطــوة وربمـا الحيوية، المعلوماتيةعالميا.

Page 11: البرمجة الحيوية Bioinformatics

البيانات عن والمفيدة المساعدة المعلومات بعض المواقع هذه تقدم Ensembl, Vega, Entrez" مهمة عرض طرق ثالث المتسلسلة. يوجد

Mapview"طريقة . طورت Ensemblومعهد األوروبي المعهد بواسطة Wellcom Trust Sangerيهدف "توضيح" آلي تفسير نظام عن عبارة وهو

خاصة بتحديثات مستمر بشكل الجينوم بيانات قواعد مجموعة تزويد إلى في عنها وتختلف السابقة للطريقة مماثلةVega طريقة تعتبر بالتوضيحات،

C اليدوي التنظيم وتستخدم الجينومات، بعض رئيسيتين: تغطي نقطتين بدال الجينوم عرض . لندرسMapviwe طريقة علىNCBI اآللي. يعتمد من

عدة تجدEnsembl موقع إلى تدخل . عندماEnsembl بطريقة البشري صورة تظهر البشري النوع زر اختيار طريق عن معروضة ثديية جينومات على اإلضافية. بالنقر المعلومات بعض الوراثي" مع "النمط للصبغيات

من ما منطقة على وبالنقر الصبغي، عن أكثر مفصلة صورة تفتح الصبغي مستويات عدة المنطقة. يوجد هذه عن مفصل عرض إلى تنتقل الصبغي إلى الفوري والوصول بالفأرة النقر أن نفسه. يبدو التسلسل حول تفصيلية

Page 12: البرمجة الحيوية Bioinformatics

C التفكير يستوجب ذلك ومباشر. لكن بسيط المعلومات ما حقيقة حول قليال فتح ،1الصبغي النظر. لندرس وجهات بعض على للحصول معروض هو

معلومات لنا الوراثي" تقدم "النمط الصبغيات صفحة من الخاصة صفحته بحوالي اآلزوتية األسس من زوج مليون250 من الصبغي. يتكون هذا عن

:SNPs( SNPs شكلي تعدد ذو وحيد نكليوتيد800000 و مورث2000 غير أفراد بين بتواجدها مفردة نكليوتيدات فيها تختلف مواقع عن عبارة

الوراثية(. إذا الخرائط دراسات في مفيدة وهي النوع، نفس من متقاربة�عرض تكبير أعلى على ذلك وتم المرتبطة، األسس أزواج عرض إلى انتقلنا ي

لكل6mm يعني هذا ،150mm حاسوب شاشة خالل من األسس من زوج25 الحسابية العمليات من زوج تنفيذ اآلن اآلزوتية. يمكن األسس من زوج

سنحتاج1الصبغي من لجزء كنافذة الحاسوب شاشة أن اعتبرنا إذا الممتعة، متجاور. إذا بشكل األسس أزواج لعرض150Km حوالي عرضها لصفحة

في سطر20 و25bp سطر كل فيA4 ورق على التسلسل نطبع أن أردنا . يبقى1الصبغي تسلسل تضم لكي صفحة مليون نصف صفحة. سنحتاج كل الممكن غير من أنه توضح الحسابات هذه أن إلضافتها. أعتقد صبغي22

هناك يكن لم إذا معبرة طريقة بأي الجينوم تسلسل معلومات عرض الوصول سهلة البيانات تجعل عرض وطرق بيانات، قواعد أو حواسيب

C. بينما C، الوصول بسهولة المعلومات تتميز نسبيا من المباشر والتصفح نسبيا مثل العرض طرق إلى النظر عند الشيء بعض مبالين غير نكون أن المريح 1500km الطول ذي التسلسل في فكر هذا حدث إذا ،Ensembl طريقة هذا جعلت التي والحسابات السلسلة تقانة وتأمل ،1للصبغي الممثلC المصدر للجميع. متاحا

Page 13: البرمجة الحيوية Bioinformatics

ムハッマド دعائكم صالح من تنسونا ال تعالى بعونه تم