Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

ब्लास्ट लोकल अलाइनमेंट एल्गोरिथम क्या है?

<घंटा/>

BLAST एल्गोरिथम का निर्माण 1990 के आसपास Altschul, Gish, Miller द्वारा नेशनल सेंटर फॉर बायोटेक्नोलॉजी इंफॉर्मेशन (NCBI) में किया गया था। BLAST का उपयोग अनुक्रमों के बीच कार्यात्मक और विकासवादी संबंधों को प्राप्त करने और जीन परिवारों के सदस्यों को पहचानने में मदद करने के लिए किया जाता है।

एनसीबीआई वेबसाइट में कई सामान्य ब्लास्ट डेटाबेस शामिल हैं। उनकी सामग्री के अनुसार, उन्हें न्यूक्लियोटाइड और प्रोटीन डेटाबेस में जोड़ा जाता है। NCBI वेक्टर स्क्रीनिंग डेटाबेस सहित विशिष्ट BLAST डेटाबेस का भी समर्थन करता है, कई जीवों के लिए कई जीनोम डेटाबेस हैं, और डेटाबेस का पता लगाते हैं।

क्वेरी अनुक्रम और डेटाबेस के बीच सबसे बड़ा स्थानीय संरेखण खोजने के लिए BLAST एक अनुमानी दृष्टिकोण का उपयोग करता है। BLAST अनुक्रमों को टुकड़ों के अनुक्रमों (शब्दों के रूप में परिभाषित) में विभाजित करके और मूल रूप से इन शब्दों के बीच मिलान की तलाश करके खोज की पूरी गति को बढ़ाता है।

BLAST में, शब्दों को k-tuples के रूप में माना जाता है। डीएनए न्यूक्लियोटाइड्स के लिए, एक शब्द में आम तौर पर 11 बेस (न्यूक्लियोटाइड्स) शामिल होते हैं, जबकि प्रोटीन के लिए, एक शब्द में आमतौर पर 3 अमीनो एसिड होते हैं। BLAST पड़ोस (यानी, लगभग मेल खाने वाले) शब्दों की हैश तालिका बनाता है, जबकि "निकटता" की सीमा निर्धारित की जाती है जो आंकड़ों पर निर्भर करती है। यह सटीक मिलान से लेकर आस-पड़ोस के शब्दों तक शुरू होता है।

क्योंकि अच्छे संरेखण में कई करीबी मैच शामिल होने चाहिए, यह तय करने के लिए आँकड़ों का उपयोग कर सकता है कि कौन से मैच महत्वपूर्ण हैं। हैशिंग द्वारा, यह ओ (एन) (रैखिक) समय में मैचों की खोज कर सकता है। दोनों दिशाओं में मिलान तक पहुंचकर, दृष्टिकोण कई उच्च-स्कोरिंग और अधिकतम खंड जोड़े सहित उच्च गुणवत्ता संरेखण की खोज करता है।

BLAST एल्गोरिदम के कई संस्करण और विस्तार हैं। उदाहरण के लिए, MEGABLAST, Discontinuous MEGABLAST, और BLASTN सभी का उपयोग न्यूक्लियोटाइड अनुक्रम को पहचानने के लिए किया जा सकता है। MEGABLAST को विशेष रूप से बहुत ही समान अनुक्रमों के बीच लंबे संरेखण को कुशलता से खोजने के लिए डिज़ाइन किया गया है, और इसलिए क्वेरी अनुक्रम के समान मिलान को खोजने के लिए उपयोग करने के लिए सबसे अच्छा उपकरण है।

BLAST खोजों की संवेदनशीलता को निर्देशित करने वाले आवश्यक मापदंडों में से एक मूल शब्दों की लंबाई, या शब्द का आकार है। BLASTN में शब्द का आकार लचीला है और खोज संवेदनशीलता में सुधार के लिए इसे डिफ़ॉल्ट मान से घटाकर न्यूनतम 7 किया जा सकता है। इस प्रकार विभिन्न जीवों से संबंधित न्यूक्लियोटाइड अनुक्रमों के संरेखण की खोज में BLASTN MEGABLAST से बेहतर है।

मानक प्रोटीन-प्रोटीन ब्लास्ट (BLASTP) का उपयोग क्वेरी अमीनो एसिड अनुक्रम को पहचानने और प्रोटीन डेटाबेस में समान अनुक्रमों की खोज दोनों के लिए किया जाता है। स्थिति-विशिष्ट पुनरावृत्त (PSI) -BLAST उच्च संवेदनशील प्रोटीन-समानता खोजों के लिए बनाया गया है। यह बहुत दूर से संबंधित प्रोटीन की खोज के लिए फायदेमंद है।

पैटर्न-हिट इनिशियेटेड (पीएचआई)-ब्लास्ट सीमित प्रोटीन पैटर्न खोज कर सकता है। यह प्रोटीन की खोज के लिए बनाया गया है जिसमें उपयोगकर्ता द्वारा परिभाषित एक पैटर्न शामिल है और पैटर्न की निकटता में क्वेरी अनुक्रम के समान है।


  1. ब्लोफिश एन्क्रिप्शन एल्गोरिथम क्या है?

    ब्लोफिश एन्क्रिप्शन एल्गोरिथ्म एक सममित ब्लॉक सिफर है जिसे डेस एल्गोरिथ्म में प्राप्त करने के लिए डिज़ाइन किया गया है जो धीमा और अनिश्चित था। ब्लोफिश 1993 में ब्रूस श्नेयर द्वारा आविष्कार किया गया एक कुंजीयुक्त, सममित क्रिप्टोग्राफिक ब्लॉक सिफर है और सार्वजनिक डोमेन में स्थित है। सममित एन्क्रिप्शन

  1. सूचना सुरक्षा में RSA एल्गोरिथम क्या है?

    RSA का मतलब रिवेस्ट, शमीर, एडलमैन है। वे सार्वजनिक-कुंजी एन्क्रिप्शन तकनीक के संस्थापक हैं, जो संरक्षित सूचना प्रसारण के लिए एक सार्वजनिक-कुंजी क्रिप्टोसिस्टम है। यह विशेष रूप से इंटरनेट पर डेटा स्थानांतरित करते समय प्रतिक्रियाशील जानकारी प्रसारित करने के लिए एक मानक एन्क्रिप्शन दृष्टिकोण है। रिवेस

  1. सी # द्वारा समर्थित एस्केप अनुक्रम क्या हैं?

    निम्नलिखित एक उदाहरण है जो दिखाता है कि C# में कुछ एस्केप वर्णों को कैसे प्रदर्शित किया जाए - उदाहरण using System; using System.Collections.Generic; class Demo {    static void Main() {       Console.WriteLine("Warning!" + '\u0007');