dizi hizalama etiketine sahip kayıtlar gösteriliyor. Tüm kayıtları göster
dizi hizalama etiketine sahip kayıtlar gösteriliyor. Tüm kayıtları göster

1 Kasım 2016 Salı

DNA Dizilerini Karşılaştırma (BLAST)

DNA dizilerini karşılaştırma işlemi için en yaygın kullanılan uygulama BLAST yazılımıdır. NCBI (National Center for Biotechnology Information) kütüphanesi içinden istenen genom kodları hızlı bir şekilde karşılaştırılıp filogenetik soy ağaçları üretilebilir. Bu yazıda istenen bir DNA dizisi veritabanındaki diğer dizilerle kıyaslanıp, dizi hizalama işlemi gerçekleştirilecek ve soy ağaçları oluşturulacaktır.

Aşağıdaki videodaki anlatım ayrıca adım adım yazılı olarak da anlatılmıştır.



1. Adım - Aranılan DNA dizisini kütüphaneden bulmak.

Bunun için ilke önce https://www.ncbi.nlm.nih.gov/ adresine giriş yapınız. Siteye giriş yaptıktan sonra üst taraftaki arama kutucuğunu "Gene" olarak ayarlayın.


Şimdi aradığınız Genomun ismini belirtiniz, ben Human Actin yazarak arama yaptım. Gene bölümünde yaklaşık 33 bin kayıt buldu.


Gene linkine tıkladığınızda bulunan sonuçlar için ayrı ayrı linklere ulaşırız. Ben buradan ikinci sıradaki FLNA isimli genomu seçeceğim.


Genomla ilgili temel bilgileri buradan görebilirsiniz. Fakat bizim aradığımız DNA dizisi sayfanın oldukça aşağısında "NCBI Reference Sequences (RefSeq)" adlı başlığın altında bulabiliriz. "FASTA" formatında almak için o seçeneği seçiyoruz.


Açıklama satırı hariç, tüm DNA kodlarını seçerek kopyalayalım. Bu aşamadan sonra Blast programına geçip oraya yapıştıracağız. İsterseniz kodları bir word yada txt doyasına yapıştırıp daha sonra kullanmak içinde saklayabilirsiniz.



2. Adım - BLAST Programı ile dizileri hizalama yaptırarak karşılaştırmak

 Bu aşamada artık elde ettiğimiz DNA kodlarını Blast programı ile hizalama yaptıracağız ve Genom veritabanındaki benzer dizileri bulduracağız. Anasayfadan BLAST linkine tıklayarak yada şu adresten --> https://blast.ncbi.nlm.nih.gov/Blast.cgi


Linke ulaştığınızda Nükleotid, Protein yada translate edilmiş data ile yapacağınız hizalama ilgili seçeneği seçiniz. Biz nükleotid karşılaştırması yapacağımız için onu seçiyoruz.


Açılan pencerede ana text alanına az önce kopyaladığımız DNA kodlarını yapıştırıyoruz. Aşağıdaki alanda ise sadece insan genomu, fare genomu yada tüm genomları araştırmak istiyorsanız others seçeneğini seçiyoruz. Biz tüm kodları araştırarak daha geniş bir ağaç oluşturmak istediğimiz için others seçeneğini seçiyoruz. En aşağıda ise yüksek uyumluluktan - düşük uyumluluğa doğru seçim yapabilirsiniz. Düşük uyumluluk seçtiğinizde binlerce benzer dizi bulunabilir. Biz orada "Highly Similar" seçeneğini seçelim. Bu işlemler bittikten sonra En alttaki BLAST butonuna basıyoruz.


Bu aşamadan sonra araştırdığınız kodun uzunluğuna göre işlem biraz uzun sürecektir. Benim araştırdığım oldukça uzun olan DNA kodu için yaklaşık 40 saniye sürdü.

Sonuç olarak epey uzun bir açıklama sayfası oluşturuldu.  200 adet yüksek uyumlu DNA dizisi bulundu.


Sayfayı aşağıya doğru çekip ve bulunan dizileri ve uyumluluk yüzdelerini görebilirsiniz. Yüksek uyumlu %99 benzeri çıkan dizilerin yine İnsan gen dizileri olduğunu görebilirsiniz.


Sayfanın biraz daha altına indiğinizde bulunan tüm diziler için hizalama sonuçlarını görebilirsiniz. Burada sizi oldukça uzun bir sayfa bekliyor çünkü yüzbinlerce satırlık bir karşılaştırma yapıldı bunların dökümü sunuluyor.



3. Adım - Ağaç Yapısının oluşturulması

Bu aşamada hizalaması yapılan dizilerin benzerlik oranına göre Filogenetik ağaç yapısı oluşturulacaktır. Aynı sayfada bulunan gen dizilerinden isterseniz istediklerinizi seçin yada hepsini seçmek istiyorsanız en üstteki All seçeneğini seçiniz. Daha sonra "Distance tree of results" linkini tıklayınız. Sistemin ağaç yapısını oluşturması biraz zaman alabilir bekleyiniz.


İşlem bittikten sonra ağaç yapısını görebilirsiniz. İsterseniz sol üst köşedeki yaklaştırma aracı ile ağacı büyüterek inceleyebilirsiniz.


Tools seçeneği altında bulunan Layout türleri ile isterseniz ağaç yapısını farklı şekillerde inceleyebilirsiniz.




İyi çalışmalar.

3 Ekim 2016 Pazartesi

Needleman-Wunsch Algoritması

Algoritma,  Protein ve DNA sekanslarının hizalanması için bulundu. 1970 yılında büyük dizilerin hizalanması için ilk defa kullanılan ilk Dinamik Programdır. İki dizi içindeki benzerlikler ve benzer olmayan durumlar puanlandırılır ve bir tabloya yerleştirilir. Puanlama işlemi bittikten sonra sağ alt köşeden başlayarak en az penaltı puanına sahip olan yol optimum hizalamayı verir. 

Elimizde

GCATGCU
GATTACA

şeklinde iki adet nükleotid dizisi olsun. Bu iki dizinin onlarca hizalanma ihtimali mevcut fakat bize en optimum olanı lazım. Bunun için dizi elemanlarını yatay ve dikey olarak tabloya yerleştiriyoruz. Tablonun üzt kısmında bir satır boş bırakılıyor.


Dah sonra bu tabloyu en üst satırdan başlayarak dolduruyoruz.
Birbirinin aynı olan harfler (G/G gibi) +1 ile
Uyumsuzlar (G/A gibi) -1 ile
Boşluk harf kombinasyonları (G/"-" gibi) -1 ile puanlandırılsın.

Bu algoritmada komşu olan karelerden en yüsek değerli olanı alınır ve puanlama onun üzerine eklenerek yapılır. İlk satırı doldurduğumuza aşağıdaki gibi olacaktır;


Görüldüğü gibi en üstteki sıra 0 dan başlayarak ceza puanı olan -1 eklenerek devam etti. Yatay ve dikey sıralartamandık tan sonra G ile başlayan ilk yatay sıraya geliyor. Burada G-G uyumu +1 ile puanlandıracak, komşu karelerde en büyük değer 0 olduğu için + eklenecek ve o kare +1 olacak;


Şimdi ikinci satırdaki G-C için -1 değeri vermeliyiz. Komşu karelerdeki en büyük değer +1 dolayısı ile -1 ile toplandığında bu karedeki değer 0 olacaktır;


Bu şekilde tüm tabloyu dolduruyoruz. Tüm değerler yazıldıktan sonra sağ alt köşeden başlayarak en yüksek puan değerine ulaşan hizalamalar optimum oluyor.


Bu tabloda çeşitli optimum hizalamalar mevcut, mavi ve kırmızı oklarla köşegen geçişler harf karşılıklarını belirtirken yatay ve dikey geçişler (siyah okla belirtilenler) "-" indel boşluk karakterini ifade eder.

Tabloya göre olası ihtimaller şöyle olacaktır;

GCATGCU      GCATG-CU      GCA-TGCU      GCAT-GCU
GATTACA      G-ATTACA      G-ATTACA      G-ATTACA