1. Türkiye’de elde edilip Sağlık Bakanlığı tarafından dizilenen ilk SARS-CoV-2 genomu yayınlanmıştır. Dizilenen bu genomun dünya üzerinden elde edilmiş diğer SARS-CoV-2 genomları ile ilişkilendirmek ve kökenini belirlemek için evrimsel tarihçe (filogeni) analizi yapılmıştır.

2. Filogenetik analizler Türkiye örneğini daha yüksek bulaşıcı kapasitesi olan L soy hattı içinde Kuveyt, Belarus ve Gürcistan suşları ile birlikte konumlandırmış ve ortadoğu bölgesine özgün mutasyonları taşıması nedeniyle bu örneğin Türkiye’ye ortadoğu üzerinden girmiş olabileceğine işaret etmektedir.

3. Bu ön çalışma Türkiye’de SARS-CoV-2 çeşitliliğinin yüksek olabileceğine işaret etmekte ve Türkiye’nin her bölgesini kapsayan örneklerden bir an önce genetik veri üretilerek, Türkiye’de var olan suşların belirlenmesinin öneminin altını çizmektedir.

Bilim insanları, COVID-19 pandemisine karşı etkin savaşta son derece önemli olan genetik bilgi ve kaynakların üretimi için yoğun bir seferberlik içindedir. Bu amaç doğrultusunda  ilk olarak Çin’deki araştırmacılar hızla virüsün genomunu dizilemeyi başarmış ve virüsün dünyada yayılmasıyla beraber, birçok ülke virüs genomunu dizileyerek büyük bir veritabanı oluşmasını sağlamıştır. Virüsler, konak hücreye girdikten sonra ilk olarak kendi genetik bilgilerini çoğaltıp, sayılarını arttırmayı hedefler. Ancak bu süreç içerisinde virüsün genetik materyalinde (genomunda) değişimler meydana gelebilir. Bu değişimler,  varyasyon oluşturarak, suş olarak isimlendirilen farklı COVID-19 tiplerinin oluşmasını sağlar. Üretilen genetik verilerin incelenmesiyle, virüsün yayılma örüntüleri ve yayılırken geçirdiği genetik değişimler takip edilebilmektedir.

Türkiye’de bulunan SARS-CoV-2 soylarından birine ait ilk genom bilgisi kısa bir süre önce yayınlanmıştır.  Dizilenen bu genom, SARS-CoV-2 virüsünün Türkiye’ye hangi bölge veya bölgelerden giriş yaptığına, Türkiye’de hangi virüs soy hattı/hatları bulunduğuna ve virüsün genetik çeşitliliğine dair önemli bilgiler sunabileceği için dizilenmiş diğer SARS-CoV-2 genomları kullanılarak evrimsel filogenetik analize tabi tutulmuştur. Bu bilgi notunda Türkiye’de elde edilip Sağlık Bakanlığı tarafından dizisi yayınlanan SARS-CoV-2 suşunun ön değerlendirme analizi sunulacaktır.

Bu ön çalışmada, Türkiye’den SARS-CoV-2 suşlarına ilişkin genomik verinin dağılımını doğrudan incelemek üzere GISAID veritabanından (https://www.gisaid.org/) Türkiye, Türkiye’ye yakın Avrupa ve Asya ülkelerinden (İtalya, Estonya, Macaristan, Yunanistan, Gürcistan, Belarus, Kuveyt ve İsrail) ve Çin’den dizilenmiş SARS-CoV-2 genomlarına ait veriler kullanılmıştır. İki farklı filogenetik ağaç oluşturma algoritması ile ön değerlendirme yapılmıştır. Bilgi notunun sonunda yöntemin ayrıntıları bulunmaktadır.

Ön Sonuçlar

Türkiye örneğinin dizileri diğer örnekler ile karşılaştırıldığında, özellikle genomun 1000 - 1480; 2100 - 3400 ve 14400 - 15000 bölgeleri arasında, karşılaştırılan diğer örneklerde gözlenmeyen yüksek sayıda özgün tekil (singleton) mutasyonlara rastlanmıştır. Toplamda Türkiye örneğinin referans genoma kıyasla %0.44 oranında özgün mutasyona sahip olduğu görülmektedir. Konuyla ilgili çıkan haberlerde de belirtildiği gibi [1], Türkiye dizisinden çok sayıda özgün tekil mutasyonun görülmesi, dizileme sırasında hatalarına ya da dizi okumalarından fasta çağırma sırasında yetersiz filtrelemeye de işaret edebilir. Nitekim, Türkiye’de yapılan dizileme işlemi hata oranı daha yüksek olan Oxford Nanopore platformunda gerçekleştirilmiştir.

Sonuçlara baktığımızda, her iki yöntem ile çizilen ağacın Türkiye’nin konumu dışında büyük oranda aynı olduğu görülmektedir (Şekil 1). Şu ana kadar yapılan çalışmalar, SARS-Cov-2 virüsünün farklı tipleri olduğunu göstermiştir. Oluşturduğumuz her iki ağaç da önceden belirlenmiş olan iki temel soy hattını ve L ve S tipi suşları yakalayabilmiştir. Genel olarak Bayesyen yöntemle oluşturulan ağaç, suşlar arasındaki ilişkileri daha belirgin ve daha yüksek güvenilirlikte ortaya koyabilmiştir. Buna karşın, maksimum olasılık ağacında suşlar arasındaki ilişkilerin güvenilirliği daha düşük ve filogenetik ilişkiler daha az belirgindir.  Fakat, maksimum olasılık ağacında Türkiye’nin konumu Bayesyen ağaca göre daha gerçekçi olup, maksimum olasılık ağacı Türkiye’den örneklenen SARS-CoV-2 suşunu ortadoğudan örneklenen diğer suşlar ile birlikte konumlandırmıştır. Bayesyen ağaçta ise Türkiye diğer SARS-CoV-2 suşlarından oldukça farklı ve neredeyse atasal veya dış grup olacak şekilde konumlanmıştır (Şekil 1). Yukarıda bahsedilen dizileme hataları, Türkiye’den yayınlanan dizinin Bayesyen ağaçtaki beklenmeyen konumunu açıklayabilir. Bayesen analizlerin tekil mutasyonlara hassasiyetinin yüksek olduğu bilinmektedir.

Türkiye’den örneklenen SARS-CoV-2’nin Şekil 1’de verilen mutasyon örüntüsüne baktığımızda, bu örneğin Kuveyt, İsrail, Gürcistan gibi Batı Asya ve Ortadoğu suşlarını içinde barındıran soy hattı olan Soyhattı 1’e özgün belirteçleri taşıdığı ve dünyada yayılmış çoğu suş gibi L tipi olduğu ortaya çıkmıştır. Türkiye’den dizilenen örneğin aynı zamanda Kuveyt ve Ortadoğu suşlarına özgü mutasyonları taşıması (Şeki 1) bu suşun Türkiye’ye Ortadoğu üzerinden girmiş olma ihtimalini yükseltmektedir.

Türkiye’nin yakın çevresinde bulunan ülkelerde her iki temel soy hattına ait SARS-CoV-2 örneklerinin bulunduğu görülmüştür. Bunun yanında, “L” tipi olarak adlandırılan ve bulaşma hızı daha yüksek olan SARS-CoV-2 şuşunun, Avrupa ve Asya’da  daha yaygın olduğu anlaşılmıştır (Şekil 1). Fakat hem Gürcistan’da hem de Yunanistan’dan alınan örnekler arasında “S” tipinin bulunması, ülkemizde de bulaşma hızı ve potansiyel olarak virülansları farklı olan iki ayrı şuşun bulunma ihtimalini kuvvetlendirmektedir. Son olarak Türkiye’ye görece yakın ve Türkiye ile yolcu trafiği yüksek olan Gürcistan, Belarus, Estonya, İsrail, İtalya ve Kuveyt gibi ülkelerde, özgün soy hatlarının varlığına rastlanmıştır (Şekil 1). Bu ön çalışma açık bir şekilde:

  1. Türkiye’de SARS-CoV-2 çeşitliliğinin yüksek olabileceğine işaret etmekte,
  2. Türkiye’nin her bölgesini kapsayan örneklerden bir an önce genetik veri üretilerek, Türkiye’de var olan suşların belirlenmesinin öneminin altını çizmektedir.
[1]. https://sol.org.tr/haber/turkiyenin-ilk-sars-cov-2-genomu-dizilendi-1096

Şekil 1. Türkiye, Türkiye’ye yakın Avrupa ve Asya ülkelerinden ve Çin’den elde edilmiş SARS-CoV-2 ve en yakın akrabası olan yarasa koronavirüsü  genomlarının Bayesyen ve Maksimum Olasılık tabanlı filogenetik ağaçları. SARS-CoV-2’nin atasal olan S (mavi) ve türemiş olduğu tahmin edilen L (kırmızı) tiplerini ve iki ana soy hattını ayıran mutasyonlar SARS-CoV-2 genomundaki pozisyonları ile beraber verilmiştir (üst rakam ilgili mutasyonların MN938384.1 referans genomdaki pozisyonuna, alt rakamlar ise bu çalışmadaki hizalama pozisyonuna denk gelmektedir). Ek olarak Türkiye’ye yakın bölgelerde bulunan ve sıklığı %20 üzerinde olan özgün iki SARS-CoV-2 haplotipi gösterilmektedir. RaTG13: Yarasa coronavirüsü; Tr_Ankara: Türkiye; MN938384_1: Referans genom, Shenzhen, Çin; Gdong: Guangdong Çin; SZTH: Shenzhen, Çin; GTb: Tblisi, Gürcistan; Gre: Yunanistan; NC_045512_2: Referans genom, Wuhan, Çin; Brus: Belarus; KU: Kuveyt; It: İtalya; ISR: İsrail; Estn: Estonya; Hun: Macaristan.

Yöntem

Bu ön çalışmaya konu olan veriler, GISAID veritabanından (https://www.gisaid.org/) indirilmiştir. Fasta formatından indirilen genomlar MAFFT algoritması ile hizalanmış ve bu diziler kullanılarak polimorfizm taraması ve filogenetik analizler yürütülmüştür. Filogenetik analizler hem Bayesyen tabanlı hem de maksimum olasılık tabanlı yöntemler kullanılarak oluşturulmuştur. Bayesyen analizler BEAST programı kullanılarak 10 milyon zincir olacak şekilde HKY mutasyon modeli altında gerçekleştirilmiştir. Elde edilen ağaçlardan ilk %10’u ön-deneme (İng. ‘burnin’) olarak gözden çıkarılmış ve geriye kalan ağaçlardan TreeAnnotator programı vasıtasıyla en olasılıklı soy ağacı (İng. ‘maximum clade credibility tree’) çizilmiştir. Maksimum olasılık ağaçları RaxML programı kullanılarak GTRGAMMA modeli altında 1000’li hızlı bootstrap tarama algoritması altında gerçekleştirilmiştir. Hızlı bootstrap taraması sonucunda tahmin edilen en olasılıklı ağaç bootstrap değerleri ile birlikte çizilmiştir. Analizin tekrarı için gerekli genom hiza dosyası, xml dosyası ve analiz kodları aşağıdaki linkler yoluyla indirilebilir.

Bu çalışmada kullanılan veriyi GISAID’s EpiFlu™ veri tabanına yükleyerek çalışmayı mümkün kılan tüm bilim insanlarına ve laboratuvarlarına teşekkür ederiz. Sağlık Bakanlığı araştırmacıları dahil söz konusu araştırmacıların ve laboratuvarların listesine şuradan erişebilirsiniz.

Genom hiza dosyası

BEAST analiz xml dosyası

RaxML analiz kodu