T.C. İSTANBUL KÜLTÜR ÜNİVERSİTESİ LİSANSÜSTÜ EĞİTİM ENSTİTÜSÜ BENZER PATOJENİTEYE SAHİP BAKTERİLERİN RAMAN SPEKTRUMLARI ÜZERİNDEN KEMOMETRİK YÖNTEMLERLE AYRIŞTIRILMASI YÜKSEKLİSANS TEZİ DİLARA KAPLANOĞLU 2100003181 Ana Bilim Dalı: Fizik Program: Fizik Tez Danışmanı: Prof. Dr. Gülce ÖĞRÜÇ ILDIZ 2024 T.C. İSTANBUL KÜLTÜR ÜNİVERSİTESİ LİSANSÜSTÜ EĞİTİM ENSTİTÜSÜ BENZER PATOJENİTEYE SAHİP BAKTERİLERİN RAMAN SPEKTRUMLARI ÜZERİNDEN KEMOMETRİK YÖNTEMLERLE AYRIŞTIRILMASI YÜKSEKLİSANS TEZİ DİLARA KAPLANOĞLU 2100003181 Ana Bilim Dalı: Fizik Program: Fizik Tez Danışmanı: Prof. Dr. Gülce ÖĞRÜÇ ILDIZ Jüri: Prof. Dr. Ayberk YILMAZ Dr. Öğr. Üyesi Ayşegül Fulya YELKENCİ 2024 I ÖNSÖZ Yüksek lisans tez çalışmasının yürütülmesinde bana her konuda destek sağlayan değerli tez danışmanım Prof. Dr. Gülce ÖĞRÜÇ ILDIZ’a en içten teşekkürlerimi sunuyorum. Tez çalışması esnasında benimle bilgi birikimlerini ve tecrübelerini paylaşarak desteklerini esirgemeyen Öğr. Gör. Gizem YAVUZ DOĞAN ve Uzm. Ersin KAYGISIZ’a çok teşekkür ederim. Son olarak; yüksek lisansımın başlangıcından tez sürecimin sonuna kadar bana maddi manevi desteklerini esirgemeyen varlıklarıyla hep yanımda olan sevgili annem Nihan KAPLANOĞLU, babam İrfan KAPLANOĞLU, kardeşim Berkin KAPLANOĞLU ve Kürşat ÖZBEK’e teşekkürlerimi sunuyorum. Bu tez çalışması, İKÜ BAP2308 numaralı, proje önerisine istinaden, T.C. İstanbul Kültür Üniversitesi, Bilimsel Araştırma Projeleri Koordinasyon Birimi tarafından desteklenmiştir. II İÇİNDEKİLER İÇİNDEKİLER ............................................................................................................................. II KISALTMALAR ........................................................................................................................ IV TABLO LİSTESİ ....................................................................................................................... VI ŞEKİL LİSTESİ ........................................................................................................................ VII SİMGE LİSTESİ ........................................................................................................................ IX ÖZET ............................................................................................................................................. X ABSTRACT ............................................................................................................................... XII 1. GİRİŞ .......................................................................................................................................... 1 2. MATERYAL VE METOT .................................................................................................... 10 2.1 Biyolojik Örneklerin Hazırlanması ................................................................................... 10 2.1.1. Bakteri Kültürlerinin Hazırlanacağı Saf Suşların Temin Edilmesi ...................... 10 2.1.2. Saf Bakteri Kültür Numunelerinin Hazırlanması ................................................. 11 2.1.3. Saf Bakteri Kültürlerinden Sub-Kültürlerin Hazırlanması ................................. 12 2.2 Bakterilerin Raman Spektrumlarının Elde Edilmesi ..................................................... 12 2.2.1 Raman Spektroskopisi ................................................................................................ 12 2.2.2 Klasik Görüş Altında Raman Spektroskopisi .......................................................... 14 2.2.3 Bakterilerin Raman Spektrumlarının Kaydedilmesi .............................................. 17 2.2.4 Bakterileri Raman Spektrumlarının Ön İşlenmesi ................................................. 17 2.3 Spektral Verilerin Kemometrik Yöntemlerle Analizi .................................................... 19 2.3.1 Temel Bileşenler Analizi (PCA) ................................................................................. 20 2.3.2 Hiyerarşik Kümeleme Analizi (HCA) ....................................................................... 22 2.3.3 Kısmi En Küçük Kareler Ayrıştırma Analizi (PLS-DA) ........................................ 25 2.3.4 Sınıflandırma Modelinin Geliştirilmesi ve Tahmin Yeteneğinin Test Edilmesi .... 27 III 2.3.5 İstatistiksel Model Performansının Değerlendirilmesi ............................................. 28 3. BULGULAR ............................................................................................................................. 31 3.1 Bakteri Raman Spektrumlarının Ön İşlenmesi .............................................................. 31 3.2 Raman Spektrumları Tabanlı Sınıflandırma Modelinin Geliştirilmesi ........................ 37 3.3 Geliştirilen PCA ve PLS-DA Modellerinin Tahmin Yeteneğinin Test Edilmesi .......... 41 4. TARTIŞMA VE SONUÇ ........................................................................................................ 49 5. KAYNAKÇA ........................................................................................................................... 52 IV KISALTMALAR S.saprophyticus : Staphylococcus saprophyticus A. faecalis : Alcaligenes faecalis E.faecalis : Enterococcus faecalis C.jeikeium : Corynebacterium jeikeium PCA : Temel Bileşenler Analizi PLS-DA : Kısmi Küçük Kareler Ayrıştırma Analizi PC1 : Birinci Temel Bileşen PC2 : İkinci Temel Bileşen Gram Pozitif : Gram (+) Gram Negatif : Gram (-) SBAP : Sheep Blood Agar Plate AFS : Alcaligenes faecalis SSP : Staphylococcus saprophyticus EFS : Enterococcus faecalis CJ : Corynebacterium jeikeium AFS1 : Alcaligenes faecalis 1. Örnek AFS2 : Alcaligenes faecalis 2. Örnek AFS3 : Alcaligenes faecalis 3. Örnek AFS4 : Alcaligenes faecalis 4. Örnek AFS5 : Alcaligenes faecalis 5. Örnek AFS20 : Alcaligenes faecalis 20. Örnek HCA : Hiyerarşik Kümeleme Analizi V NIPALS : Doğrusal Olmayan Yinelemeli Kısmi En Küçük Kareler DP : Doğru Pozitif DN : Doğru Negatif FP : Yanlış Pozitif FN : Yanlış Negatif RMSE : Ortalama Karekök Sapması VI TABLO LİSTESİ Tablo 3.1. : Bakteri Raman spektrumlarında temel bantlara ait işaretlemeler ....................... 32 Tablo 3.2. : İstatistiksel model performans verileri ve karışıklık matrisi (PLS-DA modeli için) ................................................................................................................................ 45 Tablo 3.3. : Dört bakteri grubu için (AFS, CJ, EFS ve SSP olmak üzere) Tablo 3.2.’deki karışıklık matrisi verileri kullanılarak elde edilmiş YP, YN, DP, DN sayısal değerleri ................................................................................................................ 46 VII ŞEKİL LİSTESİ Şekil 1.1. : Bakterilerin şekillerine göre sınıflandırılması ....................................................... 2 Şekil 1.2. : Bakterilerin gram boyama özelliklerine göre sınıflandırılması a) gram negatif bir bakteriye ait boyama sonucu b) gram pozitif bir bakteriye ait boyama sonucu .... 3 Şekil 1.3. : Gram boyama aşamalarının görsel olarak açıklanması ......................................... 4 Şekil 1.4. : Mikroorganizmaların tanımlanmasında kullanılan otomatize yöntemlerden birinin şematik olarak gösterilmesi ................................................................................... 7 Şekil 2.1. : Liyofilize mikroorganizma saf suşu içeren Kwik-Stik örneği ............................. 11 Şekil 2.2. : CCl4 bileşiğinin 532 nm dalga boyuyla uyarılması sonucu elde edilen Rayleigh-Stokes-Anti-Stokes saçılmaları ............................................................ 13 Şekil 2.3. : İki eksenli (iki boyutlu) bir veri kümesi içerisinde iki temel bileşen olan PC1 ve PC2 ...................................................................................................................... 22 Şekil 2.4. : P1, P2, P3, P4 ve P5 olmak üzere 5 örnekten oluşan bir grup için kümeleme analizi sonucu elde edilmiş olan dendrogram örneği ...................................................... 24 Şekil 2.5. : İkili sınıflandırma için karışıklık matrisi örneği .................................................. 29 Şekil 3.1. : Bakteri gruplarının alan normalize edilmiş Raman Spektrumlarından elde edilen ortalama spektrumlar (CJ bakterisi mavi, SSP bakterisi yeşil, AFS bakterisi siyah ve EFS bakterisi kırmızı). ..................................................................................... 31 Şekil 3.2. : Dört bakteri grubuna ait (CJ, EFS, AFS, SSP olmak üzere) ortalama Raman spektrumlarına hiyerarşik kümeleme analizi uygulanması ((Hierarchical Single- linkage algoritması) sonucu oluşturulan dendrogram ............................................................................ 33 Şekil 3.3. : CJ, EFS, AFS, SSP gruplarına ait Raman ortalama spektrumlarına alan normalizasyonu uygulanmasının ardından elde edilen PCA skor grafiği (Temel Bileşen PC-2’ye karşı Temel Bileşen PC-1). ....................................................... 34 VIII Şekil 3.4. : AFS bakterilerine ait ortalama Raman spektrumlarının SSP ortalama Raman spektrumundan çıkartılmasıyla elde edilen fark spektrumu (yeşil), PCA modeline ait PC-2 yüklemeleri (pembe) ............................................................................... 36 Şekil 3.5. : EFS bakterilerine ait ortalama Raman spektrumlarının SSP ortalama Raman spektrumundan çıkartılmasıyla elde edilen fark spektrumu (mavi), PCA modeline ait PC-1 yüklemeleri (kırmızı) .............................................................................. 37 Şekil 3.6. : PCA iki boyutlu skor grafiği (PC-2’ye karşı PC-1) ............................................ 38 Şekil 3.7. : PCA modeline ait üç boyutlu (PC-3’e karşı, PC-2’ye karşı PC-1) skor grafiği ... 39 Şekil 3.8. : PLS-DA modeli 2D skor grafiği (Faktör-2’ye karşı Faktör-1) ............................. 49 Şekil 3.9. : PLS-DA modeli 3D skor grafiği (Faktör-1, Faktör-2, Faktör-3) .......................... 41 Şekil 3.10. : PCA modeli için 2D projeksiyon skor tablosu (PC-2’ye karşı PC-1) .................. 42 Şekil 3.11. : PCA modeli için 3D projeksiyon skor tablosu (PC-3, PC-2’ye karşı PC-1) ........ 43 Şekil 3.12. : PLS-DA modeli için 2D projeksiyon skor tablosu (Faktör-2 x Faktör-1) ............ 44 Şekil 3.13. : PLS-DA modeli için 3D projeksiyon skor tablosu (Faktör-3 x Faktör-2 x Faktör- 1) ............................................................................................................................. 44 Şekil 3.14. : PLS-DA modelini test etmede kullanılan AFS örnekleri için tahmin edilmiş Y değerleri. .............................................................................................................. 46 Şekil 3.15. : PLS-DA modelini test etmede kullanılan CJ örnekleri için tahmin edilmiş Y değerleri ............................................................................................................... 47 Şekil 3.16. : PLS-DA modelini test etmede kullanılan EFS örnekleri için tahmin edilmiş Y değerleri ............................................................................................................... 47 Şekil 3.17. : PLS-DA modelini test etmede kullanılan SSP örnekleri için tahmin edilmiş Y değerleri ............................................................................................................... 48 Şekil 3.18. : PCA (A) ve PLS-DA (B) modelleri için 2D projeksiyon skor tabloları .............. 49 IX SİMGE LİSTESİ cm : Santimetre µl : Mikrolitre mW : Miliwatt nm : Nanometre ᵒC : Celcius µ⃗ : İndüklenmiş dipol moment α : Molekülün kutuplanabilme yatkınlığı �⃗� : Uygulanan elektrik alan vektörü αd : Molekülün denge konumunda kutuplanabilirliği Q : Titreşim koordinatı ν : Frekans ν0 : Gelen ışının frekansı Cn : n x n merkezleme matrisi Ln : Yükleme vektörleri en : C’nin özvektörleri λn : C’nin özdeğerleri y : Sınıf etiketi vektörü r : Herhangi bir zamanda çekirdekler arası uzaklık X ÖZET Mikroorganizmalar pek çok tür ve çeşitliliğe sahiptirler. Her sene çok sayıda insan ve hayvan, bakteriyel ya da fungal şikayetlerden dolayı tedavi gereksinimi duymaktadır. Staphylococcus saprophyticus (S.saprophyticus) gibi patojen mikroorganizmalar özellikle insan sağlığını olumsuz yönde etkilemektedir. Bunun dışında Alcaligenes faecalis (A. faecalis), Enterococcus faecalis (E.faecalis) ve Corynebacterium jeikeium (C.jeikeium) gibi fırsatçı patojenlerin de her geçen gün insan sağlığı üzerindeki negatif etkileri artmaktadır. Mikroorganizmaların tanımlanması, hastalıkların tanısı, ilaç-gıda kontaminasyon kaynaklarının belirlenmesi, gıda zehirlenmeleri, yeni antimikrobiyal koruyucuların geliştirilmesi gibi konularda önem arz etmektedir. Günümüzdeki çalışmalar hastalıklara doğrudan sebep olan patojen mikroorganizmalara yoğunlaşırken; fırsatçı patojenlerle ilgili literatürde daha az sayıda çalışma bulunmaktadır. A. faecalis ve E. faecalis doğal olarak insan bağırsağında bulunur. Son dönemlerde ise, antibiyotiklere karşı dirençli hale gelmiştir. A. faecalis, S. Saprophyticus’ta olduğu gibi özellikle idrar yolu enfeksiyonları ve hastane kaynaklı enfeksiyonlarda yaygındır. C. jeikeium, insan derisinde bulunur ve özellikle bağışıklığı zayıflamış hastalarda ciddi enfeksiyonlara neden olabilmektedir. Patojenlerin sebep olduğu bu hastalıkların tedavi stratejisinin belirlenmesi ve benzer klinik tablo gösteren bakteriler için doğru tedavinin seçilmesi amacıyla mikroorganizmaların tanımlanması günümüzde insan, halk ve çevre sağlığı için önemini sürdürmektedir. Geleneksel tanı yöntemleri çeşitli dezavantajlar taşıdığından, alternatif yöntemlerin geliştirilmesine ihtiyaç duyulmaktadır. Bu sebepten dolayı, bakterilerin ayrıştırılması ve tanımlanmasında Raman Spektroskopisi gibi yöntemler hakkında araştırmalar artış göstermektedir ancak; günümüze kadar spektrumları literatüre kazandırılmamış çok sayıda mikroorganizma bulunmaktadır. Bu tez çalışmasıyla, literatürde ilk kez olmak üzere, son yıllarda özellikle artan direnç mekanizmaları ve hastane enfeksiyonlarında rastlanmalarıyla dikkat çeken ve benzer patojeniteye sahip, A. faecalis, S.saprophyticus, E.faecalis ve C.jeikeium bakterilerinin kemometrik yöntemlerle Raman spektrumları üzerinden ayrıştırılmasına olanak sağlayan istatistiksel modeller geliştirilmiştir. Saf bakteriler üzerinden elde edilen Raman spektral veriler XI kullanılarak, PLS-DA ve PCA modelleri geliştirilmiş ve modellerin ayrıştırma yeteneği test edilmiştir. Spektral veriler test edilen her numune için parmak izi niteliği taşıdığından dolayı, mikroorganizmaların bu yöntemle ayrıştırılması, kısmi olarak daha pahalı olan, nükleik asit temelli identifikasyon yöntemlerinde olduğu gibi daha spesifik sonuçların elde edilmesine olanak sağlamaktadır. Elde edilen modeller A. faecalis, S.saprophyticus, E.faecalis ve C.jeikeium olmak üzere tüm bakteri gruplarını cins-tür özellikleri bakımından birbirinden ayrıştırılmasına olanak sağlarken, Gram (-) A. faecalis ve Gram (+) S.saprophyticus, E.faecalis, C.jeikeium bakterilerinin hücre duvar yapısı farklılıklarına göre de gruplandırdığı görülmüştür. Böylelikle insan kaynaklı hata payı az, düşük maliyetli ve ek ekipman gerektirmeyen Raman spektroskopisi yönteminin geleneksel identifikasyon yöntemlerine tamamlayıcı nitelikte bir yöntem olarak kullanılabilirliği gösterilmiştir. XII ABSTRACT Microorganisms exhibit a wide range of species and diversity. Every year, numerous humans and animals require treatment due to bacterial or fungal complaints. Pathogenic microorganisms, such as Staphylococcus saprophyticus (S. saprophyticus), adversely affect human health. Additionally, the negative impacts of opportunistic pathogens like Alcaligenes faecalis (A. faecalis), Enterococcus faecalis (E. faecalis), and Corynebacterium jeikeium (C. jeikeium) on human health are increasing daily. The identification of microorganisms is crucial for diagnosing diseases, determining sources of drug and food contamination, preventing food poisoning, and developing new antimicrobial preservatives. Current research focuses primarily on pathogenic microorganisms that directly cause diseases, while fewer studies in the literature address opportunistic pathogens. A. faecalis and E. faecalis are naturally found in the human intestine but have recently developed resistance to antibiotics. A. faecalis, like S. saprophyticus, is particularly common in urinary tract infections and hospital-acquired infections. C. jeikeium, present on human skin, can cause severe infections, especially in immunocompromised patients. Identifying microorganisms remains vital for human, public, and environmental health to determine treatment strategies for these pathogen-induced diseases and to select appropriate treatments for bacteria presenting similar clinical symptoms. Traditional diagnostic methods have various disadvantages, necessitating the development of alternative approaches. Consequently, there has been increased research into methods such as Raman Spectroscopy for differentiating and identifying bacteria. However, many microorganisms' spectra have yet to be documented in the literature. This thesis aims, for the first time in the literature, to develop statistical models that enable the differentiation of A. faecalis, S. saprophyticus, E. faecalis, and C. jeikeium, bacteria noted for their increasing resistance mechanisms and prevalence in hospital infections in recent years, using chemometric methods based on their Raman spectra. XIII Using Raman spectral data obtained from pure bacterial samples, PLS-DA and PCA models were developed, and the differentiation capability of these models was tested. Since the spectral data serve as a fingerprint for each tested sample, differentiating microorganisms using this method allows for more specific results akin to nucleic acid-based identification methods, which are relatively more expensive. The developed models successfully distinguished all bacterial groups, A. faecalis, S. saprophyticus, E. faecalis, and C. jeikeium, at the genus-species level and grouped Gram-negative A. faecalis and Gram-positive S. saprophyticus, E. faecalis, and C. jeikeium according to cell wall structure differences. Thus, it has been demonstrated that the Raman spectroscopy method, with minimal human error, low cost, and no additional equipment requirement, can complement traditional identification methods. 1 1. GİRİŞ Hücreler, canlı organizmaların en küçük yapı taşlarıdır. Canlılık hücresel boyutta başlangıç göstermektedir ve hücre yapılarına göre canlılar ‘prokaryot’ ve ‘ökaryot’ olmak üzere temel iki sınıfa ayrılmaktadır (Vellai & Vida, n.d.). Prokaryot ve ökaryot hücreler yapıları bakımından birbirlerinden farklılık göstermektedir. Prokaryotik hücreler, zarla çevrili hücre çekirdeğine ve zarlı organellere (zarsız bir organel olan ribozomları bulunur) sahip değillerken; ökaryotik hücreler zarla çevrili bir nükleusa ve zarlı organellere sahiptirler (Kalaycı, 2017) . Bakteri ve arkeler prokaryotik hücre yapısı gösterirken; bitkiler, hayvanlar, mantarlar ökaryotik hücre yapısına sahiptir. Mikroorganizma; Yunanca mikros (küçük) ve organizmos (canlı) kelimelerinin birleşmesinden meydana gelen gözle görülemeyecek kadar küçük organizmaları ifade etmek için kullanılan bir mikrobiyoloji terimidir. Mikroorganizmalar tek hücreli veya çok hücreli olabildikleri gibi; prokaryotik veya ökaryotik hücre yapısı da gösterebilirler. Mikroorganizmalar genel olarak bakteriler, arkeler ve mantarlar (küf ve maya) olmak üzere üç ana sınıf altında toplanmaktadır. Mikrobiyoloji ise; mikroorganizmaların izole edilmesi ve incelenmesiyle ilgilenen bilim dalıdır (G Diniz, 2022). Bu alanla ilgili bilgilerimiz, 1800’lü yıllarda özellikle bakteriler üzerine yapılan çalışmalarla başlamıştır. Louis Pasteur ve Robert Koch yapmış oldukları çalışmalarla bakterilerin insan sağlığı üzerindeki etkilerine dikkat çekmişlerdir (Shetty & Soman, 2015). Bakteriler, mikroskobik boyutta tek hücreleri ve prokaryotik hücre yapısı gösteren mikroorganizmalardır. Özellikleri bakımından farklılık gösteren milyonlarca farklı türde bakteri vardır. Bakterilerle ilgili genel kanı; insan, hayvan ve çevre sağlığını tehdit ettikleri yönündedir. Ancak bunun aksine bakterilerin önemli bir bölümü insan ve hayvan florasını düzenlemekte olup, ticari alanlarda da kullanılmaktadır (Cohan, 2002). Probiyotikler, bakterilerin insan ve hayvan sağlığının düzenlenmesinde kullanımına güzel bir ticari örnektir. Hastalık oluşturan bakterilere genel olarak ‘patojen’ adı verilmektedir. Fırsatçı patojen bakteriler ise; normal koşullarda insan veya hayvanların floralarında bulunup hastalık yapmayan ancak; immün sistemin zayıfladığı durumlarda hastalık yapıcı özellik kazanan bakterilere verilen isimdir. Özetle, patojen mikroorganizmalar, enfektif özelliklerini her koşulda gösterirken, fırsatçı patojenler; sağlıklı bireylerin florasında doğal olarak bulunup, 2 immün sistem çeşitli sebeplerden zayıfladığında hastalık yapıcı konuma geçerler (Brown et al., 2012). Bakteriler, çeşitli özellikleri bakımından sınıflandırılmaktadırlar. Sınıflandırılmaları şekillerine göre, oksijen ihtiyaçlarına göre, boyanma özelliklerine ve genetik özelliklerine göre yapılmaktadır (Cohan, 2002). Şekillerine göre bakteriler; kok (yuvarlak), basil (çubuk), vibrio (virgül), spiral veya sarmal (spiroket) olarak sınıflandırılırlar. Şekil 1.1. Bakterilerin Şekillerine Göre Sınıflandırılması Oksijen ihtiyaçlarına göre ise; oksijenli ortamda yaşayan bakteriler (aerobik), oksijensiz ortamda yaşayan bakteriler (anaerobik) ve hem oksijen varlığında hem de oksijensiz ortamda yaşayabilen fakültatif bakteriler bulunmaktadır. Boyanma özelliklerine göre sınıflandırılma; genel olarak yaygın bir boyama yöntemi olan Gram Boyama yöntemi, kullanılarak yapılmaktadır. Gram boyama özelliklerine göre ise bakteriler; Gram pozitif [Gram (+)] ve Gram negatif [Gram (-)] olmak üzere iki gruba ayrılmaktadır. Gram boyama, bakterilerin hücre çeper yapılarındaki farklılığa bağlı olarak, mikroskop altında farklı renklerde görülmelerini sağlayan bir tekniktir. Gram (+) ve Gram (-) bakteriler hücre duvarlarında farklı kalınlıklarda peptidoglikan içermekte olup farklı kimyasal bileşimlere sahiptirler (Beveridge, n.d.). Gram (+) bakteriler kalın bir peptidoglikan hücre duvarına ve anyonik özellik gösteren teikoik asit olarak adlandırılan yüzey polimerlerine sahipken, Gram (-) bakteriler ise, daha ince bir peptidoglikan hücre duvarlı, lipopolisakkarit yapıda bir zar ile çevrilidirler. 1884 yılında Hans Christian Gram, bakterilerin hücre duvarlarındaki farklılığı fark ederek, iki sınıfa ayrılmalarına olanak sağlayan bir boyama 3 tekniği geliştirmiştir. Bulmuş olduğu teknikle kalın peptidoglikan tabakaya sahip olan bakteriler, boyama sonucunda mor renkle boyanarak Gram (+) bakteri sınıfını oluştururken; ince peptidoglikan ve lipopolisakkarit içeren Gram (-) bakteriler ise pembe-kırmızı bir renk ile boyanmaktadır. Gram boyama tekniği bakterileri hücre duvarlarına göre ayırabilmesi yönüyle mikrobiyoloji için temel taşlardan biri olup, yaygın olarak kullanılmaktadır. Hücre duvarlarında lipopolisakkarit ihtiva eden patojenik bakterilerin enfeksiyona yol açma olasılığı oldukça yüksektir. Gram (-) bakterilerin hücre duvarları lipopolisakkarit içerirken, Gram (+) bakterilerde bu yapı bulunmamaktadır. Bu yönüyle Gram boyama ile mikroskop altında, potansiyel olarak hastalık yapıcı bakterileri net bir şekilde ayırt edilebilmektedir (Silhavy et al., 2010) . Şekil 1.2. Bakterilerin Gram boyama özelliklerine göre sınıflandırılması a) Gram negatif bir bakteriye ait boyama sonucu b) Gram pozitif bir bakteriye ait boyama sonucu (GÜNAL & SEYLAM KÜŞÜMLER, 2023). Gram Boyama; petri kabından veya sıvı besiyeri içeren süspansiyondan alınan bakteri örneğinin, lam yüzeyine sürülüp, alevle yüzeye sabitleme (fiksasyon) işleminin ardından hazırlanmış olan preparata sırasıyla ‘Kristal Violet, Iodine, Aseton ya da Ethanol gibi bir Dekolarizatör ve karşıt boyama için Safranin-Sulu Fuksinin’ uygulanması yoluyla yapılmaktadır (Beveridge, n.d.). Kristal Violet, Gram (+) ve Gram (-) bakterileri mor renge boyar. Ardından uygulanan Iodine, Gram (+) bakterilere kristal violeti sabitler. Bu aşamadan sonra aseton, ethanol ya da her ikisinin karışımından meydana gelen bir renksizleştirici (dekolorizatör), Gram (-) bakterilerden, kristal violeti uzaklaştırır. Son aşama olarak mikroskopta Gram (-) bakterilerin de görüntülenebilmesi için, karşıt boyama işlemi yapılır. 4 Bunun için de safranin ya da sulu fuksin kullanılmaktadır. Kimyasallar preparata tatbik edilmeden önce (kristal violet aşamasından sonra) uygulanmış olan kimyasalı ortamdan uzaklaştırmak için, preparat saf su ile yıkanır. Tüm bu anlatılan aşamalar, Şekil 1.3.’te şematik olarak gösterilmektedir. Şekil 1.3. Gram Boyama aşamalarının görsel olarak açıklanması (Labster Theory Pages, 2024) Bakteriler eski çağlardan bu yana insan, hayvan ve çevre sağlığını tehdit eden mikroorganizmalardır. Özellikle son yıllarda küreselleşmenin artmasıyla beraber bakterilerin yayılma hızı artmakta ve direnç oranı yükselmektedir. Gram (-) olan; Alcaligenes faecalis (A. faecalis) ve Gram (+) olan; Staphylococcus saprophyticus (S.saprophyticus), Enterococcus faecalis (E.faecalis) ve Corynebacterium jeikeium (C.jeikeium) insan sağlığını etkileyen bakteriler arasında hızla yerini almıştır. Bu bakterilerin insan sağlığını tehdit etmesi üzerine birçok çalışma bulunmaktadır (Brown et al., 2012). Patojen mikroorganizmalar, enfektif özelliklerini her koşulda gösterirken, fırsatçı patojenler; sağlıklı bireylerin florasında doğal olarak bulunup, immün sistem çeşitli sebeplerden zayıfladığında hastalık yapıcı konuma geçerler. 5 A. faecalis (ATCC: 35655), insan bağırsak sisteminde bulunan Gram negatif basil şekilli fırsatçı bir patojendir. Makroskobik olarak koyun kanlı agar besiyeri (sheep blood agar plate SBAP) üzerinde küçük, gri renkli koloniler oluşturur ve meyve kokusuna benzer kokuya sahip bakterilerdir. Çeşitli antibiyotiklere karşı direnç göstermeleriyle beraber; toprak, su, hastane ortamı gibi çeşitli ortamlardan kolaylıkla izole edilebilmektedirler. A. faecalis, idrar yolu enfeksiyonu, orta kulak iltihabı, yumuşak doku ve deri enfeksiyonları, peritonit, endokardit, pnömoni, menenjit ile ilişkilendirilmiştir. Ancak bu bakteri daha çok idrar yolu enfeksiyonları ve hastane kaynaklı enfeksiyonlarda gözlemlenmektedir (Huang, 2020). C. jeikeium (ATCC: 43734), insan deri yüzeyinde bulunan Gram pozitif basil şekilli bir bakteridir. Makroskobik olarak besiyeri yüzeyinde (SBAP) küçük, yuvarlak, beyaz koloniler oluşturmaktadırlar. Corynebacterium ailesi genellikle difteri ile ilişkilendirilmelerinin aksine Corynebacterium jeikeium difteriye sebebiyet vermemektedir. C. jeikeium insan cilt florasında normal olarak bulunmasına karşın fırsatçı bir patojendir. Özellikle bağışıklığı baskılanmış kanser, kemik iliği nakli gibi çeşitli hastalarda ölümcül enfeksiyonlara sebep verebilen çoklu ilaç direncine sahip bir bakteridir (Moore Pardo et al., 2020). S. saprophyticus (ATCC: 15305), kadınlarda idrar yolu enfeksiyonunun önemli bir sebebi olan Gram pozitif kok (yuvarlak) şekilli bakterilerdir. Besiyeri üzerinde (SBAP), küçük veya orta büyüklükte, pürüzsüz, dışbükey, parlak, beyaz koloniler oluşturmaktadırlar. Toplumsal sebepli idrar yolu enfeksiyonlarının ikinci en önemli etmenidir (Ehlers & Merrill, 2023). Aynı zamanda böbrek taşlarının oluşumuyla da ilişkilendirilmişlerdir (Raz, R. et al.,2005). S.saprophyticus antibiyotiklerle yüksek oranda tedavi edilebilmektedir ancak; tedavi edilmeyen S. saprophyticus enfeksiyonu böbrek yetmezliğine gidebilecek bir tablo oluşturmaktadır (Ehlers & Merrill, 2023). E. faecalis (ATCC: 51299), insan ve hayvanların gastrointestinal sisteminde bulunan Gram pozitif kok şekilli bir flora bakterisidir (Yüksel, F. N. 2012). Katı besiyeri üzerinde, beyaz-gri, transparan, pürüzsüz koloniler oluşturmaktadır. E. faecalis özellikle bağırsak florasının düzenlenmesinde de önemli rol oynayan prebiyotiklerdir (Z Erginkaya, 2007). Diyare (ishal) şikayetlerinin giderilmesinde kullanımları önerilmektedir. E. faecalis florada bulunan bakteriler olmalarına karşın son dönemlerde hastane kaynaklı ve topluluk sebepli enfeksiyonlarda görülme sıklıkları artmış olup antibiyotiklere karşı direnç göstermektedir (Aral et al., 2011). Antibiyotiğe 6 direnç kazanmış (vankomisine karşı) olan E. faecalis, başta bağışıklığı baskılanmış hastalar olmak üzere toplum sağlığı açısından tehdit oluşturmaktadır (Samadi & Asgharzadeh, 2014) . Mikroorganizmaların identifikasyonu, özellikleri bakımından mikroorganizmaların tanımlanmasını ifade etmektedir. Halk ve çevre sağlığının korunmasında mikroorganizmaların izolasyonu ve identifikasyonu önem taşımaktadır. Mikroorganizmaların tanımlanması zor, uzmanlık gerektiren, bekleme süresi uzun olan ve pahalı bir yöntemlerdir. Patojenlerin sebep olduğu hastalıkların tedavi stratejilerinin belirlenmesi ve benzer klinik tablo gösteren bakteriler için doğru tedavinin seçilmesi için mikroorganizmaların tanımlanması gerekmektedir (Buszewski et al., 2017). Benzer patojeniteye sahip mikroorganizmaların, biyolojik identifikasyon yöntemleriyle birbirlerinden ayırt edilmeleri konusunda güçlükler günümüzde de devam etmektedir. Tez çalışması kapsamında kullanılan fırsatçı patojenlerin ayırt edilebilmelerinde de aynı güçlükler bulunmaktadır. Mikroorganizmaların tanımlanması için öncesinde mikroorganizmaların izolasyonun yapılması gerekmektedir. Mikroorganizma izolasyon kaynakları çok çeşitlidir. Hava, su, toprak, cilt mikroorganizmaların izolasyon kaynaklarına örnek verilebilmektedir. Mikroorganizmalar, genel bir besiyerinde, agar veya broth içerisinde zenginleştirilmesinin ardından, selektif besiyerlerinde üretilerek aranan mikroorganizmaların saflaştırılması sağlanmaktadır (Janda & Abbott, 2002). Mikroorganizmaların tanımlanması ancak mikroorganizmaların saflaştırılmasından sonra yapılabilmektedir. Mikroorganizmaların tanımlanması yani identifikasyonu genel olarak üç aşamaya ayrılmaktadır. Bunlar; ● Morfolojik özelliklerin belirlenmesi, ● Biyokimyasal özelliklerin belirlenmesi ve ● Serolojik testlerdir. Mikroorganizmaların morfolojik özelliklerinin belirlenebilmesi için organizmaların büyüyeceği uygun katı veya sıvı besiyerleri seçilmektedir. Besiyerlerinde üreyen kolonilerden mikroorganizmaların morfolojik özellikleri saptanmaktadır (Janda & Abbott, 2002). Bu aşama mikroorganizmaların doğru tanımlanması için oldukça önemlidir. Morfolojik tanımlama aynı 7 zamanda mikroskopik analizlerin de gerçekleştiği aşamadır ve çeşitli boyama teknikleri kullanılarak bakteriler belirli sınıflara ayrılmaktadır. Biyokimyasal özellikler ise; katalaz, oksidaz, indol testleri gibi testleri içermektedir. Bu testler sonucunda bakteriler türlerine ve cinslerine göre ayrılmaya başlamaktadır (Baron, 1996). Serolojik testlerde ise organizmaların aglütinasyon gibi serolojik özellikleri değerlendirilmektedir (Baron, 1996). Günümüzde çeşitli şirketler, mikroorganizmaların tanımlanmasında birtakım sistemler geliştirerek sürecin hızlanmasını sağlamışlardır. Bu sistemler, - Antikor temelli serolojik testleri, - Biyokimyasal tanımlama kitlerini, - Nükleik asit hibridizasyonuna dayalı yöntemleri ve - Biyosensörleri kapsamaktadır (Aras, 2011). Şekil 1.4. mikroorganizmaların tanımlanmasında kullanılan otomatize yöntemlerden BD Phoenix’i göstermektedir(BD, 2024). Şekil 1.4. Mikroorganizmaların tanımlanmasında kullanılan otomatize yöntemlerden birinin şematik olarak gösterilmesi(BD, 2024). Bu sistemler her ne kadar hızlı sonuç almayı sağlasa da ek ekipman ve cihaz gereksinimi duymalarından dolayı yüksek maliyetli olması, cihaza ya da kite yükleme aşamasından önce morfolojik özelliklerin belirlenmesine ihtiyaç duyulması ve kısmi olarak hız konusunda dezavantajlara sahip olması, yeni yöntemlerin araştırılmasına yol açmaktadır. Bu konuyla ilgili olarak Helm ve ark. tarafından Staphylococcus, Streptococcus, Clostridium, Legionella ve 8 Escherichia coli olmak üzere 14 türe ait bakteriyel suşları FTIR yöntemiyle tanımlanmıştır. Kirschner ve ark. ise bakterilerin antibiyotik dirençleri üzerine FTIR kullanılarak yapılan bir çalışma yer almaktadır. Udelhoven ve ark. ile Winder ve ark. yaptıkları farklı çalışmalarla Bacillus, Pseudomonas, Staphylococcus, Candida, Mycobacterium bovis bakterilerinin tanımlanmasında FTIR’ın kullanılabileceğini göstermişlerdir (Başyiğit Kılıç et al., n.d.). Rösch ve ark. yine benzer şekilde Micrococcus luteus, Bacillus subtilis, Rhodotorula mucilaginosa (rubra), Bacillus sphaericus ve Pseudomonas fluorescens bakterilerinin tanımlanmasında Raman spektroskopik yöntemini kullanmışlardır (Rösch et al., 2003). Tüm bu örnekler spektroskopik yöntemlerin mikroorganizmaları ayırma ve tanımlamada kullanılabileceğini gösterir niteliktedir. Raman Spektroskopisi Hint asıllı fizikçi C.V. Raman tarafından molekül üzerine gönderilen ışının dalga boyunun, molekül üzerinden saçılan ışının dalga boyundan farklı olduğunun saptamasıyla ortaya çıkmıştır. Raman Spektroskopisi, incelenecek yapının yakın kırmızı-altı, görünür ve morüstü bölgede tek frekanslı lazer kaynağıyla ışınlanarak, saçılan dalganın incelenmesi tekniğidir. Saçılan ışının enerji miktarındaki değişim ilgilenilen molekülün titreşim enerji düzeyleri arasındaki farkı ifade etmektedir. Molekülün titreşim enerji düzeyleri arasındaki farkı veriyor olmasından dolayı, Raman saçılmaları, moleküllerin titreşim ve dönü düzeylerini açıklamaktadır. Raman saçılması sonucu elde edilen veri, ilgili molekül için parmak izi niteliği taşımaktadır. Elde edilen frekans değerleri incelenen örneğin yapı özelliklerinin değerlendirilmesi için kullanılmaktadır (Öztürk, T. P. 2015). Bu durum örnekler arasındaki farklılıkların değerlendirilmesinde ve incelenen örneğin fonksiyonel ve kimyasal yapılarının açıklanmasında kullanılabilmektedir. Bununla beraber Raman spektrumları birbiriyle ilişkili grupların saptanmasına da olanak sağlamaktadır (Kabuk, H. N. 2021). Bu özelliklerinden dolayı Raman Spektroskopisi özellikle son dönemlerde yapıları tanımlamak, yapılar arasındaki bağlantıları anlamak amacıyla kullanım alanını arttırmıştır. (Rodriguez et al., 2023). Raman spektroskopisi gibi tekniklerle büyük miktardaki örneklerden çok sayıda spektral veri elde edilmektedir. Bu verilerin benzerlik ve farklılıkları yönünden analiz edilmesinde istatistiksel yöntemlere ihtiyaç duyulmaktadır. Spektral verilerin istatistiksel analizinde kemometrik yöntemlerden faydalanılmaktadır. En yaygın olarak kullanılan kemometrik yöntemlerin arasında Temel Bileşen Analizi (PCA) ve Kısmi En Küçük Kareler Ayrıştırma Analizi 9 (PLS-DA) yer almaktadır. PCA yüksek boyutlu veri setlerinde en yüksek varyansın belirlenmesi ve boyut indirgeme yapmak için kullanılan istatistiksel bir yöntemdir. PLS-DA ise, bağımsız değişkenlerin çok olduğu veri setlerinde, birbirleriyle ilişkili olan bağımlı değişkenlerin tahmin edilmesinde kullanılan başka bir istatistiksel yöntemdir. Günümüze kadar yapılan çalışmalar, milyonlarca farklı türe ait bakterilerin ayrıştırılmasında biyolojik yöntemlere tamamlayıcı olarak titreşimsel spektroskopik yöntemlerin kullanılabileceğini göstermiş olmasına karşın; günümüze kadar spektrumları literatüre kazandırılmamış çok sayıda mikroorganizma bulunmaktadır. Bu tez çalışmasıyla, literatürde ilk kez olmak üzere, son yıllarda özellikle artan direnç mekanizmaları ve hastane enfeksiyonlarında rastlanmalarıyla dikkat çeken ve benzer patojeniteye sahip, A. faecalis, S.saprophyticus, E.faecalis ve C.jeikeium bakterilerinin kemometrik yöntemlerle Raman spektrumları üzerinden ayrıştırılmasına olanak sağlayan istatistiksel modeller geliştirilmiştir. Saf bakteriler üzerinden elde edilen Raman spektral veriler kullanılarak, PLS-DA ve PCA modelleri geliştirilmiş ve modellerin ayrıştırma yeteneği test edilmiştir. Spektral veriler test edilen her numune için parmak izi niteliği taşıdığından dolayı, mikroorganizmaların bu yöntemle ayrıştırılması kısmi olarak daha pahalı olan nükleik asit temelli identifikasyon yöntemlerinde (PCR) olduğu gibi daha spesifik sonuçların elde edilmesine olanak sağlamaktadır. Elde edilen modeller A. faecalis, S.saprophyticus, E.faecalis ve C.jeikeium olmak üzere tüm bakteri gruplarını birbirinden ayrıştırılmasına olanak sağlarken, Gram (-) A. faecalis ve Gram (+) S.saprophyticus, E.faecalis, C.jeikeium bakterilerinin hücre duvar yapısı farklılıklarına göre de ayrıştırılmasında kullanılabilirliğini göstermiştir. Böylelikle insan kaynaklı hata payı az, düşük maliyetli ve ek ekipman gerektirmeyen Raman spektroskopisi yönteminin geleneksel identifikasyon yöntemlerine tamamlayıcı nitelikte bir yöntem olarak kullanılabilirliği gösterilmiştir. 10 2. MATERYAL VE METOT Tez çalışmasının yöntem kısmı; ‘Biyolojik Örneklerin Hazırlanması, Bakterilerin Raman Spektrumlarının Elde Edilmesi ve Spektral Verilerin Kemometrik Yöntemlerle Analizi’ olmak üzere üç temel basamaktan meydana gelmektedir. 2.1. Biyolojik Örneklerin Hazırlanması 2.1.1. Bakteri Kültürlerinin Hazırlanacağı Saf Suşların Temin Edilmesi Bakterilere ait saf hücreleri bulunduran Microbiologics firmasına ait Kwik Stikler çalışma sürecinde kullanılacak olan bakterilerin ATCC numaralarına göre ticari olarak satın alınmıştır. ATCC kelimesi; İngilizce olarak, The American Type Culture Collection sözcüklerinin baş harfleri kullanılarak oluşturulmuş olan bir kısaltmadır. Bu kurum mikroorganizma kültürlerinin korunması ve dağıtımının sağlanması amacıyla 1925 yılında kurulmuştur. Günümüzde de ATCC standartlarına uygun olan çok sayıda saf mikroorganizma ve rekombinant mikroorganizma kültürleri biyoloji, moleküler biyoloji, biyoteknoloji, ilaç, gıda vb. alanlarda kullanılmaktadır (Kenneth I. Berns, 1996). ATCC numarası ise; mikroorganizmaları uluslararası olarak tanınmalarını sağlayan ve ATCC standartlarına uygun olarak elde edildiklerine belirten bir tür kimlik numarasıdır. Tez çalışması kapsamında ATCC: 35655 olan A.faecalis, ATCC: 43734 olan C.jeikeium, ATCC: 15305 olan S.saprophyticus ve ATCC: 51299 olan E.faecalis bakterileri kullanılmıştır. Kullanılan E.faecalis suşu, klinik vakaları daha iyi temsil etmesi adına düşük Vankomisin dirençli olacak şekilde seçilmiştir. Ticari olarak satın alınan çubuk şeklindeki Kwik Stik’lerin içerisinde liyofilize bakteri hücreleri ve sulandırma sıvısı bulunmaktadır. 11 Şekil 2.1. Liyofilize mikroorganizma saf suşu içeren Kwik-Stik örneği 2.1.2. Saf Bakteri Kültür Numunelerinin Hazırlanması Bakterilere ait Kwik Stikler kendi sulandırma sıvısı içerisinde sulandırılarak pasaj geçilmek üzere hazır hale getirilmiştir. Bakteriler büyüyebilmek için katı veya sıvı bir büyüme ortamına ihtiyaç duymaktadır. Bu amaçla; %5 koyun kanı içeren, koyun kanlı agar (sheep blood agar) katı besiyeri kullanılmıştır. Koyun kanlı agar mikroorganizmalar için oldukça besleyici olup, genel amaçlı kullanılan bir besiyeridir. Güç üreyen ya da güç kültürlenen mikroorganizmaların üretilmesinde kullanılmaktadır. Koyun kanlı agar klinik örneklerin kültürlenmesinde de tercih edilen bir tür besleyici alandır. Tez çalışması kapsamında; saf bakteri kültürlerinin oluşturulması için ticari olarak satışı olan ve üretilebilirlik sertifikaları bulunan paketli kullanıma hazır steril %5 koyun kanlı agar besiyerlerinin alınması maliyet ve zamandan tasarruf açısından tercih edilmiştir. Her bakteri suşu için kanlı agar petrileri isimlendirilerek (Örneğin; A.faecalis için AFS 1.petri , AFS 2. petri, AFS 3. petri, AFS 4. petri , AFS 5. petri olmak üzere), pasaj geçilmek üzere hazırlanmış olan Kwik Stikler her bakteri türü için 5 petriye olacak şekilde pasaj geçilmiştir. Böylelikle her grup için 5, toplamda 20 adet petri elde edilmiştir. Pasaj geçildikten sonra petriler, 35 °C’lik inkübatörde 5-7 gün inkübe edilerek bakteri kolonilerinin besiyeri yüzeyini tamamen doldurması sağlanmıştır. İnkübasyon süresinin tamamlanmasıyla beraber saf bakteri kültürleri elde edilmiştir. 12 2.1.3. Saf Bakteri Kültürlerinden Sub-Kültürlerin Hazırlanması Mikroorganizmalar, gelişim göstermek ve yeni koloniler üreterek çoğalabilmek için yeni bir besleyici ortama ihtiyaç duymaktadırlar. Aksi halde bulundukları besiyerindeki besleyicilik zaman içerisinde bitecek ve mikroorganizmaların ölmesine sebep olacaktır. Bu sebeple elde edilmiş olan bakterilere ait saf kültürlerden, bakterilerin ölmemesi ve yeni kolonilerin çoğaltılabilmesi için sub- kültürler elde edilmiştir. Bu amaç doğrultusunda üretilen A. faecalis (ATCC: 35655), C.jeikeium (ATCC: 43734), S.saprophyticus (ATCC: 15305) ve E.faecalis (ATCC: 51299) bakteri kültürlerinin bulunduğu petrilerden, kullanıma hazır %5 koyun kanlı agar katı besiyerlerine (Örneğin; A.faecalis’in AFS saf kültürleri içeren 1-5 numaralı petrilerden; AFS1, AFS2, AFS3, AFS4…AFS20 olmak üzere), her petriden 4 yeni petriye geçilecek şekilde öze yardımıyla koloniler alınarak pasaj geçilmiştir. Pasajlar 35°C inkübatörde 5-7 gün inkübe edilerek ardından bakterilerin petri yüzeyini tamamen doldurması sağlanmış ve bunun sonucunda her bakteri için 20 olmak üzere toplamda 80 adet sub-kültür elde edilmiştir. 2.2. Bakterilerin Raman Spektrumlarının Elde Edilmesi 2.2.1. Raman Spektroskopisi Raman Spektroskopisi, Hint asıllı fizikçi Sir Chandrasekhara Venkata Raman tarafından 1928 yılında, bir molekül üzerine gönderilen ışının dalga boyunun saçılan ışının dalga boyundan farklı olduğunun saptanmasıyla bulunmuştur. Bu keşfi kendisine 1930 yılında Nobel Fizik Ödülünü de beraberinde getirmiştir. Raman Spektroskopisi bir tür titreşim spektroskopisidir. (AKÇE & KADIOĞLU, 2020). Bir molekül tek bir dalga boyuna sahip ışınla etkileşime girdiği zaman gelen ışını soğurur ya da saçar. Saçılma elastik saçılma ya da elastik olmayan saçılma olmak üzere ikiye ayrılır. Saçılma olayında genel olarak elastik saçılma gözlemlenmektedir. Işığın saçılması esnasında, saçılan ışık miktarının madde ile etkileşen ışığın enerji miktarına eşit olduğu durumlarda elastik bir saçılma olan Rayleigh Saçılması meydana gelmektedir. Daha az miktarda ise; ışık elastik olmayan saçılma yapmaktadır. Bu tür elastik olmayan saçılmalara Raman Saçılmaları adı verilmektedir. Elastik saçılmalarda gelen fotonun frekansında, dalga boyunda ve enerjisinde değişiklik olmamaktadır. Elastik olmayan Raman Saçılmalarında ise durum bunun tersidir. Bir başka ifadeyle; Raman Saçılmalarında, moleküler titreşimler uyarılarak foton enerji kazanabilir ya 13 da kaybedebilir. Bununla beraber gelen ışının frekansında değişiklikler de meydana gelebilir (Das & Agrawal, 2011). Bu değişimlerin sebebi moleküllerin titreşim enerji geçişlerinin uyarılmış olmasıdır. Molekül ve foton arasında etkileşimlere bağlı olarak iki alt tip Raman Saçılması meydana gelmektedir. Bunlar Stokes ve Anti-Stokes saçılmaları olarak adlandırılmaktadır. Stokes saçılma; titreşimsel olarak kararlı enerji seviyesindeki molekül, gelen ışın tarafından uyarılarak üst enerji seviyesine çıktığı durumlarda meydana gelen saçılmadır. Bir başka ifadeyle, molekülün gelen fotondan enerji soğurduğu durumlarda meydana gelen ve molekülün uyarılmış hale geçmesini ifade eden saçılmalara ‘Stokes Saçılması’ adı verilmektedir. Bununla beraber molekül daha önceden uyarılmış halde olabilir, bu durumlarda ise Anti-Stokes saçılma meydana gelmektedir. Genel olarak moleküllerin uyarılmamış durumda bulunma olasılıkları daha yüksek olduğundan Stokes saçılmaları baskın olarak gerçekleşmekte olup Raman Spektroskopisinde kaydedilmektedir(Tu & Chang, 2012). Saçılmalar şiddetlerine göre değerlendirildiğinde en şiddetli olan saçılma esnek saçılma olan Rayleigh Saçılmasıdır. Rayleigh Saçılmasından sonra ise moleküllerin titreşimsel kararlı seviyeden uyarılmış konuma geçmesini ifade eden Stokes Saçılması gelmektedir. Diğerlerine göre daha az şiddetli olan saçılmalar ise; Anti-Stokes saçılmalarıdır. Şekil 2.2.’de, karbon-tetraklorür bileşiğine ait Raman spektrumu verilmiştir. Spektrumda en şiddetli gözlenen pik, Rayleigh saçılmasına ait pik olup; Anti-stokes (sol taraf) ve Stokes (sağ taraf) saçılmalara ait pikler de gösterilmiştir. Şekil 2.2. CCl4 bileşiğinin 532 nm dalga boyuyla uyarılması sonucu elde edilen Rayleigh- Stokes-Anti-stokes saçılmaları (EDINBURG INSTRUMENTS, 2024) 14 2.2.2. Klasik Görüş Altında Raman Spektroskopisi Bir molekül grubu ν frekanslı bir elektromanyetik dalgaya maruz bırakıldığında, moleküller değişime uğrar. Bu değişim elektron ve çekirdeklerine etki eden kuvvetten dolayı gerçekleşmektedir. Bunun sonucunda da molekülün ilk durumda dipol momenti bulunmuyorsa, dipol momenti oluşur. Başlangıç konumunda dipol momenti var ise; dipol momentine ek olarak, dipol moment yüklenir veya değişir (Keresztury, 2006; Kabuk, H. N. 2021). �⃗� = �⃗� 0 sin(2𝜋𝑣𝑡) (2.1) Bir molekülün kutuplanma yatkınlığı yani polarizibilitesi, Raman olayının klasik görüş altında anlaşılabilmesine olanak sağlamaktadır. Molekül statik elektrik alan içerisine yerleştirildiği zaman, moleküle ait pozitif ve negatif yüklü parçacıklar uygulanan alan içerisinde zıt kutuplara doğru çekilir. Bu durum indüklenmiş dipol momentin oluşmasına sebep olmaktadır. İndüklenmiş dipol momentin büyüklüğü uygulanan alanın büyüklüğü ile doğru orantılı olarak değişmektedir (Keresztury, 2006). 𝜇 = 𝑎�⃗� (2.2) Denklem 2.2’de yer alan, orantılılık sabiti olan α ifadesine polarizibilite denilmektedir ve bir molekülün ne kadar kolay polarize olabileceğinin bir ölçüsüdür. İfade de yer alan; 𝜇 : İndüklenmiş dipol momenti α : Molekülün kutuplanabilme yatkınlığı �⃗� : Uygulanan elektrik alan vektörünü ifade etmektedir. α ikinci mertebeden bir tensördür ve μ aşağıda olduğu gibi ifade edilmektedir (Gülce ÖĞRÜÇ ILDIZ, 2008; Volkan DURAK, 2019). �⃑�𝑥 𝜇𝑦 �⃑�𝑧 = [ 𝑎𝑥𝑥 𝑎𝑥𝑦 𝑎𝑥𝑧 𝑎𝑦𝑥 𝑎𝑦𝑦 𝑎𝑦𝑧 𝑎𝑧𝑥 𝑎𝑧𝑦 𝑎𝑧𝑧 ] [ �⃑⃗�𝑥 �⃑⃗�𝑦 �⃑⃗�𝑧 ] (2.3) Matris daha açık bir şekilde aşağıdaki ifadelerle gösterilebilinir. 15 𝜇𝑥= 𝑎𝑥𝑥�⃑⃗�𝑥 + 𝑎𝑥𝑦�⃑⃗�𝑦 + 𝑎𝑥𝑧�⃑⃗�𝑧 𝜇𝑦= 𝑎𝑦𝑥�⃑⃗�𝑥 + 𝑎𝑦𝑦�⃑⃗�𝑦 + 𝑎𝑦𝑧�⃑⃗�𝑧 (2.4) 𝜇𝑧= 𝑎𝑧𝑥�⃑⃗�𝑥 + 𝑎𝑧𝑦�⃑⃗�𝑦 + 𝑎𝑧𝑧 �⃑⃗�𝑧 𝐸2 = 𝐸𝑥 2 + 𝐸𝑦 2 + 𝐸𝑧 2 Denklem 2.3 ve Denklem 2.4’ te bulunan αij elemanlarının anlamı, elektrik alan hangi doğrultuda ise dipol momentin o doğrultuda elemanları olabileceğini ifade etmektedir. Bir başka ifadeyle i doğrultusunda dipol moment, j doğrultusunda ise; elektrik alan bileşeni bulunmaktadır. Kutuplanma tensörü simetriktir. Bunun sonucunda αij = αji birbirine eşit olmaktadır. Bunun sonucunda bütün i ≠ j ler için αij teriminin sıfır olduğu esas eksen sistemine geçilebilmektedir. Bu tarz sistemlerin indüklenmiş dipol momentleri Denklem 2.5’ te olduğu şekilde gösterilmektedir (Volkan DURAK, 2019). 𝜇𝑥′ = 𝑎𝑥′𝑥′ �⃑⃗�𝑥′ 𝜇𝑦′ = 𝑎𝑦′𝑦′ �⃑⃗�𝑦′ (2.5) 𝜇𝑧′ = 𝑎𝑧′𝑧′ �⃑⃗�𝑧′ İfadede αx’x’ = αy’y’ = αz’z’ olması durumda molekül için izotropik olduğu söylenebilmektedir. Moleküllerin yapmış olduğu dönme ve titreşim hareketleri, moleküllerin elektronik dağılımlarını sürekli olarak değiştirmektedir. Bunun sonucunda kutuplanma yatkınlığı da değişmektedir. Moleküller arası bağ uzunluğu arttıkça kutuplanma yatkınlığı artar, tersi şekilde ise bağ uzunluğu azaldıkça kutuplanma yatkınlığı azalır. Bu durum Denklem 2.6 ile açıklanmaktadır (Gülce ÖĞRÜÇ ILDIZ, 2008; Volkan DURAK, 2019). 𝑎 = 𝑎𝛼 ( 𝑎𝛼 𝑎𝑄 ) 0 𝑄 + 1 2 ( 𝑎 𝛼2 𝑎𝑄2 ) 0 𝑄2 + ……… (2.6) Bu denklemde; αd : Molekülün denge konumunda kutuplanabilirliği 16 𝑄 ≡ 𝑟 − 𝑟𝑑: Titreşim koordinatı r: Herhangi bir zamanda çekirdekler arası uzaklık anlamına gelmektedir. Burada Q zamanın bir fonksiyonudur. Denklem 2.6’de yer alan ifadede ilk iki terim dışındaki terimler ihmal edilebilmektedir. 𝑄 = 𝑄0𝑠𝑖𝑛2𝑣0𝑡 (2.7) Bu durumda Denklem 2.7 ‘deki ifadede yerine konulacak olursa, aşağıdaki şekilde yazılabilmektedir. 𝑎 = 𝑎𝛼 ( 𝑎𝛼 𝑎𝑄 ) 0 𝑄0𝑠𝑖𝑛2𝑣0𝑡 (2.8) Moleküle ν0 tek frekanslı bir elektromanyetik dalga yollanırsa, bu elektromanyetik dalganın etkisiyle µ titreşir. Bu durum ise Denklem 2.9’ da olduğu gibi ifade edilir. 𝜇 = 𝑎𝑒 �⃑⃗�0𝑠𝑖𝑛2𝜋𝑣𝑡 + �⃑⃗�0𝑄0 ( 𝑎𝛼 𝑎𝑄 ) 0 𝑄0𝑠𝑖𝑛2𝜋𝑣0𝑡𝑠𝑖𝑛2𝜋𝑣𝑡 (2.9) Trigonometrik sinA.sinB çarpımı kullanılarak Denklem 2.9 yeniden düzenlenecek olursa aşağıdaki eşitlik elde edilir. 𝑠𝑖𝑛𝐴𝑠𝑖𝑛𝐵 = 1 2 cos(𝐴 − 𝐵) − 1 2 cos(𝐴 + 𝐵) (2.10) Bu denklemdeki ilk terim Rayleigh saçılmasıdır ve gönderilmiş olan dalga ile aynı frekanstadır. Geriye kalan ikinci ve üçüncü terimler ise; Raman saçılmaları olan Stokes ve Anti-stokes Saçılmalarıdır. Stokes saçılmalar (ν0-ν) frekanslı iken Anti-stokes saçılmalar (ν0+ν) frekanslı saçılmalardır (Gülce ÖĞRÜÇ ILDIZ, 2008; Volkan DURAK, 2019). Sonuç olarak titreşimin Raman spektroskopisinde gözlemlenebilmesi için, molekülün titreşim hareketi esnasında molekülün kutuplanma yatkınlığında değişimin olması gerekmektedir (Volkan DURAK, 2019). 17 2.2.3. Bakterilerin Raman Spektrumlarının Kaydedilmesi İstanbul Kültür Üniversitesi Raman spektroskopi laboratuvarında bulunan B&W-Tek i- Raman Plus-785 model mikro-Raman sistemi ile Raman ölçümleri alınmıştır. Raman Spektroskopisi yüksek hassasiyeti, tahribatsız ve kısmen ucuz bir teknik olmasından dolayı, biyoloji, biyotıp, nanoteknoloji vb. birçok alanda kullanılmaktadır (Han et al., 2022). Raman Spektroskopik tekniği; malzeme karakterizasyonu, adli analizler, sanat eserleri, biyoloji, biyotıp gibi pek çok alanda kullanılmaktadır. Bu kadar çeşitli alanda kullanımının olmasının en önemli nedeni, yöntemin sahip olmuş olduğu avantajlardır. Bu avantajlar; tahribatsız bir yöntem olması, numune hazırlama ihtiyacının olmaması, hızlı veri eldesi sağlaması, düşük hacimlerde kullanılabilmesi şeklinde sıralanabilmektedir (Mitsutake et al., 2019). Bu yüksek lisans tezi çerçevesinde incelenen dört bakteri türüne ait seksen sub-kültürün Raman spektrumları kaydedilmiştir. Sub-kültürleri içeren seksen petrinin her birinden bir özelik numune, halka uçlu özenin 10 µl’lik ucuyla kanlı agar, katı besiyeri üzerinden toplandı. Bakterilerin agar yüzeyinden toplanması esnasında besiyerinin öze ucuna gelmemesine özen gösterildi. Halka uçlu öze yüzeyinde bulunan, bakteriye ait örnek, alüminyum kaplı lam üzerine konulduktan sonra oda koşullarında (20-25 ᵒ C’de) yaklaşık 5 dakika kurumaya bırakıldı. Kurutulmuş numunelerin Raman spektrumları, lazer dalga boyu 785 nm olan, 280 mW güce sahip taşınabilir Raman spektrometresi (20x objektif) kullanılarak kaydedildi. Raman spektrumları, her numune için örneğin farklı bölgelerinden olacak şekilde 6 adet spektrum çekilerek elde edilmiştir. Spektrumlar 100-3400 cm-1 spektral bölgede ve 4 cm-1 çözünürlükte kaydedilmiştir. Çalışmada kullanılan Raman cihazında biyolojik örneklerde sıkça karşılaşılan floresans sorununu ortadan kaldırmak amacıyla 785 nm dalga boyuna sahip lazer sistemi kullanılmıştır. 2.2.4. Bakteri Raman Spektrumlarının Ön İşlenmesi Elde edilen spektral verilerinin analiz edilmesinden önce bakterilere ait Raman spektrumları üzerinde taban çizgisi düzeltmesi (baseline corection), normalleştirme, aykırı değerlerin çıkarılması (outliers) işlemleri uygulanmıştır. 18 Taban çizgisi düzeltmesi (baseline correction); özellikle floresans gözlemlenen Raman spektrumlarının düzeltilmesinde kullanılmaktadır. Spektrumlardaki sıfır şiddet düzeylerinin tashih edilmesini sağlamaktadır. Tüm spektrumlara adaptif (uyarlanabilir) taban çizgisi düzeltmesi SpectraGryph programı üzerinden gerçekleştirilmiştir (Dr. Friedrich Menges, 2016). Spektrumların birbirleriyle doğrudan mukayese edilebilmesi için alan normalizasyonu uygulanmıştır. Yanlış spektrum veren örneklerin çıkarılması için aykırı değerler (outliers); her bir bakteri grubuna ilişkin Raman spektrumlarına Temel Bileşen Analizi (PCA) uygulanarak belirlenmiştir. Normalizasyon ve PCA analizleri UnscramblerTM CAMO (sürüm:5.5) programı üzerinden gerçekleştirilmiştir(CAMO Software AS., 2016). PCA analiz yöntemi, çok sayıda birbiri ile ilişki verinin, temel bileşenler adı verilen temel özelliklere indirgeyen bir tekniktir. Bir başka ifadeyle; veri setinin boyutlarını veride var olan değişimlerin korunarak, daha az boyuta indirgenmesini sağlayan istatistiksel bir yöntemdir. Bu analiz yönteminde temel bileşenler, bütün değişkenlerin varyansını en iyi şekilde açıklayan ana değişkenlerin doğrusal bir birleşimidir (Greenacre et al., 2023). Çok sayıda değişkene sahip verilerle ilgili en temel problem veri seti içerisindeki ilişkilerin tamamının görülmesindeki zorluktur. Bu noktada Temel Bileşen Analizi, aralarında ilişki bulunan ana değişkenlerin doğrusal kombinasyonları olan ana bileşenlerini belirleyerek verinin boyutunun küçültülmesini sağlamaktadır. Bu sebepten dolayı PCA yöntemi, boyut azaltma yöntemi olarak da bilinmektedir (Jolliffe, 1990) . Dönüşümlerinin ardından elde edilen değişkenler, ilk değişkenlerin temel bileşenleri olarak isimlendirilmektedir. Elde edilen ilk temel bileşen varyansı en büyük olandır ve diğer temel bileşenler gitgide varyans değeri azalacak şekilde sıralanmaktadır. Bir başka şekilde ifade edilecek olursa; diğerlerine göre daha büyük varyansa sahip olan örnekler ilk temel bileşen olarak hareket edecek ve bu değerden daha küçük varyansa sahip olan örnekler ikinci temel bileşen olarak görev yapacaktır (Jolliffe, 1990; Maćkiewicz & Ratajczak, 1993; Ringnér, 2008). Aykırı değerlerin çıkarılabilmesi amacıyla yukarıda bahsedildiği üzere, her bir örneğe ait replika spektrumları içeren dört bakteri grubundan elde edilen 120 spektruma (toplam 480 spektrum) Doğrusal Olmayan Yinelemeli Kısmi En Küçük Kareler (NIPALS) algoritması uygulanarak, Temel Bileşen Analizi (PCA) yapıldı. Her bir grup için aykırı değerler, PCA analizi sonucunda elde edilen skor grafiğindeki, bakterileri örneklerinin konumlarına, uygunluk 19 rezidülerine ve Hotellings değişkenleri (parametreleri) değerlendirilerek belirlendi (E.Arzu KANIK, 2002). Gruplarla ilişkili yaklaşık 20 replika spektrum aykırı olarak belirlenerek analiz dışında bırakıldı. 2.3. Spektral Verilerin Kemometrik Yöntemlerle Analizi Tez çalışması kapsamında ele alınan 80 adet bakteri numunesine ilişkin Raman spektrumlarının kemometrik analizi 450-3100 cm-1 aralığında kaydedilen ortalama spektrumları üzerinden geçekleştirilmiştir. Analiz edilecek veri seti 80 x 4000 boyutunda ve 320.000 datayı içermektedir. Analiz edilecek örnek sayısı arttıkça bununla doğru orantılı olacak şekilde veri seti matrisinin boyutları ve içerdiği bilgi de artmaktadır. Bu tarzda yüksek bilgi içeren veri setlerinde benzerlikleri ve farklıları analiz etmek için istatistiksel yöntemlerin kullanımına ihtiyaç duyulmaktadır. Bu çerçevede spektral verilerin analizinde, karmaşık sistemlerin bilgisayar, istatistik ve matematik vasıtasıyla çözümünü sağlayan kemometrik yöntemler kullanılmaktadır. Kemometri; aslında bir kimya disiplinidir. Kemometri vasıtasıyla veriler, istatistiksel metotlar kullanılarak karakterize edilir ve böylelikle test edilmeleri sağlanır. Analitik verilerin işlenmesinde, istatistik ve uygulamalı matematik kemometrinin temel araçlarıdır (Dinç, n.d.). İstatistiksel analizler temel olarak tek değişkenli ve çok değişkenli istatistiksel analiz yöntemleri olmak üzere iki gruba ayrılmaktadır. Tek değişkenli istatistiksel analiz yöntemlerinde; incelenen değişken dışındaki diğer bütün değişkenler ihmal edilmektedir. Diğer bir deyişle incelenen değişken dışındaki değişkenler türdeş ya da özdeş kabul edilmektedir. Bu sebepten tek değişkenli istatistiksel analiz yöntemleri gerçek durumun net bir ifadesini sunma konusunda yetersiz kalabilmektedir. Çünkü çoğu zaman, incelenen değişkenle beraber, değişken üzerine diğer faktörler de etki etmekte olup özdeş veya türdeş kabul edilebilmeleri mümkün değildir. Çok değişkenli istatistiksel analizlerde ise; ilgilenilen örnek ve onun üzerine etki eden değişkenler ele alınır veya yüksek olan değişken sayısı daha az sayıya indirgenebilmektedir. Böylece çok değişkenli istatistiksel analizler gerçek durumun anlaşılmasında; veriler arasındaki karmaşık ilişkileri aydınlattığından dolayı daha etkili bir istatistiksel yöntem olarak kullanılmaktadır. Verilerin çözümlenmesi konusunda çok değişkenli istatistiksel analizler önemli bir konuma sahip olmakla birlikte, tek değişkenli 20 istatistiksel analizlere kıyasla daha karmaşık işlemlerin kullanımını gerektirmektedir. Günümüzde bilgisayar ve yazılımların varlığı ise; bu karmaşık işlemlerin daha pratik olarak yapılmasına olanak sağlamaktadır. Çok değişkenli analiz yöntemleri; birçok kulanım alanına sahip olup daha sıklıkla kimya, biyoloji, mühendislik, psikoloji ve tıpta oldukça yaygın bir şekilde kullanılmaktadır. Bu yöntemler özellikle biyoloji ve sağlık alanlarında; klinik tanı, hastalık seyri, risk tahmini yapılması amaçlarıyla istatistiksel modeller geliştirmekte kullanılmaktadır (Akbulut & Çapik, 2022). Tez çalışması kapsamında elde edilen verilerin analiz edilmesinde kullanılmış olan PCA, PLS-DA ve kümeleme analizleri aşağıda detaylı biçimde verilmektedir. 2.3.1. Temel Bileşenler Analizi (PCA) Temel Bileşenler Analizi (PCA), yukarıda bahsedildiği üzer çok değişkenli takipsiz (denetimsiz) istatistiksel analiz yöntemlerinden biridir (Maćkiewicz & Ratajczak, 1993). PCA, yöntemi veriler arasındaki varyansın çoğunun korunmasını sağlamakla beraber, verilerin boyutunun azaltılmasına da olanak sağlayan bir çeşit matematiksel algoritmadır. Veri boyutlarının indirgenmesini, veriler arasındaki varyansın en yüksek olduğu, temel bileşenleri tanımlamak suretiyle gerçekleştirir. Böylelikle çok değişkenli veriler, yalnızca birkaç bileşen kullanılarak, kısmen daha az sayıda değişkenle temsil edilerek, ilgilenilen örnekler arasındaki benzerlik ve farklılıklar görsel olarak değerlendirilebilir hale gelmektedir. PCA analizi araştırılması yapılan örneklerin gruplandırılabilirliğinin belirlenmesine olanak sağlamaktadır. (Ringnér, 2008). Sonuç olarak PCA, büyük veri setlerindeki bilginin; temel bileşenler olarak adlandırılmakta olan; daha küçük, ilişkisiz değişkenlere indirgeyerek özetlemektedir. Temel bileşenler, en yüksek varyansa sahip olan ana değişkenlerin doğrusal olarak düzenlenmiş halleridir. Bu bileşenler ana veri setinden mümkün olacak en yüksek oranda bilgiyi alır ve muhafaza eder. İstatistiksel yöntem olarak PCA’nın uygulanabilmesi için hem doğrusal cebir hem de matris işlemlerinin yapılması gerekmektedir. Bunun sonucunda ana veri seti temel bileşenler olarak yapılandırılarak koordinat sistemine aktarılır. Ana bileşenleri destekleyen nitelikte olan kovaryans matrisinde bulunan özvektörler ve özdeğerler, doğrusal dönüşümlerin analiz edilebilmesine imkan sağlamaktadır. Özvektörler dağılım grafiğindeki varyansın yönünü belirler. Özdeğerler ise; özvektörlerin katsayılarıdır ve yönlü verinin önemini göstermektedirler. Bu sebepten, yüksek bir özdeğerle 21 karşılaşıldığı zaman, özvektörün daha kritik olduğu ifade edilebilmektedir. Temel bileşenler veriler arasındaki en yüksek varyansın yönlerini de temsil ettiklerinden dolayı aslında bunlar kovaryans matrisinin özvektörleri olduklarını söylemek mümkündür. PCA' da genellikle veriler arasındaki ilişkiyi en yüksek oranda açıklayan ilk iki ana bileşen olan, birinci temel bileşen (PC1) ve ikinci temel bileşen (PC2) odaklanılmaktadır. (Maćkiewicz & Ratajczak, 1993). Temel bileşenler, veriler arasındaki varyansı azalan sırayla açıklar: birinci temel bileşen, PC1, verilerdeki varyansın büyük bir bölümünü ifade ederken; PC2, veriler arasında kalan varyansın PC1’den sonra en yüksek miktarda açıklar ve diğer PC bileşenleri de bu şekilde sıralanır. Yüksek lisans tez çalışması çerçevesinde, dört bakteri grubu arasındaki benzerlik ve farklılıklar hakkındaki bilgi, benzer örneklerin skor grafiğinde yakın veya uzak bölgelerde kümelenmesiyle elde edilir (Granato et al., 2018). Bir skor grafiğindeki iki nokta arasındaki uzaklıktaki artış, bu iki örnek arasındaki farklılığa işaret etmektedir. Bir başka ifadeyle Raman spektrumları arasındaki farklılığa karşılık gelmektedir. İki temel bileşenin birbirine göre (PC-2’ye karşı PC-1) çizilmesiyle elde edilen skor grafiği incelenen örnekler arasındaki ilişkiyi yorumlamak amacıyla kullanılmaktadır. PCA’ nın kullanım amaçları sıralanacak olursa; matrislerin özdeğerlerinin ve özvektörlerinin belirlenmesi, belirlenen ana bileşenlerin testi, orijinal değişkenlerin değişim miktarının belirlenmesi, veri setlerinin dendritlerinin oluşturulması, oluşturulan model için bir dendritin oluşturulması, koordinat sisteminde incelenen nesnelerin dağılımının gözlemlenmesi gibi amaçları yerine getirmek için kullanıldığını söylemek mümkündür (Maćkiewicz & Ratajczak, 1993; Ringnér, 2008). 22 . Şekil 2.3. İki eksenli (iki boyutlu) bir veri kümesi içerisinde, iki temel bileşen olan PC1 ve PC2. PC1 ve PC2 birbirleriyle dikey (ortogonal) yerleşimli olup; PC1 veriler arasındaki en yüksek varyansı koruyup yönünü belirtirken; PC2 ise; bu en büyük varyans yönünde tanımlanmaktadır. Tez çalışması kapsamında Raman spektral verilerine, temel bileşenler analizi UnscramblerTM CAMO (sürüm:5.5) programı vasıtasıyla yapılmıştır(CAMO Software AS., 2016). 2.3.2. Hiyerarşik Kümeleme Analizi (HCA) Kümeleme analizi, ait oldukları gruplar kesin bir şekilde bilinmeyen elemanların, birbiriyle ilişkili alt sınıflara ayrılmasına olanak sağlayan çok değişkenli istatistiksel yöntemlerden bir tanesidir. Bir başka ifadeyle; gruplandırılmamış veri setlerinin benzerliklerine göre sınıflandırılmasını sağlamaktadır. Kümeleme analizi PCA’ya benzer şekilde, birbiriyle ilişkili verilerin saptanmasını sağlamaktadır. Takipsiz çok değişkenli istatistiksel analiz yöntemlerinden biri olan PCA bazı durumlarda gruplandırma yapılmak istenen veriler arasındaki ayrımı net bir şekilde yapamayabilmektedir. Veriler arasındaki ilişkinin aydınlatılması ve görselleştirilmesi için grafik oluşturulmak istendiğinde; iki değişkenli veriler için saçılım grafiği oluşturulabilirken; 23 ikiden fazla değişkene sahip verilerin grafiği, PCA ile iki değişkene indirgendikten sonra yapılabilmektedir. Bu durumlarda ana hedefi, ilgilenilen örneklerin karakteristik özelliklerini temel alarak gruplandırmak olan kümeleme analizinden yararlanılmaktadır. Bu ayrım benzerlik ve farklılıklar üzerinden yapılmaktadır ve bu benzerlik farklılık ölçütleri, uzaklık ölçütlerine ya da korelasyona göre yapılmaktadır. Kümele analizinin kullanımı birçok alanda tercih edilmekle beraber; daha karmaşık sistemlerin değerlendirildiği tıp, biyoloji, psikoloji gibi branşlarda daha fazla tercih edilmektedir. Kümeleme analizi yapmış olduğu sınıflandırma vasıtasıyla, araştırmacılar için verilerin değerlendirilebilir ve yorumlanabilir hale dönüştürülmesine olanak sağlamaktadır. Özetle; bu analiz yöntemi grupları bilinmeyen bir popülasyondan seçilmiş n tane bireyin, p adet değişkene göre elde edilmiş olan gözlem sonuçlarıyla ilgilenmektedir. Sınıflandırmanın ardından gözlem sonuçlarında çok az bir kayıp meydana geldiğinden dolayı verilerin gruplandırılması yüksek verimlilikle yapılmaktadır. Kümeleme analizinde sırasıyla; veriler arası ilişkinin belirlenebilmesi amacıyla kullanılacak olan ölçütlerin ve değişkenlerin saptanması, birimlerin gruplandırılması, oluşturulan grupların uygunluğunun test edilmesi ve istatistiksel olarak uygunluğun değerlendirilmesi (test edilmesi) adımları gerçekleştirilir (Ada et al., n.d.). Hiyerarşik kümeleme analizinde ise; ilgilenilen numunelerin, bir başka ifadeyle birimlerin, değişik evrelerde bir araya getirmek suretiyle, ardışık olacak şekilde, kümeler (gruplar) olarak ayırmayı sağlar. Bununla beraber kümeler arasındaki benzerlik ve farklılıkların belirlenmesini yani uzaklık düzeylerinin saptanmasını da sağlamaktadır (Ada et al., n.d.). Hiyerarşik kümeleme kendi içerisinde ‘Gruplayıcı Hiyerarşik Kümeleme’ ve ‘Bölücü Hiyerarşik Kümeleme’ olmak üzere iki gruba ayrılmaktadır. Gruplayıcı hiyerarşik kümeleme tekniğinde ilgilenilen her örnek başlangıçta bir küme (grup) olarak değerlendirilir. Ardından birbiriyle ilişkili olan kümeler (iki küme) bir araya getirilerek yeni bir küme meydana getirilir. Bununla beraber gruplamanın her adımında küme sayısı bir azalmaktadır. Görsel olarak gruplayıcı kümeleme analizi dendrogram veya ağaç grafiği olarak bilinen şekillerle görselleştirilebilir. Bölücü hiyerarşik kümeleme analizi yönteminde ise; bütün verilerin oluşturmuş olduğu büyük topluluk bir küme olarak kabul edilmektedir. Burada kümedeki benzer olmayan veriler ayrıştırılarak gitgide daha küçük kümeler (gruplar) oluşturulur. 24 Gruplayıcı hiyerarşik kümeleme analizinin tersi olacak şekilde en sonunda her örnek bir küme oluşturuncaya kadar işlem devam eder (Fen et al., 2013). Şekil 2.4. P1, P2, P3, P4 ve P5 olmak üzere 5 örnekten oluşan bir grup için kümeleme analizi sonucu elde edilmiş olan dendrogram örneği Şekil 2.4.’te P1, P2, P3, P4 ve P5 olmak üzere 5 örnekten oluşan bir grup verilmiştir. Örneklere kümeleme analizi uygulanmasının ardından, bu sonuca göre bir dendrogram oluşturulmak istendiğinde, birbirine en çok benzeyen örnekler arasındaki bağıl mesafenin en az olması beklenmektedir. Çünkü birbirine yakın gruplar boş bir uzayda birbirlerine en yakın konumda yerleşim göstereceklerdir. Bu bağlamda P1 ve P2 ile P4 ve P5 birbirlerine en yakın özellik gösteren örneklerdir. P3 ise bu iki sınıf örnekten, P1 ve P2 örneklerinin oluşturmuş olduğu gruba daha yakın özellik göstermektedir. Tez çalışması kapsamında, her bakteri grubu için elde edilmiş olan ortalama spektrumlara ait verilere hiyerarşik kümeleme analizi, UnscramblerTM CAMO (sürüm:5.5) programı vasıtasıyla uygunlanmıştır (CAMO Software AS., 2016). 25 2.3.3. Kısmi En Küçük Kareler Ayrıştırma Analizi (PLS-DA) Kısmi En Küçük Kareler Ayrıştırma Analizi (PLS-DA), kemometri alanında yaygın olarak kullanılmakta olan çok değişkenli istatistiksel analiz yöntemlerinden biridir. Özellikle metabolomik çalışmalarda sınıflandırma yapmak amacıyla ve biyobelirteç belirlenmesi gibi konularda daha çok tercih edilmektedir. PLS-DA, yakın akrabası olan PCA yöntemine benzer şekilde verilerin boyutlarının indirilmesi amacıyla da kullanılmaktadır (Szymańska et al., 2012) . Kemometrik ve omik veriler (biyolojik materyal üzerine yapılan çalışmalar sonucu elde edilen verilerdir) oldukça yüksek hacimli olup, çok sayıda değişken, gürültü içermeleri bakımından PLS- DA, PCA vb. çok değişkenli istatistiksel analiz yöntemlerine ihtiyaç duymaktadırlar. PLS-DA, grupların tam olarak belli olması bakımından PCA’dan ayrılır. Bu bakımdan PCA denetimsiz bir analiz yöntemiyken; PLS-DA denetimli bir yöntemdir. Bir başka deyişle PLS-DA analizinde örneklerin sınıf ataması yapılmaktadır. Verilerin boyut azaltılması ve sınıflandırma yapılmasına olanak sağlayan PLS-DA, özellik seçimi yapılmak üzere de kullanılabilmektedir. Bu tarz boyut azaltma yapılmasına olanak sağlayan analiz yöntemlerinin temel amacı; ilgilenilen verilerin olabilecek en düşük hatayla, veriler arasındaki varyansı koruyarak, daha düşük boyutlu ve doğrusal bir hale dönüştürülmesini sağlamaktır. PLS-DA’nin uygulanacağı ana veri matrisi nm-boyutlu vektörlerden oluştuğu bir durumda X bir n x m matrisidir. PLS-DA ve PCA’nın kullanım şekilleri düşünüldüğünde, amaç m x d matrisini bir başka ifadeyle, A dönüşüm matrisini bulmaktır. Matris A, en uygun (optimum) şekilde nd-boyutlu S vektörüne dönüştürülmesini sağlar. Bunun sonucunda S.= X .A .+.E olarak ifade edilebilir. Bu eşitlikte E hata matrisi olarak isimlendirilmektedir. Satırları dönüştürülmüş vektörleri ifade eden S matrisi, X veri matrisindeki n vektörünün, her biri için d-boyutlu skorlar verir. Boyutları indirilmiş yeni bileşenlere ana bileşen (PC) denilmektedir. PCA’da dönüşümde ilk ana bileşende veriler arasındaki varyans olabilecek en yüksek oranda korunur. PLS-DA’da ise; ilk ana bileşende ana veri seti ve etiketlenmişi arasındaki kovaryans mümkün olduğunca en yüksek oranda korunmaktadır. PCA yöntemi projeksiyon hatasının en aza indirerek ilk özvektör boyunca ortogonal bir alt uzaya yansıtarak ilk temel bileşeni hesaplar ve bunu son temel bileşene kadar yineler. Alternatif olarak; temel bileşenlerin kovaryans matrisi C’nin özvektörleri vasıtasıyla aşağıdaki şekilde ifade edilebilmektedir (Ruiz-Perez et al., 2020). 26 𝐶 = 1 𝑛−1 𝑋𝑇𝐶𝑛𝑋 (2.11) Cn : n x n merkezleme matrisi 𝐿1,𝐿2 … 𝐿𝑛 : Yükleme vektörleri 𝑒1, 𝑒2 … 𝑒𝑛 : C’nin özvektörleri 𝜆1 , 𝜆2 … 𝜆𝑛 : C’nin özdeğerleri olarak alındığında aşağıdaki 2.17 eşitliği kurulmaktadır. 𝐿𝑖 = √𝜆𝑖𝑒𝑖, 𝑖 = 1, … . , 𝑛, (2.12) PLS-DA ‘da bileşenlerin birbirlerine ortogonal (dikey) olması gerekir ve PLS-DA’nın ilk bileşeni C’nin özvektörleri olarak aşağıdaki şekilde ifade edilmektedir. 𝐶 = 1 (𝑛−1)2 𝑋𝑇𝐶𝑛𝑦𝑦𝑇𝐶𝑛𝑋 (2.13) y: Sınıf etiketi vektörü Tekrarlı olan süreç, özelliklerin önemini veren yükleme vektörlerini a 1 ,…, a d hesaplamaktadır. Tekrarlı süreç h, en yüksek kovaryansın hesaplanmasını amacına hizmet etmektedir. 𝑚𝑎𝑥(𝑎ℎ𝑏ℎ) 𝑐𝑜𝑣(𝑋ℎ𝑎ℎ, 𝑦ℎ𝑏ℎ) (2.14) 𝑏ℎ : 𝑦ℎ etiket vektörü için yükleme X 1 = X ve X. h ve y h, önceki h −1 bileşenleriyle dönüştürme sonrasında artık (hata) matrislerdir. Tez çalışması kapsamında elde edilmiş olan spektral verilere, PLS-DA, UnscramblerTM CAMO (sürüm:5.5) programı vasıtasıyla uygulanmıştır (CAMO Software AS., 2016; Ruiz-Perez et al., 2020). 27 2.3.4. Sınıflandırma Modelinin Geliştirilmesi ve Tahmin Yeteneğinin Test Edilmesi Tez çalışması sürecinde, model geliştirilmesi sırasında, çok değişkenli istatistiksel analiz yöntemlerinden olan PCA ve PLS-DA metotlarının kullanımı tercih edildi. PCA yukarıda da anlatıldığı üzere, ilgilenilen örneklerin (tez çalışmasında bu örnekler bakterilere ait spektrumlardır) gruplarının bilinmediği denetimsiz bir analiz yöntemiyken; PLS-DA ise, örneklerin ait olduğu sınıf (grup) bilgisi bilindiğinden dolayı denetimli bir yöntemdir. 4 bakteri grubunun her biri 20 adet sub-kültür içermektedir. 20 adet sub-kültürün (toplamda 80 tane) her biri için 6 adet olacak şekilde Raman spektrumları çekilmiş ve kaydedilmiştir. Bu sub- kültürlerden 15 adedi (toplamda 60 adet) bakteri gruplarının Raman spektrumları üzerinden ayrıştırılmasına olanak sağlayacak sınıflandırma modelinin geliştirilmesi için kullanıldı. Rastgele olarak seçilmiş olan her bir sub-kültür için 5 toplamda 20 adet bakteriden elde edilen ortalama Raman spektrumları ise; geliştirilmiş modelin tahmin kabiliyetinin test edilmesi amacıyla kullanıldı. Model geliştirme için kullanılmış spektrumlara ait veri setine ‘kalibrasyon veri seti veya eğitim veri seti’, modelin test yeteneğinin değerlendirilmesi amacıyla kullanılmış olan veri setine ise ‘validasyon seti’ adı verilmektedir (Povey et al., 2014). Model geliştirilmesi sırasında kullanılmış olan denetimsiz ve denetimli çok değişkenli istatistiksel yöntemlerden olan PCA ve PLS-DA analiz yöntemleri, UnscramblerTM CAMO (sürüm:5.5) yazılımı vasıtasıyla gerçekleştirilmiştir (CAMO Software AS., 2016). PLS-DA, yukarıda bahsedildiği üzere denetimli bir analiz yöntemi olup, ilgilenilen örneklere ait grup bilgisinin bilinmesini gerektirmektedir. Grup bilgisinin bilindiği matematiksel modellerin geliştirilmesine olanak sağlayan bu yöntemle, ait olduğu sınıf bilinmeyen örneklerin ait oldukları gruplara atanması sağlanabilmektedir. Bahsi geçen modelleme en küçük kareler analiz algoritmasının farklı bir türü ile yapılmaktadır. Bakterilere ilişkin spektrumlara ait veri setleriyle geliştirilmiş olan sınıflandırma modeline, grup bilgisi atanmamış olan (validasyon seti içerisinde bulunan bakteriyel spektrumlar) örneklerin, ait olduğu gruplar tahmin edilebilmektedir. PLS-DA yönteminde, ilgilenilen örneklere ait veriler (tez çalışması kapsamında bu veriler bakteriyel spektrumlardır) X ekseninde yerleşim gösterirken; bakterilerin ait olduğu grup veya sınıf bilgisi ise Y ekseniyle ifade edilmektedir. Sınıf bilgisini taşıyan Y ekseni için, ilgilenilen gruba ait 28 bir bakteri numunesi uygun olarak ‘1’ değerini alırken bu sınıfa ait olmayan bir bakteri ‘0’ değerini almaktadır. Geliştirilmiş olan model bu şekilde bakterilerin ait olduğu grup bilgisiyle ilgili tahmin yapabilmektedir. Atanan bu 0 ve 1’ler ideal tahmin (varsayım) değerleridir. Varsayım sürecinde, model her örnek için ideal olmayan değerler atar, bu nedenden dolayı grup bilgisinin belirlenebilmesi için bir ölçüt belirlenmesi gerekliliği ortaya çıkar. Tez çalışması kapsamında grup üyeliklerinin belirlenebilmesi için belirlenmiş olan ölçüt değerler ‘0,75-1,25’ aralığıdır. Sonuç olarak, ilgili grup için tahmin edilen Y değeri 0,75-1,25 aralığında olduğu durumlarda, bakterilere ait örneklemin, belirli bir grubun üyesi olduğu sonucuna varılmıştır. 2.3.5. İstatistiksel Model Performansının Değerlendirilmesi Geliştirilmiş olan modellerin, güvenilirliklerinin ve uygulanabilirliklerinin saptanması ve değerlendirilmesi gerekmektedir. Modelin başarısının değerlendirilmesi için duyarlılık, etkinlik, hassasiyet, doğruluk parametreleri hesaplanmalıdır. Bu parametrelerin hesaplanması karışıklık matrisinden (confusion matrix) yararlanarak yapılır. Karışıklık matrisi, iki satır ve iki sütun içeren ve bu satır-sütunlarda; gerçek pozitif (true positive) , gerçek negatif (true negative) , yanlış pozitif (false positive), yanlış negatif (false negative) bilgileri yer almaktadır (Yonar & Haman Bayarı, 2023). Şekil 2.5 ‘te örnek bir karışıklık matrisi verilmiştir. Bu matris tahmin edilen sınıf ve gerçek sınıf ile ilgili bilgileri barındırmaktadır (Cihan et al., 2020). 29 Şekil 2.5. İkili sınıflandırma için karışıklık matrisi örneği Şekil 2.5. ikili sınıflandırma yapmak amacıyla kullanılabilecek karışıklık matrisi için temel bir örneği göstermektedir. Matris tahmin edilen ve gerçek sınıf değerleriyle ilgili bilgi içermekte olup satır ve sütunlarda bu bilgiler verilmiştir. Duyarlılık (Sensitivity), modelin sınıflandırma kabiliyetinin bir ölçütüdür ve denklem 2.15’ de gösterildiği gibi hesaplanır. (%)Duyarlılık = DP DP + YN x 100 (2.15) Denklem 2.15’de DP; gerçek pozitif, YN ise; yanlış negatifi ifade etmek için kullanılmıştır. Seçicilik (Specificity), modelin, ilgilenilen gruba ait olmayan örnekleri ayırma kabiliyetinin bir ölçütüdür. Başka bir ifadeyle sınıfa ait olmayan örneklerin belirlenebilme kabiliyetinin test edilmesidir. Denklem 2.16’de ifade edildiği şekilde hesaplanır. 30 (%)Seçicilik = DN (DN+YP)x100 (2.16) Denklem 2.16’de DN; doğru negatif, YP ise; yanlış pozitifi belirtmek amacıyla kullanılmıştır. Hassasiyet ise; Modelin bütün gruplar içerisinde ne kadar doğru tahmin yaptığının belirlenmesi amacıyla hesaplanır. Hesaplama denklem 2.17’de gösterildiği şekilde yapılmaktadır (Cihan et al., 2020). (%)Hassasiyet = DP (DP+YP)x100 (2.17) Denklem 2.17’deki ifadede DP; doğru pozitif, YP ise; yanlış pozitifi ifade etmek için kullanılmıştır. Etkinlik; Geliştirilmiş olan model için elde edilmiş olan karışıklık matrisiyle, hesaplanması yapılmış duyarlılık ve seçicilik sonuçlarının birleştirilmesidir. Denklem 2.18’te belirtildiği şekilde seçicilik ve duyarlılık değerleriyle hesaplanır (Cihan et al., 2020). (%)Etkinlik = Duyarlılık+Seçicilik 2 x 100 (2.18) Doğruluk (Accuracy); doğru sınıflandırma oranının belirlenmesi amacıyla grup bilgisinden bağımsız olarak denklem 2.19’te olduğu şekilde hesaplanmaktadır (Cihan et al., 2020). (%)𝐷𝑜ğ𝑟𝑢𝑙𝑢𝑘 = 𝑑𝑜ğ𝑟𝑢 𝑠𝚤𝑛𝚤𝑓𝑙𝑎𝑛𝑑𝚤𝑟𝑚𝑎 𝑡𝑜𝑝𝑙𝑎𝑚 ö𝑟𝑛𝑒𝑘 𝑠𝑎𝑦𝚤𝑠𝚤 𝑥 100 (2.19) Denklem 2.20 daha açık bir şekilde ifade edilecek olursa; denklem 2.20 ‘te olduğu gibi bir eşitlik elde edilmektedir. (%)𝐷𝑜ğ𝑟𝑢𝑙𝑢𝑘 = 𝐷𝑃+𝐷𝑁 𝐷𝑃+𝐷𝑁+𝐹𝑃+𝐹𝑁 𝑥 100 (2.20) Denklem 2.20’te DP; doğru pozitif, DN; doğru negatif, FP; yanlış pozitif ve FN; yanlış negatifi ifade etmek üzere kullanılmıştır. 31 3. BULGULAR 3.1. Bakteri Raman Spektrumlarının Ön İşlenmesi Şekil 3.1’de bakterilere ait ortalama Raman spektrumları yer almaktadır. Literatürden elde edilen bilgiler ışığında, bakterilere ait Raman bantlarının işaretlemeleri; Tablo 3.1’de gösterilmektedir (de Siqueira e Oliveira et al., 2012; Paret et al., n.d.). Şekil 3.1. Bakteri gruplarının alan normalize edilmiş Raman Spektrumlarından elde edilen ortalama spektrumlar (CJ bakterisi mavi, SSP bakterisi yeşil, AFS bakterisi siyah ve EFS bakterisi kırmızı). Şekil 3.1 incelendiğinde bakterilere ait ortalama Raman spektrumları her ne kadar benzer profil gösteriyor olsalar da; 4 farklı bakteri grubuna ilişkin ortalama spektrumların önemli farklılıklar gösterdiği görülmektedir. Tez çalışmasında kullanılan dört tür bakterinin benzer patojeniteye sahip 32 olmalarına karşın, Raman spektrumlarının bakterilerin farklı hücre yapılarını incelenen bakteri türlerinin her birini karakterize edecek şekilde yansıtması gerektiği tezimizi desteklemektedir. Tablo 3.1. Bakteri Raman spektrumlarında temel bantlara ait işaretlemeler Raman Kayması (cm-1) İşaretlemeler 515 Glikozidik halka deformasyonu 641 Tirozin 720 Aromatik aminoasitler; νC-C bağ gerilmesi; δC-H açı bükülmesi 745 Triptofan 840 δC-C; δC-OH 900 νC-O-C bağ gerilmesi; δC-H 931 νC-C bağ gerilmesi 948 Karbonhidratlar (νC-O; νC-C bağ gerilmesi) 959 Fenilalanin ; prolin ; tirozin 1040 Karbonhidratlar (νC-O; νC-C bağ gerilmesi) 1080 νC-C bağ gerilmesi 1092 Nükleik asit (PO2 simetrik bağ gerilmesi); νC-O-C ve νC-C bağ gerilmesi; sakkaritler arası glikozidik bağlanma 1208 Amid III + aminoasitler 1259 Amid III + sakkaritler 1340-1350 δC-H; δC-H3 simetrik açı bükülmesi 1450 Amid II; δC-H3; δC-H2 açı bükülmesi (makas) 1555 Polisakkaritler 1574 Peptidoglikan νC=O 1610 νC=C halka gerilmesi; asimetrik aminoasitler 1659 Amid I Bakteri Raman spektrumlarına ait işaretlemeler literatürdeki çalışmalara uygun olacak şekilde yapılmıştır (de Siqueira e Oliveira et al., 2012; Paret et al., n.d.). 33 Bakteri gruplarına ait spektrumların benzerlikleri ve farklılıklarını daha detaylı incelemek amacıyla, ortalama spektrumlara kümeleme analizi (Hierarchical Single-linkage algoritması kullanılmıştır) ve Temel Bileşen Analizi (PCA) uygulanmıştır. Bakteri gruplarına ait (CJ, EFS, AFS ve SSP olmak üzere) ortalama spektrumlara uygulanmış olan kümeleme analizi sonucu elde edilen dendrogram Şekil 3.2’de; Temel Bileşen Analizine ait skor grafiği ise Şekil 3.3’te gösterilmiştir. Şekil 3.2. Dört bakteri grubuna ait (CJ, EFS, AFS, SSP olmak üzere) ortalama Raman spektrumlarına hiyerarşik kümeleme analizi uygulanması (Hierarchical Single-linkage algoritması) sonucu oluşturulan dendrogram. Şekil 3.2’deki dendogramlar, PC-2’nin skorları kullanılarak, Hiyerarşik Kümeleme Analizi (Hierarchical Single-linkage algoritması) yapılarak oluşturulmuştur. Farklı bakterilerin ortalama Raman spektrumlarının PC-2 puanları kullanılarak gerçekleştirilen hiyerarşik kümeleme analizi, Gr(-)'i, Gr(+) suşlardan ayırmak ve bu koordinatın uygunluğunu vurgulamak için 34 kullanılabilmektedir. Şekil 3.2’de gösterildiği gibi, gerçekleştirilen kümeleme analizi (Hierarchical Single-linkage algoritması, Öklid mesafeleri) Gr (+) tipi bakterileri Gr (-) olandan ayırarak uygun şekilde gruplandırmıştır. Kümeleme analizinin gerçekleştirilme şekli, Şekil 3.2'de sol tarafta gösterilmektedir. Bu şekilde, PC-2 ve PC-1 puan grafiğindeki farklı bakterilere karşılık gelen noktalar, PC-2 eksenine yansıtılarak Gr (+) ve Gr (-) bakteriler için farklı bölgeleri açıkça tanımlamaktadır. Projeksiyonlar arasındaki Öklid mesafeleri, Şekil 3.2’de gösterilen dendrogramı oluşturmak için kullanılan benzerlik kriterlerini tanımlamaktadır. Dendrogramda, her düğümde birleşen dalların, yöneliminin keyfi olduğunu, yansıtılan noktalar, belirli bir numunenin komşu dallanmadan kaynaklanan numunelerle benzerliğinin karşılaştırılmasına izin vermektedir. Örneğin; AFS, SSP'den çok CJ, EFS çiftine benzer veya SSP, CJ'den ziyade EFS'ye daha benzerdir. Tahmin edilebileceği gibi, eğer hiyerarşik analiz PC-1 / PC-2 koordinatları seti veya tam veriler (tam spektrum) kullanılarak yapılırsa, PC-1 bileşeni bakterilerin Gram boyanma özelliklerine bakılmaksızın gruplar arası varyansın büyük bir bölümünü açıklamaktadır. Genel olarak, SSP türü en belirgin bileşimi sergileyen türken, Gr (-) hücre duvarlı AFS ise; aslında CJ'ye oldukça benzer özellik göstermektedir. Şekil 3.3. CJ, EFS, AFS, SSP gruplarına ait Raman ortalama spektrumlarına alan normalizasyonu uygulanmasının ardından elde edilen PCA skor grafiği (PC-2’ye karşı PC-1). 35 Şekil 3.3’te ortalamalar üzerinden elde edilen PCA skor grafiğinde, PC-2 temel bileşeni, Gr (-) olan AFS'yi negatif bölgeye ve Gr (+) tipi bakterileri (EFS, SSP, CJ) pozitif bölgeye yerleştirerek, Gr (+) bakterileri Gr (-)'den ayırmaktadır. PC-1 temel bileşeni ise bakterileri Gr (+) veya Gr (-) olduğunu dikkate almaksızın birbirinden ayrışmasına olanak sağlamaktadır. Şekil 3.4’de SSP ve AFS bakterilerinin birbirinden çıkartılmış ortalama Raman spektrumları PCA modeline ait PC-2 yüklemesi ile birlikte, Şekil 3.5’de SSP ve EFS bakterilerinin birbirinden çıkartılmış ortalama Raman spektrumları PCA modeline ait PC-1 yüklemesi ile birlikte verilmektedir. PC2 yüklemeleri, ilki Gr (+) tipi bakterilerin ikincisi Gr (-) tipi bakterilerin temsili olan SSP ve AFS bakterilerinin ortalama spektrumları arasındaki farka çok benzerken (Şekil 3.4), PC1 yüklemeleri SSP-EFS fark spektrumunun profiline oldukça yakındır. Skor grafiğindeki farklı ortalama spektrumlara karşılık gelen noktaların konumları, PC1 ve PC2'nin yükleme profilleri tarafından belirlenir. Şekil 3.3'te gösterilen verilere göre, PC1 için, en pozitif yüklemeler, SSP bakterilerinin Raman spektrumunun (skor grafiğinde PC1 ekseninde en pozitif değer alanlar) öne çıkan karakteristik bantlara sahip olduğu değişkenlerle (frekanslar), en negatif yüklemeler ise EFS’nin Raman spektrumunun (PC1'in daha negatif tarafında bulunanlar) en şiddetli bantlara sahip olduğu frekanslarla ilişkilidir. CJ ve AFS bakterilerine karşılık gelen PC1 puanlarının sıfıra yakın olması bu iki bakteri türünün karakteristik spektral özelliklerinin, bu temel bileşenin yüklemelerine yansımadığı anlamına gelmektedir. Bu eğilimler Şekil 3.5'te açıkça görülmektedir. Benzer şekilde sırasıyla en pozitif ve en negatif PC2 skor değerleri alan SSP ve AFS bakterileri, PC2 yüklemelerinin en pozitif ve en negatif değerlere sahip olduğu frekans değerlerinde belirgin karakteristik spektral özelliklere sahiptir (bkz. Şekil 3.4). 36 Şekil 3.4. AFS bakterilerine ait ortalama Raman spektrumlarının SSP ortalama Raman spektrumundan çıkartılmasıyla elde edilen fark spektrumu (yeşil), PCA modeline ait PC-2 yüklemeleri (pembe) CJ ve EFS bakterilerinin PC2 puanları da sıfıra yakındır; bu durum, CJ ve EFS’nin Raman spektrumlarındaki karakteristik (işaret) bantlarının, PC2 yüklemelerinin küçük değerlere sahip olduğu frekanslarda göründüğü anlamına gelmektedir. Ancak EFS, spektrumun yüksek frekans aralığında (yaklaşık 3000 cm-1) çok güçlü bir Raman bandına sahiptir ve bu durum, PC2 yükleme profili, SSP–AFS Raman spektrumu (SSP ortalama Raman spektrumu AFS ortalama Raman Spektrumundan çıkarılmış) ile karşılaştırıldığında gözlenen farkı açıklamaktadır (bkz. Şekil 3.4). 37 Şekil 3.5. EFS bakterilerine ait ortalama Raman spektrumlarının SSP ortalama Raman spektrumundan çıkartılmasıyla elde edilen fark spektrumu (mavi), PCA modeline ait PC-1 yüklemeleri (kırmızı) Yukarıda belirtildiği gibi, PC2 yükleme grafiğinden Gr (+) tipi bakterileri Gr (-) tipi bakterilerden ayıran spektral bölgeleri belirlemek mümkündür. En şiddetli negatif pikler, Gr (-) bakterilerde Gr (+) olanlara göre nispeten daha fazla bulunan moleküler türlerle ilişkili olacaktır. 1555, 1259, 1040, 948, cm-1'de gözlenen bu piklerin tümü karbonhidrat türleriyle ilişkilidir (bkz. Tablo 3), bunlar iki bakteri türünün hücre duvarlarının farklı yapısıyla ilişkilendirilebilinir. 3.2. Raman Spektrumları Tabanlı Bakteriyel Sınıflandırma Modelinin Geliştirilmesi Sınıflandırma modeli geliştirilebilmek için bakterilerle ilişkili Raman spektrumları kullanıldı. Temel Bileşenler Analizi (PCA) ve Kısmi En Küçük Kareler Ayrıştırma Analizi (PLS-DA) yöntemleri kullanılarak 4 sınıflı (CJ, EFS, SSP, AFS) iki model geliştirilmiştir. Veri analizinin bu 38 aşamasında, Raman spektral verilerin, bakterilerin ayrıştırılmasında kullanılabilirliği araştırılmıştır. İlk aşamada farklı bakteri türlerinin sınıf bilgileri tanımlanmaksızın denetimsiz çok değişkenli istatistiksel veri analizinde kullanılan bir yöntem olan PCA analizi tüm bakteri örneklerine ilişkin Raman spektrumları üzerinden gerçekleştirilmiştir. PCA modelinin geliştirilmesi için her gruptan 15, toplamda 60 ortalama spektrum kullanılmıştır. 60 ortalama spektrumdan oluşan veri seti modelin geliştirilmesi için, rastgele olarak seçilmiş olan, kalibrasyon veri setini oluşturmaktadır. Kalibrasyon veri seti 15 CJ, 15 EFS, 15 SSP ve 15 AFS bakterisine ait sub-kültürlerin replika spektrumlarının ortalamalarından meydana gelmektedir. Model geliştirilirken çapraz validasyon (cross-validation) kullanılmıştır. Şekil 3.6. PCA iki boyutlu skor grafiği (PC-2’ye karşı PC-1) Geliştirilen PCA modelinde, kalibrasyon (eğitim) veri setinde, PC-1, PC-2, PC-3 temel bileşenleri verilerdeki varyansın sırasıyla %80, %8, %3 olmak üzere toplamda %91’ini açıklamaktadır (Şekil 3.6, Şekil 3.7). Validasyon veri setinde de benzer şekilde, PC-1, PC-2, PC-3 temel bileşenleri verilerdeki varyansın sırasıyla %80, %8, %3 olmak üzere toplamda %91’ini açıklamaktadır. Model 39 geliştirilirken kullanılan 5 temel bileşenin tümü kalibrasyon ve validasyon veri setleri üzerindeki varyansları sırasıyla %94 ve %93’ünü açıklamaktadır. Skor grafiklerinde, EFS negatif PC-1 skor bölgesinde, AFS ve SSP örnekleri ise pozitif skor bölgesinde kümelenirken, CJ örnekleri PC-1 ekseni boyunca yayılmıştır. PC-1 ekseni bakterileri Gr (+) veya Gr (-) olmalarına bakmaksızın birbirinden ayrıştırmıştır. PC-2 ise bakterileri gram boyama özelliklerine göre sınıflandırarak, AFS örneklerini negatif PC-2 skor bölgesinde ve SSP, CJ ve EFS örneklerini ise kendi içinde sınıflandırarak pozitif skor bölgesinde gruplandırmıştır (Şekil 3.6, Şekil 3.7). Şekil 3.7. PCA modeline ait üç boyutlu (PC-3’e karşı, PC-2’ye karşı PC-1) skor grafiği İkinci bir model olan PLS-DA modeli, AFS, CJ, EFS ve SSP türü bakterilerin her birinden 15 örnek olmak üzere toplamda 60 örnekten elde edilen Raman spektrumları üzerinden, her bir bakteri türünün sınıflara atandığı Kısmi En Küçük Kareler Ayrıştırma Analizi (PLS-DA) yapılarak, elde edilmiştir. PLS-DA modelinde X değişkenleri bakterilere ait spektrumlarla ilgili bilgi içerirken (frekanslar); Y değişkeni bakterilerin grup bilgisini içermektedir. Örneğin; AFS bakteri grubu için, Y 1 olarak kabul edildiğinde; CJ, EFS ve SSP için 0 olarak atanmıştır. Benzer şekilde CJ grubu için Y bileşeni 40 1 olarak atandığında, diğer bakteri sınıfları için 0 olarak alınmıştır. Böylece bakterilere ait Raman spektrumlarından, denetimli (takipli) bir ayrıştırma modeli geliştirilmiştir. PLS-DA modeli bu özelliği bakımından PCA modelinden farklılık göstermektedir. Şekil 3.8. PLS-DA modeli 2D skor grafiği (Faktör-2’ye karşı Faktör-1) Geliştirilen PLS-DA modelinde, kalibrasyon (eğitim) veri setinde, Faktör-1, Faktör-2 ve Faktör-3, X verilerindeki varyansın sırasıyla %80, %8, %2 olmak üzere toplamda %90’nını açıklarken, Y verilerindeki varyansın ise sırasıyla; %29, %29, %27 olmak üzere toplamda %85’ini açıklamaktadır. Validasyon veri setinde de benzer şekilde, Faktör-1, Faktör-2 ve Faktör-3, X verilerindeki varyansın sırasıyla %80, %8, %2 olmak üzere toplamda %90’nını açıklarken, Y verilerindeki varyansın ise sırasıyla; %27, %29, %25 olmak üzere toplamda %81’ini açıklamaktadır. Model geliştirilmesi sırasında kullanılan beş faktör, kalibrasyon seti için, X ve Y üzerindeki varyansın sırasıyla %94 ve %93 ‘ünü; validasyon seti için ise, %92 ve %89 temsil ettiği görülmektedir. 41 PCA analizinde elde edilen sonuçlara benzer biçimde PLS-DA skor grafiğinde Faktör-1, Gr (+) veya Gr (-) olmalarını dikkate almaksızın bakterileri birbirinden ayrıştırmıştır. Faktör-2 ise, PCA modelinde olduğu gibi bakterileri gram boyama özelliklerine göre sınıflandırmıştır. AFS örneklerini yine negatif Faktör-2 skor bölgesinde konumlanırken, SSP, CJ ve EFS örnekleri kendi içinde gruplanarak pozitif skor bölgesinde yer almaktadır. Şekil 3.9. PLS-DA modeli D skor grafiği (Faktör-1, Faktör-2, Faktör-3) 3.3. Geliştirilen PCA ve PLS-DA Modellerinin Tahmin Yeteneğinin Test Edilmesi Model geliştirilmesi sırasında kullanılmamış olan (rastgele olarak seçilmiş), Raman spektrumları, geliştirilen PCA ve PLS-DA modellerinin tahmin yeteneklerinin test edilmesi amacıyla kullanılmıştır. Bu amaç için AFS bakterisinden AFS12, AFS16, AFS19, AFS5, AFS9 numaralı örnekler, CJ bakterisinden CJ10, CJ11, CJ15, CJ16, CJ17 numaralı örnekler, EFS bakterisinden EFS10, EFS13, EFS16, EFS19, EFS20 numaralı örnekler ve SSP bakterisinden 42 SSP10, SSP17, SSP20, SSP7, SSP9 numaralı örnekler validasyon veri setini oluşturmak üzere alınmıştır. Modellerin tahmin yeteneklerinin sınanması için hazırlanmış olan karışıklık matrisi ve model performans göstergeleri Tablo 3.2. ve Tablo 3.3.’te yer almaktadır. Geliştirilen modellerin performansları, tahmin edilen değerler karışıklık matrisine yerleştirilerek, duyarlılık, seçicilik, etkinlik, hassasiyet ve doğruluk değerlerinin hesaplanmasıyla yapılmıştır. Numuneler için sınıf bilgisinin atandığı PLS-DA modelinde, tahmin aşamasında Y değeri için eşik (grup bilgisi yer alır) 0,25 olarak belirlenmiştir. 0,75’ten küçük, 1,25’ten büyük bir sayı atanmış olan örnekler aykırı değer olarak kabul edilmiştir. Şekil 3.10. PCA modeli için 2D projeksiyon skor tablosu (PC-2’ye karşı PC-1) 43 Şekil 3.11. PCA modeli için 3D projeksiyon skor tablosu (PC-3, PC-2’ye karşı PC-1). PCA modelinin tahmin yeteneği Şekil 3.10 ve Şekil 3.11’e bakılarak değerlendirildiğinde, geliştirilen modelin örnekleri iyi bir şekilde ayırdığı ve doğru gruplara atadığı görülmektedir. Örneğin; AFS bakterisi için, seçilmiş olan AFS12, AFS16, AFS19, AFS5, AFS9 numaralı örnekleri, AFS türü bakterilerin yerleşim göstermiş olduğu pozitif PC-1, negatif PC-2 bölgesine yerleştirmiştir (mor). PC-1 ve PC-2 ‘nin pozitif bölgesinde yerleşim gösteren SSP bakterisi için; SSP10, SSP17, SSP20, SSP7, SSP9 numaralı örnekleri SSP’nin yerleşim gösterdiği bölgeye atamıştır (kahverengi). 44 Şekil 3.12. PLS-DA modeli için 2D projeksiyon skor tablosu (Faktör-2 x Faktör-1) Şekil 3.13. PLS-DA modeli için 3D projeksiyon skor tablosu (Faktör-3 x Faktör-2 x Faktör-1) 45 PLS-DA modelinde, PCA modeldeki PC-1’e benzer şekilde, Faktör-1 boyunca bakteri örneklerinin dağılımı, ait oldukları gruptan bağımsız olarak neredeyse aynıdır. Faktör-2 ise, PC-2’de olduğu bakterileri Gram boyama özelliklerine göre sınıflandırmaktadır (bkz. Şekil 3.12 ve Şekil 3.13). PLS-DA modelinde, kalibrasyon ve validasyon için elde edilen ortalama karekök sapması (RMSE), sırasıyla AFS için 0,11-0,13, CJ için 0,15-0,19, EFS için 0,09-0,11 ve SSP için ise, 0,10-0,13 olarak bulunmuştur bu da regresyonların kalitesinin iyi olduğunu göstermektedir. PCA ve PLS-DA tahminler için skor grafikleri değerlendirildiğinde geliştirilen modellerin beklenildiği gibi bütün verileri doğru gruplara atadığı gözlemlenmiştir. PCA ve PLS-DA modelleri olmak üzere, geliştirilmiş iki modelde de elde edilen sonuçların birbirlerine benzer olduğu görülmüştür. Bu nedenden dolayı PCA ve PLS-DA modelleri birbirinin alternatifi olacak şekilde kullanılabilir özellik göstermektedir. İstatistiksel olarak, modelin tahmin yeteneğinin değerlendirilmesi için; karışıklık matrisleri hazırlanarak, DP, DN, YP ve YN değerleri belirlenmiş ve duyarlılık, seçicilik, etkinlik, hassasiyet ve doğruluk gibi performans parametreleri hesaplanmıştır (bkz. Tablo 3.2 ve Tablo 3.3). Tablolar incelendiğinde geliştirilmiş olan PLS-DA modelinin validasyon veri setindeki örnekleri (toplam 20 tane) yanlış pozitif veya yanlış negatif olarak yerleştirmediği ve hepsini doğru gruplara atadığı görülmüştür. 46 PLS-DA modelinin doğruluk değeri %100 olarak hesaplanmıştır. Modellerin tahmin performansı parametreleri olan hassasiyet, seçicilik, etkinlik, duyarlılık ve doğruluk ölçütlerinin tümü optimaldir (uygundur). Şekil 3.14. PLS-DA modelini test etmede kullanılan AFS örnekleri için tahmin edilmiş Y değerleri. Şekil 3.14’de yer alan kırmızı çizgiler tahmin edilen değerleri, mavi kutular ise sapmaları ifade etmek için kullanılmaktadır. X ekseninde validasyon veri setinde kullanılmış olan bakteriler ve isimleri yer almaktadır. AFS için tahmin edilen Y değerleri 1 iken diğer bakteriler için (CJ, EFS ve SSP) tahmin edilen Y değerleri 0 olduğu görülmektedir. 47 Şekil 3.15. PLS-DA modelini test etmede kullanılan CJ örnekleri için tahmin edilmiş Y değerleri. Şekilde yer alan kırmızı çizgiler tahmin edilen değerleri, mavi kutular ise sapmaları ifade etmek için kullanılmaktadır. X ekseninde validasyon veri setinde kullanılmış olan bakteriler ve isimleri yer almaktadır. CJ için tahmin edilen Y değerleri 1 iken diğer bakteriler için (AFS, EFS ve SSP) tahmin edilen Y değerleri 0 olduğu görülmektedir. Şekil 3.16. PLS-DA modelini test etmede kullanılan EFS örnekleri için tahmin edilmiş Y değerleri. Şekilde yer alan kırmızı çizgiler tahmin edilen değerleri, mavi kutular ise sapmaları ifade etmek için kullanılmaktadır. X ekseninde validasyon veri setinde kullanılmış olan bakteriler ve isimleri yer almaktadır. EFS için tahmin edilen Y değerleri 1 iken diğer bakteriler için (CJ, AFS ve SSP) tahmin edilen Y değerleri 0 olduğu görülmektedir. 48 Şekil 3.17. PLS-DA modelini test etmede kullanılan SSP örnekleri için tahmin edilmiş Y değerleri. Şekilde yer alan kırmızı çizgiler tahmin edilen değerleri, mavi kutular ise sapmaları ifade etmek için kullanılmaktadır. X ekseninde validasyon veri setinde kullanılmış olan bakteriler ve isimleri yer almaktadır. SSP için tahmin edilen Y değerleri 1 iken diğer bakteriler için (CJ, EFS ve AFS) tahmin edilen Y değerleri 0 olduğu görülmektedir. 49 4. TARTIŞMA VE SONUÇ Bu tez çalışması kapsamında literatürde ilk kez olmak üzere, son yıllarda özellikle artan direnç mekanizmaları ve hastane enfeksiyonlarında rastlanmalarıyla dikkat çeken ve benzer patojeniteye sahip, A. faecalis, S.saprophyticus, E.faecalis ve C.jeikeium bakterilerinin kemometrik yöntemlerle Raman spektrumları üzerinden ayrıştırılmasına olanak sağlayan 4 sınıflı (CJ, EFS, SSP, AFS) iki istatistiksel model geliştirilmiştir. Temel Bileşenler Analizi ve Kısmi En Küçük Kareler Ayrıştırma Analizi yöntemleri kullanılarak PCA ve PLS-DA istatistiksel modellerinin geliştirilmesinde dört farklı bakteri grubunun her birinden 15 olmak üzere toplamda 60 bakteriden elde edilen Raman spektrumları (455-3100 cm-1 bölgesi) kullanılmıştır. Şekil 3.18’de elde edilen PCA ve PLS-DA skor grafikleri, PC-1 temel bileşeninin ve Faktör-1'in bakterileri Gr (+) veya Gr (-) olduğunu dikkate almaksızın birbirinden ayırmasına olanak sağladığını göstermektedir. PC-2 temel bileşeni ve Faktör-2 ise bakterileri gram boyama özelliklerine göre sınıflandırarak, Gr (-) olan AFS'yi negatif bölgeye ve Gr (+) tipi bakterileri (EFS, SSP, CJ) pozitif bölgeye yerleştirmiştir. Bu sonuç PC-2 temel bileşeninin ve Faktör-2'nin Gr (+) bakterileri Gr (-)'den ayrılmasına olanak sağladığını göstermektedir. Şekil 3.18. PCA (A) ve PLS-DA (B) modelleri için 2D projeksiyon skor tabloları Elde edilen bu sonuçlar, bu dört tip bakteri arasında yalnızca hücre çeper yapılarından kaynaklanan 50 bir ayrışma olmadığını; bunun dışında bakterilerin cins ve türlerinden dolayı da birbirlerinden ayrıldığını göstermiştir. Majör olarak hücre duvar yapısındaki farklılık [Gr (+) ve Gr (-)] bakteriler arasında net bir ayrılmaya sebep olurken, bakterilerin tür özelliklerine bağlı farklılıklarından kaynaklı olarak da ayrışma olduğu saptanmıştır. AFS bakterilerine ait ortalama Raman spektrumlarının SSP ortalama Raman spektrumundan çıkartılmasıyla elde edilen fark spektrumu ve PCA modeline ait PC-2 yüklemelerinden (Şekil 3.4) Gr (+) tipi bakterileri Gr (-) tipi bakterilerden ayıran spektral bölgeler belirlenmiştir. 1555, 1259, 1040, 948, cm-1'de gözlenen ve tümü karbonhidrat türleriyle ilişkili olan en şiddetli negatif pikler (bkz. Tablo 3), Gr (-) bakterilerde Gr (+) olanlara göre nispeten daha fazla bulunan moleküler yapılarla ilişkili olup, iki bakteri türünün hücre duvarlarının farklı yapıya sahip olmasına atfedilebilinir. Bu bantların,