Bu çalışmada, hastalıkla ilişkili gen setlerini tahmin etmek amacıyla uçtan uca bir sınıflandırma pipeline’ı geliştirilmiştir. Veri kalitesini artırmak için biyolojik anlam taşımayan ve modele katkı sağlamayan rep sütunu veri setinden çıkarılmıştır. Sınıf dengesizliği problemi ise scale_pos_weight kullanımı ve F1-skoruna odaklanılarak ele alınmıştır. Farklı modellerin karşılaştırılması sonucunda, doğrusal yöntemlerin verideki karmaşık ilişkileri yeterince yakalayamadığı, ağaç tabanlı yöntemlerin ise daha iyi performans gösterdiği gözlemlenmiştir. Özellikle XGBoost modelinin boosting yaklaşımı, hataları adım adım azaltarak model performansını artırmıştır. Bu nedenle, XGBoost modeli final model olarak seçilmiş ve tüm eğitim verisi kullanılarak yeniden eğitilmiştir.
In this study, an end-to-end classification pipeline was developed to predict disease-associated gene sets. In order to improve data quality, the rep column that did not have biological meaning and did not contribute to the model was removed from the data set. The class imbalance problem is addressed by focusing on the use of scale_pos_weight and F1-score. As a result of comparing different models, it has been observed that linear methods cannot adequately capture the complex relationships in the data, while tree-based methods perform better. In particular, the boosting approach of the XGBoost model increased model performance by reducing errors step by step. Therefore, the XGBoost model was selected as the final model and retrained using all training data.
Yapılan tüm cümle çevirileri veritabanına kaydedilmektedir. Kaydedilen veriler, herkese açık ve anonim olarak web sitesinde yayınlanır. Bu sebeple yapacağınız çevirilerde kişisel bilgi ve verilerinizin yer almaması gerektiğini hatırlatırız. Kullanıcıların çevirilerinden oluşturulan içeriklerde argo, küfür, cinsellik ve benzeri öğeler bulunabilir. Oluşturulan çeviriler, her yaş ve kesimden insanlar için uygun olamayabileceğinden dolayı, rahatsızlık duyulan hallerde web sitemizin kullanılmamasını öneriyoruz. Kullanıcılarımızın, çeviri yaparak eklemiş olduğu içerikler de, telif hakkı ve ya kişiliğe hakaret ve benzeri öğeler bulunuyorsa, →"İletişim" elektronik posta adresinden iletişime geçebilirsiniz.
Google dahil üçüncü taraf tedarikçiler, kullanıcıların web sitenize veya diğer web sitelerine yaptığı önceki ziyaretleri temel alan reklamlar yayınlamak için çerez kullanmaktadır. Google'ın reklam çerezlerini kullanması, Google ve iş ortaklarının kullanıcılara siteniz ve/veya internetteki diğer sitelere yaptıkları ziyaretleri temel alan reklamlar sunmasına olanak tanır. Kullanıcılar Reklam Ayarları sayfasını ziyaret ederek kişiselleştirilmiş reklamcılığı devre dışı bırakabilir. (Alternatif olarak, üçüncü taraf tedarikçilerin kişiselleştirilmiş reklamcılık için çerezleri kullanmasını devre dışı bırakmak isteyen kullanıcılar www.aboutads.info web adresini ziyaret edebilirler.)