A missing data imputation method based on grey wolf algorithm for diabetes disease
dc.authorid | 0000-0001-5324-3442 | en_US |
dc.authorid | 0000-0002-6647-3025 | en_US |
dc.contributor.author | Ahmed, Anas | |
dc.contributor.author | İnan, Timur | |
dc.date.accessioned | 2023-10-18T13:27:22Z | |
dc.date.available | 2023-10-18T13:27:22Z | |
dc.date.issued | 2023 | en_US |
dc.department | Enstitüler, Lisansüstü Eğitim Enstitüsü, Bilişim Teknolojileri Ana Bilim Dalı | en_US |
dc.description.abstract | The bulk of medical databases contain coverage gaps due in large part to the expensive expense of some tests or human error in documenting these tests. Due to the absence of values for some features, the performance of the machine learning models is significantly impacted. Consequently, a specific category of techniques is necessary for the aim of imputing missing data. In this study, the Grey Wolf Algorithm (GWA) is used to generate and impute the missing values in the Pima Indian Diabetes Disease (PIDD) dataset. The proposed method is known as the Pima Indian Diabetes Disease (PIDD) Algorithm (IGW). The obtained results demonstrated that the classification performance of three distinct classifiers, namely the Support Vector Machine (SVM), the K-Nearest Neighbor (KNN), and the Naive Bayesian Classifier (NBC), was enhanced in comparison to the dataset prior to the application of the proposed method. In addition, the results indicated that IGW performed better than statistical imputation procedures such as removing samples with missing values, replacing them with zeros, mean, or random values. | en_US |
dc.description.abstract | Tıbbi veritabanlarının büyük kısmı, büyük ölçüde bazı testlerin pahalı masraflarından veya bu testlerin belgelenmesindeki insan hatasından dolayı kapsam boşlukları içermektedir. Bazı özellikler için değerlerin olmaması nedeniyle, makine öğrenimi modellerinin performansı önemli ölçüde etkilenir. Sonuç olarak, eksik verileri atamak amacıyla belirli bir teknik kategorisi gereklidir. Bu çalışmada, Pima Indian Diabetes Disease (PIDD) veri setindeki eksik değerleri oluşturmak ve hesaplamak için Gray Wolf Algoritması (GWA) kullanılmıştır. Önerilen yöntem Pima Hint Diyabet Hastalığı (PIDD) Algoritması (IGW) olarak bilinir. Elde edilen sonuçlar, Destek Vektör Makinesi (SVM), K-En Yakın Komşu (KNN) ve Naive Bayes Sınıflandırıcısı (NBC) olmak üzere üç farklı sınıflandırıcının sınıflandırma performansının önceki veri kümesine kıyasla arttığını göstermiştir. Önerilen yöntemin uygulanması. Ek olarak, sonuçlar IGW'nin istatistiksel olarak daha iyi performans gösterdiğini göstermiştir. eksik değerlere sahip örneklerin çıkarılması, sıfırlar, ortalama veya rastgele değerler ile değiştirilmesi gibi atama prosedürleri. | en_US |
dc.identifier.citation | Ahmed, A., İnan, T. (2023). A missing data imputation method based on grey wolf algorithm for diabetes disease. AURUM Journal of Engineering Systems and Architecture, 7(1), 55-72. | en_US |
dc.identifier.endpage | 72 | en_US |
dc.identifier.issn | 2564-6397 | |
dc.identifier.issue | 1 | en_US |
dc.identifier.startpage | 55 | en_US |
dc.identifier.uri | https://hdl.handle.net/20.500.12939/4173 | |
dc.identifier.volume | 7 | en_US |
dc.institutionauthor | Ahmed, Anas | |
dc.institutionauthor | İnan, Timur | |
dc.language.iso | en | |
dc.publisher | Altınbaş Üniversitesi | en_US |
dc.relation.ispartof | AURUM Journal of Engineering Systems and Architecture | |
dc.relation.publicationcategory | Makale - Ulusal Hakemli Dergi - İdari Personel ve Öğrenci | en_US |
dc.rights | info:eu-repo/semantics/openAccess | en_US |
dc.subject | Missing Values | en_US |
dc.subject | Grey Wolf Algorithm | en_US |
dc.subject | Diabetes Disease | en_US |
dc.subject | Classification | en_US |
dc.subject | Eksik Değerler | en_US |
dc.subject | Gri Kurt Algoritması | en_US |
dc.subject | Diyabet Hastalığı | en_US |
dc.subject | Sınıflandırma | en_US |
dc.title | A missing data imputation method based on grey wolf algorithm for diabetes disease | |
dc.title.alternative | Diyabet hastalığı için gri kurt algoritmasına dayalı eksik bir veri tahmin yöntemi | |
dc.type | Article |