Metaheuristic algorithms to enhance artificial neural network for medical data classification
Citation
Gburı, Ihsan Salman Jasım Al. (2018). Metaheuristic algorithms to enhance artificial neural network for medical data classification. (Yayınlanmamış doktora tezi). Altınbaş Üniversitesi, Fen Bilimleri Enstitüsü, İstanbul.Abstract
Bilgisayar donanım teknolojilerinin muazzam büyümesi ve büyük miktarlardaki veri karmaşıklığını çözme yetenekleri, araştırmacıları karmaşık veri madenciliği zorluklarını ve problemlerini aşmaya yöneltmiştir. Tıbbi veri seti sınıflandırması, yapay zeka ve veri madenciliği alanındaki araştırmaların karşılaştığı en önemli ve karmaşık problemlerden birini temsil etmektedir. Farklı hastalıklar ve birden fazla test kullanarak çeşitli teşhis yolları, çok miktarda karmaşık tıbbi veri üretmiştir. Üstelik, klinik merkezler ve hastanelerdeki ve diğer sağlık kurumlarındaki hasta kayıtlarının sayısı, doktorların ve terapistlerin, hastaların kritik koşullarda olup olmadığına veya uzak takiplere ihtiyaç duyulup duyulmadığına bakılmaksızın vakaları araştırmasına yardımcı olmak için gelişmiş ve doğru tıbbi madencilik uygulamalarına ihtiyaç duymaktadır. Bu tez, tıbbi veri madenciliğinin üst üste binen alanları için bir sınıflandırma modelinin doğruluğunu arttırmak için yapay sinir ağı (YSA) ve metaheuristik algoritmaların melezleştirilmesine odaklanmaktadır. Tıbbi tanılarla ilişkili temel problemler, son derece doğru sınıflandırma modellerinin tanımlanmasını içerir. Bu tezin katkıları, ilgili literatürde vurgulanan iki önemli sınıflandırma problemi veya konu etrafında döner. İlk strateji için, YSA yapısı ve optimize edilmiş algoritma arasındaki ilişki kurulmuştur. İkinci strateji için, çeşitlendirme ve yoğunlaşma arasındaki geçiş, optimal küresel çözüm arayışının bir parçası olarak incelenmiştir. Birinci bölümde bir arka plan girişini tartıştık ve ikinci bölümde problem üzerine uygulanan yaklaşımlar hakkında bir literatür taraması yaptık. Bu tezin üçüncü bölümünde, metaheüristik yinelemenin YSA yapısına etkisi tartışılmaktadır. Metaheuristik algoritma yinelemesinin YSA yapısı üzerindeki etkisini iyileştirmek suretiyle önerilen çalışmanın yeniliği gösterilmiştir. YSA, üç farklı metaheuristik algoritma (parçacık sürüsü optimizasyonu PSO, genetik algoritma GA ve havai fişek algoritması FW) kullanılarak geliştirilmiştir. Önerilen modeller beş standart tıbbi kriter ve bir büyük veri tıbbi veri kümesi üzerinde test edilmiştir. Önerilen çalışma başarıyla uygulandı ve dikkate değer sonuçlar elde edildi. Ayrıca, serbest-öğle yemeği teoremi NFLT çalışmanın bağlamında doğrulanır, yani, tüm sorun alanları için hiçbir algoritma evrensel değildir. Bu tezin ileriki bölümü, tıbbi veri sınıflandırmasının en iyi doğruluğunu temsil eden en uygun küresel çözümü elde ederken, keşif ve sömürü arasındaki geçişi araştırmaktadır. Gizli katmanların sayısı ve her katmandaki nöronların sayısı hem ANN öğrenimini etkileyebilir. Böylece, bu tezde kullanılan YSA, yüksek doğrulukta sonuçlara ulaşabilen karmaşık bir yapının seçilmesini içerir; Sonuç olarak, küresel optimum için arama yaparken metaheuristik algoritma verimliliği garanti edilebilir. Diferansiyel evrim algoritması DE ve benzetimli tavlama SA olarak adlandırılan iki meta-yandaş algoritma, problem alan adı için yeni ve geliştirilmiş bir algoritma DESA formüle etmek üzere birleştirilmiştir. Bununla birlikte, son derece hassas iki algoritmanın seçilmesi zorunlu değildir; bunun yerine, kolaylık sağlamak için ampirik testler yapılabilir. Önerilen yöntemin orijinalliği, küresel çözümler ve yoğun olarak kullanılan yerel çözümler için geniş bir alanı araştırmak için arama ve sömürü arasında denge sağlamak üzere, evrimsel metaheuristik algoritma olarak DE ve yörünge algoritması olarak SA'yı birleştirmektedir. DESA yöntemi GA ve DE olan tow evrimsel ile ve SA ve Tabu TS olan iki yörüngeyle karşılaştırıldı. Önerilen yöntem DESA başarıyla uygulandı ve daha iyi sonuçlar elde edildi. The tremendous growth of computer hardware technologies and their abilities to solve huge amounts of complex of data has motivated researchers to overcome complicated data mining challenges and problems. Medical dataset classification represents one of the most crucial and complicated problems faced by researches in the field of artificial intelligence and data mining. The different diseases and the various ways of diagnosis by using multiple testing have produced large amounts of complex medical data. Moreover, the huge number of patient records in clinical centers and hospitals and other health institutions has generated the need for advanced and accurate medical mining applications to help doctors and therapists investigate cases regardless whether patients are in critical conditions or require remote follow-ups. This thesis focuses on the hybridization of the artificial neural network (ANN) and metaheuristic algorithms to enhance the accuracy of a classification model for the overlapping fields of medical data mining. The key problems associated with medical diagnoses involve the identification of highly accurate classification models. The contributions of this thesis revolve around the two important classification problems or issues highlighted in the related literature. For the first strategy, the relation between the ANN structure and the optimized algorithm is established. For the second strategy, the tradeoff between diversification and intensification is investigated as part of the search for the optimal global solution. In the first chapter we discuss a background introduction and in the second chapter a literature survey about the approaches applied on the problem. The third chapter of this thesis discusses the effect of metaheuristic iteration on ANN structure. The novelty of the proposed work shown through improving the impact of metaheuristic algorithm iteration on ANN structure. ANN is enhanced using separate three metaheuristic algorithms (particle swarm optimization PSO, genetic algorithm GA, and fireworks algorithm FW). The proposed models are tested on five standard medical benchmarks and one big-data medical dataset. The proposed study is successfully implemented, and remarkable results are obtained. Furthermore, the no-free-lunch theorem (NFLT) is verified in the study's context, that is, no algorithm is universal for all problem domains. The forth chapter of this thesis investigates the tradeoff between exploration and exploitation when obtaining the optimal global solution which represent best accuracy of medical data classification. The number of hidden layers and the number of neurons in each layer can both affect ANN learning. Thus, the ANN used in this thesis involves the selection of a complex structure that can achieve highly accurate results; consequently, metaheuristic algorithm efficiency can be guaranteed when searching for the global optimum. Two metaheuristic algorithms named differential evolution algorithm DE and simulated annealing SA are combined to formulate a new and improved algorithm DESA for considered problem domain. However, selecting the highly accurate two algorithms is not mandatory; instead, empirical tests can be performed for convenience. Originality of proposed method is combining between DE as evolutionary metaheuristic algorithm and SA as trajectory algorithm to provide balance between exploration and exploitation to explore search space widely for global solutions and intensively exploited local solutions. DESA method compared with tow evolutionary which are GA and DE, and with two trajectory which are SA and Tabu search TS. Proposed method DESA is implemented successfully, and better results obtained.
URI
https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=fS4sqEZr79C_n60Rk6MjFQEw3Iu9dIneA7XTu80WLqDq9yLWRkFIE2XDOESAZevFhttps://hdl.handle.net/20.500.12939/1689
Collections
- Tez Koleksiyonu [1884]