Effective integration of data mining techniques with business intelligence using web mining
Citation
Mushref, Omer Muneam. (2019). Effective integration of data mining techniques with business intelligence using web mining. (Yayınlanmamış yüksek lisans tezi). Altınbaş Üniversitesi, Fen Bilimleri Enstitüsü, İstanbul.Abstract
Web madenciliği, World Wide Web'i dönüştürüyor ve daha kullanışlı hale getiriyor kullanıcıların verimli bir şekilde bilgi edinebilecekleri ortam. Dünya web çok sayıda multimedya dosyası, metin belgesi, eğitim içeriği ve her yeni kullanıcı ile sürekli artan görüntüler. Web madenciliği bir türüdür İnternette mevcut verilerin çıkarılmasını gerektiren veri madenciliği, özellikle köprüler, sunucu günlükleri, web gibi Web ile ilgili veri kaynaklarından kalıp bulma içerik ve web belgeleri. Web madenciliği üç farklı şekilde gerçekleştirilebilir, yani, web içeriği madenciliği, web kullanım madenciliği ve web yapısı madenciliği, vs. Bir web sayfasının farklı unsurlarını analiz etmeye katkıda bulunmak. Etkili uygulanması web madenciliğinin bu üç unsuru bilgi almayı oldukça kolaylaştırmıştır. web madenciliği kavramı, mevcut web kullanıcılarının mevcut olması nedeniyle yıllar içerisinde büyümüştür. indirmeye kıyasla verileri yüklemeyi tercih edin. Trenddeki bu değişiklik, ülkemizde bir dalgalanmaya neden oldu. İnternet verileri, bilgi verici kalıpların alınmasını zorlaştırıp zaman alıcı kılar ve bilgi. Bu araştırmada web madenciliğinin temellerini anlatacağız. Bir sonraki web madenciliği olduğunu göstermek için üç temel veri madenciliği tekniğini uygulamak iş zekası şoförü. Veri madenciliği teknolojileri bir veri setine uygulanacak iki haber ajansından çıkarılan 1098 cümle, yani Reuters ve Newswire. Sonuç Naif Bayes ve KNN uygulamalarının, veri ve PageRank'i ağırlık ifadesini kullanmak için kullanmak, bir kullanıcının Bir web sitesinin içeriği açısından gereklilik. Karşılaştırmalı analiz KNN tekniğinin Naif Bayes ve PageRank'le sırasıyla% 96.7,% 89.3 ve% 91.1 doğruluk. İş zekası alanı Alanın uzun vadeli veri analizi araçları ve çeşitliliği nedeniyle geliştirildi. Araştırmamızda ele alınan çeşitli araçların ilk üç aracı, Her bir aracın güçlü yönleriyle ilgili okuyucuyu aydınlatmak için ortalama olanı, zayıflıklar ve genel işlevsellik ve seçicilik. Araştırmanın ardından derinlemesine Geliştirilen özelleştirilmiş analitik aracın yanı sıra incelenen ve incelenen kusurları, hataları ve kusurları bulmak için gerçek şirket verileri üzerinde yapılan çeşitli testler ve eksiklikleri, her birini düzeltmek ve yazılımı temin etmek için yeterli zamana sahip olmak için gelecekte etkili olmaya devam etmektedir. Çalışma daha sonra değerlendirilen ile birlikte özetlenecek geliştirilen özel uygulamanın saha testlerinden elde edilen sonuçlar. Web mining is transforming the World Wide Web and changing it into a more useful environment through which users can obtain information efficiently. The world web contains massive quantities of multimedia files, text documents, educational content, and images which is continuously increasing with every new user. Web mining is a type of data mining that entails the extraction of data available on the internet, especially discovering patterns from Web-related data sources such as hyperlinks, server logs, web content, and web documents. Web mining can be accomplished in three different ways, i.e., web content mining, web usage mining, and web structure mining, etc. as they contribute to analyze different elements of a webpage. The effective implementation of these three elements of web mining has made it quite easy to retrieve information. The web mining concept has grown over the years due to the fact that the current web users prefer to upload data compared to download. This alteration in trend has led to a surge in the internet data making it difficult and time-consuming to retrieve informative patterns and knowledge. In this research, we will describe the fundamentals of web mining, well applying three essential data mining techniques to illustrate that web mining is the next driver of business intelligence. The data mining technologies will be applied on a dataset of 1098 phrases extracted from two news agencies, i.e., Reuters and Newswire. The result illustrated that the application of the Naïve Bayes and KNN to extract patterns from the data and to use PageRank to give the phrase weights makes it easy to determine a user's requirement in terms of the content of a website. The comparative analysis has illustrated that the KNN technique performed better that the Naïve Bayes and PageRank with an accuracy of 96.7%, 89.3% and 91.1% respectively. The field of Business ntelligence was picked due to the field's long-term development of data analysis tools and their diversity. The top three tools of the various tools covered in our research were compared to an average one in order to enlighten the reader in regards to each tool's strengths, weaknesses, and general functionality and electivity. Following the research is an in-depth review and examination of the customized analytical tool being developed, as well as various tests, conducted on actual company data, in order to discover flaws, faults, and deficiencies early, so as to have sufficient time to fix each of them and assure the software remains effective in the future. The work will then be summarized along with evaluated results from field tests of the developed custom application.
URI
https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=4J_FzTwlrMCH4qBROpXPH4VpVk_KE72ZCkKW1ocqarcBNgwim4gluQ-51cb9X0OVhttps://hdl.handle.net/20.500.12939/1850
Collections
- Tez Koleksiyonu [1884]