MANTIQIY REGRESSIYA YORDAMIDA SPAM XABARLARNI ANIQLASH
Keywords:
Kalit so’zlar: Logistik regressiya, Spamni aniqlash, Mashinali o‘qitish,TF-IDF, Klassifikatsiya, Python.Abstract
Ushbu ishda mantiqiy regressiya (logistic regression) usuli yordamida spam
xabarlarni aniqlash masalasi o‘rganiladi. Mantiqiy regressiya – bu tasniflash algoritmi
bo‘lib, kiruvchi ma’lumotlar asosida xabar spam yoki spam emasligini ehtimollik bilan
baholaydi. Ishda turli matnlarni oldindan qayta ishlash, so‘zlarni vektorlarga
aylantirish va modelni o‘rgatish jarayonlari ko‘rib chiqilgan. Modelning samaradorligi
aniqlik, to‘g‘ri tasniflash va F1-skori orqali baholangan. Tadqiqot natijalari shuni
ko‘rsatadiki, mantiqiy regressiya oddiy, ammo samarali usul bo‘lib, kichik va o‘rta
hajmdagi ma’lumotlar to‘plamida spam xabarlarni aniqlash uchun yetarli darajada
ishlaydi.
References
UCI Foydalanilgan Adabiyotlar
1. Hosmer, D. W., & Lemeshow, S. 'Applied Logistic Regression.' Wiley, 2000.
2. Manning, C., Raghavan, P., & Schütze, H. 'Introduction to Information Retrieval.'
Cambridge, 2008.
3. Jurafsky, D., & Martin, J. 'Speech and Language Processing.' Pearson, 2021.
4. Pedregosa et al. 'Scikit-learn: Machine Learning in Python.' JMLR, 2011.
5. SpamAssassin Public Corpus — Machine Learning Repository.