APACHE KAFKA VA SPARK STREAMING ASOSIDA OQIMLI MA’LUMOTLARNI QAYTA ISHLASH
Abstract
Annotatsiya: Ushbu ishda Apache Kafka va Spark Streaming texnologiyalari
asosida oqimli ma’lumotlarni real vaqt rejimida yig‘ish, uzatish va qayta ishlash
jarayoni yoritilgan. Tizim katta hajmdagi ma’lumotlarni uzluksiz tahlil qilish, filtrlash
va natijalarni tezkor olish imkonini beradi. Ushbu yondashuv sanoat, moliya,
telekommunikatsiya va IoT sohalarida samaradorlikni oshirish hamda qaror qabul
qilish jarayonlarini tezlashtirishga xizmat qiladi.
References
Foydalanilgan adabiyotlar
Ushbu mavzuni yoritishda bir qator ilmiy manbalar va rasmiy hujjatlardan
foydalanildi. Avvalo, oqimli ma’lumotlarni qayta ishlash texnologiyalarini chuqur
o‘rganishda Apache Software Foundation tomonidan taqdim etilgan Apache Kafka
Documentation va Spark Streaming Programming Guide rasmiy hujjatlari muhim
nazariy va amaliy manba bo‘lib xizmat qildi. Kafka arxitekturasi, uning ishlash
tamoyillari va qo‘llanish sohalari bo‘yicha Kreps J., Narkhede N. va Rao J. tomonidan
yozilgan “Kafka: a Distributed Messaging System for Log Processing” (2011) asari
asosiy texnik yo‘nalishlarni tushuntirib berdi.
Spark Streaming texnologiyasining nazariy asoslari va uning ishonchli ishlash
mexanizmlari M. Zaharia va hamkorlari tomonidan yozilgan “Discretized Streams:
Fault-Tolerant Streaming Computation at Scale” (2013) ilmiy ishida keng
yoritilgan. Spark texnologiyasining yuqori samaradorlikda ishlashi va funksional
imkoniyatlari Karau H. va Warren R.ning “High Performance Spark” (2017) asarida
batafsil tushuntirib berilgan.
Kafka platformasining chuqur tahlili va amaliyotdagi qo‘llanilishi Shapira G.,
Palino T. va Seidman T. muallifligidagi “Kafka: The Definitive Guide” (2017)
kitobida keng ochib berilgan. Shuningdek, Spark Streaming va Structured Streaming
imkoniyatlari Vohra D.ning “Practical Apache Spark” (2018) asarida amaliy
misollar asosida ko‘rsatib o‘tilgan. Real vaqt rejimida ma’lumotlarni qayta ishlash
masalalarini yoritishda Chen L. va Suneja S.ning IEEE konferensiya maqolasi (2019)
ham muhim ilmiy manbalardan biri bo‘ldi.
Katta ma’lumotlarni tahlil qilishga oid umumiy nazariy va amaliy bilimlar Guller
M.ning “Big Data Analytics with Spark” (2015) hamda Marz N. va Warren J.ning
“Big Data: Principles and Best Practices of Scalable Real-Time Data Systems”
(2015) asarlarida keng qamrab olingan.