GORONTALOPOST - Cloudflare akhirnya mengungkap penyebab gangguan besar yang terjadi pada Selasa malam, sebuah insiden yang mereka sebut sebagai “outage terburuk sejak 2019.” Dalam sebuah posting blog, CEO sekaligus cofounder Cloudflare, Matthew Prince, menjelaskan bahwa masalah berasal dari sistem Bot Management, fitur yang seharusnya mengatur akses para crawler otomatis ke situs-situs yang menggunakan CDN Cloudflare.
Sebagai perusahaan yang menangani sekitar 20 persen lalu lintas internet, Cloudflare biasanya berfungsi sebagai pelindung untuk menjaga situs tetap online saat terjadi lonjakan trafik atau serangan DDoS. Namun insiden kali ini berdampak luas—menjatuhkan berbagai layanan besar seperti X, ChatGPT, hingga Downdetector selama beberapa jam, mengingatkan publik pada gangguan serupa yang pernah terjadi di Azure dan AWS.
Sumber Masalahnya: Bukan AI, Bukan DNS, dan Bukan Serangan Siber
Sebelumnya, banyak yang menduga gangguan ini terkait teknologi baru Cloudflare, termasuk sistem AI Labyrinth—mekanisme berbasis AI untuk memperlambat dan membingungkan bot perayap yang tidak patuh. Namun Cloudflare menegaskan bahwa bukan itu penyebabnya, dan juga bukan masalah pada DNS ataupun serangan DDoS berskala besar.
Matthew Prince menjelaskan bahwa akar masalah sebenarnya ada pada perubahan perilaku query di ClickHouse, database yang digunakan untuk menghasilkan file konfigurasi model machine learning Bot Management. File ini menentukan “bot score” untuk setiap permintaan trafik yang melewati jaringan Cloudflare.
Perubahan kecil pada query tersebut justru membuat database memproduksi banyak baris “fitur” duplikat, hingga file konfigurasi membengkak melebihi batas memori yang telah ditentukan.
Dampak Berantai: Proxy System Tumbang
Ketika file konfigurasi melampaui batas memori, sistem proxy inti Cloudflare ikut tumbang, terutama pada trafik yang bergantung pada modul bots. Dampaknya:
-
Sistem Cloudflare yang memblokir bot tertentu menghasilkan false positive, sehingga trafik asli ikut terputus.
-
Pelanggan yang tidak menggunakan bot score justru tetap online tanpa masalah.
-
Jutaan pengguna di seluruh dunia merasakan pemadaman layanan beberapa jam.
Masalah sederhana berupa duplikasi data berhasil melumpuhkan sebagian besar internet—pengingat betapa sensitifnya infrastruktur digital modern.
(HL)
Editor : Priska Watung