Gangguan Massal Canva hingga Zoom, AWS Ungkap Biang Keroknya
Uzone.id — Pekan lalu,
gangguan massal jaringan AWS menyebabkan ratusan aplikasi di seluruh dunia
down. Kejadian ini disebut sebagai ‘kiamat internet kecil’ karena
aplikasi-aplikasi seperti Reddit, Canva, Zoom hingga Snapchat mengalami tidak
bisa diakses oleh pengguna di seluruh dunia.
Kejadian ini terjadi pada Senin, (20/10) dan berlangsung
kurang lebih 15 jam dan mulai kembali normal untuk sebagian aplikasi pada
keesokan harinya.
Kurang dari sepekan dari insiden ini, Amazon pun membagikan rincian lengkap mengenai peristiwa yang menyebabkan gangguan besar ini.
Total layanan yang terdampak dari gangguan ini adalah lebih
dari 2.000 layanan dan mengakibatkan lebih dari 16 juta laporan pengguna yang
kesulitan mengakses layanan di 60 negara.
Amazon mengungkapkan bahwa masalah tersebut terjadi di
cluster pusat data terbesar mereka, US-East-1 yang berada di Virginia Utara,
Amerika Serikat. Masalah ini "dipicu oleh kerusakan tersembunyi"
dalam sistem Domain Name System (DNS) DynamoDB milik perusahaan.
Ini artinya sistem tersebut tidak lagi dapat membagikan
informasi penting yang dibutuhkan untuk menghubungkan pelanggan ke layanan yang
menggunakan Amazon Web Services (AWS).
Sebagai informasi, sistem DNS sendiri berfungsi sebagai buku telepon internet, dimana mereka menghubungkan nama situs web seperti Amazon.com dan lainnya dengan alamat IP agar perangkat pengguna terhubung dengan layanan.
Dalam kasus ini, terdapat bug di sistem DNS yang gagal
memperbaiki secara otomatis dan akibatnya, gangguan kecil itu menyebar ke
bagian lain dari platform AWS, sehingga menimbulkan efek berantai dan
menyebabkan gangguan besar di berbagai layanan Amazon Web Services.
Analis memperkirakan total biaya gangguan tersebut bisa
mencapai miliaran dolar. Di X, banyak yang menyoroti bahwa peristiwa ini
merupakan contoh banyaknya perusahaan internet terkemuka yang bergantung pada
satu penyedia cloud.
Tak lama dari kejadian ini, Amazon pun meminta maaf pada
para pengguna dan berjanji untuk "melakukan segala upaya untuk belajar
dari peristiwa ini.
"Kami menyadari bahwa peristiwa ini berdampak
signifikan bagi banyak pelanggan,” kata pihak Amazon.
Mereka melanjutkan, “Meskipun kami memiliki rekam jejak yang
kuat dalam mengoperasikan layanan dengan tingkat ketersediaan tertinggi, kami
menyadari betapa pentingnya layanan kami bagi pelanggan kami, aplikasi mereka,
pengguna akhir, dan bisnis mereka.”