Sự cố ngừng hoạt động của Facebook là do bảo trì theo định kỳ

Sự cố ngừng hoạt động kéo dài hơn 6 giờ đã ảnh hưởng rất lớn đến Facebook và người dùng. Sự cố này khiến Facebook mất hơn 100 triệu USD.
Công ty tự nhận lỗi về mình và nói rằng sự cố ngừng hoạt động do các kỹ sư của Facebook đang tiến hành “bảo trì định kỳ”. Trong một bài đăng trên blog của Giám đốc cơ sở hạ tần của công ty, Santosh Janardhan nói rằng công ty sẽ rút kinh nghiệm sau sự cố này để không lặp lại.

Sự cố của Facebook khiến Mark Zuckerberg mất hàng tỷ đô la

Janardham cho biết thêm “Sự cố ngừng hoạt động này được kích hoạt bởi hệ thống quản lý dung lượng mạng lõi toàn cầu của chúng tôi. Mạng lõi là mạng mà Facebook đã xây dựng để kết nối tất cả cơ sở máy tính của chúng tôi với nhau. Trong đó bao gồm hàng chục nghìn dặm cáp quang xuyên qua toàn cầu và liên kết tất cả các trung tâm dữ liệu của chúng tôi”.
Vài giờ sau sự cố, cổ phiếu của Facebook đã giảm khiến giá trị của CEO Mark Zuckerberg giảm 6 tỷ USD. Trong tháng trước, cổ phiếu Facebook giảm 12,88% khiến giá trị cá nhân của Zuckerberg giảm từ gần 140 tỷ USD xuống còn 120,9 tỷ USD. Bộ định tuyến được sử dụng để xác định vị trí tất cả dữ liệu đến và đi. Và đôi khi các kỹ sư phải cần bảo trì và kiểm ra lại cơ sở hạ tầng. Nhưng sự cố bất ngờ đã xảy ra và khiến tất cả các kết nối bị ngắt trên toàn thế giới.

Facebook nói rằng họ sẽ rút kinh nghiệm từ sự cố này để nó không bao giờ xảy ra nữa

Sự cố này ảnh hưởng một phần từ máy chủ DNS của Facebook. Công ty nói rằng mọi thứ diễn ra quá nhanh khiến các kỹ sư của họ phải gặp hai vấn đề lớn: không thể truy cập dữ vào trung tâm dữ liệu và mất DNS.

Khi Facebook có thể khôi phục kết nối mạng lõi thì mọi thứ đã hoạt động trở lại. Nhưng Facebook lại gặp một vấn đề khác cũng cần lưu ý. Nếu tất cả các dịch vụ bật và chạy lại cùng lúc thì lưu lượng đổ về sẽ là rất lớn. Nhờ có những sự cố này mà Facebook đã có thêm những bài học cho riêng mình.

Công ty đã nói rằng họ sẽ rút kinh nghiệm để không bao giờ xảy ra nữa. Mỗi thất bại đều mang lại những bài học và khiến công ty trở nên tốt hơn. Sau mỗi sự cố, dù lớn hay nhỏ chúng tôi đều thực hiện đánh giá về hệ thống của mình. Và quá trình đó vẫn đang được tiến hành.”
Nguồn: phonearena
Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

You May Also Like