Vì sao Facebook mất hơn 6 tiếng để khắc phục sự cố?

Các nhân viên của Facebook không thể xử lý sự cố từ xa, dẫn tới việc sửa chữa kéo dài hơn dự tính trong vụ sập hệ thống kỷ lục hơn 6 tiếng đồng hồ.

Từ khoảng 22h34 ngày 4/10 theo giờ Việt Nam, đồng loạt các dịch vụ của Facebook bao gồm Instagram và WhatsApp đều không thể truy cập được gây ảnh hưởng tới hàng tỷ người dùng, hàng triệu nhà quảng cáo.

Cho đến sáng hôm sau (5/10), sự cố mới được Facebook khắc phục và mọi dịch vụ của mạng xã hội lớn nhất hành tinh mới hoạt động trở lại bình thường.

Vì sao Facebook mất hơn 6 tiếng để khắc phục sự cố?
Sự cố kéo dài hơn 6 tiếng của Facebook liên quan đến một giao thức đã bị chỉnh (config) sai.

Facebook không đưa ra lời giải thích nào về nguyên nhân sự cố. Nhưng theo Phó chủ tịch Cloudflare Dane Knecht, một giao thức định tuyến có tên gọi BGP của Facebook đã bị rút khỏi Internet. Đây là giao thức giúp xác định tuyến đường đi trên Internet nhanh nhất có thể và nó có ảnh hưởng tới DNS và những dịch vụ khác. 

Hệ quả là truy cập vào các dịch vụ của Facebook không thể thực hiện được khi mọi thiết bị đều chọn con đường xa nhất, khiến cho kết nối kéo dài và tự động bị ngắt. Để sửa chữa, Facebook phải cấu hình lại giao thức BGP ở máy chủ đặt tại trung tâm dữ liệu (data center) của riêng mình.

Vấn đề phát sinh ở chỗ các nhân viên trực tại trung tâm dữ liệu được cấp email riêng dùng cho công việc và có thể gửi mail cho nhau, nhưng không thể nhận mail từ bên ngoài.

Họ không thể dùng email này xác thực truy cập vào các công cụ như Google Docs hoặc Zoom mà phải dùng FaceTime hoặc Discord. Tuy nhiên, việc kết nối giữa người bên trong trung tâm dữ liệu và người có khả năng sửa chữa ở bên ngoài lại gặp trục trặc.

 
Vì sao Facebook mất hơn 6 tiếng để khắc phục sự cố?
Facebook không thể xử lý sự cố từ xa và buộc phải đưa kỹ sư vào tận trung tâm dữ liệu để sửa chữa.

Hệ quả là nhân viên của Facebook không thể tiến hành sửa chữa từ xa mà phải giành quyền truy cập vật lý tại chỗ. Ít nhất hai kỹ sư đã phải trực tiếp đến trung tâm dữ liệu đặt ở California để xử lý sự cố. 

Cộng thêm ảnh hưởng của Covid-19, lực lượng túc trực ở trung tâm dữ liệu mỏng hơn bình thường và việc tiếp cận để sửa chữa cũng tốn nhiều thời gian hơn.

Trong một email gửi nhân viên sau sự cố, Giám đốc công nghệ của Facebook Mike Schroepfer thừa nhận sự cố đã ảnh hưởng tới mạng lưới xương sống kết nối tất cả trung tâm dữ liệu với nhau.

Mike Schroepfer nhắc các nhân viên bình tĩnh và không vội vàng tải lại mọi thứ, tránh làm chậm quá trình sửa chữa. Vì vậy, sau hơn 6 tiếng đồng hồ gián đoạn, mọi dịch vụ của Facebook mới hoạt động trở lại bình thường.

Phương Nguyễn (Theo TheVerge)

Mark Zuckerberg mất 6 tỷ USD trong ngày tồi tệ của Facebook

Mark Zuckerberg mất 6 tỷ USD trong ngày tồi tệ của Facebook

Facebook bị sập khiến ông chủ Mark Zuckerberg mất 6 tỷ USD chỉ trong vài giờ. Chưa kể, người tố cáo Facebook với báo chí và Quốc hội Mỹ đã lộ diện.  

Chủ đề : facebook
 
List comment
 
Zalo đã khắc phục lỗi trên PC
icon

Ứng dụng Zalo trên máy tính đã hoạt động trở lại, phía Zalo vẫn chưa thông tin lý do ứng dụng này gặp sự cố sáng nay.  

 
Người dân Hà Nội dần quen với quét mã QR ghi nhận vào, ra các địa điểm
icon

Với sự quyết liệt của chính quyền các cấp, đến nay nhiều người dân Hà Nội, cơ sở kinh doanh, địa điểm tập trung đông người... đã hình thành thói quen quét QR Code ghi nhận thông tin vào ra, coi đây là một phần thời kỳ bình thường mới.

 
Hội nghị Bộ trưởng ITU: Cắt giảm chi phí là chìa khóa cho chuyển đổi số
icon

Trong khi 4G, 5G dần trở nên phổ biến hơn thì trên toàn cầu vẫn có gần 50% dân số chưa được sử dụng Internet. Không phải quốc gia nào cũng dễ dàng chuyển đổi số bởi sự khác biệt trong tiếp cận với Internet và công nghệ.

 
Bà Rịa - Vũng Tàu sớm cán đích 100% học sinh có thiết bị để học trực tuyến
icon

Sớm chuẩn bị điều kiện cho việc dạy học trực tuyến và kêu gọi được sự chung tay của cộng đồng, Bà Rịa - Vũng Tàu đã đưa con số 44.378 học sinh chưa có thiết bị học online ở thời điểm tháng 8 về 0 trước ngày 20/10.

 
FPT Smart Cloud và VMware thảo luận cách thức chuyển đổi hạ tầng cùng 300 lãnh đạo doanh nghiệp Việt
icon

Trước những thách thức của hành trình dịch chuyển lên Cloud, gần 300 lãnh đạo doanh nghiệp đã cùng các chuyên gia FPT Smart Cloud và VMware thảo luận, tìm ra phương thức vận hành hiệu quả với nền tảng FPT Cloud thế hệ mới đã được VMware chứng nhận.

 
 
Zalo trên máy tính đang gặp sự cố về tin nhắn
icon

Một số người dùng phản ánh ứng dụng Zalo trên máy tính không nhận được tin nhắn dù vẫn gửi được thành công.  

Apple cuối cùng cũng phải 'đau đầu' vì thiếu chip: Cắt giảm 10 triệu iPhone 13
icon

Các báo cáo mới cho thấy Apple đã đặt mục tiêu cắt giảm sản lượng sản xuất iPhone do thiếu linh kiện.

Facebook cấm cửa người tạo ra công cụ 'hủy theo dõi mọi thứ'
icon

Facebook đã đình chỉ vô thời hạn đối với một nhà phát triển vì tạo ra công cụ cho phép người dùng ngừng theo dõi bạn bè và các trang tin tức trên mạng xã hội này.

CMC tham dự triển lãm trực tuyến ITU Virtual Digital World 2021
icon

Tại Triển lãm trực tuyến Thế giới số (ITU Digital World) 2021, Tập đoàn Công nghệ CMC giới thiệu những sản phẩm, dịch vụ thế mạnh ở các mảng: Điện toán đám mây, bảo mật, chuyển đổi số và công nghệ nghiên cứu, ứng dụng.   

 
123

Giấy phép hoạt động báo chí: Số 09/GP-BTTTT, Bộ Thông tin và Truyền thông cấp ngày 07/01/2019.

Tòa soạn: Tầng 7, Tòa nhà Cục Tần số Vô tuyến điện, 115 Trần Duy Hưng, Quận Cầu Giấy, Hà Nội

Điện thoại: 024 3 936 9966 - Fax: 024 3 936 9364

Hotline nội dung: 0888 911 911 - Email: toasoan@ictnews.vn

123