Facebook dùng dữ liệu cá nhân người dùng để dạy AI cách phân loại bài viết

Một báo cáo mới đây cho thấy mạng xã hội Facebook đang cho phép nhân viên của mình truy cập vào các bài viết cá nhân trên Facebook và Instagram để gắn nhãn cho hệ thống AI.

Facebook vi phạm quyền riêng tư để đào tạo AI

Giống như nhiều công ty công nghệ khác, Facebook sử dụng trí tuệ nhân tạo (AI) để sắp xếp các nội dung trên nền tảng của mình. Để làm được điều này, phần mềm cần phải trải qua đào tạo về khả năng nhận biết các loại nội dung khác nhau. Việc huấn luyện các thuật toán đòi hỏi phải có một lượng dữ liệu mẫu lớn, tất cả chúng đều đươc chú thích hay dán nhãn bởi con người.

{keywords}
Facebook đang liên tục phát triển công nghệ AI của mình bằng chính dữ liệu người dùng. 

Theo Reuters, Facebook đã thuê công ty phần mềm WiPro của Ấn Độ để chú thích từng bài đăng trên Facebook và Instagram. Việc này được phân loại theo nội dung (chụp người hay thực phẩm,...), sự kiện (sinh nhật, đám cưới,...) hay ý định của tác giả (chọc cười, kêu gọi, truyền cảm hứng,...).

260 nhân viên của WiPro đã phải phân loại từng dòng cập nhật trạng thái, hình ảnh, video theo cách như vậy. Mỗi nội dung lại được kiểm tra bởi 2 người nhằm làm giảm tỷ lệ mắc lỗi.

Xác nhận với Reuters, Facebook cho biết các bài đăng sử dụng cho quá trình dạy AI bao gồm cả những nội dung riêng tư chỉ được người dùng đăng tải cho bạn bè. Dữ liệu này đôi khi bao gồm cả tên của người dùng và nhiều thông tin nhạy cảm khác.

Facebook cũng cho biết rằng không chỉ WiPro, họ có hơn 200 đối tác như vậy với hàng nghìn nhân viên phụ trách dán nhãn trên toàn cầu.

Không chỉ Facebook, việc đọc dữ liệu dạy AI diễn ra trên toàn cầu

Các dự án như vậy là chìa khóa để phát triển trí thông minh nhân tạo. Những công ty chuyên dán nhãn xuất hiện nhiều ở những quốc gia có nguồn lao động giá rẻ, Ấn Độ hay Trung Quốc là những ví dụ điển hình.

Ở Trung Quốc, nhiều công ty được lập ra với cả trăm người lao động. Thế nhưng nhiệm vụ của họ đơn giản chỉ là dán nhãn phân loại đâu là người đi xe đạp, đâu là người đi bộ trong các đoạn video. Điều này là nhằm phát triển các thuật toán về công nghệ xe tự lái.

Việc dạy AI cũng phổ biến đến mức mà nhiều người chúng ta vẫn làm hàng ngày mà chẳng hề hay biết. Đó đơn giản là việc xác định các nội dung trong ảnh với hệ thống CAPTCHA của Google.

{keywords}
Việc dạy AI bằng cách dán nhãn dữ liệu diễn ra ở khắp nơi trên thế giới, đặc biệt là Trung Quốc. 

Điều này sẽ không có vấn đề gì nếu nó không động chạm đến những nội dung thuộc về quyền riêng tư. Các cuộc điều tra gần đây cho thấy, khi bạn nói chuyện với trợ lý ảo trên những chiếc loa thông minh Amazon Echo, rất có thể sẽ có một người khác đang lắng nghe câu chuyện của bạn. Đó chính xác là những gì sẽ xảy ra.

Quyền riêng tư của mỗi cá nhân còn bị xâm phạm nghiêm trọng hơn bởi chính các công ty gia công trong việc dạy thuật toán cho AI. Đây cũng là nơi có tiêu chuẩn bảo mật thấp hơn nhiều so với các công ty công nghệ lớn.

Facebook cho biết nhóm pháp lý và quyền riêng tư của mạng xã hội này đang cho ra đời một hệ thống kiểm toán để đảm bảo việc tuân thủ các kỳ vọng về quyền riêng tư. Mặc dù vậy, Facebook vẫn có khả năng phải đối mặt với quy định GDPR của Liên minh Châu Âu (EU). GDPR đặt ra những quy định rất nghiêm ngặt về cách mà các công ty có thể thu thập dữ liệu cá nhân của người dùng.

Tuấn Nghĩa (Theo TheVerge)

Sản phẩm AI của VNG được Mỹ chứng nhận tiêu chuẩn nhận diện gương mặt

Định danh người dùng với công nghệ AI thuộc VNG được iBeta chứng nhận về công nghệ xác định người thật chỉ từ một bức hình đơn.

Hơn 30 doanh nghiệp trưng bày sản phẩm, giải pháp an toàn thông tin

Hơn 30 gian hàng giới thiệu sản phẩm, công nghệ ATTT của các công ty công nghệ Việt Nam và thế giới là một trong những khu vực hấp dẫn tại sự kiện Ngày an toàn thông tin 2022.

Một bang của Mỹ cấm TikTok trên thiết bị công

Thị trưởng bang Nam Dakota (Mỹ) vừa ký sắc lệnh cấm các cơ quan, nhân viên và nhà thầu của bang truy cập TikTok trên thiết bị chính phủ.

Tấn công có chủ đích APT, mã độc đào tiền ảo sẽ gia tăng mạnh trong năm tới

Cùng với nhận định năm 2023 sẽ chứng kiến sự gia tăng mạnh của các loại mã độc đào tiền ảo, chuyên gia NCS dự báo các cuộc tấn công có chủ đích APT sẽ diễn ra nhiều hơn trong năm tới.

WhatsApp nói gì khi bị nghi lộ số điện thoại nửa tỷ người dùng?

Một người dùng Internet ẩn danh tuyên bố sở hữu thông tin của gần 500 triệu người dùng WhatsApp.

Trí tuệ nhân tạo giúp doanh nghiệp bảo mật phân tích 100 tỷ hành vi mỗi ngày

Hãng Fortinet cho biết công nghệ trí tuệ nhân tạo (AI) và máy học (ML) đã giúp đơn vị phân tích được hơn 100 tỷ hành vi có liên quan tới bảo mật trên toàn cầu mỗi ngày, bao gồm tất cả các loại nguy cơ, kỹ thuật tấn công.

Chuyên gia an ninh mạng cảnh báo 3 loại hình tấn công nhiều nhất 12 tháng qua

Các chuyên gia an ninh mạng tại Việt Nam cho biết, tổ chức của họ đã gặp sự cố an ninh mạng trong 12 tháng qua, với ba loại hình tấn công nhiều nhất là phần mềm độc hại, rò rỉ dữ liệu và lừa đảo.

Thành phố ảo, thế giới trực tuyến là bề mặt tấn công mới của tội phạm mạng

Bên cạnh nhận định về sự gia tăng số cuộc tấn công sử dụng dịch vụ tội phạm mạng, các chuyên gia Fortinet cũng dự báo thành phố ảo và thế giới trực tuyến là những bề mặt tấn công mới của nhiều nhóm hacker.

Đã chặn kết nối hơn 900 máy chủ điều khiển các mạng “máy tính ma” tại Việt Nam

Qua chiến dịch làm sạch mã độc trên không gian mạng Việt Nam 2022, đã có 915 địa chỉ máy chủ điều khiển các mạng botnet (mạng máy tính ma - PV) tại Việt Nam bị chặn kết nối và 76 website phát tán mã độc bị xử lý.

Số lượng máy tính bị lợi dụng đào tiền ảo gia tăng

Trong quý 3/2022, số lượng mã độc đào tiền ảo bất ngờ gia tăng hơn gấp 3 so với cùng kỳ.

Đang cập nhật dữ liệu !