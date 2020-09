Bất kỳ công ty nào mua TikTok cũng có thể gặp khó trong việc mô phỏng thuật toán gợi ý của ứng dụng video ngắn này.

ByteDance, công ty mẹ TikTok, đang đàm phán với một số người mua tiềm năng để bán TikTok tại Mỹ sau khi Tổng thống Trump dọa cấm ứng dụng. Thương vụ có thể trị giá 30 tỷ USD với Microsoft. Oracle bày tỏ sự quan tâm. Tuy nhiên, các cuộc thảo luận bị chậm lại do lệnh cấm xuất khẩu mới của Trung Quốc, trong đó có thuật toán. Do đó, rất có thể người mua Mỹ cuối cùng chỉ mua được TikTok mà không có thuật toán gợi ý video, thứ làm nên sự phổ biến cho ứng dụng.

Bondy Valdovinos Kaye, một nhà nghiên cứu tại Đại học công nghệ Queensland, nhận định TikTok không còn là TikTok nếu thiếu thuật toán.

Tại Mỹ, TikTok có khoảng 100 triệu người dùng. Về cơ bản, nó không khác mấy YouTube: mọi người tải video bản thân đang làm mọi thứ, từ tham gia thử thách tới nhảy múa, diễn hài. Thứ khác biệt chính là trang “For You” (Dành cho bạn), hiển thị hàng loạt video gây nghiện. Nhân viên TikTok gọi thuật toán gợi ý video này là “chiếc vương miện” của ByteDance.

Valdovinos Kaye từng ghé thăm văn phòng ByteDance Bắc Kinh năm 2019. Theo chuyên gia, thuật toán được hợp tác phát triển giữa phòng thí nghiệm AI của ByteDance và Đại học Peking. Đó chính là thứ "nước sốt" bí mật kiểm soát mọi phần mềm ByteDance. Ban đầu, nó được phát triển dành cho Toutiao, ứng dụng tổng hợp tin tức của ByteDance nhưng hiện tại, nó có mặt trong mọi ứng dụng của công ty, trong đó có Douyin, phiên bản tiếng Trung của TikTok.

Sabba Keynejad, nhà sáng lập ứng dụng biên tập video Veed, phải thừa nhận chưa chứng kiến một ai đạt trình độ bậc thầy về thuật toán gợi ý như vậy. Chắc chắn, ByteDance đã phải tuyển dụng số lượng lớn kỹ sư để phát triển thuật toán. Valdovinos Kaye kể rằng đã đứng trước một văn phòng đầy ắp lập trình viên khi đến thăm quan ByteDance Bắc Kinh.

Theo Keynejad, thuật toán không phải thứ vận hành mọi thứ nhưng là một “cơn bão hoàn hảo”. Sản phẩm của ByteDance xuất hiện đúng thời điểm, đáp ứng người dùng trẻ tuổi bằng thuật toán gợi ý tuyệt vời. Đây cũng là điều mà Eugene Wei, cựu Giám đốc sản phẩm tại Flipboard, Amazon đồng tình. Trước đó, Wei đã đào sâu vào tính ma thuật của thuật toán TikTok trong một bài blog. Theo ông, TikTok sở hữu các bộ lọc video và công cụ biên tập dễ sử dụng, kết hợp với thuật toán đưa video lên trước mắt mọi người một cách nhanh chóng. Ông cho rằng nhiều người nghĩ thuật toán là một thứ “phép thuật” song những ai từng phát triển công cụ gợi ý bằng máy học (machine learning) sẽ biết các kỹ thuật ByteDance dùng chỉ là loại tiêu chuẩn.

Nikita Aggarwal đến từ Viện Internet Oxford nhận xét thuật toán học được nhiều từ lượng dữ liệu khổng lồ mà TikTok thu hút được. Theo bà, TikTok thu thập được nhiều dữ liệu người dùng hơn các ứng dụng khác nên có thể lập hồ sơ người dùng tốt hơn và từ đó gợi ý được video họ có xu hướng thích xem hơn. Bà cũng đồng ý thiết kế của ứng dụng và trải nghiệm xem video toàn màn hình góp phần nâng cao sự phổ biến của TikTok.

“Mỗi cái bấm chuột đều tiết lộ sở thích của người dùng, đến mức độ nào đó sẽ mang đến cho TikTok nhiều thông tin hữu ích hơn về thị hiếu của một người. Hiểu được điều đó sẽ khiến ứng dụng trở nên lớn mạnh hơn”, bà nói.

Bên cạnh đó, ứng dụng cũng đánh giá mối quan tâm của người dùng theo quy mô không thể tưởng tượng nổi so với các nền tảng khác, chẳng hạn YouTube. Định dạng video TikTok – không video nào dài quá 1 phút – đồng nghĩa với việc người dùng sẽ xem qua chúng với tốc độ nhanh hơn nhiều YouTube, nơi video có độ dài trung bình hơn 12 phút.

Theo Eugene Wei, YouTube khó làm như vậy vì về cơ bản họ không có ứng dụng bày nhiều video ngẫu nhiên ra trước mắt người dùng. Thông thường, mọi người tự lựa chọn thứ họ xem trên YouTube. Ngược lại, trang For You trên TikTok phục vụ người dùng hàng trăm video mỗi giờ, tức là ứng dụng đôi khi sẽ đưa ra một video mà người dùng không thích xem mà không ảnh hưởng quá lớn. Dữ liệu thực tế ấy được dùng để “nuôi” thuật toán máy học của TikTok, biến nó trở nên quyền lực hơn do với bộ dữ liệu đào tạo có sẵn mà các dịch vụ khác đang dùng.

Ngay cả khi chỉ là thuật toán tương đối thông thường, TikTok lại được bồi dưỡng từ gần 600 triệu người dùng hàng tháng trên toàn cầu, đặt ra câu hỏi hóc búa nếu thuật toán không được chuyển nhượng trong vụ mua bán. Wei nhận định người mua vẫn có thể mô phỏng phần lớn ma thuật của thuật toán nếu TikTok cung cấp cho họ tất cả dữ liệu người dùng, dữ liệu video song họ phải sẵn sàng hỗ trợ toàn bộ quá trình. Một thách thức cho họ là làm thế nào để kết nối giá trị của hệ thống thuật toán hay thuật toán với dữ liệu mà nó được đào tạo. Nếu TikTok bán cho Microsoft, Microsoft giả định sẽ được hưởng lợi từ dữ liệu này. Song, vẫn có những hiểu biết ẩn sâu (insight) mà ByteDance thu được từ người dùng, đây chính là thứ di sản đáng giá mà Trung Quốc rõ ràng đã nhận ra khi áp đặt hạn chế xuất khẩu.

Du Lam (Theo BI)