Doanh nghiệp Việt có thể thu thập dữ liệu theo kiểu ve, nhện, hay cáo?

Chuyên gia Việt kiều đưa ra 3 mô hình thu thập dữ liệu theo kiểu ve, nhện, cáo mà doanh nghiệp có thể áp dụng.

Hầu hết các doanh nghiệp đều xác định được tầm quan trọng của dữ liệu trong quá trình chuyển đổi số, phát triển công ty. Song không ít người chưa hiểu rõ cách xây dựng dữ liệu, xác định dữ liệu nào cần sử dụng, và áp dụng dữ liệu như thế nào để hiệu quả.

Hiểu thế nào về dữ liệu lớn?

Trong sự kiện Vietnam Data Summit 2022 mới đây, ông Albert Antoine - chuyên gia ngành khoa học dữ liệu và trí tuệ nhân tạo, đồng sáng lập công ty Avaiga - đã giải đáp những thắc mắc nói trên, đồng thời đưa ra một số lời khuyên cho doanh nghiệp trên hành trình chuyển đổi số.

Vị chuyên gia Việt kiều cho rằng dữ liệu hiện có mặt khắp mọi nơi, trong đó, chiếc smartphone mọi người đang sử dụng chính là vật thu thập dữ liệu phổ biến nhất.

Song, để xây dựng dữ liệu lớn, cần xác định rõ các tiêu chí ngay từ đầu. Về cơ bản, big data được định nghĩa xoay quanh 5 chữ V. Đầu tiên, khối lượng (volume) dữ liệu phải đủ lớn. Chẳng hạn, mỗi ngày hệ thống bán lẻ Walmart tại Mỹ tạo ra khối dữ liệu khoảng 24-25 TB (trong khi chiếc smartphone mạnh nhất hiện nay có dung lượng lưu trữ tối đa 1TB). 

Tiếp đến, dữ liệu phải có tính đa dạng (variety), từ hình ảnh, âm thanh, chữ viết,... đến video, bài viết. Việc thu thập, khai thác dữ liệu cũng cần dựa trên yếu tố tốc độ (velocity), chẳng hạn khi vận hành xe tự lái thì khối lượng dữ liệu thu thập và xử lý phải được thực hiện theo thời gian thực để giúp xe xử lý tình huống ngay tức khắc.

Thêm vào đó, dữ liệu thu thập phải chính xác (veracity), vì nếu thu thập sai sẽ dẫn đến kết quả sai. Do đó, người ta phải tốn đến 80% công sức cho việc “làm sạch” dữ liệu trước khi đem vào sử dụng. Cuối cùng, dữ liệu phải có giá trị (value).

{keywords}
Ông Albert Antoine đang trình bày tại sự kiện Vietnam Data Summit 2022. (Ảnh: Hải Đăng)

Chiến lược thu thập dữ liệu của nhện và cáo

Sau khi đã xác định được tầm quan trọng của dữ liệu và loại dữ liệu cần thu thập, có 3 cách để lấy được dữ liệu.

Với doanh nghiệp chưa từng có cơ sở dữ liệu thì cần phải đi xin, hoặc đi mua dữ liệu. Cách này được ông Antoine ví von như kiểu của con ve trong truyện ngụ ngôn: mùa hè con ve mải lo ca hát nên mùa đông không có thức ăn, phải xin của con kiến vốn cần cù làm lụng quanh năm.

Ở cách thứ hai, một số doanh nghiệp áp dụng nguyên tắc con nhện giăng tơ, tức cung cấp các dịch vụ để khách hàng sử dụng, từ đó thu thập dữ liệu. Chẳng hạn, khi bạn dùng Wi-Fi công cộng miễn phí thường phải cung cấp địa chỉ email - cũng là một dạng dữ liệu.

Những doanh nghiệp có sẵn cơ sở hạ tầng tiên tiến sẽ áp dụng nguyên tắc của con cáo: cung cấp công cụ phân tích cho những người sở hữu sẵn dữ liệu, sau đó dùng kết quả phân tích để bán cho bên có nhu cầu. Ví dụ các doanh nghiệp toàn cầu như Facebook, Google đang áp dụng cả chiến lược của nhện lẫn cáo.

“Khi đọc sách Kindle của Amazon, bạn tưởng bạn đang đọc sách nhưng thực ra sách đang “đọc” bạn”, vị chuyên gia từng tư vấn cho nhiều doanh nghiệp và chính phủ ví von.

Ông ám chỉ việc mỗi lần bạn dừng lại, đọc lâu hơn một đoạn nào đó chính là đang cung cấp hành vi để máy thu thập dữ liệu.

Thế giới đang dùng dữ liệu vào việc gì?

Sau khi đã có dữ liệu lớn, trên thế giới hiện nay có nhiều xu hướng sử dụng. Dễ thấy nhất là mô hình bot/công nhân số. Nhờ dữ liệu lớn và máy học, các doanh nghiệp xây dựng nên những con bot để giao tiếp với khách hàng trên mạng. Tại Việt Nam hay trên toàn cầu, khi bạn chat với tổng đài, thường là bạn đang trò chuyện với hệ thống máy tính (bot). Các con bot hiện nay khá thông minh, thậm chí có thể chốt đơn hàng mà không cần con người can thiệp vào.

Ngoài ra, các thông tin thu thập có thể dùng trong ngành phân tích dữ liệu. Qua hệ thống máy tính, dữ liệu có thể dùng vào việc phân tích các sự kiện đã diễn ra, chẳng hạn đưa ra các kết quả kinh doanh phục vụ doanh nghiệp. Nếu áp dụng AI/ML, có thể dự báo được những xu hướng kinh doanh, những sự việc xảy ra tiếp đến. Các thuật toán cũng có thể đưa ra lời khuyên để hỗ trợ con người đưa ra các hành động tiếp theo.

Mặc dù rất nhiều doanh nghiệp đã nhận ra được tầm quan trọng của dữ liệu trong quá trình chuyển đổi số, song không phải doanh nghiệp nào cũng đi đúng lộ trình.

“Nhiều doanh nghiệp cho rằng chuyển đổi số chỉ cần mua phần mềm về là xong, nhưng thực tế không phải vậy. Điều quan trọng là sự sắp xếp vận hành của doanh nghiệp trong quá trình thay đổi của công ty”, ông Antoine nhấn mạnh.

Vị chuyên gia cho rằng trong quá trình chuyển đổi số và xây dựng dữ liệu, mọi người đều phải tham gia. Thông thường, giữa các bộ phận và các đơn vị trong một tổ chức không chịu chia sẻ dữ liệu với nhau, vì nó không thuộc phạm vi công việc của họ. Do đó, cần đưa nội dung hợp tác và chia sẻ dữ liệu như một nhiệm vụ trong công việc hàng ngày để nhân viên làm việc.

Ngoài ra, để có được dữ liệu, doanh nghiệp cần cung cấp công cụ công nghệ cho nhân viên. Vì nếu không hoạt động trên nền tảng công nghệ thì không thể nào sản sinh ra dữ liệu.

Cuối cùng, để xây dựng dữ liệu thì những nhà lãnh đạo phải xác định doanh nghiệp xoanh quanh dữ liệu. Phải truyền đạt rõ ràng và minh bạch với nhân viên ngay từ đầu để nâng cao ý thức cho họ. Từ đó, mọi người đều chuyên tâm vào việc xây dựng và sản sinh dữ liệu.

Hải Đăng

Meta bị kiện vì thu thập dữ liệu từ hơn 600 bệnh viện và nhà cung cấp dịch vụ y tế

Meta bị kiện vì thu thập dữ liệu từ hơn 600 bệnh viện và nhà cung cấp dịch vụ y tế

Tờ Bloomberg đưa tin, Meta vừa bị đệ đơn kiện với cáo buộc cho phép dữ liệu y tế riêng tư được chia sẻ bí mật với Facebook mỗi khi bệnh nhân truy cập website của một số nhà cung cấp dịch vụ chăm sóc sức khỏe.

Không xảy ra sự cố an toàn thông tin nghiêm trọng trong 7 ngày Tết Quý Mão

Trong đợt nghỉ tết Nguyên đán Quý Mão 2023 vừa qua, Cục An toàn thông tin, Bộ TT&TT đã hỗ trợ ứng cứu 41 sự cố an toàn thông tin. Các sự cố này đều ở mức trung bình và thấp, không gây hậu quả.

Cách bảo vệ tài khoản Facebook doanh nghiệp khỏi tấn công mạng

Facebook và các mạng xã hội khác đang là công cụ giao tiếp, quảng bá hữu hiệu cho doanh nghiệp, do đó nếu chúng rơi vào tay kẻ xấu thì hậu quả khó lường.

Kỷ nguyên thống trị tìm kiếm và quảng cáo của Google sắp kết thúc?

Chính quyền liên bang cùng 8 tiểu bang tại Mỹ đệ đơn kiện chống độc quyền nhằm vào Google với cáo buộc công ty này đã sử dụng các phương tiện “phi pháp” để duy trì lợi thế cạnh tranh trong lĩnh vực quảng cáo và tìm kiếm.

Lợi nhuận LG giảm kỷ lục 91%

Do nhu cầu thiết bị gia dụng giảm, kết hợp với bất ổn kinh tế toàn cầu, lợi nhuận hoạt động quý IV/2022 của LG Electronics giảm hơn 90%.

Tết 2023: Người dùng di động gọi Zalo, Facebook nhiều hơn gọi thoại

Trong dịp tết Nguyên đán 2023, nhu cầu sử dụng các dịch vụ viễn thông truyền thống của người dùng di động tiếp tục giảm, ở chiều ngược lại, lưu lượng data tăng vọt.

Mỹ tấn công mạng nhóm tin tặc khét tiếng, Apple sắp mở cửa hàng tại Malaysia Icon

Mỹ tấn công mạng nhóm tin tặc khét tiếng; Apple sắp mở chuỗi cửa hàng bán lẻ tại Malaysia;... là những thông tin nổi bật trong bản tin Công nghệ thứ 7 tuần này.

5 hãng chip Mỹ ‘bốc hơi’ gần 15 tỷ USD trong một ngày

Vốn hóa của 5 trong số các hãng chip lớn nhất Mỹ có thể giảm gần 15 tỷ USD trong phiên giao dịch ngày 27/1 (giờ địa phương), sau khi Intel đưa ra dự báo doanh thu ảm đạm.

Nhật Bản, Hà Lan đạt đồng thuận cấm vận bán dẫn Trung Quốc

Bloomberg đưa tin, Nhật Bản và Hà Lan sẽ sớm đạt thoả thuận tham gia cùng Mỹ hạn chế xuất khẩu trang thiết bị lĩnh vực bán dẫn sang Trung Quốc.

Nghề ‘siêu hot’ bất chấp sóng thần sa thải công nghệ

Ngành này vẫn đang thiếu tới hơn 700.000 nhân sự và luôn trong trạng thái ‘tìm người’.

Elon Musk hé lộ đối thủ xứng tầm Tesla

Elon Musk cho biết một hãng xe Trung Quốc có thể sẽ vươn lên trở thành đối thủ đáng gờm của Tesla trong thời gian tới.

Đang cập nhật dữ liệu !