Doanh nghiệp Việt có thể thu thập dữ liệu theo kiểu ve, nhện, hay cáo?

Chuyên gia Việt kiều đưa ra 3 mô hình thu thập dữ liệu theo kiểu ve, nhện, cáo mà doanh nghiệp có thể áp dụng.

Hầu hết các doanh nghiệp đều xác định được tầm quan trọng của dữ liệu trong quá trình chuyển đổi số, phát triển công ty. Song không ít người chưa hiểu rõ cách xây dựng dữ liệu, xác định dữ liệu nào cần sử dụng, và áp dụng dữ liệu như thế nào để hiệu quả.

Hiểu thế nào về dữ liệu lớn?

Trong sự kiện Vietnam Data Summit 2022 mới đây, ông Albert Antoine - chuyên gia ngành khoa học dữ liệu và trí tuệ nhân tạo, đồng sáng lập công ty Avaiga - đã giải đáp những thắc mắc nói trên, đồng thời đưa ra một số lời khuyên cho doanh nghiệp trên hành trình chuyển đổi số.

Vị chuyên gia Việt kiều cho rằng dữ liệu hiện có mặt khắp mọi nơi, trong đó, chiếc smartphone mọi người đang sử dụng chính là vật thu thập dữ liệu phổ biến nhất.

Song, để xây dựng dữ liệu lớn, cần xác định rõ các tiêu chí ngay từ đầu. Về cơ bản, big data được định nghĩa xoay quanh 5 chữ V. Đầu tiên, khối lượng (volume) dữ liệu phải đủ lớn. Chẳng hạn, mỗi ngày hệ thống bán lẻ Walmart tại Mỹ tạo ra khối dữ liệu khoảng 24-25 TB (trong khi chiếc smartphone mạnh nhất hiện nay có dung lượng lưu trữ tối đa 1TB). 

Tiếp đến, dữ liệu phải có tính đa dạng (variety), từ hình ảnh, âm thanh, chữ viết,... đến video, bài viết. Việc thu thập, khai thác dữ liệu cũng cần dựa trên yếu tố tốc độ (velocity), chẳng hạn khi vận hành xe tự lái thì khối lượng dữ liệu thu thập và xử lý phải được thực hiện theo thời gian thực để giúp xe xử lý tình huống ngay tức khắc.

Thêm vào đó, dữ liệu thu thập phải chính xác (veracity), vì nếu thu thập sai sẽ dẫn đến kết quả sai. Do đó, người ta phải tốn đến 80% công sức cho việc “làm sạch” dữ liệu trước khi đem vào sử dụng. Cuối cùng, dữ liệu phải có giá trị (value).

Doanh nghiệp Việt có thể thu thập dữ liệu theo kiểu ve, nhện, hay cáo?
Ông Albert Antoine đang trình bày tại sự kiện Vietnam Data Summit 2022. (Ảnh: Hải Đăng)

Chiến lược thu thập dữ liệu của nhện và cáo

Sau khi đã xác định được tầm quan trọng của dữ liệu và loại dữ liệu cần thu thập, có 3 cách để lấy được dữ liệu.

Với doanh nghiệp chưa từng có cơ sở dữ liệu thì cần phải đi xin, hoặc đi mua dữ liệu. Cách này được ông Antoine ví von như kiểu của con ve trong truyện ngụ ngôn: mùa hè con ve mải lo ca hát nên mùa đông không có thức ăn, phải xin của con kiến vốn cần cù làm lụng quanh năm.

Ở cách thứ hai, một số doanh nghiệp áp dụng nguyên tắc con nhện giăng tơ, tức cung cấp các dịch vụ để khách hàng sử dụng, từ đó thu thập dữ liệu. Chẳng hạn, khi bạn dùng Wi-Fi công cộng miễn phí thường phải cung cấp địa chỉ email - cũng là một dạng dữ liệu.

Những doanh nghiệp có sẵn cơ sở hạ tầng tiên tiến sẽ áp dụng nguyên tắc của con cáo: cung cấp công cụ phân tích cho những người sở hữu sẵn dữ liệu, sau đó dùng kết quả phân tích để bán cho bên có nhu cầu. Ví dụ các doanh nghiệp toàn cầu như Facebook, Google đang áp dụng cả chiến lược của nhện lẫn cáo.

 

“Khi đọc sách Kindle của Amazon, bạn tưởng bạn đang đọc sách nhưng thực ra sách đang “đọc” bạn”, vị chuyên gia từng tư vấn cho nhiều doanh nghiệp và chính phủ ví von.

Ông ám chỉ việc mỗi lần bạn dừng lại, đọc lâu hơn một đoạn nào đó chính là đang cung cấp hành vi để máy thu thập dữ liệu.

Thế giới đang dùng dữ liệu vào việc gì?

Sau khi đã có dữ liệu lớn, trên thế giới hiện nay có nhiều xu hướng sử dụng. Dễ thấy nhất là mô hình bot/công nhân số. Nhờ dữ liệu lớn và máy học, các doanh nghiệp xây dựng nên những con bot để giao tiếp với khách hàng trên mạng. Tại Việt Nam hay trên toàn cầu, khi bạn chat với tổng đài, thường là bạn đang trò chuyện với hệ thống máy tính (bot). Các con bot hiện nay khá thông minh, thậm chí có thể chốt đơn hàng mà không cần con người can thiệp vào.

Ngoài ra, các thông tin thu thập có thể dùng trong ngành phân tích dữ liệu. Qua hệ thống máy tính, dữ liệu có thể dùng vào việc phân tích các sự kiện đã diễn ra, chẳng hạn đưa ra các kết quả kinh doanh phục vụ doanh nghiệp. Nếu áp dụng AI/ML, có thể dự báo được những xu hướng kinh doanh, những sự việc xảy ra tiếp đến. Các thuật toán cũng có thể đưa ra lời khuyên để hỗ trợ con người đưa ra các hành động tiếp theo.

Mặc dù rất nhiều doanh nghiệp đã nhận ra được tầm quan trọng của dữ liệu trong quá trình chuyển đổi số, song không phải doanh nghiệp nào cũng đi đúng lộ trình.

“Nhiều doanh nghiệp cho rằng chuyển đổi số chỉ cần mua phần mềm về là xong, nhưng thực tế không phải vậy. Điều quan trọng là sự sắp xếp vận hành của doanh nghiệp trong quá trình thay đổi của công ty”, ông Antoine nhấn mạnh.

Vị chuyên gia cho rằng trong quá trình chuyển đổi số và xây dựng dữ liệu, mọi người đều phải tham gia. Thông thường, giữa các bộ phận và các đơn vị trong một tổ chức không chịu chia sẻ dữ liệu với nhau, vì nó không thuộc phạm vi công việc của họ. Do đó, cần đưa nội dung hợp tác và chia sẻ dữ liệu như một nhiệm vụ trong công việc hàng ngày để nhân viên làm việc.

Ngoài ra, để có được dữ liệu, doanh nghiệp cần cung cấp công cụ công nghệ cho nhân viên. Vì nếu không hoạt động trên nền tảng công nghệ thì không thể nào sản sinh ra dữ liệu.

Cuối cùng, để xây dựng dữ liệu thì những nhà lãnh đạo phải xác định doanh nghiệp xoanh quanh dữ liệu. Phải truyền đạt rõ ràng và minh bạch với nhân viên ngay từ đầu để nâng cao ý thức cho họ. Từ đó, mọi người đều chuyên tâm vào việc xây dựng và sản sinh dữ liệu.

Hải Đăng

Meta bị kiện vì thu thập dữ liệu từ hơn 600 bệnh viện và nhà cung cấp dịch vụ y tế

Meta bị kiện vì thu thập dữ liệu từ hơn 600 bệnh viện và nhà cung cấp dịch vụ y tế

Tờ Bloomberg đưa tin, Meta vừa bị đệ đơn kiện với cáo buộc cho phép dữ liệu y tế riêng tư được chia sẻ bí mật với Facebook mỗi khi bệnh nhân truy cập website của một số nhà cung cấp dịch vụ chăm sóc sức khỏe.

 
List comment
 

Savvycom, công ty tư vấn chuyển đổi số và cung cấp dịch vụ phát triển phần mềm tại Việt Nam, và Insider, kỳ lân Martech với nền tảng cá nhân hóa trải nghiệm của khách hàng, đã ký kết hợp tác chiến lược.

 

Chuyến bay liên quan đến các nhân vật nổi tiếng, sự kiện quốc tế quan trọng được hàng trăm nghìn người theo dõi trực tiếp trên các ứng dụng như Flightradar24.

 

Sản phẩm đáp ứng các quy định của chính phủ và đạt tiêu chuẩn châu Âu, đủ điều kiện để chuẩn bị cung cấp chính thức ra thị trường.  

 

Hiện có khoảng 35.000 phương tiện dán cả 2 loại thẻ thu phí không dừng gây lãng phí và bất cập khi xe không qua được trạm.

 

Diễn ra trong tuần thứ 3 của tháng 8 với chủ đề “Chuyển đổi số tạo đà đẩy nhanh phát triển kinh tế xã hội”, Tuần lễ chuyển đổi số tỉnh Thừa Thiên Huế 2022 là một hoạt động hưởng ứng Ngày chuyển đổi số quốc gia 10/10.

 
 

Vào 9h30 ngày 10/08/2022, chuyên gia CMC Telecom cùng AWS và Apzon IRS sẽ chia sẻ cách các doanh nghiệp sản xuất hiện đại hàng đầu nâng cao hiệu quả hoạt động vận hành với SAP trên nền tảng AWS tại webinar “Cloud solution trends in Manufacturing'.

Trên nền tảng học trực tuyến mở đại trà tại onetouch.mic.gov.vn, Bộ TT&TT đã tổng hợp các tài liệu và đưa vào 1 khóa bồi dưỡng “Phổ cập kỹ năng số cộng đồng” dành cho các thành viên Tổ công nghệ số cộng đồng và người dân.

Zalo đang hứng bão dư luận từ việc thu phí người dùng, tuy nhiên một số ý kiến ủng hộ cho rằng nền tảng này cần cung cấp dịch vụ xứng đáng khí thu phí.

Theo nguồn tin của Reuters, Mỹ đang cân nhắc hạn chế bán thiết bị sản xuất chip của Mỹ cho các nhà sản xuất chip nhớ tại Trung Quốc.  

Nguyên mẫu máy tính Apple 1 – Apple Computer A từng thuộc sở hữu của cố CEO Steve Jobs đang được bán đấu giá. Và số tiền tối thiểu để có thể mua...

 
123

Giấy phép hoạt động báo chí: Số 09/GP-BTTTT, Bộ Thông tin và Truyền thông cấp ngày 07/01/2019.

Tòa soạn: Tầng 7, Tòa nhà Cục Tần số Vô tuyến điện, 115 Trần Duy Hưng, Quận Cầu Giấy, Hà Nội

Điện thoại: 024 3 936 9966 - Fax: 024 3 936 9364

Hotline nội dung: 0888 911 911 - Email: toasoan@ictnews.vn

123