Dữ liệu phi cấu trúc và tầm quan trọng đối với các doanh nghiệp

Chúng ta đang sống trong một giai đoạn mà các nhà phân tích thị trường như Gartner và IDC đã gọi với một cái tên là “Kỷ nguyên dữ liệu”, giai đoạn mà dữ liệu đã trở thành mạch máu cho hoạt động của các doanh nghiệp.

Khi các doanh nghiệp đều sở hữu cho mình những nhân sự xuất sắc, những công nghệ tiên tiến nhất và những sản phẩm tốt, điều gì sẽ khiến mỗi doanh nghiệp tạo ra sự khác biệt và bứt phá được trong lĩnh vực của mình? Rất nhiều những nhà lãnh đạo của các tập đoàn lớn trên thế giới đều có chung một câu trả lời, đó là “dữ liệu” và cách mà mỗi doanh nghiệp khai thác dữ liệu đó, sẽ đem đến cho mỗi doanh nghiệp những quyết định kinh doanh thông minh và chính xác hơn, là chìa khóa mở ra những cơ hội đem lại thành công cho doanh nghiệp.

Theo John Roese, CTO của Dell Technologies: “Lần đầu tiên trong lịch sử, chúng ta không chỉ có một khối lượng lớn và đa dạng trong dữ liệu, mà con người còn sáng chế ra nhưng phương thức mới và mang tính kinh tế hơn trong việc lưu trữ và xử lý dữ liệu. Điều quan trọng nhất hiện nay, đó là phần mềm và những giải thuật đã đạt đến một ngưỡng – chủ yếu thông qua Trí tuệ nhân tạo (AI) và Học máy (ML) – mà chúng ta có thể đào sâu vào những dữ liệu mình có được và biến chúng thành những thông tin thú vị, bổ ích phục vụ cho kinh doanh và cuộc sống.

Có một sự phân cấp trong dữ liệu. Đầu tiên là mức “Dữ liệu” - Data, khi mọi thứ ở mức thô, chưa được quy hoạch và khai thác. Mức tiếp theo, chúng ta có “Thông tin” – Information, khi dữ liệu được tổ chức dưới dạng các cấu trúc. Cao hơn nữa, chúng ta có thể có được “Kiến thức” – Knowledge, từ việc tìm thấy những sự thấu hiểu (insight) từ những thông tin trước đó. Và cuối cùng, “Sự thông thái” – Wisdom, có được khi chúng ta biến những kiến thức thành những dự đoán cho tương lai, thành sự thấu hiểu quá khứ và thành những hành động thiết thực nhằm đạt được một múc đích nào đó. Chúng ta đang tiến vào một kỷ nguyên mà hạ tầng CNTT, khối lượng dữ liệu cũng như những giải thuật phần mềm kết hợp lại với nhau và đem lại cho con người “Kiến thức” và “Sự thông thái” trong hầu hết tất cả các ngành nghề. Tôi nghĩ những điều này đã đủ chứng minh việc chúng ta đang bước và một kỷ nguyên mới – Kỷ nguyên dữ liệu.”

{keywords}
image001.png

Thế giới đang đứng trước một sự bùng nổ dữ liệu vô cùng mạnh mẽ trong những năm qua, theo IDC, tổng dung lượng dữ liệu trên toàn thế giới đến năm 2025 có thể đạt đến 175 Zettabytes (175 tỷ Terabytes). Trên thực tế, các công nghệ mới mang tính đột phá như 5G đang là tiền đề giúp cho nhiều doanh nghiệp cung cấp nhiều dịch vụ cao cấp hơn cho khách hàng của mình, nhằm tận dụng sức mạnh của mạng 5G và chính điều này đã khiến cho rất nhiều loại dữ liệu mới sẽ được sinh ra và xử lý ở vùng biên (Edge) thay vì trong trung tâm dữ liệu tập trung. Theo dự đoán của Gartner, đến năm 2025 sẽ có khoảng 75% dữ liệu được tạo ra và xử lý bên ngoài các trung tâm dữ liệu tập trung.

Sự tăng trưởng đột biến về dữ liệu này được tạo ra từ một nhóm dữ liệu, đó là “dữ liệu phi cấu trúc – unstructured data”, hiện đang chiếm 80% tổng dung lượng trên toàn thế giới và được dự đoán sẽ tăng gấp 3 lần trong năm 2023. Dữ liệu có cấu trúc, là một nhóm dữ liệu đã rất quen thuộc, là những loại dữ liệu thường nằm trong các CSDL quan hệ và có thể được truy vấn thông qua các câu lệnh SQL (ví dụ Oracle DB, IBM DB2, MS SQL, v.v…). Dữ liệu phi cấu trúc là tất cả những loại dữ liệu còn lại, ví dụ như file văn bản, email, video, ảnh, dữ liệu di động, dữ liệu mạng xã hội, dữ liệu từ cảm biến, ảnh chụp vệ tinh, v.v… đây là nhóm dữ liệu không thể được lưu trữ dưới dạng hàng và cột như dữ liệu có cấu trúc và cũng không thể dùng những kỹ thuật truy vấn dữ liệu truyền thống để khai thác.

{keywords}

Với việc chiếm 80% tổng dung lượng dữ liệu hiện nay, hiển nhiên là dữ liệu phi cấu trúc đang giữ trong mình những thông tin và “sự thấu hiểu” quan trọng trọng kinh doanh mà chưa được khai thác hết.

Dữ liệu có cấu trúc rất quan trọng, nhưng dữ liệu phi cấu trúc lại đóng vai trò then chốt trong việc tạo ra sự bứt phá cho doanh nghiệp nhờ việc đem lại sự phong phú về thông tin và kiến thức mà những kết quả thông kê thông thường qua dữ liệu có cấu trúc không thể đem lại. Chính vì vậy, các doanh nghiệp và tổ chức bắt buộc phải tìm ra phương pháp để quản lý và phân tích dữ liệu phi cấu trúc nhằm đưa ra các quyết định quan trọng trong kinh doanh, làm cơ sở tạo ra ưu thế cạnh tranh của mình trong thị trường, nhất là trong kỷ nguyên dữ liệu hiện nay.

Thấu hiểu được những khó khăn và thách thức trong việc quản lý và phân tích dữ liệu phi cấu trúc, Dell Technologies luôn đồng hành cùng các doanh nghiệp thông qua các giải pháp trong nhóm UDS – Unstructured Data Solution bao gồm: PowerScale (NAS), ECS (Object Storage) và SDP (Streaming Data Platform). NT&T Solution, tự hào là nhà phân phối và đối tác dịch vụ ủy quyền bởi Dell Technologies, luôn sẵn sàng tư vấn và cung cấp đến cho các doanh nghiệp tại Việt Nam những dịch vụ và giải pháp quản lý dữ liệu phi cấu trúc cao cấp nhất (http://nttsolution.com).

Phạm Trang

Địa chỉ xem trực tiếp World Cup 2022, Iran vs Mỹ, 2h00 ngày 30/11

Kênh VTV2 để xem trận đấu giữa Iran và Mỹ hôm nay có trên những hệ thống truyền hình trực tuyến như VTV News, VTV Go, VTVcab ON, hay cả FPT Play, TV360...

Cơ quan chức năng phạt TikToker Nờ Ô Nô 7,5 triệu đồng

Theo cơ quan chức năng, Nờ Ô Nô đã có hành vi cung cấp chia sẻ thông tin giả mạo, thông tin sai sự thật, xuyên tạc, vu khống, xúc phạm uy tín của cơ quan, tổ chức, danh dự nhân phẩm của cá nhân.

Địa chỉ xem trực tiếp World Cup 2022, Wales vs Anh, 2h00 ngày 30/11

Kênh VTV3 để xem trận đấu giữa Anh và Wales hôm nay có trên những hệ thống truyền hình trực tuyến như VTV News, VTV Go, VTVcab ON, hay cả FPT Play, TV360...

Người dùng có thể đặt niềm tin vào camera Make in VietNam

Đặt server ở Việt Nam, phần mềm được update liên tục để vá lỗ hổng và bảo vệ khách hàng… những điều này chỉ có các doanh nghiệp Việt Nam mới thực hiện được. Đây là lý do khiến người dùng có thể đặt niềm tin vào camera Make in Vietnam.

Tấn công có chủ đích APT, mã độc đào tiền ảo sẽ gia tăng mạnh trong năm tới

Cùng với nhận định năm 2023 sẽ chứng kiến sự gia tăng mạnh của các loại mã độc đào tiền ảo, chuyên gia NCS dự báo các cuộc tấn công có chủ đích APT sẽ diễn ra nhiều hơn trong năm tới.

WhatsApp nói gì khi bị nghi lộ số điện thoại nửa tỷ người dùng?

Một người dùng Internet ẩn danh tuyên bố sở hữu thông tin của gần 500 triệu người dùng WhatsApp.

Địa chỉ xem trực tiếp World Cup 2022, Hà Lan vs Qatar, 22h00 ngày 29/11

Kênh VTV2 để xem trận đấu giữa Hà Lan và Qatar hôm nay có trên những hệ thống truyền hình trực tuyến như VTV News, VTV Go, VTVcab ON, hay cả FPT Play, TV360...

Địa chỉ xem trực tiếp World Cup 2022, Ecuador vs Senegal, 22h00 ngày 29/11

Kênh VTV5 để xem trận đấu giữa Ecuador và Senegal hôm nay có trên những hệ thống truyền hình trực tuyến như VTV News, VTV Go, VTVcab ON, hay cả FPT Play, TV360...

Trí tuệ nhân tạo giúp doanh nghiệp bảo mật phân tích 100 tỷ hành vi mỗi ngày

Hãng Fortinet cho biết công nghệ trí tuệ nhân tạo (AI) và máy học (ML) đã giúp đơn vị phân tích được hơn 100 tỷ hành vi có liên quan tới bảo mật trên toàn cầu mỗi ngày, bao gồm tất cả các loại nguy cơ, kỹ thuật tấn công.

Camera Make in Vietnam tăng cường bảo mật, đáp ứng tiêu chuẩn ATTT

Các nhà sản xuất camera make in Vietnam đang tập trung tăng cường yếu tố bảo mật, đáp ứng tiêu chuẩn về ATTT do Bộ TT&TT ban hành đối với những thiết bị như camera và IoT nói chung.

Đang cập nhật dữ liệu !