Hổ đeo tai nghe VR: Từ trò đùa vu vơ tới màn so tài của các hệ thống AL hàng đầu thế giới

Ai có thể ngờ rằng một ngày nào đó, những con hổ của triều đại nhà Tống sẽ trở thành tâm điểm của một cuộc cạnh tranh của trí tuệ nhân tạo.

Cách đây không lâu, Google đã phát hành Imagen, một công cụ tạo tác bằng trí tuệ nhân tạo. Về cơ bản, chỉ cần bạn đưa ra một câu nói mô tả điều gì đó, nó có thể từ đó tạo ra các bức tranh theo đúng ngữ nghĩa.

So với các hệ thống khác, Imagen được Google mô tả là có "mức độ hiện thực cao chưa từng có và mức độ hiểu biết sâu sắc về ngôn ngữ”. Hệ thống này có thể hiểu văn bản thông qua các mô hình ngôn ngữ khác nhau, sau đó dựa vào các thuật toán phức tạp để tái tạo các hình ảnh có độ trung thực cao, gần với những gì đã được mô tả.

Và mới đây, một người dùng đã thử "hack não" trí tuệ nhân tạo này, bằng cách đặt ra một "đề bài" không theo khuôn mẫu: "Hãy mang tai nghe VR cho những chú hổ phương Đông trong triều đại nhà Tống."

Imagen không hề ngại ngần và chỉ với một cái “búng tay”, hệ thống này đã cho ra đời một kiệt tác mang tên: “Tiger Wear VR”.

Hổ đeo tai nghe VR: Từ trò đùa vu vơ tới màn so tài của các hệ thống AI hàng đầu thế giới - Ảnh 1.

Chỉ nhìn qua, bạn cũng có thể nhận ra điểm độc đáo thú vị của bức tranh về hai hổ mang thiết bị thực tế ảo này. Không chỉ riêng phong cách vẽ tranh, mà tai nghe VR dường như phù hợp một cách đặc biệt với con hổ, cũng như toàn bộ bức tranh.

Ngay cả tay cầm và cảm giác vui đùa của hai con hổ cũng được thể hiện một cách rõ ràng và chính xác.

Sau đó, hệ thống tiếp tục đưa ra một sản phẩm khác, với hai con hổ đang đeo tai nghe VR, nhưng nắm tay và nhảy múa cùng nhau.

Hổ đeo tai nghe VR: Từ trò đùa vu vơ tới màn so tài của các hệ thống AI hàng đầu thế giới - Ảnh 2.

Thậm chí, chưa dừng lại ở đó. Imagen còn khéo léo thiết kế một phiên bản VR "kết nối", cho phép hai con hổ xem các nội dung thực tế ảo cùng với nhau.

Hổ đeo tai nghe VR: Từ trò đùa vu vơ tới màn so tài của các hệ thống AI hàng đầu thế giới - Ảnh 3.

Loạt tranh đã ngay lập tức thu hút sự chú ý của cộng đồng mạng. Và nó cũng khiến nhiều người đặt ra câu hỏi về khả năng cũng như sự thích ứng nhanh nhạy của hệ thống AI này. Và trong lĩnh vực vẽ tranh bằng AI, vẫn còn có rất nhiều gương mặt đại diện khác ngoài Google Imagen.

Kết quả là, một trận chiến vẽ tranh "Tiger Wear VR" đã chính thức bắt đầu.

Ứng cử viên đầu tiên là DALL-E từ OpenAI, công ty trí tuệ nhân tạo do Elon Musk sáng lập. Giống với Imagen, nó cũng là một chương trình trí tuệ nhân tạo có thể tạo ra hình ảnh từ các mô tả bằng văn bản. Và tác phẩm của DALL-E đã nhanh chóng chinh phục được người xem, với phong cách vẽ riêng vô cùng "ngổ ngáo".

Hổ đeo tai nghe VR: Từ trò đùa vu vơ tới màn so tài của các hệ thống AI hàng đầu thế giới - Ảnh 4.

Không khó để nhận thấy rằng có sự khác biệt lớn về phong cách giữa tranh của DALL-E và Imagen. Tranh của Imagen có xu hướng đơn giản và tuyến tính hơn, trong khi DALL- E mang phong cách của thể loại tranh sơn dầu.

Và không chỉ vậy, xét về quan niệm nghệ thuật, DALL-E cũng có thể cho ra đời những bức tranh khác đúng với nội dung, mang tính nhân cách hóa cao.

Hổ đeo tai nghe VR: Từ trò đùa vu vơ tới màn so tài của các hệ thống AI hàng đầu thế giới - Ảnh 5.
Hổ đeo tai nghe VR: Từ trò đùa vu vơ tới màn so tài của các hệ thống AI hàng đầu thế giới - Ảnh 6.

Điều này khiến cộng đồng mạng băn khoăn. Người thì nghiêng về Imagen, người lại thích phong cách tranh của DALL-E. Nhưng xét về sự phá cách và sáng tạo, hầu hết cư dân mạng đều có phần ủng hộ hệ thống AI của Google hơn.

Ngoài hai "họa sĩ AI" kể trên, một cái tên khác cũng tham gia cuộc đấu trí này là AI MidJourney. Đây là một nền tảng mới ra đời và đang cho các nghệ sĩ trên khắp thế giới tham gia thử nghiệm beta. Nền tảng cơ sở dữ liệu của Midjourney là những bức tranh của hàng trăm họa sĩ nổi tiếng khác nhau, cho phép nó có thể nhận dạng và xây dựng nên những phong cách nghệ thuật cho riêng mình.

Tài khoản Twitter @hardmaru, một trong các nghệ sĩ được thử nghiệm MidJourney đã tiến hành bài kiểm tra. Tuy nhiên, kết quả công việc của AI này hơi kỳ lạ. Các bức tranh mang phong cách trừu tượng, khó hình dung và nói thẳng ra là khá xấu. Khó trách khi đây vẫn là một hệ thống mới phát triển và cần thêm thời gian để hoàn thiện cơ sở dữ liệu của mình.

Hổ đeo tai nghe VR: Từ trò đùa vu vơ tới màn so tài của các hệ thống AI hàng đầu thế giới - Ảnh 7.

Quay trở lại với Imagen và DALL-E, tại sao phong cách vẽ của chúng lại khác nhau tới vậy?

Cả hai sản phẩm của Open AI và Google đều có thể tạo ra những hình ảnh siêu thực theo mô tả của văn bản, và đã chứng minh rằng máy móc có khả năng sáng tạo giống như một nhà thiết kế. Tuy nhiên, nguyên tắc "sáng tạo" của đôi bên khá khác nhau.

DALL-E sử dụng CLIP để ánh xạ các đặc điểm văn bản với các đặc điểm hình ảnh, sau đó chỉ đạo kiến trúc GAN hoặc mô hình khuếch tán để tạo hình ảnh. Cái gọi là CLIP chính là một mạng nơ-ron được đào tạo trên các hình ảnh và văn bản khác nhau, phân loại nhiều hình ảnh được tạo và chọn các kết quả được tạo ra tốt hơn để hiển thị.

Còn Imagen của Google thì khác. Bằng cách tìm hiểu tường tận văn bản được cung cấp, nó sẽ sử dụng những hình ảnh thật sau đó tinh chỉnh theo cách tốt nhất có thể. Vì vậy, những hình ảnh do công cụ AI này tạo ra trông rất chân thực như thể chúng được tạo ra bởi con người. Phần xử lý ngôn ngữ sử dụng bộ mã hóa T5-XXL của riêng Google, còn phần tạo hình ảnh là một loạt các mô hình khuếch tán, đầu tiên tạo ra các hình ảnh có độ phân giải thấp và sau đó tinh chỉnh theo từng bước một.

T5-XXL của Google có 4,6 tỷ tham số và việc mở rộng quy mô của bộ mã hóa văn bản có thể cải thiện hiệu quả về sự tương đồng giữa văn bản với hình ảnh cũng như độ trung thực của hình ảnh. Ngoài ra, Imagen còn sử dụng một kỹ thuật khuếch tán khác được gọi là tăng cường điều hòa nhiễu, giúp cải thiện khả năng phục hồi của hình ảnh.

Hổ đeo tai nghe VR: Từ trò đùa vu vơ tới màn so tài của các hệ thống AI hàng đầu thế giới - Ảnh 8.

Dù đạt kết quả ấn tượng nhưng Google cho biết họ chưa có ý định ra mắt công cụ này để có thể sử dụng rộng rãi trên toàn cầu. Lý do là bởi công ty lo lắng về nguy cơ tiềm ẩn của việc sử dụng sai mục đích, hay những thách thức về mặt đạo đức, thành kiến xã hội, cũng như giới hạn của các công cụ.

Trong khi đó, DALL-E cũng đang gặp phải vấn đề với các "định kiến xã hội". Ví dụ khi yêu cầu tạo ra hình ảnh của một “tiếp viên hàng không”, hầu như tất cả các đối tượng sẽ là phụ nữ. Hay yêu cầu hình ảnh của một “Giám đốc điều hành”, bạn sẽ nhận được một loạt hình ảnh những người đàn ông da trắng.

Vì lý do này, OpenAI cũng quyết định không phát hành DALL-E công khai, nhưng công ty cung cấp quyền truy cập cho những người được chọn tham gia thử nghiệm. Nhưng lịch sử về AI cho chúng ta biết rằng các mô hình chuyển văn bản thành hình ảnh như vậy gần như chắc chắn sẽ được công khai vào một thời điểm nào đó trong tương lai.

(Theo Trí Thức Trẻ, NetEase)

Thiết bị AR/VR của Apple sẽ có những gì?

Thiết bị AR/VR của Apple sẽ có những gì?

Headset đời đầu của Apple mới đây được dự báo sẽ ra mắt trong chưa đầy một năm nữa. Hiện người dùng đã có thể hình dung tương đối đầy đủ về thiết bị này thông qua các tin đồn.

Nokia bổ nhiệm tổng giám đốc tại Việt Nam

Người có kinh nghiệm ở thị trường châu Mỹ La-tinh mới được bổ nhiệm vào vị trí cao nhất của Nokia tại Việt Nam.

50 ngân hàng, tổ chức tài chính tại Việt Nam sắp diễn tập chủ động chống tấn công mạng

Trong lần thứ 2 được tổ chức, diễn tập thực chiến phòng thủ không gian mạng - DF Cyber Defense 2022 vào ngày 11/10 tới có sự tham gia của 50 tổ chức ngân hàng, tài chính lớn tại Việt Nam.

Xiaomi kháng cáo án phạt 682 triệu USD tại Ấn Độ

Ngày 02/10, công ty sản xuất smartphone Trung Quốc Xiaomi cho biết, hãng “thất vọng” với phán quyết đóng băng 682 triệu USD mà nhà chức trách Ấn Độ đưa ra và khẳng định làm mọi cách để bảo vệ lợi ích kinh doanh tại đây.

Mạng xã hội giết chết một cô gái 14 tuổi như thế nào

Cái chết của Molly gây rúng động năm 2017 được kết luận một phần do mạng xã hội. Các nền tảng đã để cô gái tiếp xúc với nội dung độc hại mà đáng ra một thiếu niên không thể xem.

Hacker Trung Quốc ẩn mã độc vào hình ảnh để phát tán

Các chuyên gia nghiên cứu bảo mật vừa phát hiện một chiến dịch phát tán mã độc tinh vi bắt nguồn từ các tin tặc đến từ Trung Quốc, trong đó mã độc được ẩn chứa bên trong hình ảnh chứa logo Windows.

9 tháng hơn 9.500 sự cố tấn công mạng nhưng nhiều đơn vị vẫn “thờ ơ” với lỗ hổng

Trong tháng 9/2022, số cuộc tấn công mạng gây ra sự cố vào các hệ thống thông tin tại Việt Nam là 988 cuộc, nâng tổng số sự cố tấn công mạng và các hệ thống trong nước trong 9 tháng qua lên 9.519.

Tim Cook: Vũ trụ ảo không thể thay thế cuộc sống thực

CEO Apple cho biết ông đánh giá cao tiềm năng của công nghệ thực tế ảo và thực tế tăng cường. Tuy nhiên, ông không tin nó có thể thay thế cuộc sống thực.

Viettel hợp tác với đối tác Đài Loan phát triển thiết bị cho mạng 5G

Tổng Công ty Công nghiệp Công nghệ cao Viettel (Viettel High Tech) và Công ty UfiSpace (Đài Loan) vừa công bố kế hoạch hợp tác phát triển thiết bị Site Router 100G cho hạ tầng mạng 5G của Viettel.

Người dùng Trung Quốc ‘kêu trời’ vì Google Translate ngừng cung cấp dịch vụ

Google Translate (Google Dịch thuật), một trong những dịch vụ hiếm hoi Google còn cung cấp tại thị trường Trung Quốc, đã ngắt truy cập kể từ cuối tuần trước.

4 phẩm chất Tim Cook tìm kiếm ở nhân viên Apple

Công việc của Tim Cook không phải là ngồi duyệt hồ sơ xin việc, nhưng trong 11 năm điều hành Apple, ông đã xác định được điều gì sẽ giúp công ty phát triển.

Đang cập nhật dữ liệu !