img 30/05/21
img 51

CÔNG NGHỆ ẢNH BA CHIỀU TIÊN TIẾN ĐANG RẤT GẦN VỚI THỰC TẾ

Trong thập kỷ vừa qua, sự phát triển rầm rộ của máy xem VR (Virtual Reality) và AR (Augmented Reality) đã lan rộng khắp, nhưng chúng vẫn chưa đạt tới sức hút của TV hay màn hình máy tính – giao diện thông thường của phương tiện kỹ thuật số. Bên cạnh lý do chi phí, tính chất mất phương hướng của việc đeo một thiết bị mô phỏng môi trường 3D cũng khiến nhiều người cảm thấy khó chịu. Nhưng làn sóng cải tiến một công nghệ đã 60 năm tuổi cho những năm tới đang dâng lên mạnh mẽ: công nghệ ảnh ba chiều.

Ảnh ba chiều bạn có thể chạm và cảm nhận

Gần đây nhất, các nhà nghiên cứu của MIT đã phát minh ra cách để tạo ảnh ba chiều mới với độ trung thực gần như thời gian thực, sử dụng phương pháp dựa trên việc học tập với hiệu quả cực cao. Tính hiệu quả là chìa khóa của khám phá này, bởi hệ thống mạng lưới xử lý của nó cho phép hình ảnh ba chiều chạy trên máy tính xách tay và thậm chí có thể là trên điện thoại thông minh thế hệ mới.

Phương pháp ảnh ba chiều tensor

Các nhà nghiên cứu đã làm việc để tạo ra những hình ảnh ba chiều trên máy tính trong một quá trình lâu dài, nhưng hầu hết các mô hình đều đòi hỏi một siêu máy tính “bò” qua các mô phỏng vật lý. Điều này mất rất nhiều thời gian và thường tạo ra hình ảnh ba chiều có độ trung thực thấp. Vì vậy, công việc của các nhà nghiên cứu MIT là tập trung vào việc khắc phục những trở ngại này. Liang Shi, tác giả chính của nghiên cứu, cũng là nghiên cứu sinh tại khoa kỹ thuật điện và khoa học máy tính của MIT (EECS) cho biết trong một bài đăng trên blog của MIT: “Trước đây mọi người nghĩ rằng không thể thực hiện tính toán ảnh ba chiều 3D theo thời gian thực với phần cứng ở cấp độ dành cho người tiêu dùng hiện tại. Người ta cũng nói màn hình ba chiều sẽ được bán trên thị trường sau 10 năm nữa, nhưng tuyên bố này đã tồn tại trong nhiều thập kỷ.”

Shi cho rằng phương pháp mới “ảnh ba chiều tensor” sẽ khiến lời hứa trong tương lai gần về ảnh ba chiều cuối cùng cũng đơm hoa kết trái. Nếu cách tiếp cận mới của các nhà nghiên cứu có tiến triển, thì một cuộc cách mạng công nghệ trong các lĩnh vực như in 3D và VR sẽ được tạo ra. Vào năm 2019, các nhà khoa học đã tạo ra “hình ba chiều xúc giác” mà con người có thể nhìn và nghe. MATD (Multimodel Acoustic Trap Display – Màn hình bẫy âm thanh đa mẫu) sử dụng máy chiếu LED, hạt xốp và dàn loa, các loa phát ra sóng ở mức siêu âm giữ hạt trong không khí và di chuyển đủ nhanh để nó xuất hiện như là đang di chuyển và phản chiếu ánh sáng từ máy chiếu. Con người không thể nghe thấy nó, nhưng chuyển động cơ học của hạt có thể được ghi lại và tập trung để kích thích tai người nghe “hoặc kích thích làn da của con người để cảm nhận”, Martinez Plasencia, nhà nghiên cứu, đồng sáng tạo của MATD giải thích về giao diện người dùng 3D trong một bài đăng trên blog của Đại học Sussex.

Trong ống kính máy ảnh thông thường, độ sáng của mỗi sóng ánh sáng được mã hóa, cho phép ảnh chụp có độ trung thực cao về màu sắc của cảnh, nhưng chỉ cho chúng ta hình ảnh phẳng 2D. Ngược lại, hình ảnh ba chiều mã hóa độ sáng và pha của mọi sóng ánh sáng, giúp mô tả trung thực hơn về độ sâu và thị sai của cảnh. Ví dụ, một hình ba chiều có thể biến “Hoa súng” của Monet thành một kết cấu 3D độc đáo với từng nét vẽ mượt mà thay vì làm nổi bật bảng màu của tác phẩm nghệ thuật. Điều này nghe có vẻ ấn tượng, nhưng rất khó để tạo và chia sẻ ảnh ba chiều.

AI tự đào tạo chính mình để bắt chước con người

Để vượt qua quá trình tốn nhiều thời giờ cho việc nhập liệu vật lý nâng cao, nhóm nghiên cứu gần đây hơn của Shi đã quyết định để máy tính tự đào tạo bản thân về vật lý. Họ đã tăng tốc đáng kể tính năng ba chiều do máy tính tạo ra với AI kiến thức sâu, thiết kế mạng nơ-ron phức hợp của riêng mình. Mạng nơ-ron sử dụng một chuỗi các bộ tensor có thể huấn luyện để bắt chước cách con người nhận thức thông tin thị giác, và điều này thường yêu cầu một tập dữ liệu lớn, chất lượng cao. Các nhà nghiên cứu đã xây dựng cơ sở dữ liệu của riêng họ gồm 4.000 cặp hình ảnh do máy tính tạo ra – trong đó mỗi cặp khớp với một bức ảnh theo thông tin về độ sâu và màu sắc trên mỗi pixel, với một hình ba chiều được phối hợp. Các hình dạng và màu sắc phức hợp, thay đổi được sử dụng, với các pixel phân bổ đồng đều giữa tiền cảnh và hậu cảnh, sự chèn lấp được khắc phục bằng những phép tính dựa trên vật lý. Với tất cả những điều này, thuật toán đã đạt được thành công lớn, tạo ra những trật tự ba chiều về độ lớn nhanh hơn so với các phép tính dựa trên vật lý.

Trong bài đăng trên blog, Matusik cho biết: “Chúng tôi rất ngạc nhiên về hiệu quả hoạt động của nó. Chỉ sau vài mili giây, hình ảnh ba chiều tensor đã được dựng lên từ hình ảnh mã hóa với thông tin về độ sâu mà máy tính tạo ra và các kỹ sư có thể tính toán bằng cảm biến đa màn hình hoặc cảm biến LiDAR (điện thoại thông minh thế hệ mới đã có những tính năng này). Đây là một sự phát triển đáng kinh ngạc, đặc biệt do hệ thống ảnh ba chiều chỉ sử dụng ít hơn 1 MB bộ nhớ để chạy mạng tensor nhỏ gọn của nó. “Dung lượng chiếm không đáng kể so với hàng chục hàng trăm gigabyte có sẵn trên điện thoại di động đời mới nhất”.

Tags: hi tech

Các bài viết khác