Một cuộc cách mạng thông minh trong việc chụp ảnh bằng smartphone đang lặng lẽ tới gần, bạn đã nhận ra chưa?

0
17
Một cuộc cách mạng thông minh trong việc chụp ảnh bằng smartphone

“AI” đồng nghĩa với những bức ảnh thông minh hơn, chất hơn

Một cuộc cách mạng thông minh trong việc chụp ảnh bằng smartphone đang lặng lẽ tới gần, bạn đã nhận ra chưa? – Ảnh 1.
Trí tuệ nhân tạo (AI) đang len lỏi vào mọi khía cạnh của cuộc sống. Nó là smartphone trong túi chúng ta, nó bước vào nhà chúng ta dưới hình hài một trợ lý ảo trong một bộ loa thông minh.

Đấy chỉ là những hình thức dễ thấy, trong tương lai AI sẽ chạy ngầm trong các siêu máy tính để điều khiển cho các thành phố thông minh của chúng ta luôn hoạt động.

Tuy nhiên, có một lĩnh vực AI đang trực tiếp đưa cách mạng đến chúng ta rồi: nhiếp ảnh di động và xử lý hình ảnh – nơi bạn có thể thấy AI làm được những việc nặng nhọc nhất. Hãy xem qua vài ví dụ về ảnh hưởng từ trí tuệ nhân tạo lên lĩnh vực nhiếp ảnh dưới đây.

Samsung Bixby Vision và Scene Optimizer
Người dùng sẽ nghĩ camera trên Note9 năm nay không khác Note8 năm ngoái, ít nhất về thông số. Có thể họ đã nhầm, các chế độ thông minh Samsung trang bị cho ứng dụng camera Android O sẽ thay đổi hoàn toàn chất lượng ảnh chụp từ di động.

Scene Optimizer hoạt động dựa trên việc tối ưu cài đặt cho 20 kiểu khung cảnh khác nhau, từ chụp ban đêm đến chụp thức ăn hay ngoài trời. Mọi thứ hoàn toàn tự động giúp người dùng không phải bận tâm về thông số mà đánh mất khoảnh khắc. Chức năng Flaw Detection cũng được đánh giá cao khi lặng lẽ chạy và phát hiện ra ai đang chớp mắt, ống kính bị bẩn hay góc chụp bị lóa để “nhắc” người dùng.

Một cuộc cách mạng thông minh trong việc chụp ảnh bằng smartphone

Bixby Vision cũng được tích hợp vào một góc camera Note9, cho phép bạn đọc và dịch văn bản tức thời, nhận dạng vật thể và gợi ý nơi mua, giá bán cũng như thông tin liên quan.

Cho đến giờ, những chức năng AI trên Galaxy Note9 tập trung vào trải nghiệm sử dụng của người dùng được đánh giá rất cao và giúp smartphone này nằm trong danh sách khuyến cáo nên mua hàng đầu của người Mỹ – Consumer Reports .

ThinQ AI camera
Đây là phiên bản được quảng bá dữ dội nhất trong số AI xử lý ảnh hiện nay. Nhiều mẫu LG mới gần đây có trợ lý thông minh giúp nhận diện các chế độ phong cảnh và đối tượng phù hợp để tối ưu ảnh chụp của bạn. ThinQ AI còn xuất hiện trên các mẫu TV thông minh của hãng.

Một cuộc cách mạng thông minh trong việc chụp ảnh bằng smartphone đang lặng lẽ tới gần, bạn đã nhận ra chưa? – Ảnh 3.
Mỗi nhà sản xuất điện thoại khác nhau sẽ có cách tiếp cận và tính năng khác nhau cho smartphone của mình, do đó độ lệch tiếp cận cũng như chất lượng AI của họ cũng khác nhau xa.

Huawei AI
Ít công ty dám mạnh miệng tuyên bố về AI điện thoại như Huawei năm 2018. Đó là tính năng “đinh” bạn nên cân nhắc nếu mua Mate 20 Pro.

Họ có chế độ “Chụp AI” trong ứng dụng camera, giúp nhận diện 1500 loại khung cảnh và tình huống khác nhau. Máy sẽ áp dụng hồ sơ màu và độ tương phản phù hợp, cho hình ảnh sống động hơn.

Tiêu chí “đẹp tự nhiên” bị bỏ qua. Huawei AI có xu hướng đẩy độ bão hòa màu lên cao, nước ảnh đẹp nhưng trông không thật khiến họ nhận không ít những lời khen chê trên mạng xã hội.

Apple Portrait Lighting (chụp chân dung của iPhone)
Đây là tính năng chụp ảnh AI của Apple mô phỏng hiệu ứng ánh sáng studio. Vài điện thoại đã ra mắt chức năng này trước, nhưng iPhone vẫn làm tốt nhất đến nay.

Tại sao lại AI? Chế độ chụp chân dung bao gồm việc tạo bản đồ 3D khuôn mặt đối tượng, sau đó áp dụng bộ lọc để thêm hiệu ứng ánh sáng dựa trên các đường nét nổi khối của chủ thể, như thể chúng được chiếu từ đèn sáng trong phòng studio.

Apple gọi nó là “studio trong túi bạn”. Tất nhiên nó không bao giờ thay thế một studio xịn được, nhưng kết quả đem lại thật đáng ngạc nhiên.

Google Lens

Google là hãng phát triển và nghiên cứu công nghệ AI sâu nhất, nhiều chế độ camera trên điện thoại của họ xử lý “giống hệt” như AI.

Ví dụ Shot Top của Pixel 3 chụp liên tục hàng loạt sau đó máy tự động chọn ảnh đẹp nhất. Photobooth cũng vậy, áp dụng cho ảnh nhận diện rõ khuôn mặt hoặc nụ cười của bạn và bạn bè.

Nhưng Google Lens còn làm được nhiều hơn thế. Chế độ camera này nhận dạng theo thời gian thực dựa vào bối cảnh thực tế. Bạn bật Google Lens, soi điện thoại vào các sản phẩm, tòa nhà, thậm chí cả hình nền, và Lens sẽ cố tìm dữ liệu trực tuyến và cung cấp thông tin liên quan.

Google Photos
Ít ai nhận thấy khả năng tìm kiếm ảnh đã được Google nâng lên trình độ hoàn toàn mới.

Mở Google Photos và gõ thử vào thanh tìm kiếm “Hoàng hôn”, máy sẽ trả về các bức ảnh có liên quan trong điện thoại của bạn.

Trợ lý ảo này cũng đóng vai trò người quản lý, đổi ảnh thành GIF động, đề xuất ảnh nên xóa, áp dụng bộ lọc màu hoặc ghép ảnh panorama. Tất cả được dựa trên những thuật toán nhận dạng hình ảnh tiên tiến nhất hiện nay

Phục dựng hình ảnh của Nvidia AI
Nếu các AI trên vẫn khiến bạn cảm thấy “bình thường” quá thì Nvidia AI thực sự là một ứng dụng gây choáng ngợp, với vài ví dụ sau

Đầu tiên là “khử lỗi” hình ảnh. AI dùng phương pháp học sâu (deep learning) để khôi phục phần dữ liệu ảnh bị che khuất bởi nhiễu. AI nhận ra từ một mạng lưới thần kinh được đào tạo bằng cách tiếp xúc với số lượng lớn các hình ảnh khác, giúp nó nhận biết các mẫu và nội suy dữ liệu bị thiếu từ ảnh gốc.

Một minh chứng mạnh mẽ về sức mạnh của mạng thần kinh của Nvidia là AI vẽ tranh. Trong thử nghiệm, một phần ảnh gốc bị xóa và vẽ lại, thông tin thiếu được AI nội suy hoàn toàn.

Trong demo cuối, Nvidia AI có thể chuyển video 30fps thành cảnh quay 480fps, gấp 16 lần so với video chuẩn. Dùng cùng một kỹ thuật khi phục dựng tranh, trí tuệ nhân tạo đã tạo ra những “frame” (khung hình) vốn không có trong video gốc.

Các TV thông minh hiện nay có chế độ upscale tương tự. Tuy nhiên Nvidia AI xử lý các hình ảnh phức tạp, như cảnh một dải lụa bay phấp phới, trông mượt hơn nhiều.

Iconem
Iconem là một startup về di tích sử dụng AI do Microsoft phát triển. AI này bắt đầu từ những viên gạch nhỏ, không có gì xuất sắc nhưng khi áp dụng trên quy mô lớn thì tạo ra kết quả đáng kinh ngạc.

Mục tiêu của dự án là ghi lại hình ảnh của các di tích lịch sử quan trọng trước đe dọa chiến tranh, xói mòn hoặc các nguy cơ khác, tạo ra một phiên bản tòa nhà 3D thời gian thực

Công việc của AI là lập bản đồ hàng chục nghìn bức ảnh tạo thành mô hình 3D được quét của một khu vực di tích, đồng thời dùng drone chụp các hình ảnh yêu cầu. Iconem cũng dùng để lấy ảnh những nơi nguy hiểm, chẳng hạn như nhà thờ Hồi giáo Great Umayyad ở Aleppo trong chiến tranh Syria.

Google BigGAN

DeepMind là công ty AI con của Alphabet, và BigGAN là một trong những dự án mới nhất – được phát minh bởi một thực tập sinh. Đây là phần mềm AI tạo ra hình ảnh bằng cách sử dụng thuật toán.

Đầu tiên, hình ảnh được tạo ra theo thuật toán từ một số ngẫu nhiên, hình ảnh sau đó được so sánh với ảnh “thực” để phân tích mức độ gần đúng. Một phiên bản mới của hình ảnh được tạo ra và cứ như thế hình ảnh ngày càng hoàn thiện hơn.

Nói dễ hiểu, bạn gõ “chó” hoặc “cây” thì BigGAN sẽ hoàn toàn tự vẽ ra “chó” hoặc “cây” bằng thuật toán (nhờ việc học hàng vạn tấm hình khác).

Những ứng dụng tương lai của GAN là vô cùng lớn khi có thể tạo ra những hình ảnh cầu thủ trong game FIFA trông “như thật”, mô hình hóa 3D các đối tượng từ ảnh. Tháng 5/2018, người ta đã tạo ra một video giả Donald Trump mà không cần dùng đến chút kiến thức đồ họa nào, chỉ hoàn toàn nhờ lập trình (đây là mặt xấu của nó – có thể bị dùng để tạo ra video giả). Trong lĩnh vực y học, GAN đang được hi vọng giúp con người hiểu cơ chế di căn của tế bào ung thư khi có một lượng dữ liệu ảnh chụp đủ lớn.

Theo Tri Thức Trẻ

LEAVE A REPLY

Please enter your comment!
Please enter your name here