Ảnh: dailysabah.com
Lookout là một ứng dụng mới sử dụng tính năng nhận dạng hình ảnh và trí tuệ nhân tạo để mô tả một hiện trường thông qua chiếc camera của điện thoại. Google hiện đang thử nghiệm ứng dụng này và cho biết nó sẽ được phát hành vào cuối năm nay, bắt đầu từ các thiết bị Pixel.
Nếu bạn đi vào hành lang một tòa nhà bằng một chiếc camera Android cầm trong tay hoặc đeo quanh cổ, hướng ra ngoài, thì Lookout sẽ phát hiện được người và các vật thể, chẳng hạn như cửa thang máy, và đọc văn bản gần đó. Ứng dụng này không cần phải kết nối internet.
Google cho biết Lookout được thiết kế để giúp người dùng tương tác với những gì đang diễn ra mà không cần phải báo cho họ biết quá nhiều thông tin. Nó chỉ mô tả các mục quan trọng nhất. Nếu một người muốn ngăn chặn tường thuật, họ đặt một tay lên máy ảnh hoặc gõ vào nó một cái để tạm dừng ứng dụng.
Công ty cho biết ứng dụng này sử dụng các công nghệ tương tự như Google Lens, một công cụ tìm kiếm trực quan. Nó kết hợp học máy (machine learning), nhận dạng hình ảnh và một số mô hình học máy khác nhau.
“Những gì người khiếm thị cần là tiếp cận thông tin”, Erin Lauridsen – giám đốc công nghệ truy cập tại LightHouse ở San Francisco, Mỹ, nói.
“Rất nhiều lần các thiết bị được phát triển và tạo ra theo cách làm cho người khiếm thị ‘nhìn thấy’ được, nhưng thực sự mọi chuyện là nằm ở việc lấy thông tin thị giác và dịch nó thành thông tin không trực quan”.
Google không phải là công ty đầu tiên sử dụng trí tuệ nhân tạo và điện thoại thông minh để giúp người khiếm thị. Microsoft hiện cũng có một ứng dụng tương tự cho iOS gọi là Seeing AI.
Seeing AI có thể đọc văn bản in hoặc viết tay, mô tả màu sắc và nhận biết mệnh giá tiền tệ. Không giống như Google Lookout, Seeing AI có một thành phần nhận dạng khuôn mặt.
Sau khi trỏ điện thoại vào một người, Seeing AI mô tả họ và cho biết họ đang ở cách bao xa. Nếu bạn đã “dạy” ứng dụng này nhận dạng khuôn mặt, nó sẽ cho bạn biết tên của người đó.
Google cho biết họ có thể thêm nhận diện khuôn mặt vào Lookout trong tương lai.
Công nghệ dựa trên ứng dụng dành cho người khiếm thị không chỉ giới hạn ở các công ty lớn. Mới đây, một học sinh trung học 18 tuổi tại một chương trình hè của MIT đã tạo ra ứng dụng VocalEyes AI có thể mô tả cảm xúc hoặc tuổi tác của một người dựa trên khuôn mặt của họ.
Ngoài ra còn có nhiều ứng dụng truyền thống vẫn sử dụng con người thay vì AI. Ví dụ, Aira cung cấp cho các thành viên kính thông minh với một camera tích hợp để các nhân viên đã qua đào tạo có thể mô tả những gì họ nhìn thấy thông qua máy ảnh.
Trong khi đó Be My Eyes dựa vào các tình nguyện viên để kiểm tra những gì xung quanh bạn thông qua một cuộc trò chuyện video trực tiếp.