AI nhận diện vật thể và cảnh vật: ‘Đôi mắt’ cho người khiếm thị

Công nghệ này đang định hình lại cách người khiếm thị tương tác với thế giới, thúc đẩy sự độc lập và nâng cao chất lượng sống của họ.

AI nhận diện vật thể và cảnh vật như thế nào?

Theo tìm hiểu của Tuổi Trẻ Online, công nghệ nhận diện vật thể và cảnh vật được xây dựng trên nền tảng của mạng nơ-ron tích chập (CNN). Khi tiếp nhận hình ảnh mới, CNN phân tích từng pixel, trích xuất các đặc trưng từ chi tiết cơ bản như cạnh, góc, đến các cấu trúc phức tạp hơn như hình dạng.

Sau đó, AI sử dụng những đặc trưng này để xác định, phân loại và định vị các đối tượng trong ảnh, đồng thời cố gắng giải thích ngữ cảnh tổng thể của cảnh vật.

Ví dụ, một hệ thống AI không chỉ nhận diện người và cột, mà còn có thể diễn giải rằng “một người đang đi bộ và sắp va vào cây cột”. Sự kết hợp giữa nhận diện và hiểu ngữ cảnh này chính là chìa khóa để AI trở thành “đôi mắt” thực sự cho người khiếm thị.

Giúp người khiếm thị tìm đường, đọc menu…

Đối với những người mất đi thị lực, tác động của công nghệ này là vô cùng to lớn và mang tính cách mạng.

Các thiết bị đeo thông minh như kính tích hợp camera hoặc thiết bị cầm tay có thể liên tục quét môi trường xung quanh và cảnh báo người dùng về các chướng ngại vật tiềm ẩn như cột điện, bậc thang, hố ga, hay thậm chí là xe cộ đang di chuyển nhanh.

Nền tảng này còn có thể giúp người khiến thị định vị và tìm đường một cách tự tin hơn, giảm bớt sự phụ thuộc vào người khác.

Cạnh đó, AI còn nâng cao đáng kể khả năng tương tác của người khiếm thị với môi trường và xã hội. Tính năng nhận diện khuôn mặt cho phép họ “nhận ra” bạn bè, người thân hoặc đồng nghiệp khi họ ở gần, tạo ra những tương tác xã hội tự nhiên và ấm áp hơn.

Ngoài ra, AI có thể quét và đọc to các văn bản in ấn trên nhãn sản phẩm, menu nhà hàng, hóa đơn, tài liệu. Tính năng này hỗ trợ người khiếm thị trong đời sống thường ngày như mua sắm, nấu ăn và việc cá nhân mà không cần sự trợ giúp của người khác.

Thách thức và triển vọng

Dù vậy, việc triển khai rộng rãi công nghệ này vẫn gặp nhiều thách thức. Đầu tiên là độ chính xác và độ tin cậy của AI trong môi trường thực tế bị ảnh hưởng bởi các yếu tố như ánh sáng yếu, góc quay bất lợi, vật thể bị che khuất hoặc thời tiết khắc nghiệt. Kế đến là chi phí, do các thiết bị tích hợp AI thường đắt đỏ, khó tiếp cận với nhiều người.

Quyền riêng tư và bảo mật dữ liệu cũng bị nghi ngờ, vì camera liên tục quét môi trường có thể thu thập hình ảnh của người xung quanh mà không có sự đồng ý của họ.

Cuối cùng, việc phát triển giao diện thân thiện (thông qua âm thanh hoặc xúc giác) đòi hỏi nghiên cứu và thiết kế tỉ mỉ để đảm bảo tính trực quan và hiệu quả cho người khiếm thị.

Tuy nhiên, với tốc độ phát triển chóng mặt của AI và sự đầu tư ngày càng lớn từ các tập đoàn công nghệ cũng như các tổ chức phi lợi nhuận, những thách thức này đang dần được giải quyết.

Các thuật toán học sâu ngày càng tinh vi hơn, có khả năng xử lý dữ liệu phức tạp hơn và hoạt động tốt hơn trong điều kiện bất lợi. Qua đó, hứa hẹn sẽ đưa công nghệ này đến gần hơn với người dùng với chi phí hợp lý hơn.

Sáng chế ‘đôi chân’ cho người khuyết tật

TTO – Bị tai nạn liệt đôi chân, mất 91% sức lao động nhưng anh Lê Huy Tích không gục ngã mà còn sáng chế ra chiếc xe lăn chạy điện cho người khuyết tật được nhiều người ủng hộ.