Google I/O 2025 ‘bùng nổ’ với đại tiệc siêu AI

Sự kiện Google I/O 2025 vừa qua đã thực sự trở thành một đại tiệc công nghệ, nơi gã khổng lồ tìm kiếm trình làng hàng loạt cải tiến và sản phẩm mới, với trí tuệ nhân tạo (AI) là tâm điểm. Đáng chú ý nhất là sự xuất hiện của các mô hình Gemini 2.5 thế hệ mới, khả năng tạo ảnh đỉnh cao của Imagen 4, công cụ sản xuất video AI Veo 3, và đặc biệt là sự ra mắt của Flow – một nền tảng làm phim AI chuyên nghiệp hứa hẹn thay đổi cuộc chơi của ngành giải trí.

Gemini 2.5: Nâng tầm trí tuệ AI

Gemini 2.5 được coi là ngôi sao của buổi trình diễn, với hai phiên bản Pro và Flash hứa hẹn mang đến những cải tiến vượt bậc cho người dùng. Khả năng hỗ trợ ngôn ngữ được mở rộng lên tới hơn 24 thứ tiếng, đi kèm tính năng chuyển văn bản thành giọng nói tự nhiên và biểu cảm. Google khẳng định cả Gemini 2.5 Flash và Pro đều được tăng cường mạnh mẽ về khả năng suy luận, xử lý đa phương thức, viết mã và đặc biệt là năng lực hiểu ngữ cảnh dài.

Một trong những cập nhật đáng chú ý trên phiên bản Pro là chế độ suy luận ‘Deep Think’ dành riêng cho các bài toán và tác vụ lập trình siêu phức tạp. Dù vẫn trong giai đoạn thử nghiệm và sẽ sớm đến tay các nhà phát triển đáng tin cậy, Deep Think được kỳ vọng sẽ cho phép AI cân nhắc nhiều giả thuyết khác nhau trước khi đưa ra câu trả lời cuối cùng.

Hiện tại, Gemini 2.5 Pro đã vươn lên dẫn đầu trên các bảng xếp hạng uy tín như WebDev Arena và LMArena, cung cấp công cụ xây dựng ứng dụng web và viết mã tiên tiến cùng cửa sổ ngữ cảnh lên đến 1 triệu token. Khả năng bảo mật chống lại các cuộc tấn công prompt gián tiếp cũng được cải thiện đáng kể.

Người dùng có thể trải nghiệm trước Gemini 2.5 Flash ngay trong ứng dụng Gemini, với bản phát hành rộng rãi dự kiến vào cuối tháng 6. Phiên bản thương mại của Gemini 2.5 Pro cũng sẽ sớm nối gót.

Imagen 4 và Veo 3: Sức mạnh sáng tạo hình ảnh và video vượt trội

Không chỉ Gemini, Google còn nâng cấp mạnh mẽ các công cụ đa phương tiện. Theo đó, Imagen 4 giờ đây có khả năng xuất hình ảnh với độ phân giải lên đến 2K, đồng thời cải thiện đáng kể độ chính xác của văn bản hiển thị trong các sản phẩm đồ họa như thiệp, áp phích hay truyện tranh. Imagen 4 đã sẵn sàng để người dùng khám phá trên Gemini, Google Workspace, Whisk và Vertex AI.

Trong khi đó, Veo 3, mô hình video AI mới nhất, gây ấn tượng với khả năng nhận diện và chuyển đổi văn bản thành video được cải tiến. Veo 3 có thể tạo ra các thước phim hoàn chỉnh với âm thanh, lời thoại nhân vật và tiếng động nền một cách chân thực.

Những người đăng ký Google AI Ultra tại thị trường Mỹ và người dùng doanh nghiệp Vertex AI đã có thể tiếp cận Veo 3 ngay từ ngày 20.5. Phiên bản Veo 2 cũng nhận được cập nhật với các tính năng điều khiển chuyển động máy quay, thêm/xóa đối tượng, và khả năng mở rộng khung hình.

Flow: Công cụ ‘đạo diễn’ AI chuyên nghiệp

Đặc biệt, Google đã vén màn Flow, một công cụ làm phim AI chuyên dụng đầy tham vọng. Flow kết hợp sức mạnh của các mô hình Veo, Imagen và Lyria, cho phép người dùng tạo ra những cảnh quay điện ảnh với độ chi tiết và tính chân thực vật lý đáng kinh ngạc, chỉ từ những câu lệnh văn bản đơn giản.

Với Flow, người dùng có toàn quyền kiểm soát chuyển động máy quay, góc độ và phối cảnh, cũng như chỉnh sửa và mở rộng các video đã tạo. Google Flow hiện đã được cung cấp cho người dùng đăng ký Google AI Pro và Ultra tại Mỹ, mở ra một kỷ nguyên mới cho các nhà sáng tạo nội dung và nhà làm phim.