Việc “đốt cháy con thuyền”, tức sẵn sàng loại bỏ những nền tảng cũ để thích nghi với cái mới, đang được nhiều công ty xem xét khi AI biến đổi từng ngày.
“Phần cứng, phần mềm và mô hình liên tục phát triển. Đó là những gì đang xảy ra với AI. Bạn sẽ phải đốt cháy con thuyền”, Tuhin Srivastava, nhà đồng sáng lập nền tảng suy luận AI Baseten, nói với Business Insider. “Tôi chưa nghĩ đến việc ‘đốt cháy’, nhưng đã mua ‘dầu hỏa’ rồi”.

Khách tham quan chip tại triển lãm Computex diễn ra tháng 6/2024 tại Đài Loan. Ảnh: Khương Nha
Câu chuyện bắt đầu khi mô hình DeepSeek của Trung Quốc gây sốt trên thế giới. Nhóm của Srivastava đã làm việc trên mô hình này trong vài tuần nhằm tiết kiệm chi phí, nhưng thường xuyên gặp tình trạng tắc nghẽn do lưu lượng lớn, làm chậm quá trình cung cấp phản hồi cho khách hàng.
Baseten cũng có quyền truy cập vào hệ thống dùng chip H200 tốt nhất của Nvidia, nhưng nền tảng suy luận của hãng chip cũng gặp trục trặc. Do đó từ tháng 1, công ty tự xây dựng phần mềm riêng và hoạt động ổn định thời gian ngắn sau đó.
Tuy nhiên, đến tháng 3, CEO Nvidia Jensen Huang công bố nền tảng suy luận mới Dynamo – phần mềm nguồn mở giúp chip Nvidia xử lý quá trình suy luận chuyên sâu cho các mô hình lý luận quy mô lớn. “Về cơ bản, đây là hệ điều hành của một nhà máy AI”, ông Huang nói.
“Chúng tôi đã tính đến điều này, nhưng không nghĩ nó lại diễn ra nhanh như vậy”, Srivastava nói.
Ông thừa nhận sự xuất hiện của Dynamo khiến các nền tảng như của Baseten ngày càng trở nên nhỏ bé. Công ty quyết định sẽ từ bỏ những gì đã xây dựng và tiếp tục chuyển đổi sang mô hình mới, dù quá trình ông gọi là “đốt thuyền” này có thể kéo dài vài tháng.
Theo TechCrunch, các mô hình AI đang trở nên phức tạp, đòi hỏi sức mạnh tính toán và nhân tài kỹ thuật để vận hàng ở quy mô lớn. Tuy nhiên, chúng liên tục thay đổi để phù hợp nhu cầu thị trường, buộc các bên phải cân bằng chi phí, thời gian, độ chính xác và đầu vào phần cứng. Sự thay đổi diễn ra rất nhanh, đến mức nhiều công ty không kịp thích nghi.
“Bạn không thể gắn bó với một khuôn khổ hoạt động hoặc một cách làm việc cụ thể nào đó trong thời đại AI”, Karl Mozurkewich, kiến trúc sư trưởng tại công ty điện toán đám mây Valdi, viết trên blog.
“Đây là điều tôi thấy thích nhất về AI”, Theo Brown, YouTuber và nhà phát triển Ping – công ty chuyên xây dựng phần mềm AI cho nhà phát triển khác, nói với Business Insider. “Nó biến những thứ trước đây ngành công nghệ coi là siêu giá trị và thiêng liêng thành thứ cực kỳ rẻ và dễ vứt bỏ”.
Brown từng làm lập trình viên cho Twitch. Ông cho biết, khi đề xuất với cấp trên viết mã mới thay vì xây dựng trên nguồn có sẵn, ông thường xuyên bị phản đối dù giải pháp mới có thể tiết kiệm thời gian và tiền bạc.
“Tôi nhận ra bài học là thay vì chờ họ nói ‘Không’, hãy hành động thật nhanh để họ không có thời gian ngăn cản”, Brown nói.
Quinn Slack, CEO nền tảng mã hóa Sourcegraph, cho biết đây là tư duy của nhiều nhà phát triển AI hiện nay và cũng là yếu tố tạo sự khác biệt giữa các công ty khởi nghiệp và doanh nghiệp lớn. Startup thường nhanh nhạy và dễ tạo đột phá hơn so với công ty lớn, vốn bị ràng buộc bởi hàng loạt quy trình và rào cản.
“Không có gì đảm bảo việc trang bị công nghệ tiên tiến nhất sẽ giúp một công ty tăng lượng khách hàng”, Karl Mozurkewich của nền tảng đám mây Valdi nhận định. “Khi đứng trước người dùng cuối, lợi nhuận của một doanh nghiệp sẽ giảm dần nếu họ không chịu ‘di chuyển nhanh và phá vỡ mọi thứ’, dẫn đến tụt hậu”.
Bảo Lâm tổng hợp
- Công ty gây chú ý vì muốn tạo AI thay thế hầu hết công việc
- Nam sinh dùng AI qua mặt loạt công ty công nghệ bị đình chỉ học
- Công ty được định giá 250 triệu USD nhờ robot đấm bóp
- Công ty AI cảnh báo ứng viên ‘không dùng AI’ khi xin việc