Dữ liệu đang góp phần định hình việc vận hành của các tòa soạn hiện đại, nhất là ở những cơ quan báo chí lớn.
Tại hội thảo chuyên đề về dữ liệu tổ chức chiều 20/6, trong khuôn khổ Diễn đàn Báo chí toàn quốc 2025, các cơ quan báo chí tại Việt Nam nhìn nhận dữ liệu đang trở thành yếu tố trung tâm trong hoạt động sản xuất, phân phối nội dung, tìm kiếm nguồn thu mới, trong bối cảnh doanh thu quảng cáo truyền thống liên tục giảm sâu.
Ông Phạm Anh Chiến, Phó giám đốc Trung tâm Sản xuất và phát triển nội dung số (VTV Digital), cho biết doanh thu quảng cáo truyền thống của VTV giảm khoảng 10% mỗi năm trong 5 năm gần đây. Một số đài truyền hình địa phương mất 30-50% doanh thu từ quảng cáo, dẫn đến không còn đủ nguồn lực duy trì hoạt động. Thực tế này buộc các đơn vị truyền thông phải mở rộng dư địa kiếm tiền từ dữ liệu người dùng thay vì chỉ dựa vào quảng cáo nội dung truyền hình như trước.

Hội thảo chuyên đề về dữ liệu tại Diễn đàn Báo chí toàn quốc 2025. Ảnh: Việt Hà
Trong bối cảnh đó, dữ liệu được xác định là một loại tài sản mới. Theo ông Chiến, trước đây, truyền hình chỉ quản lý kho nội dung, nhưng nay có thêm kho dữ liệu người dùng – yếu tố mở ra dư địa cho các sản phẩm số và dịch vụ thương mại điện tử. Trung tâm Sản xuất và phát triển nội dung số đang biến VTVGo từ một nền tảng xem truyền hình thành siêu ứng dụng với các dịch vụ cá nhân hóa dựa trên thói quen và hành vi người dùng.
“Chúng tôi đang ở những bước đầu. Nhưng nếu không làm ngay bây giờ, sẽ không thể cạnh tranh được với các nền tảng xuyên biên giới”, ông Chiến nói.
Trong khi đó, là báo điện tử hàng đầu tại Việt Nam, VnExpress sử dụng dữ liệu để điều phối nội dung từ những ngày đầu thành lập. “Chúng tôi gặp phải nhiều câu hỏi mà những công cụ phổ biến như Google Analytics không trả lời được: Tại sao pageview tăng/giảm? Độc giả là ai? Họ đến và đi vì điều gì? Làm thế nào kéo họ quay lại và tương tác?”, bà Nguyễn Thu Hương, Phó tổng biên tập VnExpress, chia sẻ.
Để làm chủ dữ liệu mà không phải phụ thuộc vào bên thứ ba, báo xây dựng ba hệ thống: phân tích nội dung VnExpress Analytics, dữ liệu độc giả Audience Data Platform, và dữ liệu quảng cáo. Từ đó tòa soạn có thể phân loại độc giả theo tần suất truy cập, mức độ tương tác (cuộn trang, tỷ lệ thoát), hành vi theo thiết bị, địa lý và nguồn truy cập. Hệ thống cũng đo được hiệu quả quảng cáo ở từng vị trí hiển thị.

Phó tổng biên tập VnExpress Nguyễn Thu Hương. Ảnh: Việt Hà
Theo bà Hương, báo tự xây hệ thống dữ liệu do chi phí thuê ngoài quá lớn, ước tính 50.000-100.000 USD/năm, đồng thời đáp ứng yêu cầu bảo mật, tính linh hoạt, tùy biến theo nhu cầu vận hành thực tế của tòa soạn.
Về mục đích sử dụng dữ liệu, VnExpress theo đuổi việc phục vụ cá nhân hóa theo từng độc giả, với mong muốn đem lại trải nghiệm tốt hơn, giúp họ dễ dàng tiếp cận nội dung yêu thích, vào đúng thời điểm với ít nỗ lực nhất, từ đó gắn bó và trung thành với sản phẩm.
“Mong muốn của chúng tôi là với 45 triệu độc giả, chúng tôi sẽ có 45 triệu phiên bản báo, đi cùng là những phiên bản quảng cáo khác nhau trên cơ sở phân loại từng tệp độc giả”, Phó tổng biên tập VnExpress nói
Sau nhiều năm thử nghiệm, báo đúc rút được rằng dữ liệu là nền tảng, không phải đũa thần. Sử dụng hiệu quả đòi hỏi phải thực hiện liên tục, kiên trì, chấp nhận sai và sửa. Dữ liệu có thể giúp trả lời câu hỏi, cũng có thể hỗ trợ ra quyết định, nhưng không nên chỉ dựa trên dữ liệu mà nên dùng để tham khảo.
Theo bà Nguyễn Thu Hương, việc tự xây hay mua các hệ thống tổ chức vận hành dữ liệu tùy thuộc vào khả năng công nghệ tại mỗi tòa soạn. Tuy nhiên, cần hỗ trợ nhân sự phân tích dữ liệu để họ hiểu báo chí, bối cảnh, từ đó đưa ra khuyến nghị có ích.
“Các chỉ số cần được theo dõi và báo cáo định kỳ hàng tuần, hàng tháng, hàng quý. Đây là giải pháp để tòa soạn biết rõ ‘sức khỏe’ của sản phẩm. Nếu có thể, sử dụng nhiều hơn một hệ thống ghi nhận dữ liệu”, bà chia sẻ kinh nghiệm từ quá trình xây dựng bộ phận dữ liệu tại VnExpress.
Trọng Đạt
- Tác nghiệp báo chí thời AI
- Tòa soạn báo cần dùng AI để giải bài toán sống còn
- Báo chí thế kỷ 20 qua ảnh tư liệu