Các diễn giả và khách mời tại phiên thảo luận “Dữ liệu là gốc của tòa soạn hiện đại”. (Ảnh: THÀNH ĐẠT)
Các diễn giả và khách mời tại phiên thảo luận “Dữ liệu là gốc của tòa soạn hiện đại”. (Ảnh: THÀNH ĐẠT)

Dữ liệu là vấn đề gốc rễ của nội dung và kinh tế báo chí

Dữ liệu đóng vai trò nền tảng trong xây dựng và phân phối nội dung cũng như mở ra một hướng đi mới cho kinh tế báo chí. Tuy nhiên, bảo mật dữ liệu lớn sẽ là thách thức không nhỏ với các tòa soạn.

Chiều 20/6, phiên thảo luận “Dữ liệu là gốc của tòa soạn hiện đại” diễn ra trong khuôn khổ Hội báo toàn quốc 2025.

Chủ trì phiên thảo luận, nhà báo Nguyễn Hoàng Nhật - Phó Trưởng ban Nhân Dân Điện tử nhận định quá trình sử dụng dữ liệu đang định hình lại cách các tòa soạn xây dựng và phân phối nội dung. Dữ liệu không chỉ định hình nội dung phù hợp thị hiếu độc giả mà còn là công cụ chiến lược trong phát triển kinh tế báo chí.

6.jpg
Nhà báo Nguyễn Hoàng Nhật, Phó Trưởng ban Nhân Dân Điện tử. (Ảnh: THÀNH ĐẠT)

Dữ liệu là câu trả lời gốc rễ

Đặt ra một loạt câu hỏi: Tại sao lượt xem lại giảm? Tại sao độc giả lại rời bỏ mình mà đi?, nhà báo Nguyễn Thu Hương, Phó Tổng Biên tập báo VnExpress giải thích, câu trả lời và giải pháp gốc rễ nằm ở dữ liệu.

Dữ liệu là nền tảng để tòa soạn điều phối sản xuất hiệu quả; phát triển độc giả trung thành và tăng trưởng doanh thu.

Theo đó, dữ liệu được chia làm 5 nhóm: Dữ liệu độc giả; Dữ liệu hành vi; Dữ liệu bài viết; Dữ liệu quảng cáo và hệ thống phản hồi.

Trong đó, tòa soạn VnExpress sử dụng 3 loại dữ liệu chính, bao gồm: Dữ liệu bài viết; dữ liệu độc giả và dữ liệu quảng cáo.

Phó Tổng Biên tập VnExpress cho biết, tòa soạn đang sử dụng dữ liệu trong hầu hết các công đoạn điều phối nội dung.

Cụ thể, dựa trên dữ liệu thu thập được, Trưởng ban có trách nhiệm điều phối đề tài, trong khi thư ký tòa soạn sẽ sắp xếp mặt trang.

5.jpg
Nhà báo Nguyễn Thu Hương, Phó Tổng Biên tập báo điện tử VnExpress. (Ảnh: THÀNH ĐẠT)

Phân tích về nhân sự phân tích dữ liệu, bà thẳng thắn chia sẻ: "Các nhà báo không thể trở thành nhà phân tích dữ liệu. Chúng tôi đã từng nhiều lần yêu cầu phóng viên, biên tập viên phân tích dữ liệu nhưng đều thất bại. Trên thực tế, những nhân sự này phải được tuyển dụng riêng".

Cụ thể, từ năm 2021 VnExpress đã bắt đầu xây dựng nhóm dữ liệu, gồm 1 trưởng nhóm và hai nhân sự phân tích dữ liệu.

Tuy nhiên, do tính chất nội dung đặc thù của nghề báo, tòa soạn cũng mất hàng năm trời để đào tạo nhân sự dữ liệu. Bởi dữ liệu báo chí không chỉ nằm ở con số mà còn nằm ở bối cảnh. Người phân tích cần chỉ ra được ý nghĩa của dữ liệu và đưa ra khuyến nghị hữu ích cho tòa soạn. Do đó, nhóm dữ liệu phải làm việc chặt chẽ với Ban Nội dung.

Bàn về giá trị cốt lõi của dữ liệu, nhà báo Thu Hương kết luận: "Dữ liệu là nền tảng, không phải là đũa thần. Sử dụng dữ liệu hiệu quả đòi hỏi phải thực hành liên tục, kiên trì, chấp nhận sai và sửa".

Dữ liệu tạo ra nguồn doanh thu mới

Lấy dẫn chứng từ ứng dụng VTV Go với hơn 100 tỷ điểm dữ liệu hành vi được ghi nhận, nhà báo Phạm Anh Chiến, Phó Giám đốc VTV Digital nhận định, dữ liệu lớn là cầu nối giữa đơn vị sản xuất và khách hàng; giữa nội dung và doanh thu.

chien.jpg
Nhà báo Phạm Anh Chiến, Phó giám đốc VTV Digital. (Ảnh: THÀNH ĐẠT)

Trong đó, bên cạnh doanh thu từ quảng cáo truyền thống, dữ liệu lớn mà VTV Go thu thập được đã tạo ra hai dòng doanh thu mới là dịch vụ và thương mại điện tử.

Khi doanh thu quảng cáo sụt giảm đáng kể - khoảng 10% mỗi năm đối với VTV, 30-50% với nhiều đài truyền hình địa phương khác, việc tìm kiếm nguồn thu mới trở thành một vấn đề sống còn. "Ai nắm bắt được khán giả của mình sẽ mở ra được nhiều cơ hội khác", nhà báo Phạm Anh Chiến nói. Sự nắm bắt ở đây, chính là dữ liệu.

Tuy nhiên, sở hữu dữ liệu lớn cũng đồng nghĩa với đối mặt với nguy cơ rò rỉ dữ liệu cao.

Báo chí có nguy cơ rò rỉ dữ liệu cao

Ông Ngô Mạnh Hà, Giám đốc Công ty TechX nhìn nhận việc thu thập, lưu trữ và phân tích lượng lớn thông tin đòi hỏi các tòa soạn phải có hạ tầng công nghệ tiên tiến và nguồn nhân lực chuyên môn cao. Đây là điểm yếu với rất nhiều tòa soạn, đặc biệt là xét về khía cạnh bảo mật dữ liệu cá nhân của độc giả.

4.jpg
Ông Ngô Mạnh Hà, Giám đốc Công ty TechX. (Ảnh: THÀNH ĐẠT)

"Báo chí là một trong những ngành thu thập và xử lý lượng dữ liệu cá nhân khổng lồ. Nhưng chỉ một lần rò rỉ dữ liệu tòa soạn sẽ phải chịu những thiệt hại uy tín rất nặng nề", ông Ngô Mạnh Hà dẫn chứng từ sự cố rò rỉ dữ liệu người dùng của BuzzFeed.

Ông phân tích, việc quản lý và bảo mật dữ liệu tại các tòa soạn đang đối mặt với 5 thách thức phổ biến: Thiếu quy trình quản trị dữ liệu cá nhân; mâu thuẫn giữa quyền đưa tin và quyền riêng tư; áp lực thương mại hóa dữ liệu người đọc; rủi ro chia sẻ dữ liệu với bên thứ ba; năng lực kỹ thuật bảo mật thông tin.

Từ các phân tích trên, Giám đốc TechX đưa ra 4 khuyến nghị cho các tòa soạn. Một là, ban hành chính sách nội bộ về dữ liệu cá nhân. Hai là, Nâng cao bảo mật kỹ thuật: mã hóa, phân quyền. Ba là, chia sẻ dữ liệu có trách nhiệm: Ẩn danh hóa. Bốn là, đào tạo phóng viên, kỹ thuật viên về đạo đức số.

"Nếu cần chuyên gia để phân tích dữ liệu thì tòa soạn cũng cần chuyên gia để bảo mật thông tin. Đây sẽ là một trong những thách thức lớn nhất", ông Ngô Mạnh Hà kết luận.

      Xem thêm