Thư viện Trung Quốc lưu hơn 200 tỉ bài đăng trên Weibo

23/04/2019 18:10 GMT+7

Thư viện Quốc gia Trung Quốc vừa thông báo sẽ lưu trữ hơn 200 tỉ bài đăng công khai trên Weibo, trang blog nổi tiếng nước này theo phong cách Twitter.

Theo South China Morning Post, đây là một phần của sáng kiến bảo tồn di sản kỹ thuật số của quốc gia có số người dùng internet lớn nhất thế giới. Ngoài 200 tỉ bài đăng ở chế độ công khai trên Weibo, Thư viện Quốc gia Trung Quốc còn trữ hơn 210 triệu câu chuyện được đăng trên Sina.com, cổng thông tin do công ty mẹ Weibo Sina Corp quản lý.
Theo tuyên bố trên tài khoản chính thức của Weibo, đây là dự án phi lợi nhuận của Thư viện Quốc gia Trung Quốc. Mục tiêu của dự án là ghi lại quá trình phát triển của nền văn minh trong kỷ nguyên intenet cho “sự phát triển lâu dài về bảo mật và số hóa thông tin của quốc gia”, ông Rao Quan, giám đốc thư viện cho hay.
Sina có hơn 462 triệu người dùng có hoạt động trên Weibo tính đến cuối năm ngoái. Công ty được chọn làm đối tác đầu tiên cho dự án vì có kho dữ liệu khổng lồ ghi lại nhiều sự kiện quan trọng của xã hội và phản ứng của công chúng trước các sự kiện đó. Ngoài Sina, một số hãng internet khác cũng được mời tham gia.
Dữ liệu thu thập từ máy chủ của Weibo và Sina.com sẽ được lưu trữ trên nhiều máy chủ doanh nghiệp, trong khi thư viện và Sina sẽ cùng phân tích dữ liệu cho mục đích hoạch định chính sách và học thuật. Lưu trữ web là thông lệ phổ biến với nhiều nước trên thế giới song lưu trữ nội dung trên mạng xã hội là vấn đề thách thức vì kích thước dữ liệu quá lớn và chính sách về quyền riêng tư của các nền tảng internet khác nhau.
Thư viện Quốc hội Mỹ có trữ bộ sưu tập đầy đủ tất cả bài đăng trên Twitter kể từ ngày hãng ra đời vào năm 2006. Dù vậy, thư viện sau đó quyết định chỉ giữ lại số bài đăng có chọn lọc, bắt đầu từ tháng 12.2017 sau khi khối lượng bài đăng tăng đáng kể. Hiện giới học giả đang kêu gọi Facebook mở cửa dữ liệu hơn với cộng đồng nghiên cứu sau khi hãng này hạn chế bên thứ ba sử dụng dữ liệu vì vấp phải phản ứng dữ dội từ công chúng.
Internet Trung Quốc có 829 triệu người dùng tính đến cuối năm 2018. Đây là kho dữ liệu khổng lồ chịu sự kiểm soát của chính phủ. Nội dung trên mạng xã hội lẫn các trang online khác được kiểm tra, kiểm duyệt gắt gao. Tuần trước, Sina tự nguyện tạm ngừng ứng dụng tin tức hàng đầu và nhiều ứng dụng khác của hãng sau khi bị cơ quan quản lý internet Trung Quốc triệu tập vì phát tán thông tin sai sự thật và thô tục, gây ảnh hưởng xấu đến quan điểm của công chúng.
Top

Bạn không thể gửi bình luận liên tục. Xin hãy đợi
60 giây nữa.