Công nghệ - Bảo mật

GitHub chôn mã nguồn dưới băng tuyết Bắc Cực để bảo tồn trong 1.000 năm

Trong bối cảnh một phần rất lớn của thế giới đang hoạt động nhờ các phần mềm mã nguồn mở, dù trực tiếp hay gián tiếp, thì các kho lưu trữ của GitHub có thể nói đang nắm giữ hầu hết lịch sử và cơ sở hạ tầng số của nền văn hoá hiện tại của chúng ta. Đó là lý do tại sao GitHub đặt ra cho chính mình nhiệm vụ bảo tồn lượng dữ liệu đó bằng cách chôn sâu một bản sao (snapshot) của toàn bộ kho lưu trữ của họ dưới một khu vực nào đó ở Bắc Cực để chúng có thể được lưu giữ an toàn trong 1.000 năm.

Tất nhiên, GitHub không đơn thuần đào một hố thật sâu ngay giữa Bắc cực rồi chôn hàng tá đĩa DVD, hay tệ hơn, những chiếc đĩa cứng từ tính, mà vị trí họ chọn cũng khá gần với vùng cực của Trái đất rồi. Cụ thể, để giữ an toàn cho kho mã nguồn mở của thế giới trong hàng trăm năm, GitHub đã chọn một mỏ than đã ngừng hoạt động ở Svalbard, Nauy, nơi họ xây dựng một căn phòng nằm sâu nhiều mét bên dưới lớp băng vĩnh cửu để phục vụ cho mục đích của mình.

GitHub cũng chọn một giải pháp hợp lý hơn để lưu trữ mã nguồn, chứ không phải DVD hay đĩa cứng như đã nói ở trên đâu. Sau khi nén toàn bộ các kho lưu trữ cộng đồng hiện đang hoạt động vào ngày 2/2 năm nay, GitHub đã thu được một khối dữ liệu nặng 21TB, và lưu trữ chúng vào 186 cuộn phim lưu trữ số nhạy sáng piqiFilm của Piql. Những cuộn phim này được đóng gói và chuyển đến Nauy, nơi chúng yên vị trong các container, sẵn sàng để “ngủ” một giấc dài nghìn năm.

GitHub Arctic Code Vault  

GitHub hẳn đã muốn đi đến nơi họ chọn để quay lại toàn bộ cuộc hành trình, nhưng thế giới nay đã khác nhiều so với khi họ công bố chương trình lưu trữ vào tháng 11 năm ngoái. Kể cả khi họ tự mình đưa được kho lưu trữ đến Nauy, thì phần còn lại của công việc cũng phải được chuyển giao cho các đối tác địa phương. Vào ngày 8/7/2020, snapshot của GitHub tính đến ngày 2/2/2020 đã được đưa vào Arctic Code Vault (Hầm chứ mã an toàn Bắc cực) bình an vô sự.

Dù cuộc hành trình của số cuộn phim lưu trữ trên đã kết thúc, chương trình GitHub Archive vẫn tiếp diễn. Cụ thể, Internet Archive vẫn đang thực hiện công đoạn sao lưu trọn vẹn các kho lưu trữ cộng đồng tính đến ngày 13/4 năm nay, và lượng dữ liệu hiện đã đạt 55TB. Không như khối dữ liệu lưu trữ đang nằm trong kho lạnh theo đúng nghĩa đen, Internet Archive muốn sao lưu toàn bộ khối dữ liệu lưu trữ lần này vào cuối tháng 7.


Tấn Minh

Trí Thức Trẻ

Nguồn: http://cafebiz.vn/github-chon-ma-nguon-duoi-bang-tuyet-bac-cuc-de-bao-ton-trong-1000-nam-20200722140640658.chn