Początki internetu wkrótce mogą przestać istnieć. Archiwa mają problem

Internet Archive to olbrzymia baza, w której zapisany jest internet z czasów minionych. Dzięki niemu nie tylko można zobaczyć, jak wyglądała sieć przed laty, ale także korzystać z wiedzy w nim zapisanej. Niestety, dalsze funkcjonowanie tej idei stoi pod znakiem zapytania.

Paweł Maretycz (Maniiiek)
0
Udostępnij na fb
Udostępnij na X
Początki internetu wkrótce mogą przestać istnieć. Archiwa mają problem

Jeśli dzieje się coś złego w świecie technologii i nie znamy winowajcy, to najlepszym rozwiązaniem jest obarczenie winą AI. Szanse, że trafimy celnie, są naprawdę wysokie. I nie inaczej jest w tym wypadku. Otóż to właśnie przez wysokie ceny pamięci spowodowane bazami danych AI Internet Archive ma kłopoty finansowe.

Dalsza część tekstu pod wideo

Strona ta przechowuje obecnie 210 petabajtów archiwów, a niska dostępność i wysokie ceny dysków utrudniają nie tylko dalszy rozwój projektu, ale jego funkcjonowanie nawet na obecnym stanie wiedzy.

Internet Archive ma problem z winy AI

Owszem, na początku drożały jedynie nośniki SSD, czyli wykorzystujące pamięć NAND. Jednak obecnie nawet ceny HDD biją kolejne rekordy. A nawet jeśli ktoś ma pieniądze, to nie oznacza, że będzie w stanie dysk w ogóle kupić. Co więcej, w ostatnim czasie każdego dnia archiwum to dodaje do swojej bazy około 100 TB danych.

Czemu jednak to aż tak duży problem dla Internet Archive? Czy nie mogą oni zachować sieci tylko do pewnego punktu w czasie? To nie takie proste. Dyski najzwyczajniej w świecie się zużywają. Standardową procedurą jest więc ich podmienienie na inne, kiedy padną. Dzięki licznym kopiom zapasowym same dane z jednego dysku nie przepadają. Problem w tym, że żeby dysk wymienić, to trzeba mieć na co go wymienić. 

Z podobnymi trudnościami spotykają się inne serwisy archiwizujące treści, czy fundacja Wikimedia, która przechowuje gigantyczną bazę treści i multimediów. Tym samym rośnie ryzyko, że część tych danych bezpowrotnie stracimy, lub zostaną one zachowane, ale nie będą udostępniane w celu ochrony nośników, na których się znajdują.