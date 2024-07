Dane, które napędzają sztuczną inteligencję znikają w zastraszająco szybkim tempie. O co tu dokładnie chodzi?

Skurczył się dostęp do danych

Eksperci, zajmujący się tworzeniem zaawansowanych systemów sztucznej inteligencji, do tej pory korzystali z niewyobrażalnie wielkich ilości tekstów, obrazów, filmików obecnych w sieci, aby szkolić swoje modele. Teraz te dane się skurczyły. Nie ma z czego czerpać materiałów szkoleniowych.

Jak wynika z badania grupy badawczej MIT, opublikowanego przez Data Provenance Initiative, wiele dotychczasowych źródeł internetowych ograniczyło wykorzystanie swoich danych. Zadziało się to zaledwie w ciągu ostatniego roku. Badacze przeanalizowali 14 tysięcy domen internetowych, uwzględnianych do tej pory w zestawach szkoleniowych AI. Niestety, jesteśmy w momencie kryzysowym, biorąc pod uwagę aspekt zgody na używanie materiałów do szkolenia modeli AI. Wydawcy i platformy internetowe podjęli działania zapobiegające wykorzystywaniu danych bez pozwolenia.

45% danych zostało ograniczonych przez zmianę warunków korzystania z nich przez serwisy internetowe, które coraz częściej blokują dostęp. Nie życzą sobie bowiem, by ich treści były wykorzystwane przez ChatGPT i inne modele sztucznej inteligencji. Co więcej ruszyły nawet pierwsze procesy sądowe o bezprawne wykorzystanie treści wydawców przez firmy AI.

Źródło zdjęć: Deemerwha studio / Shutterstock.com

Źródło tekstu: New York Times