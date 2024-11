Czy Microsoft robi niecne rzeczy z Twoimi dokumentami z Worda i Excela? Plotki okazały się fałszywe.

Październik i listopad 2024 roku upłynęły pod znakiem zamieszania wokół tego, co dzieje się z dokumentami tworzonymi w programach z pakietu Microsoft 365 (Office). Na początku października gruchnęła plotka o tym, że firma z Redmond trenuje modele sztucznej inteligencji na plikach użytkowników.

Microsoft zaprzecza, dokumenty są bezpieczne

Zapalnikiem tej bomby była zmiana w interfejsie programów Microsoft 365. Ustawienie pozwalające Microsoftowi na wykorzystanie treści dokumentów do dostarczania opcjonalnych funkcji zostało domyślnie włączone, a także zagrzebane głębiej w menu. Dokumentacja mówi między innymi o ułatwieniach w znajdowaniu treści online, tłumaczeniu tekstu, wyszukiwaniu grafik, a także w trenowaniu mówienia przed prezentacją. Nie ma tu mowy o trenowaniu modelu językowego na zawartości plików… ale też nie ma mowy o tym, że to się nie dzieje, gdy treść jest automatycznie analizowana.

Oliwy do ognia dodały materiały szkoleniowe, dostępne na learn.microsoft.com, z 21 października. Tu również nie ma informacji o tym, czy SI jest trenowana z użyciem treści dokumentów, czy nie.

W obliczu tego zamieszania Microsoft musiał zabrać głos. Trochę to zajęło, ale w końcu mamy wyjaśnienie. Nie, modele LLVM nie są trenowane na naszych plikach.

In the M365 apps, we do not use customer data to train LLMs. This setting only enables features requiring internet access like co-authoring a document. https://t.co/o9DGn9QnHb — Microsoft 365 (@Microsoft365) November 25, 2024

Identyczny komunikat można znaleźć na Bluesky na koncie Franka Shawa, kierującego komunikacją Microsoftu.



Co by było, gdyby oskarżenia okazały się prawdziwe? Prawdopodobnie nie byłoby to żadnym zdziwieniem – co rusz okazuje się, że ktoś stosuje podobne praktyki. Jak nie na własnych użytkownikach, to masowo ściąga dane z ogólnodostępnych źródeł (na przykład z X.com i Bluesky). Dopiero co Adobe został wciągnięty w podobne zamieszanie po tym, jak polityka prywatności została błędnie zinterpretowana przez użytkowników.

