Użyli chipów Huawei i teraz plują sobie w brodę

DeepSeek, chiński gigant z branży AI, utknął ze swoim nowym modelem R2. Powód? Chciał użyć do trenowania chińskich chipów Huaweia zamiast nielegalnie sprowadzanych akceleratorów Nvidia.

Dominik Krawczyk (dkraw)
0
Udostępnij na fb
Udostępnij na X
Użyli chipów Huawei i teraz plują sobie w brodę

Chiny: Użyjcie naszych rodzimych chipów, co złego może się stać?

Firma DeepSeek, która zdobyła rozgłos w styczniu tego roku modelem R1, została zachęcona przez chińskie władze, by korzystać z rodzimych procesorów Huawei, zamiast używać rozwiązań Nvidii. Jednak podczas treningu modelu R2 na chipach Ascend wystąpiły poważne problemy techniczne, które uniemożliwiły skuteczne przeprowadzenie treningu.

Dalsza część tekstu pod wideo

Firma zmuszona była sięgnąć po chipy Nvidii do tego procesu, pozostawiając Huaweia jedynie do obsługi inferencji, czyli generowania odpowiedzi przez już wytrenowany model. Opóźnienie premiery modelu z zaplanowanego na maj wynikało w głównej mierze z tych trudności.

Huawei chciał dobrze, ale jeszcze nie potrafi

Chipy Huaweia borykają się z problemami ze stabilnością, wolniejszą łącznością między chipami i niedoskonałym oprogramowaniem w porównaniu do produktów Nvidii. Mimo wysłania zespołu inżynierów Huaweia do pomocy przy integracji technologie nadal nie pozwoliły na udany trening na chipie Ascend.

Na pełną technologiczną autonomię Chin jest jeszcze za wcześnie. Chociaż rząd w Pekinie promuje krajowe rozwiązania, takie jak Ascend, to większość chińskich firm nadal polega na amerykańskich chipach Nvidii, które pozostają liderem rynku.

Według doniesień DeepSeek wykorzystuje setki tysięcy GPU Nvidii do treningu swoich modeli, co pokazuje ogromną zależność sektora od technologii zza granicy.