Użyli chipów Huawei i teraz plują sobie w brodę
DeepSeek, chiński gigant z branży AI, utknął ze swoim nowym modelem R2. Powód? Chciał użyć do trenowania chińskich chipów Huaweia zamiast nielegalnie sprowadzanych akceleratorów Nvidia.

Chiny: Użyjcie naszych rodzimych chipów, co złego może się stać?
Firma DeepSeek, która zdobyła rozgłos w styczniu tego roku modelem R1, została zachęcona przez chińskie władze, by korzystać z rodzimych procesorów Huawei, zamiast używać rozwiązań Nvidii. Jednak podczas treningu modelu R2 na chipach Ascend wystąpiły poważne problemy techniczne, które uniemożliwiły skuteczne przeprowadzenie treningu.
Firma zmuszona była sięgnąć po chipy Nvidii do tego procesu, pozostawiając Huaweia jedynie do obsługi inferencji, czyli generowania odpowiedzi przez już wytrenowany model. Opóźnienie premiery modelu z zaplanowanego na maj wynikało w głównej mierze z tych trudności.


Huawei chciał dobrze, ale jeszcze nie potrafi
Chipy Huaweia borykają się z problemami ze stabilnością, wolniejszą łącznością między chipami i niedoskonałym oprogramowaniem w porównaniu do produktów Nvidii. Mimo wysłania zespołu inżynierów Huaweia do pomocy przy integracji technologie nadal nie pozwoliły na udany trening na chipie Ascend.
Na pełną technologiczną autonomię Chin jest jeszcze za wcześnie. Chociaż rząd w Pekinie promuje krajowe rozwiązania, takie jak Ascend, to większość chińskich firm nadal polega na amerykańskich chipach Nvidii, które pozostają liderem rynku.
Według doniesień DeepSeek wykorzystuje setki tysięcy GPU Nvidii do treningu swoich modeli, co pokazuje ogromną zależność sektora od technologii zza granicy.