BMS, BUS, Sənaye, Ölçmə Kabelləri üçün.

Bahar Festivalı sona çatdıqda, DeepSeek ətrafındakı həyəcan güclü olaraq qalır. Bu yaxınlarda keçirilən tətil texnoloji sənayedə əhəmiyyətli bir rəqabət hissini vurğuladı, bir çoxları bu "pişik balığı" müzakirə etdi və təhlil etdi. Silikon Vadisi misli görünməmiş bir böhran hissi yaşayır: açıq mənbə tərəfdarları yenidən öz fikirlərini bildirir və hətta OpenAI qapalı mənbə strategiyasının ən yaxşı seçim olub-olmadığını yenidən qiymətləndirir. Daha aşağı hesablama xərclərinin yeni paradiqması Nvidia kimi çip nəhəngləri arasında zəncirvari reaksiyaya səbəb oldu və bu, ABŞ fond bazarı tarixində rekord bir günlük bazar dəyəri itkilərinə səbəb oldu, dövlət qurumları isə DeepSeek tərəfindən istifadə edilən çiplərin uyğunluğunu araşdırır. DeepSeek-in xaricdəki qarışıq rəyləri arasında, ölkə daxilində, qeyri-adi artım yaşayır. R1 modelinin istifadəyə verilməsindən sonra əlaqədar tətbiqetmədə trafikdə artım müşahidə olunub ki, bu da tətbiq sektorlarında artımın ümumi süni intellekt ekosistemini irəli aparacağını göstərir. Müsbət cəhət odur ki, DeepSeek tətbiq imkanlarını genişləndirəcək və bu, ChatGPT-ə güvənməyin gələcəkdə o qədər də bahalı olmayacağını göstərir. Bu dəyişiklik OpenAI-nin son fəaliyyətlərində, o cümlədən DeepSeek R1-ə cavab olaraq pulsuz istifadəçilərə o3-mini adlı əsaslandırma modelinin təqdim edilməsində, eləcə də o3-mini düşüncə zəncirini ictimai hala gətirən sonrakı təkmilləşdirmələrdə öz əksini tapmışdır. Bir çox xarici istifadəçi bu inkişaflar üçün DeepSeek-ə minnətdarlığını bildirdi, baxmayaraq ki, bu düşüncə zənciri xülasə kimi xidmət edir.
Optimist olaraq, DeepSeek-in yerli oyunçuları birləşdirdiyi aydındır. Təlim xərclərinin azaldılmasına diqqət yetirərək, müxtəlif upstream çip istehsalçıları, ara bulud provayderləri və çoxsaylı startaplar DeepSeek modelindən istifadə üçün xərc səmərəliliyini artıraraq ekosistemə fəal şəkildə qoşulurlar. DeepSeek-in sənədlərinə görə, V3 modelinin tam təlimi cəmi 2,788 milyon H800 GPU saatı tələb edir və təlim prosesi yüksək stabildir. TN (Mütəxəssislərin Qarışığı) arxitekturası 405 milyard parametrli Llama 3 ilə müqayisədə təlimdən əvvəl xərcləri on dəfə azaltmaq üçün çox vacibdir. Hazırda V3 TN-də belə yüksək seyrəklik nümayiş etdirən ilk ictimaiyyət tərəfindən tanınan modeldir. Bundan əlavə, MLA (Çox Layer Diqqət) xüsusilə əsaslandırma aspektlərində sinergik şəkildə işləyir. Chuanjing Technology-dən bir tədqiqatçı AI Technology Review üçün təhlilində qeyd etdi: "TN nə qədər seyrək olsa, hesablama gücündən tam istifadə etmək üçün düşünmə zamanı lazım olan partiyanın ölçüsü bir o qədər böyükdür, KVCache-nin ölçüsü əsas məhdudlaşdırıcı amildir; MLA KVCache ölçüsünü əhəmiyyətli dərəcədə azaldır". Ümumiyyətlə, DeepSeek-in uğuru tək bir texnologiyanın deyil, müxtəlif texnologiyaların birləşməsindədir. Sənaye insayderləri DeepSeek komandasının mühəndislik imkanlarını yüksək qiymətləndirərək, onların paralel təlim və operatorun optimallaşdırılmasında mükəmməlliyini qeyd edərək, hər bir detalı dəqiqləşdirməklə əsaslı nəticələr əldə edirlər. DeepSeek-in açıq mənbə yanaşması böyük modellərin ümumi inkişafını daha da gücləndirir və ehtimal edilir ki, oxşar modellər şəkillər, videolar və daha çox şeylərə genişlənərsə, bu, sənayedə tələbatı əhəmiyyətli dərəcədə stimullaşdıracaq.
Üçüncü Tərəf Münasibət Xidmətləri üçün imkanlar
Məlumatlar göstərir ki, DeepSeek buraxıldığı gündən etibarən cəmi 21 gün ərzində 22,15 milyon gündəlik aktiv istifadəçi (DAU) toplayıb, ChatGPT-nin istifadəçi bazasının 41,6%-nə nail olub və Doubao-nun gündəlik 16,95 milyon aktiv istifadəçisini ötüb və beləliklə, Apple App Store-da/regionlarında qlobal miqyasda ən sürətlə böyüyən tətbiq olub17. Bununla belə, istifadəçilər dəstə-dəstə axın edərkən kiber hakerlər DeepSeek tətbiqinə amansızcasına hücum edərək, onun serverlərində ciddi gərginliyə səbəb olurlar. Sənaye analitikləri bunun qismən DeepSeek-in əsaslandırma üçün kifayət qədər hesablama gücü olmadığı halda təlim üçün kartları yerləşdirməsi ilə əlaqədar olduğuna inanırlar. Bir sənaye insayderi AI Technology Review-ə məlumat verdi: "Tez-tez server problemləri rüsumların tutulması və ya daha çox maşın almaq üçün maliyyələşdirilməsi ilə asanlıqla həll edilə bilər; nəticədə bu, DeepSeek-in qərarlarından asılıdır." Bu, istehsala qarşı texnologiyaya diqqət yetirməkdə bir mübadilə təqdim edir. DeepSeek, özünü təmin etmək üçün əsasən kvant kvantlaşdırmasına etibar etdi, az xarici maliyyə aldı, nəticədə nisbətən aşağı pul axını təzyiqi və daha təmiz texnoloji mühit yarandı. Hal-hazırda, yuxarıda qeyd olunan problemlərin işığında, bəzi istifadəçilər sosial mediada DeepSeek-i istifadəçinin rahatlığını artırmaq üçün istifadə həddini yüksəltməyə və ya pullu funksiyalar təqdim etməyə çağırır. Bundan əlavə, tərtibatçılar optimallaşdırma üçün rəsmi API və ya üçüncü tərəf API-lərindən istifadə etməyə başlayıblar. Bununla belə, DeepSeek-in açıq platforması bu yaxınlarda elan etdi: "Cari server resursları azdır və API xidmətinin doldurulması dayandırılıb."
Bu, şübhəsiz ki, AI infrastruktur sektorunda üçüncü tərəf satıcılar üçün daha çox imkanlar açır. Bu yaxınlarda çoxsaylı yerli və beynəlxalq bulud nəhəngləri DeepSeek model API-lərini istifadəyə verdilər - xarici nəhənglər Microsoft və Amazon yanvarın sonunda ilk qoşulanlar arasında idi. Fevralın 1-də yerli lider Huawei Cloud Silicon əsaslı Flow ilə əməkdaşlıqda DeepSeek R1 və V3 əsaslandırma xidmətlərini təqdim edərək ilk addımı atdı. AI Technology Review-in hesabatları göstərir ki, Silicon əsaslı Flow xidmətləri istifadəçilərin axını görüb və platformanı effektiv şəkildə “çökdür”. Üç böyük texnoloji şirkət - BAT (Baidu, Alibaba, Tencent) və ByteDance də fevralın 3-dən başlayaraq aşağı qiymətli, məhdud müddətli təkliflər verdi, bu, DeepSeek-in "qiymət qəssabı" adlandırılmağa başladığı DeepSeek-in V2 modelinin bazara çıxması ilə alovlanan keçən ilki bulud satıcıları qiymət müharibələrini xatırladır. Bulud satıcılarının çılğın hərəkətləri Microsoft Azure və OpenAI arasında əvvəlki güclü əlaqələri əks etdirir, burada 2019-cu ildə Microsoft OpenAI-a 1 milyard dollar dəyərində sərmayə qoymuş və ChatGPT-nin 2023-cü ildə istifadəyə verilməsindən sonra fayda əldə etmişdir. Bununla belə, bu yaxın əlaqələr Meta açıq mənbəli Llama-dan sonra pozulmağa başladı və digər satıcılara Microsoftemystos Azureecs-dən kənarda böyük modellərlə rəqabət aparmağa imkan verdi. Bu halda, DeepSeek məhsul istiliyi baxımından təkcə ChatGPT-ni ötməyib, həm də Llamanın GPT-3-ü canlandırması ilə bağlı həyəcana bənzər o1 buraxılışından sonra açıq mənbəli modelləri təqdim edib.
Reallıqda, bulud provayderləri də özlərini süni intellekt tətbiqləri üçün trafik şlüzləri kimi yerləşdirirlər, yəni tərtibatçılarla əlaqələrin dərinləşməsi qabaqlayıcı üstünlüklərə çevrilir. Hesabatlar göstərir ki, Baidu Smart Cloud-un modelin təqdim olunduğu gün Qianfan platforması vasitəsilə DeepSeek modelindən istifadə edən 15.000-dən çox müştərisi var. Bundan əlavə, bir neçə kiçik firma, Silikon əsaslı Flow, Luchen Texnologiyası, Chuanjing Texnologiyası və DeepSeek modellərinə dəstək verən müxtəlif AI İnfra provayderləri də daxil olmaqla həllər təklif edir. AI Technology Review öyrəndi ki, DeepSeek-in lokallaşdırılmış yerləşdirilməsi üçün cari optimallaşdırma imkanları əsasən iki sahədə mövcuddur: biri hibrid GPU/CPU nəticəsindən istifadə etməklə 671 milyard parametrli MN modelini yerli olaraq yerləşdirmək üçün qarışıq əsaslandırma yanaşmasından istifadə edərək TN modelinin seyrəklik xüsusiyyətlərini optimallaşdırmaqdır. Bundan əlavə, MLA-nın optimallaşdırılması çox vacibdir. Bununla belə, DeepSeek-in iki modeli hələ də yerləşdirmənin optimallaşdırılmasında bəzi çətinliklərlə üzləşir. Chuanjing Technology-dən bir tədqiqatçı bildirib: "Modelin ölçüsü və çoxsaylı parametrlərinə görə optimallaşdırma, xüsusən də performans və xərclər arasında optimal tarazlığın əldə edilməsinin çətin olacağı yerli yerləşdirmələr üçün həqiqətən mürəkkəbdir". Ən əhəmiyyətli maneə yaddaş tutumunun məhdudiyyətlərini aradan qaldırmaqdır. "Biz CPU və digər hesablama resurslarından tam istifadə etmək üçün heterojen əməkdaşlıq yanaşmasını qəbul edirik, sıx hissələr GPU-da qalarkən, yüksək performanslı CPU operatorlarından istifadə etməklə emal üçün seyrək TN matrisinin yalnız paylaşılmayan hissələrini CPU/DRAM-a yerləşdiririk" dedi. Hesabatlar göstərir ki, Chuanjing-in açıq mənbəli çərçivə KTransformers ilk növbədə CUDAGraph kimi metodlardan istifadə edərək nəticə çıxarma sürətini əhəmiyyətli dərəcədə artıraraq, şablon vasitəsilə orijinal Transformers tətbiqinə müxtəlif strategiyalar və operatorlar daxil edir. DeepSeek bu startaplar üçün imkanlar yaratdı, çünki böyümənin faydaları aydınlaşır; bir çox firma DeepSeek API-ni işə saldıqdan sonra optimallaşdırma axtaran əvvəlki müştərilərdən sorğular alaraq nəzərəçarpacaq dərəcədə müştəri artımı olduğunu bildirdi. Sənaye insayderləri qeyd etdi ki, "Keçmişdə müəyyən dərəcədə qurulmuş müştəri qrupları tez-tez daha böyük şirkətlərin standartlaşdırılmış xidmətlərinə bağlanırdılar və miqyasına görə onların xərc üstünlükləri ilə sıx bağlıdırlar. Bununla belə, Bahar Festivalından əvvəl DeepSeek-R1/V3-ün yerləşdirilməsini tamamladıqdan sonra biz qəfildən bir neçə tanınmış müştəridən əməkdaşlıq sorğuları aldıq və hətta əvvəllər DeepSeek ilə əlaqə saxlamağa başladıq." Hal-hazırda, DeepSeek-in model çıxarış performansını getdikcə kritik hala gətirdiyi görünür və böyük modellərin daha geniş qəbulu ilə bu, AI İnfra sənayesindəki inkişafa əhəmiyyətli dərəcədə təsir göstərməyə davam edəcəkdir. DeepSeek səviyyəli model yerli olaraq aşağı qiymətə tətbiq oluna bilsəydi, bu, hökumətin və müəssisənin rəqəmsal transformasiya səylərinə böyük kömək edərdi. Bununla belə, problemlər davam edir, çünki bəzi müştərilər böyük model imkanları ilə bağlı yüksək gözləntilərə malik ola bilər və bu, performans və xərclərin tarazlaşdırılmasının praktik tətbiqdə həyati əhəmiyyət kəsb etdiyini daha aydın göstərir.
DeepSeek-in ChatGPT-dən daha yaxşı olub olmadığını qiymətləndirmək üçün onların əsas fərqlərini, güclü tərəflərini və istifadə hallarını anlamaq vacibdir. Budur hərtərəfli müqayisə:
Xüsusiyyət/Aspekt | DeepSeek | ChatGPT |
---|---|---|
Mülkiyyət | Çin şirkəti tərəfindən hazırlanıb | OpenAI tərəfindən hazırlanmışdır |
Mənbə Modeli | Açıq mənbə | Mülkiyyət |
Xərc | İstifadəsi pulsuzdur; daha ucuz API giriş variantları | Abunəlik və ya istifadə başına ödəniş qiymətləri |
Fərdiləşdirmə | Yüksək dərəcədə fərdiləşdirilə bilən, istifadəçilərə onu düzəltməyə və qurmağa imkan verir | Məhdud fərdiləşdirmə mövcuddur |
Xüsusi Tapşırıqlarda Performans | Məlumatların təhlili və məlumat axtarışı kimi müəyyən sahələrdə Excellər | Yaradıcı yazı və danışıq tapşırıqlarında güclü performansla çox yönlüdür |
Dil dəstəyi | Çin dili və mədəniyyətinə güclü diqqət | Geniş dil dəstəyi, lakin ABŞ mərkəzlidir |
Təlim dəyəri | Effektivlik üçün optimallaşdırılmış aşağı təlim xərcləri | Əhəmiyyətli hesablama resursları tələb edən daha yüksək təlim xərcləri |
Cavab dəyişikliyi | Ola bilsin ki, geosiyasi kontekstdən təsirlənən müxtəlif cavablar təklif edə bilər | Təlim məlumatlarına əsaslanan ardıcıl cavablar |
Hədəf Auditoriya | Çeviklik istəyən tərtibatçılar və tədqiqatçılar üçün nəzərdə tutulub | Danışıq imkanları axtaran ümumi istifadəçilər üçün nəzərdə tutulub |
İstifadə halları | Kod yaratmaq və sürətli tapşırıqlar üçün daha səmərəlidir | Mətn yaratmaq, sorğuları cavablandırmaq və dialoqa girmək üçün idealdır |
"Nvidia'nın pozulmasına" tənqidi baxış
Hazırda Huawei-dən başqa, Moore Threads, Muxi, Biran Technology və Tianxu Zhixin kimi bir neçə yerli çip istehsalçısı da DeepSeek-in iki modelinə uyğunlaşır. Bir çip istehsalçısı AI Technology Review-ə bildirib ki, "DeepSeek-in strukturu yenilik nümayiş etdirir, lakin o, LLM olaraq qalır. Bizim DeepSeek-ə uyğunlaşmamız ilk növbədə texniki tətbiqi kifayət qədər sadə və sürətli etmək üçün əsaslandırıcı tətbiqlərə yönəlib." Bununla belə, TN yanaşması yerli çiplərlə yerləşdirilərkən uyğunluğun təmin edilməsi və uyğunlaşma zamanı həllini tələb edən çoxsaylı mühəndis problemlərini təqdim etməklə yanaşı, saxlama və paylama baxımından daha yüksək tələblər tələb edir. "Hazırda yerli hesablama gücü Nvidia ilə uyğunluq və sabitlik baxımından uyğun gəlmir, proqram mühitinin qurulması, problemlərin aradan qaldırılması və əsas performansın optimallaşdırılması üçün orijinal zavod iştirakını tələb edir" dedi bir sənaye mütəxəssisi praktiki təcrübəyə əsaslanaraq. Eyni zamanda, "DeepSeek R1-in böyük parametr miqyasına görə, yerli hesablama gücü paralelləşdirmə üçün daha çox qovşaq tələb edir. Bundan əlavə, yerli aparat spesifikasiyaları hələ də bir qədər geridədir; məsələn, Huawei 910B hazırda DeepSeek tərəfindən təqdim edilən FP8 nəticəsinə dəstək verə bilmir." DeepSeek V3 modelinin diqqətəlayiq məqamlarından biri FP8 qarışıq dəqiqlikli təlim çərçivəsinin təqdim edilməsidir ki, bu çərçivə son dərəcə böyük bir modeldə effektiv şəkildə təsdiqlənmiş və mühüm nailiyyəti qeyd etmişdir. Əvvəllər Microsoft və Nvidia kimi əsas oyunçular əlaqəli işi təklif edirdilər, lakin sənayedə fizibilite ilə bağlı şübhələr var. Məlumdur ki, INT8 ilə müqayisədə FP8-in əsas üstünlüyü ondan ibarətdir ki, məşqdən sonra kvantlama demək olar ki, itkisiz dəqiqliyə nail olmaqla yanaşı nəticə çıxarma sürətini əhəmiyyətli dərəcədə artırır. FP16 ilə müqayisə edildikdə, FP8 Nvidia-nın H20-də iki dəfəyə qədər sürətlənmə və H100-də 1,5 dəfədən çox sürətlənmə həyata keçirə bilər. Qeyd edək ki, yerli hesablama gücü və yerli modellər tendensiyası ilə bağlı müzakirələr sürət qazandıqca, Nvidia-nın pozulacağı və CUDA xəndəyinin yan keçib-keçilməyəcəyi ilə bağlı fərziyyələr getdikcə daha çox yayılır. Danılmaz faktlardan biri də odur ki, DeepSeek həqiqətən də Nvidia-nın bazar dəyərinin əhəmiyyətli dərəcədə azalmasına səbəb olub, lakin bu dəyişiklik Nvidia-nın yüksək səviyyəli hesablama gücü bütövlüyü ilə bağlı suallar doğurur. Kapitala əsaslanan hesablama yığımı ilə bağlı əvvəllər qəbul edilmiş rəvayətlərə etiraz edilir, lakin Nvidia-nın təlim ssenarilərində tam dəyişdirilməsi çətin olaraq qalır. DeepSeek-in CUDA-dan dərindən istifadəsinin təhlili göstərir ki, rabitə üçün SM-dən istifadə və ya birbaşa şəbəkə kartlarını manipulyasiya etmək kimi çeviklik adi GPU-ların yerləşdirilməsi üçün mümkün deyil. Sənaye nöqteyi-nəzərləri vurğulayır ki, Nvidia-nın xəndəkləri yalnız CUDA-nın özündən çox, bütün CUDA ekosistemini əhatə edir və DeepSeek-in istifadə etdiyi PTX (Paralel Thread Execution) təlimatları hələ də CUDA ekosisteminin bir hissəsidir. "Qısa müddətdə Nvidia-nın hesablama gücündən yan keçmək mümkün deyil - bu, təlimdə xüsusilə aydındır; lakin, əsaslandırma üçün yerli kartların tətbiqi nisbətən asan olacaq, buna görə də irəliləyiş daha sürətli olacaq. Yerli kartların uyğunlaşdırılması ilk növbədə nəticəyə diqqət yetirir; hələ heç kim DeepSeek-in performans modelini yerli kartlarda öyrədə bilməyib". Ümumilikdə, nəticə baxımından, vəziyyət yerli böyük model çiplər üçün ümidvericidir. Yerli çip istehsalçıları üçün nəticə sahəsindəki imkanlar, girişə mane olan təlimin həddindən artıq yüksək tələbləri səbəbindən daha aydın görünür. Analitiklər iddia edirlər ki, sadəcə olaraq daxili nəticə kartlarından istifadə etmək kifayətdir; zərurət yaranarsa, əlavə maşın əldə etmək mümkündür, halbuki təlim modelləri özünəməxsus çətinliklər yaradır - artan sayda maşınların idarə edilməsi ağır ola bilər və daha yüksək səhv dərəcələri təlim nəticələrinə mənfi təsir göstərə bilər. Təlimin həmçinin xüsusi klaster miqyası tələbləri var, nəticədə klasterlərə olan tələblər o qədər də sərt deyil, beləliklə, GPU tələblərini asanlaşdırır. Hal-hazırda, Nvidia-nın tək H20 kartının performansı Huawei və ya Cambrian-dan üstün deyil; onun gücü qruplaşmadadır. Hesablama gücü bazarına ümumi təsirə əsaslanaraq, Luchen Technology-nin qurucusu You Yang, AI Technology Review-a verdiyi müsahibədə qeyd etdi: "DeepSeek, ultra-böyük təlim hesablama klasterlərinin yaradılmasına və icarəsinə müvəqqəti olaraq xələl gətirə bilər. Uzunmüddətli perspektivdə, böyük model təlimi ilə bağlı xərcləri əhəmiyyətli dərəcədə azaltmaqla, əsaslandırılmış AI tələbləri və tətbiqləri, ehtimal ki, AI. bu səbəbdən hesablama enerjisi bazarında davamlı tələbi artıracaq." Əlavə olaraq, "DeepSeek-in əsaslandırma və dəqiq tənzimləmə xidmətlərinə artan tələbatı yerli imkanların nisbətən zəif olduğu yerli hesablama landşaftına daha uyğundur və klasterdən sonra boş resurslardan tullantıları azaltmağa kömək edir; bu, yerli hesablama ekosisteminin müxtəlif səviyyələrində istehsalçılar üçün əlverişli imkanlar yaradır." Luchen Technology yerli hesablama gücünə əsaslanan DeepSeek R1 seriyalı əsaslandırıcı API və bulud görüntüləmə xidmətlərini işə salmaq üçün Huawei Cloud ilə əməkdaşlıq etdi. You Yang gələcəyə dair nikbinliyini ifadə etdi: "DeepSeek, yerli hesablama imkanlarına daha çox həvəs və sərmayə qoyaraq, yerli istehsal həllərinə inam aşılayır."

Nəticə
DeepSeek-in ChatGPT-dən "daha yaxşı" olub-olmaması istifadəçinin xüsusi ehtiyaclarından və məqsədlərindən asılıdır. Çeviklik, aşağı qiymət və fərdiləşdirmə tələb edən tapşırıqlar üçün DeepSeek üstün ola bilər. Yaradıcı yazı, ümumi sorğu və istifadəçi dostu danışıq interfeysləri üçün ChatGPT rəhbərlik edə bilər. Hər bir alət müxtəlif məqsədlərə xidmət edir, ona görə də seçim onların istifadə olunduğu kontekstdən çox asılı olacaq.
İdarəetmə kabelləri
Strukturlaşdırılmış Kabel Sistemi
Şəbəkə və Məlumat, Fiber-Optik Kabel, Yamaq Şnur, Modullar, Faceplate
16-18 aprel 2024-cü il, Dubayda Yaxın Şərq-Enerji
16-18 aprel 2024-cü il, Moskvada Sekurika
9 may 2024-cü il, Şanxayda YENİ MƏHSULLAR VƏ TEXNOLOGİYALARIN BAŞLAMASI TƏDBİRİ
22-25 oktyabr, 2024 TƏHLÜKƏSİZLİK ÇİN Pekində
Noyabr.19-20, 2024 CONNECTED WORLD KSA
Göndərmə vaxtı: 10 fevral 2025-ci il