BMS, avtobus, sənaye, alət kabeli üçün.

Bahar Festivalı yaxınlaşdıqca, DeepSeek ətrafındakı həyəcan güclü olaraq qalır. Son tətil, texnoloji sənayesi çərçivəsində əhəmiyyətli bir rəqabət hissi vurğuladı, bu "pişik" bu "pişik." Silikon Vadisi misli görünməmiş bir böhran hissi yaşayır: Açıq mənbəyi vəkilləri yenidən fikirlərini dilə gətirir və hətta Openai, qapalı mənbəli strategiyanın ən yaxşı seçim olub olmadığını da bərpa edir. Aşağı hesablama xərclərinin yeni paradiqması NVIDIA kimi çip nəhəngləri arasında bir zəncirvari reaksiya, ABŞ-ın birja bazarı tarixində bir günlük bazar dəyəri itkisini yazmağa aparan, Hökümət orqanları DeepSeek-in istifadə etdiyi fişlərin uyğunluğunu araşdırır. Xaricdəki DeepSeek'in qarışıq rəyləri, yerli olaraq, fövqəladə böyümə yaşanır. R1 modelinin işə salındıqdan sonra, əlaqəli tətbiq trafikdə artım gördü, tətbiq sektorunun böyüməsinin ümumi AI ekosistemini irəli sürəcəyini göstərir. Müsbət cəhət budur ki, DeepSeek, chatGept-ə güvənməyə güvənən bir tətbiq imkanlarını genişləndirəcək, gələcəkdə də bahalı olmayacaqdır. Bu növbə, O3-Mini ictimaiyyətin düşüncə zəncirinə cavab olaraq, O3-Mini istifadəçilərə, həmçinin O3-Mini ictimaiyyətin düşünülmüş abadlaşdırmalarına cavab olaraq O3-Mini, həmçinin O3-Mini istifadəçilərə "O3-Mini" adlı bir modelin təmin edilməsi də daxil olmaqla, son fəaliyyətin son fəaliyyətində əks olundu. Bir çox xarici istifadəçi bu inkişaflar üçün Deepseek-ə minnətdarlığını bildirdi, baxmayaraq ki, bu düşüncə zənciri xülasə rolunu oynayır.
Optimistik olaraq, Deepseek'in yerli oyunçuları birləşdirdiyi aydındır. Təlim xərclərini, müxtəlif yüksəlmə çip istehsalçıları, aralıq bulud provayderlərinin azaldılması və çox sayda başlanğıclar, DeepSeek modelindən istifadə üçün xərc səmərəliliyinin artırılması üçün çox sayda başlanğıc aktiv şəkildə ekosistemə qoşulur. DeepSeek-in sənədlərinə görə, V3 modelinin tam hazırlığı yalnız 2.788 milyon H800 GPU-nun 2,788 milyon H800 GPU tələb edir və təlim prosesi çox sabitdir. MOE (mütəxəssislərin qarışığı) memarlıq, 405 milyard parametr olan Llama 3 ilə müqayisədə on bir amil tərəfindən təlimdən əvvəlki xərcləri azaltmaq üçün çox vacibdir. Hal-hazırda V3, MOE-də belə yüksək seyrəkliyi nümayiş etdirən ilk ictimaiyyətin tanınmış modelidir. Bundan əlavə, MLA (çox qat diqqəti), xüsusən əsaslandırıcı aspektlərdə sinergistik olaraq işləyir. "Sparser, KVCache-nin əsas məhdudlaşdırıcı amili olan KVCache, KVCache ölçüsünün ölçüsü ilə, KVCache ölçüsünü əhəmiyyətli dərəcədə azaltmaq üçün lazım olan bir dəstə ölçüsü nə qədər böyükdür; Ümumilikdə, DeepSeek'in müvəffəqiyyəti yalnız bir tək deyil, müxtəlif texnologiyaların birləşməsində yerləşir. Sənaye Insiders, DeepSeek komandasının mühəndislik imkanlarını həmd edir, paralel təlim və operator optimallaşdırmasında, hər detaldan təmizlənərək təməlqoyma nəticələrinə nail olur. Deepseek'in açıq mənbəli yanaşması daha da böyük modellərin ümumi inkişafını yandırır və oxşar modellər şəkillər, videolara və daha çoxunu genişləndirsə, bu, sənayenin tələbini əhəmiyyətli dərəcədə stimullaşdıracaqdır.
Üçüncü tərəfin əsaslandırma xidmətləri üçün imkanlar
Məlumat verilməsindən bəri, DeepSeek, CHATGPT-in istifadəçi bazasının 41,6% -i və 16.95 milyon gündəlik aktiv istifadəçisinin 41.6% -i, 157 ölkədə Apple App Store-da ən sürətli böyüyən tətbiqetməni əldə etdiyini göstərir. Bununla birlikdə, istifadəçilər göyərçin içərisində axın edərkən, kiber hakerlər, serverlərində əhəmiyyətli gərginliyə səbəb olan Deepseek tətbiqinə amansızcasına hücum edirdilər. Sənaye analitikləri inanırlar ki, bu, kifayət qədər hesablama qabiliyyəti üçün kifayət qədər hesablama gücü olmadıqda, təlim üçün istifadə olunan kartların yerləşdirilməsi səbəbi ilə əlaqədardır. Bir Sənaye İnsideri AI texnologiyasına baxdı, "Tez-tez server məsələləri daha çox maşın almaq üçün ödəniş və ya maliyyələşdirmə tələb etməklə asanlıqla həll edilə bilər; nəticədə DeepSeek qərarlarından asılıdır." Bu, məhsuldarlığa qarşı texnologiyaya diqqət yetirməkdə bir ticarət təqdim edir. DeepSeek, nisbətən aşağı pul axını təzyiqi və daha təmiz bir texnoloji mühitlə nəticələnən bir az xarici maliyyələşdirmə, nəticədə bir az xarici maliyyələşdirmə üçün kvant miqdarının kvantının miqdarına güvənmişdir. Hal-hazırda, yuxarıda göstərilən problemlər işığında, bəzi istifadəçilər istifadəçi rahatlığını artırmaq üçün istifadə olunan hədləri yüksəltmək və ya pullu xüsusiyyətləri tətbiq etmək üçün sosial mediada DeepSeek-i çağırırlar. Bundan əlavə, inkişaf etdiricilər rəsmi API və ya üçüncü tərəfin optimallaşdırılması üçün istifadə etməyə başladılar. Bununla birlikdə, Deepseek'in açıq platforması bu yaxınlarda elan etdi: "Cari server resursları qıtdır və API xidmət şarjları dayandırılıb."
Bu, şübhəsiz ki, AI infrastruktur sektorundakı üçüncü tərəf satıcıları üçün daha çox imkanlar açır. Bu yaxınlarda çoxsaylı daxili və beynəlxalq buludlu nəhənglər Deepseek-in modelini APIS-Nəhəng nəhəngləri Microsoft və Amazon'un yanvar ayının sonunda birinci iştirak etdilər. Daxili lider Huawei Cloud, Fevralın 1-də silikon əsaslı axınla əməkdaşlıqda olan Deepseek R1 və V3 əsaslandırıcı xidmətləri, silikon əsaslı axın xidmətlərinin istifadəçilərin axını gördüyünü göstərir. Böyük üç texnoloji şirkət-yarasa (Baidu, Alibaba, Tencent) və ByRetteTate-də byəti tərəfindən də aşağı qiymətli, məhdud vaxt təklifləri, Deepseek'in V2 modelinin başladığı üçün 3 fevral Satıcı Qiymətləri tərəfindən xatırladan, "Qiymət Qəssab" adlandırıldığı Bulud satıcılarının qəzəbli hərəkətləri, Microsoft Azure və Openai arasındakı daha əvvəlki əlaqələri, 2019-cu ildə Microsoft, Microsoft'un 2023-cü ildə açıqlanmasının ardından bu yaxın əlaqələr, Microsoft Azure Ecosystem-dən sonra bu yaxın əlaqələrdən sonra bu yaxın əlaqələr qurmağa başladı. Bu vəziyyətdə, DeepSeek yalnız məhsul istisi baxımından chatGpt-i üstələdi, lakin Llama-in GPT-3-in canlanması həyəcanına bənzər O1 buraxılışından sonra O1 buraxılışından sonra açıq mənbəli modellər də təqdim etdi.
Əslində, bulud provayderləri də AI tətbiqləri üçün trafik şlüzləri kimi özlərini yerləşdirirlər, yəni inkişaf etdiricilərlə əlaqələrin dərinləşməsi üstünlük təşkil edən üstünlüklərə çevrilir. Hesabatlar, Baidu Smart Cloud-un modelin başlama günündə Qianfan platforması vasitəsi ilə DeepSeek modelindən istifadə edən 15000-dən çox müştərinin 15 mindən çox müştərisi olduğunu göstərir. Bundan əlavə, bir neçə kiçik firma, silikon əsaslı axın, Luchen texnologiyası, Chuanjing texnologiyası və DeepSeek modellərinə dəstək vermiş müxtəlif AI infra təminatçıları da daxil olmaqla həll yolları təklif edir. AI texnologiyası araşdırması, DeepSeek'in lokallaşdırılmış yerləşdirilməsi üçün hazırkı optimallaşdırma imkanlarının ilk növbədə iki sahədə mövcuddur: biri hibrid GPU / CPU-nun nəticəsini istifadə edərkən, yerli olaraq 671 milyard parametrli moe modelini yerləşdirmək üçün MOE modelinin boşaldılması üçün optimallaşdırıcıdır. Bundan əlavə, MLA-nın optimallaşdırılması vacibdir. Bununla birlikdə, DeepSeek'in iki modeli hələ də yerləşdirmə optimallaşdırmasında bəzi çətinliklərlə üzləşir. "Modelin ölçüsü və çoxsaylı parametrləri səbəbindən, optimallaşdırma həqiqətən də mürəkkəbdir, xüsusən də performans və maya dəyəri arasındakı optimal tarazlığa nail olmaq çətin olacaq" dedi. Ən əhəmiyyətli bir maneə yaddaş tutum həddini aşmaqda yatır. "CPU / DRAM-in yalnız CPU / DRAM-da emal etmək üçün CPU / DRAM-ın yalnız CPU operatorlarından istifadə etmək üçün cpu / dramın işlənməməsi üçün bir heterojen bir əməkdaşlıq, digər hesablama mənbələrindən istifadə etmək üçün heterojen əməkdaşlıq bir əməkdaşlıq yanaşması, GPU-da qalır. Hesabatlar, Chuanjing'in açıq mənbəli çərçivəsinin KTransformers, ilk növbədə, cudanbat kimi metodlardan istifadə edərək qeyri-adi strategiyalar və orijinal strategiyalar və orijinal strategiyalar və operatorların orijinal transformatorların tətbiqi ilə həyata keçirilməsini əhəmiyyətli dərəcədə artırır. Deepseek, bu başlanğıclar üçün imkanlar yaratdı, çünki böyümə fayda göründüyü kimi; Bir çox firma, optimallaşdırma axtaran əvvəlki müştərilərin sorğularını qəbul edərək, Deepseek API-ni işə saldıqdan sonra diqqətəlayiq müştəri böyüməsini bildirdi. Sənaye insaydları, "Keçmişdə biraz qurulmuş müştəri qrupları tez-tez böyük şirkətlərin standartlaşdırılmış xidmətlərinə kilidlənmiş, miqyaslı-r1 / v3-nin yerləşdirilməsinə görə sıx bağlıdır, birdən-birə tanınmış müştərilərin əməkdaşlıq sorğularını bağladıq və hətta əvvəllər hərəkətsiz müştərilərimizi tətbiqi ilə əlaqə qurmağımıza başladılar." Hal-hazırda, Deepseek'in model nəticəsi getdikcə daha çox tənqidi və geniş modellərin daha geniş qəbul edilməsi ilə bu, bu, AI infra sənayesində inkişafa təsir göstərməyə davam edəcəkdir. Bir DeepSeek səviyyəli bir model yerli olaraq aşağı qiymətə yerləşdirilə bilərsə, hökumət və müəssisə rəqəmsal çevrilmə səylərinə çox kömək edər. Bununla belə, bəzi müştərilərin böyük model imkanları ilə bağlı yüksək gözləntilərlə bağlı yüksək gözləntilər ola biləcəyi üçün çətinliklər israr edir, bu, performans və maya dəyəri praktik yerləşdirmədə çox vacib hala gətirir.
DeepSeek'in ChatGept'dən daha yaxşı olub olmadığını qiymətləndirmək üçün, əsas fərqlərini, güclü tərəflərini və istifadə hallarını başa düşmək vacibdir. Budur hərtərəfli müqayisə:
Xüsusiyyət / aspekt | Dərinökən | Chatgpt |
---|---|---|
Mülkiyyət | Çin şirkəti tərəfindən hazırlanmışdır | Openai tərəfindən hazırlanmışdır |
Mənbə modeli | Açıq mənbəyi | Mütərizək |
Dəyəri | Pulsuz istifadə etmək; Daha ucuz API giriş seçimləri | Abunə və ya istifadə üçün əvvəlcədən qiymət |
Özelleştirme | Yüksək özelleştirilebilir, istifadəçilərə çimdik və qurmağa imkan verir | Məhdud özelleştirme mövcuddur |
Xüsusi tapşırıqlarda performans | Məlumat analitikası və məlumatların alınması kimi müəyyən ərazilərdə üstündür | Yaradıcı yazı və danışıq tapşırıqlarında güclü performansla çox yönlü |
Dil | Çin dili və mədəniyyətinə güclü diqqət | Geniş dil dəstəyi ancaq ABŞ-da mərkəzlidir |
Təlim dəyəri | Səmərəlilik üçün optimallaşdırılmış aşağı təlim xərcləri | Əhəmiyyətli hesablama mənbələrindən istifadə edən daha yüksək təlim xərcləri |
Cavab dəyişikliyi | Geosiyasi kontekstdən təsirlənən fərqli cavablar təklif edə bilər | Təlim məlumatlarına əsaslanan ardıcıl cavablar |
Hədəf auditoriya | Rahatlıq istəyən inkişaf etdiricilərə və tədqiqatçılara yönəldilmişdir | Danışıq qabiliyyətlərini axtaran ümumi istifadəçilərə yönəldilmişdir |
İşdən istifadə etmək | Kod istehsalı və sürətli vəzifələri üçün daha səmərəlidir | Mətn yaratmaq, sorğulara cavab vermək və dialoqla məşğul olmaq üçün idealdır |
"NVIDIA pozmaq" mövzusunda kritik bir perspektiv
Hazırda Huawei-dən başqa, Moore mövzuları, Muxi, Biran texnologiyası və Tianxu Zhixin kimi bir neçə yerli çip istehsalçısı da DeepSeek'in iki modelinə uyğunlaşır. Bir çip istehsalçısı AI texnologiyasına baxdığını söylədi, "Deepseekin quruluşu yenilikləri nümayiş etdirir, lakin bir LLM olaraq qalır. DeepSeek-ə uyğunlaşmamız ilk növbədə, texniki tətbiqetmədən kifayət qədər sadə və sürətli tətbiq etmək üçün tətbiqetmələrə yönəldilmişdir." Bununla yanaşı, MOE yanaşması, uyğunlaşma zamanı həll edilməsi, həll edilməsi zamanı qətnaməyə ehtiyacı olan çox sayda mühəndis problemləri təqdim edərkən, yerli fişlərlə yerləşdirmə zamanı uyğunluğu təmin etmək və paylama baxımından daha yüksək tələblər tələb edir. "Hal-hazırda daxili hesablama gücü, NVIDIA-nın istifadəsi və sabitliyinə uyğun gəlmir, proqram mühitinin qurulması, problemlərin aradan qaldırılması və təməl performansının optimallaşdırılması, praktik təcrübə əsasında bildirib. Eyni zamanda, "DeepSeek R1-nin böyük parametr miqyası səbəbindən, daxili hesablama gücü, daxili hesablama gücü ilə müqayisədə daha çox qovşaq tələb edir. Deepseek V3 modelinin məqamlarından biri də, son dərəcə böyük bir modeldə səmərəli təsdiq edilmiş bir FP8 qarışıq dəqiqlik təlim çərçivəsinin tətbiqidir, bu, son dərəcə böyük bir nailiyyət işarələyir. Əvvəllər, Microsoft və Nvidia kimi böyük oyunçular, əlaqəli iş təklif etdilər, lakin məqsədəuyğunluq ilə bağlı sənaye içərisində olanlara şübhə edir. Anlaşılır ki, InT8 ilə müqayisədə FP8-in əsas üstünlüyü, təhsili sonradan daha çox itkisiz dəqiqliyi təmin edə bilər ki, nəticəsiz bir nəticə sürətini artırır. FP16 ilə müqayisə edildikdə, FP8 NVIDIA-nın H20-də iki dəfə sürətlənə bilər və H100-də 1,5 dəfədən çox sürətlənə bilər. Qeyd edək ki, daxili hesablama gücünün tendensiyasını əhatə edən müzakirələr kimi, daxili modellər, NVIDIA-nın pozulduğunu və Cuda Moatın keçə biləcəyi barədə fərziyyələr, getdikcə yayıla bilər. Devkən bir həqiqət budur ki, Deepseek həqiqətən NVIDIA-nın bazar dəyərində əhəmiyyətli bir eniş səbəb olub, lakin bu növbədə NVIDIA-nın yüksək səviyyəli hesablama güc bütövlüyü ilə bağlı suallar doğurur. Əvvəlcədən qəbul edilmiş hesablama yığılması ilə bağlı əvvəlcədən qəbul edilmiş povestlər etiraz olunur, lakin NVIDIA üçün təlim ssenarilərində tam əvəz edilməsi çətin olaraq qalır. DeepSeek'in dərin istifadəsinin təhlili CUDA-nın dərin istifadəsinin təhlili, rabitə üçün sm istifadə etmək və ya birbaşa manipulyasiya etmək kimi rahatlıq üçün müntəzəm GPus üçün mümkün deyil. Sənayenin baxışı NVIDIA-nın Moat, yalnız Cuda'nın özü deyil, PTX (paralel ipin icrası) təlimatlarını və PTX (paralel ipin icrası) təlimatlarını hələ də Cuda ekosisteminin bir hissəsidir. "Qısa müddətdə, NVIDIA-nın hesablama gücü, bu, təlimdə yerli kartların istifadəsi nisbətən daha asandır. Ümumiyyətlə, bir nəticə baxımından, hallar daxili böyük model çipləri üçün ruhlandırıcıdır. Daxili çip istehsalçıları üçün daxili çip istehsalçıları, təlimlərin həddən artıq yüksək tələblərinə görə daha aydın görünür, bu da girişin həliminə mane olur. Analitiklər sadəcə daxili nəticə kartlarını istifadə etmələri barədə iddia edirlər; Lazım gələrsə, əlavə bir maşın əldə etmək mümkündür, təlim modelləri, artan sayda maşınların artan sayını idarə edən unikal çətinliklər yaradır və daha yüksək səhv nisbətləri təhsilə təsir edə bilər. Təlimin də xüsusi bir çoxluq miqyası tələblərinə, yüksəkliklərə dair tələblər isə ciddi deyil, beləliklə, GPU tələblərini asanlaşdırır. Hal-hazırda NVIDIA-nın tək H20 kartının performansı Huawei və ya Cambrian-ın bu barədə üstün deyil; Onun gücü çoxluqdadır. Luchen texnologiyasının qurucusuna, Yang, Yang, AI texnologiyasına dair reportajda, ultra-böyük təlim hesablama və icarəyə görə müvəqqəti olaraq, əsaslandırma və tətbiqetmələrin azaldılması ehtimalı olduğunu, bu səbəbdən bu səbəbdən davamlı olaraq sürücüyə səbəb olur Hesablama güc bazarında davamlı tələb. " Bundan əlavə, "Deepseek-in əsaslandırılması və incə tənzimləmə xidmətləri, yerli tutumluların nisbətən zəif olduğu daxili hesablama mənzərəsi ilə daha uyğundur, burada boş ehtiyatlardan post-klubun müxtəlif səviyyələrində tullantıların azalmasına kömək edən daxili hesablama mənzərəsi ilə daha çox uyğundur; bu, daxili hesablama ekosisteminin müxtəlif səviyyələrində istehsalçılar üçün əlverişli imkanlar yaradır." Luchen Technology, DeepSeek R1 seriyalı əsaslandırıcı API-ləri və daxili hesablama gücünə əsaslanan Cloud görüntüləmə xidmətlərinin başlaması üçün Huawei Cloud ilə əməkdaşlıq etdi. Yang gələcəyə nikbinlik ifadə etdiniz: "Deepseek, yerli hesablama qabiliyyətlərinə və daxili hesablama qabiliyyətlərinə daha çox həvəs və investisiya təşviq edən, daxili istehsal olunan həllərə inamı aşılayır."

Rəy
DeepSeek'in ChatGept'dən daha yaxşı "daha yaxşı olub-olmaması istifadəçinin xüsusi ehtiyac və məqsədlərindən asılıdır. Çeviklik, ucuz qiymətə və özelleştirme, DeepSeek-in daha üstün ola bilməsi lazım olan tapşırıqlar üçün üstün ola bilər. Yaradıcı yazı, ümumi sorğu və istifadəçi dostu danışıq interfeysləri, ChatGept aparıcı ola bilər. Hər vasitə fərqli məqsədlərə xidmət edir, buna görə seçim istifadə olunduğu kontekstdən çox asılı olacaqdır.
İdarəetmə kabelləri
Strukturlaşdırılmış kabel sistemi
Şəbəkə və məlumatlar, fiber-optik kabel, yamaq şnuru, modullar, faceplate
111-ci, 1824-cü il 2024-cü ildə Dubayda Orta Şərq-Enerji
Aprel 2011-18-ci, 2024-cü ildə Moskvada Securika
May.9-da, 2024-cü il 2024 yeni məhsul və texnologiyaların Şanxayda başladın
Oktyabr22-25, 2024 Təhlükəsizlik Çin, Pekində
Nov.19-20, 2024-cü il tarixli Dünya KSA
Saat: Fevral-10-2025