विंडोज़ पर CUDA स्थापित करने का ट्यूटोरियल

  • संगतता: समर्थित विंडोज संस्करण, उपयुक्त ड्राइवर, और उचित रूप से कॉन्फ़िगर किए गए WDDM/TCC मॉडल।
  • लचीला इंस्टॉलेशन: ग्राफिकल या साइलेंट टूलकिट, कोंडा और व्हील्स, नमूनों के माध्यम से सत्यापन के साथ।
  • हाइब्रिड वातावरण: विंडोज़ पर लिनक्स के भीतर न्यूनतम कर्नेल, डॉकर और एआई फ्रेमवर्क के साथ WSL समर्थन।

विंडोज़ पर CUDA

विंडोज़ पर CUDA स्थापित करना अगर आप आधिकारिक गाइड द्वारा प्रमाणित स्पष्ट मार्ग का अनुसरण करते हैं, तो यह सिरदर्द नहीं होगा। इस व्यावहारिक और तकनीकी गाइड में, हम नेटिव विंडोज़ और WSL, दोनों में टूलकिट, ड्राइवर्स और सत्यापन टूल्स को बेहतर बनाने के लिए आवश्यक सभी चीज़ों को शामिल करेंगे। लक्ष्य यह है कि आप एक कार्यशील और परीक्षणित स्थापना प्राप्त करें।, आपके GPU वर्कफ़्लो को गति देने के लिए तैयार है।

क्लासिक चरणों के अतिरिक्त, हम विजुअल स्टूडियो संगतता, साइलेंट इंस्टॉलेशन, कोंडा पैकेज और NVIDIA व्हील्स, CUDA उदाहरणों के साथ सत्यापन, WSL विशिष्टताएं और प्रमुख रिलीज नोट्स (जैसे CUDA 13 में इंस्टॉलर से ड्राइवर को हटाना) को कवर करेंगे। आप यह भी देखेंगे कि सामान्य समस्याओं का निदान कैसे किया जाता है। (जिसमें लेनोवो आइडियापैड और 526.56 ड्राइवरों के साथ एक वास्तविक दुनिया का मामला शामिल है) और विशिष्ट परिदृश्यों के लिए विशिष्ट आवश्यकताएं जैसे कि CUDA 10.1 और cuDNN 7.6.4 के साथ मॉडल बिल्डर।

CUDA क्या है?

CUDA, NVIDIA का समानांतर प्रोग्रामिंग प्लेटफॉर्म और मॉडल है, जो GPU पर कम्प्यूट-गहन अनुप्रयोगों के त्वरण की अनुमति देता है। CUDA C/C++ और इसके एक्सटेंशन के साथ आप एल्गोरिथम को समानांतर बनाने पर ध्यान केंद्रित कर सकते हैं, जबकि CUDA रनटाइम CPU और GPU के बीच निष्पादन और मेमोरी का प्रबंधन करता है। क्रमिक (CPU) और समानांतर (GPU) कार्य को विभाजित करके, हजारों थ्रेड्स का लाभ उठाकर प्रदर्शन को बढ़ाना संभव है और साझा ऑन-चिप मेमोरी।

यह मार्गदर्शिका इस बात पर केंद्रित है कि विंडोज़ (नेटिव और WSL) में वातावरण को कैसे ठीक किया जाए, टूलकिट को कैसे स्थापित किया जाए, उदाहरणों को कैसे संकलित किया जाए, तथा यह कैसे सत्यापित किया जाए कि सिस्टम GPU का सही ढंग से पता लगाता है। डिवाइस क्वेरी और बैंडविड्थ टेस्ट जैसे नमूनों के साथ सत्यापन यह एक महत्वपूर्ण हिस्सा है जिसे अक्सर नजरअंदाज कर दिया जाता है और जिसे हम यहां स्पष्ट रूप से संबोधित कर रहे हैं।

CUDA

सिस्टम आवश्यकताएँ और समर्थित Windows संस्करण

CUDA का उपयोग करने के लिए आपको एक संगत NVIDIA GPU और एक समर्थित Windows ऑपरेटिंग सिस्टम की आवश्यकता होगी। ऑपरेटिंग सिस्टम के समर्थित संस्करणों में शामिल हैंWindows 11 24H2, 23H2 और 22H2-SV2; Windows 10 22H2; Windows Server 2022 और Windows Server 2025. डिवाइस मैनेजर में जाँच करें कि आपका कार्ड डिस्प्ले एडेप्टर के अंतर्गत दिखाई देता है और CUDA-सक्षम GPU (NVIDIA पेज) की आधिकारिक सूची पर इसकी संगतता सत्यापित करें।

कंपाइलर स्तर पर, टूलकिट Visual Studio 2022 17.x (C++11/14/17/20) में MSVC 193x और Visual Studio 2019 16.x (C++11/14/17) में MSVC 192x का समर्थन करता है। Visual Studio 2015 के लिए समर्थन 11.1 में हटा दिया गया थाVS 2017 के लिए, इसे संस्करण 12.5 में अप्रचलित कर दिया गया था और 13.0 में हटा दिया गया था। ध्यान दें कि CUDA 12.0 (नेटिव और क्रॉस-कंपाइलेशन) से 32-बिट संकलन हटा दिया गया था; अगर आपको 32-बिट की ज़रूरत है, तो आपको पुराने टूलकिट इस्तेमाल करने होंगे।

यद्यपि NVIDIA ड्राइवर, Ada आर्किटेक्चर तक GeForce GPU पर 32-बिट बाइनरी चलाने की अनुमति देता रहेगा, एडा उस समर्थन के साथ अंतिम व्यक्ति होगीहॉपर अब 32-बिट अनुप्रयोगों का समर्थन नहीं करता। यह महत्वपूर्ण है यदि आप उत्पादन में पुराने सॉफ़्टवेयर का रखरखाव करते हैं और अपग्रेड की योजना बनाना चाहते हैं।

विंडोज़ 10 और उसके बाद के संस्करणों में, NVIDIA ड्राइवर दो मॉडलों के अंतर्गत काम कर सकता है: WDDM (डिस्प्ले डिवाइस के लिए) और बिना वीडियो आउटपुट वाले GPU के लिए TCC (टेस्ला कंप्यूट क्लस्टर), जैसे टेस्ला या कुछ टाइटन मॉडल। nvidia-smi आप वर्तमान मोड की जाँच कर सकते हैं और, यदि समर्थित हो, तो उनके बीच स्विच कर सकते हैं। गेमिंग GPU वाले डेस्कटॉप पीसी पर, WDDM मानक होगा; कंप्यूट कार्ड वाले वर्कस्टेशन पर, TCC आमतौर पर डिफ़ॉल्ट रूप से सक्षम होती है।.

विंडोज़ पर टूलकिट स्थापित करना: चरण दर चरण

  1. सत्यापित करें कि आपके पास CUDA-सक्षम GPU और समर्थित Windows संस्करण है।डिवाइस मैनेजर (डिस्प्ले एडाप्टर) से आप निर्माता और मॉडल देख सकते हैं।
  2. आधिकारिक डाउनलोड पृष्ठ से NVIDIA CUDA टूलकिट डाउनलोड करें। आपके पास दो प्रारूप हैं: नेटवर्क इंस्टॉलर (केवल वही डाउनलोड करता है जो इंस्टॉलेशन के दौरान चुना गया है) और पूर्ण इंस्टॉलर (सभी घटकों को शामिल करता है, ऑफ़लाइन या एंटरप्राइज़ परिनियोजन के लिए उपयोगी)।
  3. इंस्टॉलर चलाएँ और ग्राफ़िकल विज़ार्ड का पालन करें। यदि आवश्यक हो तो टूलकिट, उदाहरण और विजुअल स्टूडियो के साथ एकीकरण स्थापित करने के लिए।
  4. स्वचालित इंस्टॉलेशन में आप साइलेंट मोड का उपयोग कर सकते हैं -sऔर विशिष्ट उप-पैकेज चुनने के लिए पैरामीटर जोड़ें। ध्वज -n यदि आवश्यक हो तो स्वचालित पुनः आरंभ से बचें।
  5. पूर्ण करें और पुनः आरंभ करें यदि अनुरोध किया।
  6. कमांड प्रॉम्प्ट खोलें और चलाएँ nvcc -V स्थापित CUDA कंपाइलर संस्करण देखने के लिए.

विंडोज़ पर CUDA स्थापित करें

मौन स्थापना और टूलकिट उप-पैकेज

इंस्टॉलर आपको टूलकिट के विशिष्ट घटकों को तैनात करने की अनुमति देता है, जो प्रबंधित या CI वातावरण में उपयोगी है। CUDA 13.0 में कुछ प्रतिनिधि उपपैकेट (डिफ़ॉल्ट पथ C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v13.0) हैं:

  • क्यूबलास_13.0 / क्यूबलास_देव_13.0: cuBLAS रनटाइम लाइब्रेरीज़.
  • सीआरटी_13.0: CUDA अनुप्रयोगों के लिए संकलक.
  • सीटीएडवाइजर_13.0संकलन समय को कम करने के लिए NVCC/NVRTC ट्रेस विश्लेषण।
  • cuda_profiler_api_13.0 y cuadrt_13.0: CUDA प्रोफाइलर और रनटाइम API.
  • कफ़्ट_13.0 / कफ़्ट_देव_13.0: cuFFT.
  • cuobjdump_13.0 y एनवीडिसास्म_13.0: क्यूबिन्स के निरीक्षण के लिए उपयोगिताएँ।
  • कपटी_13.0: प्रोफाइलिंग उपकरण इंटरफ़ेस.
  • curand_13.0 / curand_dev_13.0: क्यूरंड.
  • cusolver_13.0 / cusolver_dev_13.0 y cusparse_13.0 / cusparse_dev_13.0: रैखिक बीजगणित पुस्तकालय.
  • cuxxfilt_13.0: डेमंगलर cu++ फ़िल्टर.
  • दस्तावेज़ीकरण_13.0: HTML और PDF गाइड (प्रोग्रामिंग, सर्वोत्तम अभ्यास, आदि)।
  • nsight_compute_13.0, nsight_systems_13.0 y nsight_vse_13.0एनसाइट उपकरण.
  • एनपीपी_13.0 / एनपीपी_देव_13.0: एनपीपी.
  • एनवीसीसी_13.0CUDA संकलक.
  • एनवीफैटबिन_13.0, एनवीजीतलिंक_13.0, एनवीटीएक्स_13.0, एनवीवीएम_13.0, nvptxcompiler_13.0: टूलचेन और ट्रेस टूल/लाइब्रेरीज़.
  • nvjpeg_13.0 / nvjpeg_dev_13.0: एनवीजेपीईजी.
  • एनवीएमएल_देव_13.0NVML हेडर और लाइब्रेरीज़.
  • एनवीप्रून_13.0: डिवाइस लक्ष्यों द्वारा ऑब्जेक्ट्स/स्टैटिक्स की छंटाई।
  • अधिभोग_कैलकुलेटर_13.0: अधिभोग स्प्रेडशीट.
  • ओपनसीएल_13.0: ओपनसीएल लाइब्रेरी.
  • सैनिटाइज़र_13.0कंप्यूट सैनिटाइज़र एपीआई.
  • थ्रस्ट_13.0 y विज़ुअल_स्टूडियो_इंटीग्रेशन_13.0जोर और एकीकरण बनाम.

यदि आपको इंस्टॉल करने से पहले सामग्री का निरीक्षण करने की आवश्यकता है, तो आप LZMA-संगत टूल (जैसे, 7-ज़िप) का उपयोग करके पूर्ण इंस्टॉलर निकाल सकते हैं। टूलकिट फ़ाइलें CUDAToolkit फ़ोल्डर में स्थित हैं फ़ाइलें निकालने के बाद, आपको अंदर .dll और .nvi फ़ाइलें मिलेंगी, जिन्हें आप अनदेखा कर सकते हैं यदि आप केवल इंस्टॉलेशन ट्री की समीक्षा करना चाहते हैं। अनइंस्टॉलेशन कंट्रोल पैनल > प्रोग्राम्स और फीचर्स के माध्यम से किया जाता है।

पाइप के साथ स्थापना (NVIDIA व्हील्स)

पायथन-केंद्रित वातावरण के लिए, NVIDIA व्हील्स प्रदान करता है जो पाइप के माध्यम से CUDA रनटाइम और लाइब्रेरीज़ को स्थापित करता है। ये पैकेज रनटाइम उपयोग के लिए हैं। और इसमें डेवलपमेंट टूल्स शामिल नहीं हैं (ज़रूरत पड़ने पर आप इन्हें अलग से इंस्टॉल कर सकते हैं)। नोट: CUDA परिवेश को pip परिवेश के भीतर प्रबंधित किया जाता है, इसलिए अगर आप CUDA को इसके बाहर इस्तेमाल करना चाहते हैं, तो आपको होस्ट परिवेश को समायोजित करना होगा।

सबसे पहले, इंस्टॉल करें nvidia-pyindex ताकि pip NVIDIA NGC रिपॉजिटरी से मॉड्यूल्स को रिज़ॉल्व कर सके। यदि आवश्यक हो, पाइप और सेटअपटूल्स को अपडेट करें बाद में होने वाली गलतियों से बचने के लिए। आप की लाइन भी जोड़ सकते हैं nvidia-pyindex आप को requirements.txt यदि आप उस परंपरा के साथ काम करते हैं।

स्थापना सत्यापित करें: नमूने और परीक्षण

संकलक संस्करण की जाँच करें nvcc -V एक सीएमडी से. github.com/nvidia/cuda-samples से CUDA नमूने क्लोन करेंइन्हें रिपॉजिटरी में बताए अनुसार संकलित और चलाएँ। इन्हें बनाने और चलाने की अत्यधिक अनुशंसा की जाती है deviceQuery यह पुष्टि करने के लिए कि GPU का पता लगा लिया गया है और कॉन्फ़िगरेशन सही है।

कसौटी bandwidthTest होस्ट-डिवाइस प्रदर्शन और संचार को मान्य करता है। दोनों ही मामलों में, महत्वपूर्ण बात यह है कि डिवाइस दिखाई दे।यह आपके हार्डवेयर से मेल खाता है और परीक्षण पास कर लेता है। deviceQuery GPU का पता नहीं चला, ड्राइवर की स्थापना की जाँच करें और सुनिश्चित करें कि डिवाइस सिस्टम में चालू है।

Windows 11 और Windows 10 21H2+ में CUDA और WSL

विंडोज 11 और विंडोज 10 के हाल के संस्करण (21H2 और बाद के संस्करण) WSL का उपयोग करके GPU-त्वरित ML टूल चलाने का समर्थन करते हैं। आप TensorFlow, PyTorch, Docker और NVIDIA कंटेनर टूलकिट का उपयोग कर पाएंगे ग्लिबक-आधारित लिनक्स डिस्ट्रो (उबंटू, डेबियन, आदि) के भीतर।

मुख्य चरण: WSL में NVIDIA CUDA-सक्षम ड्राइवर स्थापित करें, WSL सक्षम करें, और Ubuntu/Debian-प्रकार का वितरण जोड़ें। सुनिश्चित करें कि आपके पास WSL कर्नेल का नवीनतम संस्करण है। (न्यूनतम 5.10.43.3)। आप इसे PowerShell में इस प्रकार सत्यापित कर सकते हैं: wsl cat /proc/versionइसके बाद, NVIDIA Docker के साथ काम करने के लिए WSL उपयोगकर्ता गाइड में NVIDIA के CUDA का पालन करें या डिस्ट्रो के भीतर PyTorch/TensorFlow स्थापित करें।

विंडोज़ में जाँच और निदान

यह जानने के लिए कि आपके पास कौन सा GPU है: सेटिंग्स > सिस्टम > डिस्प्ले > उन्नत सेटिंग्स में, आपको "डिस्प्ले जानकारी" के अंतर्गत ब्रांड और मॉडल मिलेगा। कार्य प्रबंधक में, प्रदर्शन टैबउपयोग, मॉडल और मेमोरी देखने के लिए GPU चुनें। अगर यह दिखाई न दे, तो डिवाइस मैनेजर > डिस्प्ले एडाप्टर चुनें और कार्ड के लिए उपयुक्त ड्राइवर इंस्टॉल करें।

अपने ड्राइवर द्वारा "रिपोर्ट" किया गया CUDA संस्करण देखने के लिए, चलाएँ nvidia-smi. स्थापित टूलकिट कंपाइलर का संस्करण जानने के लिए, का उपयोग करता है nvcc --version. ध्यान रखें कि nvidia-smi यह ड्राइवर द्वारा समर्थित अधिकतम CUDA “API” संस्करण प्रदर्शित करता है, न कि आपके डिस्क पर मौजूद टूलकिट का संस्करण।

क्लाउड उपयोग: GPU वाले इंस्टेंस का उदाहरण

यदि आपको ऑन-डिमांड पावर की आवश्यकता है, तो क्लाउड प्रदाता NVIDIA A100, RTX 4090, या A6000 जैसे GPU के साथ इंस्टेंस प्रदान करते हैं। यह दृष्टिकोण भुगतान-जैसे-आप-उपयोग करते हैं, लगभग तत्काल तैनाती, तथा तैयार टेम्पलेट्स की सुविधा प्रदान करता है। लोकप्रिय फ्रेमवर्क (PyTorch, TensorFlow) के लिए। बड़े कार्यभार या अस्थायी स्पाइक्स के लिए, यह मालिकाना हार्डवेयर में निवेश किए बिना और नवीनतम CUDA संस्करणों के समर्थन के साथ एक कुशल विकल्प है।

कानूनी नोटिस और ट्रेडमार्क

NVIDIA दस्तावेज और सॉफ्टवेयर "जैसा है वैसा ही" प्रदान किया जाता है, सभी अधिकार सुरक्षित हैं और किसी विशेष उद्देश्य के लिए व्यापारिकता या उपयुक्तता की कोई निहित वारंटी नहीं है। NVIDIA बिना किसी पूर्व सूचना के विनिर्देशों और दस्तावेज़ों को संशोधित कर सकता हैहमेशा नवीनतम जानकारी की पुष्टि करें और तृतीय-पक्ष की बिक्री और लाइसेंसिंग शर्तों का सम्मान करें। OpenCL, Apple Inc. का एक ट्रेडमार्क है जिसका लाइसेंस क्रोनोस को दिया गया है; NVIDIA और उसका लोगो अमेरिका और अन्य देशों में पंजीकृत ट्रेडमार्क हैं।

उपरोक्त सभी के साथ, अब आपके पास विंडोज़ पर CUDA को स्थापित करने, कॉन्फ़िगर करने और मान्य करने के लिए सभी चीजें मौजूद हैं (और जब आपको इसकी आवश्यकता हो तो WSL या Linux पर भी)। आवश्यकताओं और ड्राइवरों से लेकर विज़ुअल स्टूडियो के साथ एकीकरण और नमूनों के साथ सत्यापन तककुंजी ड्राइवर संस्करण, टूलकिट और पर्यावरण को संरेखित करना और इस तरह के उपकरणों पर भरोसा करना है nvidia-smi, nvcc और यह पुष्टि करने के लिए नमूने लिए गए कि पूरी श्रृंखला अपेक्षा के अनुरूप काम कर रही है।