Selasa, 8 Jul 2025
Selasa, 8 Juli 2025

NVIDIA NCCL 2.26 Resmi Dirilis, Bawa Fitur Baru untuk Percepat Pelatihan AI Skala Besar

astakom, Jakarta – NVIDIA resmi merilis pembaruan besar untuk pustaka komunikasi GPU mereka, NVIDIA Collective Communications Library (NCCL) versi 2.26, yang membawa peningkatan signifikan dari sisi performa, monitoring, serta keandalan dalam pemrosesan paralel berskala besar.

NCCL adalah pustaka komunikasi inti untuk pelatihan AI multi-GPU dan multinode, yang mendukung berbagai jalur komunikasi seperti PCIe, NVLink, maupun jaringan. Dalam versi terbaru ini, NCCL 2.26 menghadirkan sejumlah fitur baru yang sangat relevan untuk pengembang AI, ilmuwan data, dan praktisi komputasi berkinerja tinggi (HPC).

Beberapa sorotan penting dari pembaruan NCCL 2.26 meliputi:

  • Optimasi PAT (Parallel Aggregation Trees): Algoritma PAT kini menjalankan langkah komputasi dan eksekusi pada warp yang berbeda, mempercepat proses di lingkungan dengan banyak pohon paralel.
  • Implicit Launch Order: Mencegah deadlock saat beberapa komunikasi terjadi pada satu perangkat secara bersamaan, dengan pelacakan otomatis urutan peluncuran kernel.
  • Dukungan Profiler GPU dan Jaringan: Kini pengguna dapat memantau aktivitas kernel dan plugin jaringan secara lebih detail, memberikan visibilitas end-to-end terhadap proses komunikasi.
  • QoS Plugin Jaringan: Pengguna dapat mengatur prioritas lalu lintas jaringan antarkomunikator, penting dalam pelatihan model besar seperti LLM yang menggabungkan pipeline dan data parallelism.
  • Peningkatan RAS (Reliability, Availability, Serviceability): Deteksi lebih akurat terhadap mismatch operasi kolektif, pelaporan status komunikasi yang lebih jelas, dan pembersihan sumber daya yang lebih stabil.

Tak hanya itu, versi ini juga menyertakan berbagai perbaikan bug dan peningkatan kecil, seperti dukungan NIC langsung, penambahan timestamp pada log, dan deteksi yang lebih baik untuk lingkungan container.

Menurut rilis resmi NVIDIA yang dikutip oleh Astakom, “NCCL 2.26 dirancang untuk menjawab kebutuhan komunikasi AI modern yang semakin kompleks dan masif, sekaligus meningkatkan kemudahan debugging serta efisiensi jaringan.”

Untuk informasi teknis lebih lanjut atau kode sumber, pengguna dapat mengunjungi GitHub resmi NCCL atau menyaksikan sesi on-demand NCCL, The Inter-GPU Communication Library Powering Multi-GPU AI di ajang GTC 2025.

Rubrik Sama :

Belajar Jadi Masinis? Coba Akademi Masinis LRT Jakarta di Jakarta Fair 2025!

astakom, Jakarta - Dalam rangka memeriahkan HUT ke-498 Kota Jakarta, PT LRT Jakarta turut meramaikan gelaran Jakarta Fair Kemayoran (JFK) 2025 selama sepekan penuh,...

CEO OpenAI Sam Altman Meminta Pengguna untuk Tidak Terlalu Mempercayai ChatGPT

astakom, Jakarta – CEO OpenAI Sam Altman baru-baru ini mengingatkan agar pengguna tidak sepenuhnya percaya terhadap jawaban yang diberikan oleh chatbot AI milik Perusahaan...

Dunia Kripto Menahan Napas, Sidang Senat AS 9 Juli Bisa Jadi Titik Balik Global

astakom, Washington DC - Pasar aset digital global tengah menanti sidang krusial yang akan digelar oleh Komite Perbankan Senat Amerika Serikat pada Rabu, 9...

Indonesia Rancang Strategi AI Berbasis Pancasila, Dorong Inovasi yang Etis dan Inklusif

astakom, Jakarta - Pemerintah Indonesia tengah merancang strategi nasional kecerdasan buatan (AI) yang menempatkan etika dan nilai kemanusiaan sebagai fondasi utama. Pendekatan ini menandai...
Cover Majalah

Update