Používateľská príručka NVIDIA NeMo Framework

NVIDIA NeMo Framework User Guide

Logo NVIDIA

Rámec NVIDIA NeMo

Produkt NVIDIA-NeMo-Framework

Špecifikácie

  • Názov produktu: NVIDIA NeMo Framework
  • Ovplyvnené platformy: Windows, Linux, macOS
  • Ovplyvnené verzie: Všetky verzie pred 24
  • Chyba zabezpečenia: CVE-2025-23360
  • Základné skóre hodnotenia rizika: 7.1 (CVSS v3.1)

Návod na použitie produktu

Inštalácia aktualizácie zabezpečenia:
Ak chcete chrániť svoj systém, postupujte podľa týchto krokov:

  1. Stiahnite si najnovšiu verziu zo stránky NeMo-Framework-Launcher Releases na GitHub.
  2. Ďalšie informácie nájdete na stránke NVIDIA Product Security.

Podrobnosti aktualizácie zabezpečenia:
Aktualizácia zabezpečenia rieši chybu zabezpečenia v rámci NVIDIA NeMo Framework, ktorá by mohla viesť k spusteniu kódu a údajov.ampEring.

Aktualizácia softvéru:
Ak používate staršie vydanie vetvy, odporúča sa prejsť na najnovšie vydanie vetvy, aby ste vyriešili problém so zabezpečením.

Koniecview

NVIDIA NeMo Framework je škálovateľný a cloudovo natívny generatívny rámec AI vytvorený pre výskumníkov a vývojárov pracujúcich na Veľké jazykové modely, multimodálne a Umelá inteligencia reči (napr Automatické rozpoznávanie reči a Prevod textu na reč). Umožňuje používateľom efektívne vytvárať, prispôsobovať a nasadzovať nové generatívne modely AI využitím existujúceho kódu a vopred vyškolených kontrolných bodov modelu.

Pokyny na nastavenieNainštalujte NeMo Framework

Veľké jazykové modely a multimodálne modely
NeMo Framework poskytuje komplexnú podporu pre vývoj veľkých jazykových modelov (LLM) a multimodálnych modelov (MM). Poskytuje flexibilitu na použitie v priestoroch, v dátovom centre alebo u preferovaného poskytovateľa cloudu. Podporuje tiež spúšťanie v prostrediach s povoleným SLURM alebo Kubernetes.

_images/nemo-llm-mm-stack.png

Spracovanie údajov
Kurátor NeMo [1] je knižnica Pythonu, ktorá obsahuje sadu modulov na dolovanie údajov a generovanie syntetických údajov. Sú škálovateľné a optimalizované pre GPU, vďaka čomu sú ideálne na spracovanie údajov v prirodzenom jazyku na trénovanie alebo dolaďovanie LLM. S NeMo Curator môžete efektívne extrahovať vysokokvalitný text z rozsiahleho surového textu web dátové zdroje.

Školenie a prispôsobenie

NeMo Framework poskytuje nástroje na efektívne školenie a prispôsobenie LLM a multimodálne modely. Zahŕňa predvolené konfigurácie pre nastavenie výpočtového klastra, sťahovanie údajov a hyperparametre modelu, ktoré je možné upraviť tak, aby trénovali na nových súboroch údajov a modeloch. Okrem predtréningu podporuje NeMo techniky Supervised Fine-Tuning (SFT) a Parameter Efficient Fine-Tuning (PEFT), ako sú LoRA, Ptuning a ďalšie.

Na spustenie tréningu v NeMo sú k dispozícii dve možnosti – pomocou rozhrania API NeMo 2.0 alebo pomocou NeMo Run.

  • S NeMo Run (odporúčané): NeMo Run poskytuje rozhranie na zjednodušenie konfigurácie, vykonávania a správy experimentov v rôznych výpočtových prostrediach. To zahŕňa spúšťanie úloh na vašej pracovnej stanici lokálne alebo vo veľkých klastroch – s povoleným SLURM alebo Kubernetes v cloudovom prostredí.
    • Predtréning a rýchly štart PEFT s NeMo Run
  • Používanie NeMo 2.0 API: Táto metóda funguje dobre s jednoduchým nastavením zahŕňajúcim malé modely, alebo ak máte záujem napísať si vlastný dataloader, tréningové slučky alebo zmeniť vrstvy modelu. Poskytuje vám väčšiu flexibilitu a kontrolu nad konfiguráciami a uľahčuje programové rozšírenie a prispôsobenie konfigurácií.
    • TraRýchly štart s NeMo 2.0 API
    • Prechod z NeMo 1.0 na NeMo 2.0 API

Zarovnanie

  • NeMo-Aligner [1] je škálovateľná súprava nástrojov na efektívne zarovnanie modelov. Sada nástrojov má podporu pre najmodernejšie algoritmy zosúlaďovania modelov, ako sú SteerLM, DPO, Reinforcement Learning from Human Feedback (RLHF) a mnoho ďalších. Tieto algoritmy umožňujú používateľom zosúladiť jazykové modely tak, aby boli bezpečnejšie, neškodnejšie a užitočnejšie.
  • Všetky kontrolné body NeMo-Aligner sú krížovo kompatibilné s ekosystémom NeMo, čo umožňuje ďalšie prispôsobenie a nasadenie odvodzovania.

Postupný pracovný postup všetkých troch fáz RLHF na malom modeli GPT-2B:

  • Školenie SFT
  • Školenie modelu odmeňovania
  • Školenie PPO

Okrem toho demonštrujeme podporu pre rôzne ďalšie nové metódy zarovnania:

  • DPO: ľahký algoritmus zarovnania v porovnaní s RLHF s jednoduchšou stratovou funkciou.
  • Vlastná hra Jemné doladenie (SPIN)
  • SteerLM: technika založená na kondicionovanom SFT s riadeným výstupom.

Viac informácií nájdete v dokumentácii: Dokumentácia zarovnania

Multimodálne modely

  • NeMo Framework poskytuje optimalizovaný softvér na trénovanie a nasadzovanie najmodernejších multimodálnych modelov v niekoľkých kategóriách: Multimodálne jazykové modely, Vision-Language Foundations, Text-to-Image modely a nad rámec 2D generovania pomocou Neural Radiance Fields (NeRF).
  • Každá kategória je navrhnutá tak, aby vyhovovala špecifickým potrebám a pokrokom v tejto oblasti, pričom využíva najmodernejšie modely na spracovanie širokej škály typov údajov vrátane textu, obrázkov a 3D modelov.

Poznámka
Prebieha migrácia podpory pre multimodálne modely z NeMo 1.0 na NeMo 2.0. Ak chcete medzitým preskúmať túto doménu, pozrite si dokumentáciu k vydaniu NeMo 24.07 (predchádzajúca).

Nasadenie a odvodenie
Rámec NeMo poskytuje rôzne cesty pre odvodzovanie LLM, ktoré zodpovedajú rôznym scenárom nasadenia a potrebám výkonu.

Nasaďte s NVIDIA NIM

  • NeMo Framework sa bezproblémovo integruje s nástrojmi na nasadenie modelov na podnikovej úrovni prostredníctvom NVIDIA NIM. Táto integrácia je poháňaná technológiou NVIDIA TensorRT-LLM, ktorá zabezpečuje optimalizované a škálovateľné odvodenie.
  • Viac informácií o NIM nájdete na stránke NVIDIA webstránky.

Nasaďte s TensorRT-LLM alebo vLLM

  • NeMo Framework ponúka skripty a rozhrania API na export modelov do dvoch knižníc optimalizovaných pre odvodenie, TensorRT-LLM a vLLM, a na nasadenie exportovaného modelu pomocou servera NVIDIA Triton Inference Server.
  • Pre scenáre vyžadujúce optimalizovaný výkon môžu modely NeMo využiť TensorRT-LLM, špecializovanú knižnicu na zrýchlenie a optimalizáciu LLM odvodenia na GPU NVIDIA. Tento proces zahŕňa konverziu modelov NeMo do formátu kompatibilného s TensorRT-LLM pomocou modulu nemo.export.
    • Nasadenie LLM sa skončiloview
    • Nasaďte veľké jazykové modely NeMo pomocou NIM
    • Nasaďte veľké jazykové modely NeMo s TensorRT-LLM
    • Nasaďte veľké jazykové modely NeMo s vLLM

Podporované modely

Veľké jazykové modely

Veľké jazykové modely
Veľké jazykové modely Predškolenie a SFT PEFT Zarovnanie Konvergencia školení 8. RP TRT/TRTLLM Konvertovať do a z objímania tváre Hodnotenie
Lama3 8B/70B, Lama3.1 405B áno áno x Áno (čiastočne overené) áno Obaja áno
Mixtral 8x7B/8x22B áno áno x Áno (neoverené) áno Obaja áno
Nemotron 3 8B áno x x Áno (neoverené) x Obaja áno
Nemotron 4 340B áno x x Áno (neoverené) x Obaja áno
Baichuan2 7B áno áno x Áno (neoverené) x Obaja áno
ChatGLM3 6B áno áno x Áno (neoverené) x Obaja áno
Gemma 2B/7B áno áno x Áno (neoverené) áno Obaja áno
Gemma2 2B/9B/27B áno áno x Áno (neoverené) x Obaja áno
Mamba2 130M/370M/780M/1.3B/2.7B/8B/ Hybrid-8B áno áno x Áno (neoverené) x x áno
Phi3 mini 4k x áno x Áno (neoverené) x x x
Qwen2 0.5B/1.5B/7B/72B áno áno x Áno (neoverené) áno Obaja áno
StarCoder 15B áno áno x Áno (neoverené) áno Obaja áno
StarCoder2 3B/7B/15B áno áno x Áno (neoverené) áno Obaja áno
BERT 110M/340M áno áno x Áno (neoverené) x Obaja x
T5 220M/3B/11B áno áno x x x x x

 

Jazykové modely vízie

Jazykové modely vízie
Jazykové modely vízie Predškolenie a SFT PEFT Zarovnanie Konvergencia školení 8. RP TRT/TRTLLM Konvertovať do a z objímania tváre Hodnotenie
NeVA (LLaVA 1.5) áno áno x Áno (neoverené) x Od x
Lama 3.2 Vision 11B/90B áno áno x Áno (neoverené) x Od x
LLaVA Next (LLaVA 1.6) áno áno x Áno (neoverené) x Od x

 

Vkladanie modelov

Vkladanie modelov
Vkladanie jazykových modelov Predškolenie a SFT PEFT Zarovnanie Konvergencia školení 8. RP TRT/TRTLLM Konvertovať do a z objímania tváre Hodnotenie
SBERT 340M áno x x Áno (neoverené) x Obaja x
Lama 3.2 Vloženie 1B áno x x Áno (neoverené) x Obaja x

 

Modely svetových nadácií

Modely svetových nadácií
Modely svetových nadácií Po tréningu Zrýchlené vyvodzovanie
Cosmos-1.0-Diffusion-Text2World-7B áno áno
Cosmos-1.0-Diffusion-Text2World-14B áno áno
Cosmos-1.0-Diffusion-Video2World-7B Už čoskoro Už čoskoro
Cosmos-1.0-Diffusion-Video2World-14B Už čoskoro Už čoskoro
Cosmos-1.0-Autoregressive-4B áno áno
Cosmos-1.0-Autoregressive-Video2World-5B Už čoskoro Už čoskoro
Cosmos-1.0-Autoregressive-12B áno áno
Cosmos-1.0-Autoregressive-Video2World-13B Už čoskoro Už čoskoro

Poznámka
NeMo tiež podporuje predtrénovanie pre difúzne aj autoregresívne architektúry text2world základové modely.

Umelá inteligencia reči

Vývoj konverzačných modelov AI je zložitý proces, ktorý zahŕňa definovanie, konštruovanie a trénovanie modelov v rámci konkrétnych domén. Tento proces zvyčajne vyžaduje niekoľko iterácií na dosiahnutie vysokej úrovne presnosti. Často zahŕňa viacero iterácií na dosiahnutie vysokej presnosti, doladenie rôznych úloh a údajov špecifických pre doménu, zabezpečenie výkonu školenia a prípravu modelov na nasadenie odvodzovania.

_images/nemo-speech-ai.png

NeMo Framework poskytuje podporu pre školenie a prispôsobenie modelov Speech AI. To zahŕňa úlohy ako automatické rozpoznávanie reči (ASR) a syntéza prevodu textu na reč (TTS). Ponúka hladký prechod na produkčné nasadenie na podnikovej úrovni s NVIDIA Riva. Na pomoc vývojárom a výskumníkom obsahuje NeMo Framework najmodernejšie vopred vyškolené kontrolné body, nástroje na reprodukovateľné spracovanie dát reči a funkcie na interaktívne skúmanie a analýzu dátových súborov reči. Komponenty NeMo Framework for Speech AI sú nasledovné:

Školenie a prispôsobenie
NeMo Framework obsahuje všetko potrebné na trénovanie a prispôsobenie rečových modelov (ASRKlasifikácia rečiRozpoznávanie reproduktorovDiarizácia reproduktorovTTS) reprodukovateľným spôsobom.

Predtrénované modely SOTA

  • NeMo Framework poskytuje najmodernejšie recepty a niekoľko vopred vyškolených kontrolných bodov ASR a TTS modely, ako aj návod na ich načítanie.
  • Nástroje reči
  • NeMo Framework poskytuje sadu nástrojov užitočných na vývoj modelov ASR a TTS vrátane:
    • NeMo Forced Aligner (NFA) na generovanie timest na úrovni tokenu, slova a segmentuampreči vo zvuku pomocou modelov automatického rozpoznávania reči NeMo založených na CTC.
    • Rečový dátový procesor (SDP), súpravu nástrojov na zjednodušenie spracovania rečových dát. Umožňuje vám reprezentovať operácie spracovania údajov v konfigurácii fileminimalizuje štandardný kód a umožňuje reprodukovateľnosť a zdieľanie.
    • Speech Data Explorer (SDE), založený na Dash web aplikácia na interaktívne skúmanie a analýzu dátových súborov reči.
    • Nástroj na vytváranie množiny údajov ktorý poskytuje funkcie na zarovnanie dlhého zvuku files príslušnými prepismi a rozdeliť ich na kratšie fragmenty, ktoré sú vhodné pre modelový tréning automatického rozpoznávania reči (ASR).
    • Nástroj na porovnanie pre modely ASR na porovnanie predpovedí rôznych modelov ASR na úrovni presnosti slov a výpovede.
    • Hodnotiteľ ASR na vyhodnotenie výkonu modelov ASR a ďalších funkcií, ako je napríklad detekcia hlasovej aktivity.
    • Nástroj na normalizáciu textu na prevod textu z písanej formy do hovorenej formy a naopak (napr. „31.“ vs. „tridsať prvý“).
  • Cesta k nasadeniu
  • Modely NeMo, ktoré boli vyškolené alebo prispôsobené pomocou rámca NeMo, je možné optimalizovať a nasadiť pomocou NVIDIA Riva. Riva poskytuje kontajnery a grafy Helm špeciálne navrhnuté na automatizáciu krokov na nasadenie tlačidla.

Iné zdroje

GitHub Repos
  • NeMo: Hlavné úložisko pre NeMo Framework
  • NeMoBežať: Nástroj na konfiguráciu, spustenie a správu vašich experimentov strojového učenia.
  • NeMo-Aligner: Škálovateľná súprava nástrojov pre efektívne zarovnanie modelov
  • NeMo-kurátor: Škálovateľná súprava nástrojov na predbežné spracovanie a správu údajov pre LLM
Získanie pomoci
Zapojte sa do komunity NeMo, pýtajte sa, získajte podporu alebo nahláste chyby.
  • Diskusie NeMo
  • Problémy NeMo

Programovacie jazyky a rámce

  • Python: Hlavné rozhranie na používanie rámca NeMo
  • Pytorch: NeMo Framework je postavený na PyTorch

Licencie

  • NeMo Github repo je licencovaný pod licenciou Apache 2.0
  • NeMo Framework je licencovaný podľa DOHODY O PRODUKTE NVIDIA AI. Vytiahnutím a použitím kontajnera súhlasíte s podmienkami tejto licencie.
  • Kontajner NeMo Framework obsahuje materiály Llama, ktoré sa riadia licenčnou zmluvou komunity Meta Llama3.

Poznámky pod čiarou
V súčasnosti prebieha podpora NeMo Curator a NeMo Aligner pre multimodálne modely a bude k dispozícii veľmi skoro.

FAQ

Otázka: Ako môžem skontrolovať, či je môj systém ovplyvnený zraniteľnosťou?
Odpoveď: Môžete skontrolovať, či je váš systém ovplyvnený overením verzie nainštalovaného rámca NVIDIA NeMo Framework. Ak je nižšia ako verzia 24, váš systém môže byť zraniteľný.

Otázka: Kto nahlásil problém so zabezpečením CVE-2025-23360?
Odpoveď: Bezpečnostný problém nahlásil Or Peles – JFrog Security. NVIDIA uznáva ich prínos.

Otázka: Ako môžem v budúcnosti dostávať upozornenia na bulletin zabezpečenia?
Odpoveď: Navštívte stránku NVIDIA Product Security a prihláste sa na odber upozornení na bulletin zabezpečenia a buďte informovaní o aktualizáciách zabezpečenia produktu.

Dokumenty / zdroje

PDF thumbnailRámec NeMo
User Guide · NeMo Framework, NeMo, Framework

Referencie

Položiť otázku

Use this section to ask about setup, compatibility, troubleshooting, or anything missing from this manual.

Položiť otázku

Ask about setup, compatibility, troubleshooting, or anything missing from this manual. Name and email are optional.