
Rámec NVIDIA NeMo

Špecifikácie
- Názov produktu: NVIDIA NeMo Framework
- Ovplyvnené platformy: Windows, Linux, macOS
- Ovplyvnené verzie: Všetky verzie pred 24
- Chyba zabezpečenia: CVE-2025-23360
- Základné skóre hodnotenia rizika: 7.1 (CVSS v3.1)
Návod na použitie produktu
Inštalácia aktualizácie zabezpečenia:
Ak chcete chrániť svoj systém, postupujte podľa týchto krokov:
- Stiahnite si najnovšiu verziu zo stránky NeMo-Framework-Launcher Releases na GitHub.
- Ďalšie informácie nájdete na stránke NVIDIA Product Security.
Podrobnosti aktualizácie zabezpečenia:
Aktualizácia zabezpečenia rieši chybu zabezpečenia v rámci NVIDIA NeMo Framework, ktorá by mohla viesť k spusteniu kódu a údajov.ampEring.
Aktualizácia softvéru:
Ak používate staršie vydanie vetvy, odporúča sa prejsť na najnovšie vydanie vetvy, aby ste vyriešili problém so zabezpečením.
Koniecview
NVIDIA NeMo Framework je škálovateľný a cloudovo natívny generatívny rámec AI vytvorený pre výskumníkov a vývojárov pracujúcich na Veľké jazykové modely, multimodálne a Umelá inteligencia reči (napr Automatické rozpoznávanie reči a Prevod textu na reč). Umožňuje používateľom efektívne vytvárať, prispôsobovať a nasadzovať nové generatívne modely AI využitím existujúceho kódu a vopred vyškolených kontrolných bodov modelu.
Pokyny na nastavenie: Nainštalujte NeMo Framework
NeMo Framework poskytuje komplexnú podporu pre vývoj veľkých jazykových modelov (LLM) a multimodálnych modelov (MM). Poskytuje flexibilitu na použitie v priestoroch, v dátovom centre alebo u preferovaného poskytovateľa cloudu. Podporuje tiež spúšťanie v prostrediach s povoleným SLURM alebo Kubernetes.

Spracovanie údajov
Kurátor NeMo [1] je knižnica Pythonu, ktorá obsahuje sadu modulov na dolovanie údajov a generovanie syntetických údajov. Sú škálovateľné a optimalizované pre GPU, vďaka čomu sú ideálne na spracovanie údajov v prirodzenom jazyku na trénovanie alebo dolaďovanie LLM. S NeMo Curator môžete efektívne extrahovať vysokokvalitný text z rozsiahleho surového textu web dátové zdroje.
Školenie a prispôsobenie
NeMo Framework poskytuje nástroje na efektívne školenie a prispôsobenie LLM a multimodálne modely. Zahŕňa predvolené konfigurácie pre nastavenie výpočtového klastra, sťahovanie údajov a hyperparametre modelu, ktoré je možné upraviť tak, aby trénovali na nových súboroch údajov a modeloch. Okrem predtréningu podporuje NeMo techniky Supervised Fine-Tuning (SFT) a Parameter Efficient Fine-Tuning (PEFT), ako sú LoRA, Ptuning a ďalšie.
Na spustenie tréningu v NeMo sú k dispozícii dve možnosti – pomocou rozhrania API NeMo 2.0 alebo pomocou NeMo Run.
- S NeMo Run (odporúčané): NeMo Run poskytuje rozhranie na zjednodušenie konfigurácie, vykonávania a správy experimentov v rôznych výpočtových prostrediach. To zahŕňa spúšťanie úloh na vašej pracovnej stanici lokálne alebo vo veľkých klastroch – s povoleným SLURM alebo Kubernetes v cloudovom prostredí.
- Predtréning a rýchly štart PEFT s NeMo Run
- Používanie NeMo 2.0 API: Táto metóda funguje dobre s jednoduchým nastavením zahŕňajúcim malé modely, alebo ak máte záujem napísať si vlastný dataloader, tréningové slučky alebo zmeniť vrstvy modelu. Poskytuje vám väčšiu flexibilitu a kontrolu nad konfiguráciami a uľahčuje programové rozšírenie a prispôsobenie konfigurácií.
-
TraRýchly štart s NeMo 2.0 API
-
Prechod z NeMo 1.0 na NeMo 2.0 API
-
Zarovnanie
- NeMo-Aligner [1] je škálovateľná súprava nástrojov na efektívne zarovnanie modelov. Sada nástrojov má podporu pre najmodernejšie algoritmy zosúlaďovania modelov, ako sú SteerLM, DPO, Reinforcement Learning from Human Feedback (RLHF) a mnoho ďalších. Tieto algoritmy umožňujú používateľom zosúladiť jazykové modely tak, aby boli bezpečnejšie, neškodnejšie a užitočnejšie.
- Všetky kontrolné body NeMo-Aligner sú krížovo kompatibilné s ekosystémom NeMo, čo umožňuje ďalšie prispôsobenie a nasadenie odvodzovania.
Postupný pracovný postup všetkých troch fáz RLHF na malom modeli GPT-2B:
- Školenie SFT
- Školenie modelu odmeňovania
- Školenie PPO
Okrem toho demonštrujeme podporu pre rôzne ďalšie nové metódy zarovnania:
- DPO: ľahký algoritmus zarovnania v porovnaní s RLHF s jednoduchšou stratovou funkciou.
- Vlastná hra Jemné doladenie (SPIN)
- SteerLM: technika založená na kondicionovanom SFT s riadeným výstupom.
Viac informácií nájdete v dokumentácii: Dokumentácia zarovnania
Multimodálne modely
- NeMo Framework poskytuje optimalizovaný softvér na trénovanie a nasadzovanie najmodernejších multimodálnych modelov v niekoľkých kategóriách: Multimodálne jazykové modely, Vision-Language Foundations, Text-to-Image modely a nad rámec 2D generovania pomocou Neural Radiance Fields (NeRF).
- Každá kategória je navrhnutá tak, aby vyhovovala špecifickým potrebám a pokrokom v tejto oblasti, pričom využíva najmodernejšie modely na spracovanie širokej škály typov údajov vrátane textu, obrázkov a 3D modelov.
Poznámka
Prebieha migrácia podpory pre multimodálne modely z NeMo 1.0 na NeMo 2.0. Ak chcete medzitým preskúmať túto doménu, pozrite si dokumentáciu k vydaniu NeMo 24.07 (predchádzajúca).
Nasadenie a odvodenie
Rámec NeMo poskytuje rôzne cesty pre odvodzovanie LLM, ktoré zodpovedajú rôznym scenárom nasadenia a potrebám výkonu.
Nasaďte s NVIDIA NIM
- NeMo Framework sa bezproblémovo integruje s nástrojmi na nasadenie modelov na podnikovej úrovni prostredníctvom NVIDIA NIM. Táto integrácia je poháňaná technológiou NVIDIA TensorRT-LLM, ktorá zabezpečuje optimalizované a škálovateľné odvodenie.
- Viac informácií o NIM nájdete na stránke NVIDIA webstránky.
Nasaďte s TensorRT-LLM alebo vLLM
- NeMo Framework ponúka skripty a rozhrania API na export modelov do dvoch knižníc optimalizovaných pre odvodenie, TensorRT-LLM a vLLM, a na nasadenie exportovaného modelu pomocou servera NVIDIA Triton Inference Server.
- Pre scenáre vyžadujúce optimalizovaný výkon môžu modely NeMo využiť TensorRT-LLM, špecializovanú knižnicu na zrýchlenie a optimalizáciu LLM odvodenia na GPU NVIDIA. Tento proces zahŕňa konverziu modelov NeMo do formátu kompatibilného s TensorRT-LLM pomocou modulu nemo.export.
- Nasadenie LLM sa skončiloview
- Nasaďte veľké jazykové modely NeMo pomocou NIM
- Nasaďte veľké jazykové modely NeMo s TensorRT-LLM
- Nasaďte veľké jazykové modely NeMo s vLLM
Podporované modely
Veľké jazykové modely
| Veľké jazykové modely | Predškolenie a SFT | PEFT | Zarovnanie | Konvergencia školení 8. RP | TRT/TRTLLM | Konvertovať do a z objímania tváre | Hodnotenie |
|---|---|---|---|---|---|---|---|
| Lama3 8B/70B, Lama3.1 405B | áno | áno | x | Áno (čiastočne overené) | áno | Obaja | áno |
| Mixtral 8x7B/8x22B | áno | áno | x | Áno (neoverené) | áno | Obaja | áno |
| Nemotron 3 8B | áno | x | x | Áno (neoverené) | x | Obaja | áno |
| Nemotron 4 340B | áno | x | x | Áno (neoverené) | x | Obaja | áno |
| Baichuan2 7B | áno | áno | x | Áno (neoverené) | x | Obaja | áno |
| ChatGLM3 6B | áno | áno | x | Áno (neoverené) | x | Obaja | áno |
| Gemma 2B/7B | áno | áno | x | Áno (neoverené) | áno | Obaja | áno |
| Gemma2 2B/9B/27B | áno | áno | x | Áno (neoverené) | x | Obaja | áno |
| Mamba2 130M/370M/780M/1.3B/2.7B/8B/ Hybrid-8B | áno | áno | x | Áno (neoverené) | x | x | áno |
| Phi3 mini 4k | x | áno | x | Áno (neoverené) | x | x | x |
| Qwen2 0.5B/1.5B/7B/72B | áno | áno | x | Áno (neoverené) | áno | Obaja | áno |
| StarCoder 15B | áno | áno | x | Áno (neoverené) | áno | Obaja | áno |
| StarCoder2 3B/7B/15B | áno | áno | x | Áno (neoverené) | áno | Obaja | áno |
| BERT 110M/340M | áno | áno | x | Áno (neoverené) | x | Obaja | x |
| T5 220M/3B/11B | áno | áno | x | x | x | x | x |
Jazykové modely vízie
| Jazykové modely vízie | Predškolenie a SFT | PEFT | Zarovnanie | Konvergencia školení 8. RP | TRT/TRTLLM | Konvertovať do a z objímania tváre | Hodnotenie |
|---|---|---|---|---|---|---|---|
| NeVA (LLaVA 1.5) | áno | áno | x | Áno (neoverené) | x | Od | x |
| Lama 3.2 Vision 11B/90B | áno | áno | x | Áno (neoverené) | x | Od | x |
| LLaVA Next (LLaVA 1.6) | áno | áno | x | Áno (neoverené) | x | Od | x |
Vkladanie modelov
| Vkladanie jazykových modelov | Predškolenie a SFT | PEFT | Zarovnanie | Konvergencia školení 8. RP | TRT/TRTLLM | Konvertovať do a z objímania tváre | Hodnotenie |
|---|---|---|---|---|---|---|---|
| SBERT 340M | áno | x | x | Áno (neoverené) | x | Obaja | x |
| Lama 3.2 Vloženie 1B | áno | x | x | Áno (neoverené) | x | Obaja | x |
Modely svetových nadácií
| Modely svetových nadácií | Po tréningu | Zrýchlené vyvodzovanie |
|---|---|---|
| Cosmos-1.0-Diffusion-Text2World-7B | áno | áno |
| Cosmos-1.0-Diffusion-Text2World-14B | áno | áno |
| Cosmos-1.0-Diffusion-Video2World-7B | Už čoskoro | Už čoskoro |
| Cosmos-1.0-Diffusion-Video2World-14B | Už čoskoro | Už čoskoro |
| Cosmos-1.0-Autoregressive-4B | áno | áno |
| Cosmos-1.0-Autoregressive-Video2World-5B | Už čoskoro | Už čoskoro |
| Cosmos-1.0-Autoregressive-12B | áno | áno |
| Cosmos-1.0-Autoregressive-Video2World-13B | Už čoskoro | Už čoskoro |
Poznámka
NeMo tiež podporuje predtrénovanie pre difúzne aj autoregresívne architektúry text2world základové modely.
Umelá inteligencia reči
Vývoj konverzačných modelov AI je zložitý proces, ktorý zahŕňa definovanie, konštruovanie a trénovanie modelov v rámci konkrétnych domén. Tento proces zvyčajne vyžaduje niekoľko iterácií na dosiahnutie vysokej úrovne presnosti. Často zahŕňa viacero iterácií na dosiahnutie vysokej presnosti, doladenie rôznych úloh a údajov špecifických pre doménu, zabezpečenie výkonu školenia a prípravu modelov na nasadenie odvodzovania.

NeMo Framework poskytuje podporu pre školenie a prispôsobenie modelov Speech AI. To zahŕňa úlohy ako automatické rozpoznávanie reči (ASR) a syntéza prevodu textu na reč (TTS). Ponúka hladký prechod na produkčné nasadenie na podnikovej úrovni s NVIDIA Riva. Na pomoc vývojárom a výskumníkom obsahuje NeMo Framework najmodernejšie vopred vyškolené kontrolné body, nástroje na reprodukovateľné spracovanie dát reči a funkcie na interaktívne skúmanie a analýzu dátových súborov reči. Komponenty NeMo Framework for Speech AI sú nasledovné:
Školenie a prispôsobenie
NeMo Framework obsahuje všetko potrebné na trénovanie a prispôsobenie rečových modelov (ASR, Klasifikácia reči, Rozpoznávanie reproduktorov, Diarizácia reproduktorova TTS) reprodukovateľným spôsobom.
Predtrénované modely SOTA
- NeMo Framework poskytuje najmodernejšie recepty a niekoľko vopred vyškolených kontrolných bodov ASR a TTS modely, ako aj návod na ich načítanie.
- Nástroje reči
- NeMo Framework poskytuje sadu nástrojov užitočných na vývoj modelov ASR a TTS vrátane:
- NeMo Forced Aligner (NFA) na generovanie timest na úrovni tokenu, slova a segmentuampreči vo zvuku pomocou modelov automatického rozpoznávania reči NeMo založených na CTC.
- Rečový dátový procesor (SDP), súpravu nástrojov na zjednodušenie spracovania rečových dát. Umožňuje vám reprezentovať operácie spracovania údajov v konfigurácii fileminimalizuje štandardný kód a umožňuje reprodukovateľnosť a zdieľanie.
- Speech Data Explorer (SDE), založený na Dash web aplikácia na interaktívne skúmanie a analýzu dátových súborov reči.
- Nástroj na vytváranie množiny údajov ktorý poskytuje funkcie na zarovnanie dlhého zvuku files príslušnými prepismi a rozdeliť ich na kratšie fragmenty, ktoré sú vhodné pre modelový tréning automatického rozpoznávania reči (ASR).
- Nástroj na porovnanie pre modely ASR na porovnanie predpovedí rôznych modelov ASR na úrovni presnosti slov a výpovede.
- Hodnotiteľ ASR na vyhodnotenie výkonu modelov ASR a ďalších funkcií, ako je napríklad detekcia hlasovej aktivity.
- Nástroj na normalizáciu textu na prevod textu z písanej formy do hovorenej formy a naopak (napr. „31.“ vs. „tridsať prvý“).
- Cesta k nasadeniu
- Modely NeMo, ktoré boli vyškolené alebo prispôsobené pomocou rámca NeMo, je možné optimalizovať a nasadiť pomocou NVIDIA Riva. Riva poskytuje kontajnery a grafy Helm špeciálne navrhnuté na automatizáciu krokov na nasadenie tlačidla.
Iné zdroje
- NeMo: Hlavné úložisko pre NeMo Framework
- NeMo–Bežať: Nástroj na konfiguráciu, spustenie a správu vašich experimentov strojového učenia.
- NeMo-Aligner: Škálovateľná súprava nástrojov pre efektívne zarovnanie modelov
- NeMo-kurátor: Škálovateľná súprava nástrojov na predbežné spracovanie a správu údajov pre LLM
Zapojte sa do komunity NeMo, pýtajte sa, získajte podporu alebo nahláste chyby.
- Diskusie NeMo
- Problémy NeMo
Programovacie jazyky a rámce
- Python: Hlavné rozhranie na používanie rámca NeMo
- Pytorch: NeMo Framework je postavený na PyTorch
Licencie
- NeMo Github repo je licencovaný pod licenciou Apache 2.0
- NeMo Framework je licencovaný podľa DOHODY O PRODUKTE NVIDIA AI. Vytiahnutím a použitím kontajnera súhlasíte s podmienkami tejto licencie.
- Kontajner NeMo Framework obsahuje materiály Llama, ktoré sa riadia licenčnou zmluvou komunity Meta Llama3.
Poznámky pod čiarou
V súčasnosti prebieha podpora NeMo Curator a NeMo Aligner pre multimodálne modely a bude k dispozícii veľmi skoro.
FAQ
Otázka: Ako môžem skontrolovať, či je môj systém ovplyvnený zraniteľnosťou?
Odpoveď: Môžete skontrolovať, či je váš systém ovplyvnený overením verzie nainštalovaného rámca NVIDIA NeMo Framework. Ak je nižšia ako verzia 24, váš systém môže byť zraniteľný.
Otázka: Kto nahlásil problém so zabezpečením CVE-2025-23360?
Odpoveď: Bezpečnostný problém nahlásil Or Peles – JFrog Security. NVIDIA uznáva ich prínos.
Otázka: Ako môžem v budúcnosti dostávať upozornenia na bulletin zabezpečenia?
Odpoveď: Navštívte stránku NVIDIA Product Security a prihláste sa na odber upozornení na bulletin zabezpečenia a buďte informovaní o aktualizáciách zabezpečenia produktu.
Dokumenty / zdroje
![]() | Rámec NeMo |
Referencie
- Používateľská príručkamanual.tools

