0 отзывов
Тарифная модель
Аудитория
build.nvidia.com доступен из РФ. Бесплатный API для тестирования.
Nemotron — семейство AI-моделей от NVIDIA, оптимизированных для максимальной производительности на GPU. NVIDIA использует собственные модели как showcase для своего оборудования, предлагая впечатляющее качество с минимальной задержкой.
Nemotron модели оптимизированы с помощью TensorRT-LLM для максимальной скорости вывода на GPU NVIDIA. Они доступны через NVIDIA API Catalog (build.nvidia.com) и через NIM — контейнеры для развёртывания на собственных GPU.
Nemotron 3 Super предлагает 120B параметров с 12B активными (MoE), обеспечивая отличный баланс качества и скорости. Модели доступны через бесплатный API для тестирования и через NIM для продакшен-развёртывания.
Nemotron идеален для компаний с собственными GPU-кластерами NVIDIA, которым нужны оптимизированные модели. Также подходит разработчикам для быстрого прототипирования через бесплатный API.
Максимальная производительность на GPU NVIDIA с TensorRT-LLM оптимизацией
Готовые контейнеры для развёртывания моделей на собственных GPU за минуты
Оптимизированный inference с минимальной задержкой для real-time приложений
Тестовый доступ через build.nvidia.com без оплаты для прототипирования
120B параметров с 12B активными — высокое качество при умеренных затратах
NeMo Framework для дообучения и адаптации моделей на собственных данных
Начните бесплатно — регистрация занимает пару минут
Перейти на Nemotron (NVIDIA)0 отзывов