NVIDIA представила новый программный инструментарий для разработчиков ИИ, работающих с речевыми и языковыми моделями. Эти задачи требуют сложных моделей обучения нейронных сетей и экспериментов с разными моделями. NVIDIA NeMo — набор инструментов с открытым исходным кодом и бэкэндом PyTorch. NeMo позволяет легко создавать сложные архитектуры нейронных сетей, используя повторно используемые компоненты. NeMo использует вычисления смешанной точности для достижения максимальной производительности с помощью тензорных ядер в GPU Aphere. Поддерживается масштабирование обучения для систем с несколькими графическими процессорами и кластеров с несколькими узлами.
В основе NeMo лежит концепция нейронного модуля. Нейронный модуль принимает набор входных данных и вычисляет набор выходных данных. Его можно рассматривать как абстракцию, которая находится где-то между слоем и полной нейронной сетью. Входы и выходы нейронного модуля имеют нейронный тип. Он включает семантику, порядок осей и размеры тензора ввода/вывода. NeMo поставляется с обширными коллекциями модулей для ASR, NLP и преобразования текста в речь TTS. Можно легко создавать разные модели, связывая их вместе и обеспечивая семантическую совместимость.
NVIDIA NeMo доступен на GitHub