Версия для печати

Сейчас искусственный интеллект стал главным вектором развития технологической индустрии. За последние несколько лет генеративные ИИ буквально ворвались в нашу жизнь, а поставки серверного оборудования для дата-центров стали основным рынком для производителей «железа» и видеокарт. Но началось все со старых графических карт GeForce GTX 580 на архитектуре Fermi.

Дженсен Хуанг в подкасте Джо Рогана раскрыл историю того, как NVIDIA сконцентрировалась на направлении ИИ. Все начиналось с исследователей из Университета Торонто, которые работали над глубоким обучением для лучшего распознавания изображений в системах компьютерного зрения. В 2011 году Алекс Крижевский, Илья Суцкевер (один из сооснователей OpenAI) и Джеффри Хинтон работали над разработкой новых эффективных методов, которые были бы эффективнее существующих решений. Они разработали сеть AlexNet с архитектурой из 8 слоев и 60 миллионов параметров, которая стала прообразом современных нейросетей. Обучение производилось на системе с двумя GeForce GTX 580 в режиме SLI. Эти видеокарты оснащались 3 ГБ памяти, что на тот момент тоже было достаточно много. Оказалось, что графические процессоры с их архитектурой, которая эффективна в параллельных вычислениях, хорошо подходит и под задачи ИИ.

GeForce GTX 580 стала первой видеокартой, которая использовалась для ИИ. А сеть AlexNet показала высокую эффективность и превзошла на 70% все другие решения для распознавания изображения. Это стало сигналом для NVIDIA, которая до этого момента не инвестировала в направлении ИИ, но с 2012 года сконцентрировала усилия на этом направлении. В 2016 году представлена первая серверная система DGX для ИИ, которую лично отправили Илону Маску, а в 2017 году запущен специализированный ускоритель вычислений Volta на чипе GV100 с тензорными ядрами. С 2018 года тензорные ядра появились в потребительском сегменте в видеокартах GeForce RTX 20 Turing.

Отметим, что самой технологии нейронных сетей много десятков лет, но ранее все упиралось в сложность вычислений. Лишь 10-15 лет назад вычислительная техника подошла к тому порогу, когда реализация таких сетей позволила ввести их в массовую жизнь.