교육 개요
일수/시간 | 1일 / 6시간 | 난이도 | 입문 | ||
---|---|---|---|---|---|
강사 | 한컴아카데미 소속 / NVIDIA 인증 강사 | ||||
매니저 | 정승호 (031-622-7684) | "교육 신청 전 문의 주시기 바랍니다." | ||||
교육비 | 1인당 400,000원 (VAT포함) | ||||
정원 | 20명 | ||||
실습환경 | PyTorch, NVIDIA NeMo™ Framework, DeepSpeed, Slurm, TensorRT-LLM |
교육 소개 및 목적
자연어 처리, 컴퓨터 비전 또는 음성 AI에 적용되는지 여부에 관계없이 LLM(대형 언어 모델) 및 DNN(심층 신경망)은 특정 특성을 갖습니다.
LLM과 DNN이 점점 더 커지고 점점 더 큰 데이터 세트에 대해 훈련됨에 따라 소수의 훈련 예제만으로 새로운 작업에 적응할 수 있어
일반 인공 지능을 향한 경로가 가속화됩니다.
방대한 데이터세트에 수백억에서 수천억 개의 매개변수가 포함된 학습 모델은 결코 쉽지 않으며,
AI, 고성능 컴퓨팅(HPC) 및 시스템 지식의 고유한 조합이 필요합니다.
이 과정의 목표는 신경망을 훈련하고 이를 배포하는 방법을 보여주는 것입니다.
교육 대상
· 대규모 모델 을 활용하여 문제를 해결하고자 하는 사람
· NVIDIA NeMo™ 프레임워크에 대해 알고자 하는 사람
· 대형 신경망에 대해 알고자 하는 사람
교육 효과
· 여러 서버에 걸친 신경망 훈련
· 활성화 체크포인트, 경사 누적, 다양한 형태의 모델 병렬 처리 등의 기술을 사용하여 대규모 모델 메모리 공간과 관련된 문제를 극복
· 훈련 성능 특성을 포착하고 이해하여 모델 아키텍처 최적화
· NVIDIA® TensorRT™-LLM을 사용하여 대규모 다중 GPU 모델을 프로덕션에 배포
커리큘럼
한컴아카데미 NVIDIA DLI 전체 교육과정
가속 컴퓨팅 기초: CUDA Python
| |||
다중 GPU로 CUDA C++ 애플리케이션 가속화
| 딥러닝 기초
| ||
Al 사이버 보안 파이프라인 구축
| 모델 병렬처리: 대규모 신경망 구축 및 배포
| ||
데이터 병렬화: 다중 GPU 딥러닝 모델 훈련
|
교육 개요
일수/시간 | 1일 / 6시간 | 난이도 | 입문 | ||
---|---|---|---|---|---|
강사 | 한컴아카데미 소속 / NVIDIA 인증 강사 | ||||
매니저 | 정승호 (031-622-7684) | "교육 신청 전 문의 주시기 바랍니다." | ||||
교육비 | 1인당 400,000원 (VAT포함) | ||||
정원 | 20명 | ||||
실습환경 | PyTorch, NVIDIA NeMo™ Framework, DeepSpeed, Slurm, TensorRT-LLM |
교육 소개 및 목적
자연어 처리, 컴퓨터 비전 또는 음성 AI에 적용되는지 여부에 관계없이 LLM(대형 언어 모델) 및 DNN(심층 신경망)은 특정 특성을 갖습니다.
LLM과 DNN이 점점 더 커지고 점점 더 큰 데이터 세트에 대해 훈련됨에 따라 소수의 훈련 예제만으로 새로운 작업에 적응할 수 있어
일반 인공 지능을 향한 경로가 가속화됩니다.
방대한 데이터세트에 수백억에서 수천억 개의 매개변수가 포함된 학습 모델은 결코 쉽지 않으며,
AI, 고성능 컴퓨팅(HPC) 및 시스템 지식의 고유한 조합이 필요합니다.
이 과정의 목표는 신경망을 훈련하고 이를 배포하는 방법을 보여주는 것입니다.
교육 대상
· 대규모 모델 을 활용하여 문제를 해결하고자 하는 사람
· NVIDIA NeMo™ 프레임워크에 대해 알고자 하는 사람
· 대형 신경망에 대해 알고자 하는 사람
교육 효과
· 여러 서버에 걸친 신경망 훈련
· 활성화 체크포인트, 경사 누적, 다양한 형태의 모델 병렬 처리 등의 기술을 사용하여 대규모 모델 메모리 공간과 관련된 문제를 극복
· 훈련 성능 특성을 포착하고 이해하여 모델 아키텍처 최적화
· NVIDIA® TensorRT™-LLM을 사용하여 대규모 다중 GPU 모델을 프로덕션에 배포
커리큘럼
한컴아카데미 NVIDIA DLI 전체 교육과정
가속 컴퓨팅 기초: CUDA Python
| |||
다중 GPU로 CUDA C++ 애플리케이션 가속화
| 딥러닝 기초
| ||
Al 사이버 보안 파이프라인 구축
| 모델 병렬처리: 대규모 신경망 구축 및 배포
| ||
데이터 병렬화: 다중 GPU 딥러닝 모델 훈련
|
연관 상품