| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 | 31 |
- go
- CKA 기출문제
- 컨텍스트 엔지니어링
- tucker의 go 언어 프로그래밍
- golang
- Java
- Spring
- APM
- LLM
- CloudWatch
- Kubernetes
- MySQL
- 오블완
- AI
- 코틀린 코루틴의 정석
- 기록으로 실력을 쌓자
- aws
- minikube
- 정보처리기사 실기 기출문제
- kotlin
- 바이브코딩
- kotlin coroutine
- Linux
- Pinpoint
- PETERICA
- AWS EKS
- 공부
- 티스토리챌린지
- CKA
- SRE
- Today
- Total
피터의 개발이야기
[AI] 최신 언어 모델인 Mistral NeMo 12B 본문

ㅁ 들어가며
ㅇ Mistral AI and NVIDIA Unveil Mistral NeMo 12B, a Cutting-Edge Enterprise AI Model이 기사의 내용을 보고 요약 정리하였다.
ㅁ Mistral NeMo 12B란?
Mistral AI와 NVIDIA는 최신 언어 모델인 Mistral NeMo 12B를 발표했다. 이 모델은 엔터프라이즈 애플리케이션을 위한 챗봇, 다국어 작업, 코딩, 요약 등의 작업에 쉽게 맞춤화 및 배포할 수 있다. Mistral AI의 데이터 훈련 전문성과 NVIDIA의 최적화된 하드웨어 및 소프트웨어 생태계를 결합하여 높은 성능을 제공한다.
ㅁ 플랫폼
Mistral NeMo는 NVIDIA DGX Cloud AI 플랫폼에서 훈련되었으며, NVIDIA TensorRT-LLM과 NeMo 개발 플랫폼을 사용하여 최적화되었다. 이 모델은 128K 컨텍스트 길이를 가지고 있어 복잡한 정보를 더 잘 처리하며, FP8 데이터 형식을 사용하여 메모리 크기를 줄이고 배포 속도를 높인다.
ㅁ 사양
Mistral NeMo는 NVIDIA NIM 추론 마이크로서비스로 제공되며, 다양한 애플리케이션에 쉽게 배포할 수 있는 유연성을 제공한다. 또한, 엔터프라이즈급 소프트웨어와 보안, 지원을 포함하여 신뢰할 수 있는 성능을 제공한다. 이 모델은 NVIDIA L40S, GeForce RTX 4090, RTX 4500 GPU의 메모리에 적합하도록 설계되었으며, 높은 효율성과 낮은 컴퓨팅 비용을 자랑한다.
ㅁ Megatron-LM
Mistral NeMo는 NVIDIA의 전체 스택을 활용하여 최적의 성능을 위해 설계되었으며, Megatron-LM을 사용하여 훈련되었다. 이 모델은 클라우드, 데이터 센터, RTX 워크스테이션 등 어디서나 실행할 수 있어 다양한 플랫폼에서 AI 애플리케이션을 혁신할 준비가 되어 있다.
'AI > AI이론 | 공부' 카테고리의 다른 글
| [AI] 언어 모델의 병렬처리를 가능하게 한 트렌스포머(Transformer) 기술 (4) | 2024.09.01 |
|---|---|
| [AI] Productivity Paradox란? (1) | 2024.08.31 |
| [AI] 멀티모달(Multi Modal) AI란? (1) | 2024.08.30 |
| [AI] 인공지능에 대한 이해(2017에 정리한 리포트) (0) | 2024.08.24 |
| [AI] ChatGPT를 Fine-tuning 한다는 것은? (1) | 2023.05.01 |
