Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
Tags
- kotlin
- Kubernetes
- SRE
- Linux
- PETERICA
- 정보처리기사 실기 기출문제
- APM
- AI
- aws
- CloudWatch
- MySQL
- Spring
- 오블완
- CKA 기출문제
- tucker의 go 언어 프로그래밍
- Java
- Pinpoint
- go
- golang
- 티스토리챌린지
- minikube
- 바이브코딩
- CKA
- 기록으로 실력을 쌓자
- 공부
- 컨텍스트 엔지니어링
- AWS EKS
- 코틀린 코루틴의 정석
- LLM
- kotlin coroutine
Archives
- Today
- Total
목록quantization (1)
피터의 개발이야기
[AI] Peterica의 AI공부와 비젼 정리ㅁ 들어가며대형 LLM을 사용하다 보면 “양자화(Quantization)” 라는 용어를 자주 마주치게 된다.또 GPTQ, AWQ, GGUF, BNB(4bit/8bit 로딩) 등 다양한 방식이 존재하며,FP32·FP16·INT8·INT4 같은 비트 수도 함께 등장한다.이 글에서는 각 양자화 방식의 차이와비트 수와 메모리 관계를 가장 실질적인 관점에서 정리한다. ㅁ Quantization(양자화)란? Quantization(양자화)라는 용어의 본질적인 의미 자체가 “연속적인 값을 이산화(discretize)한다”는 것이다.그래서 컴퓨터 비전, 신호 처리, 음성 코덱, 이미지 압축, 뉴럴넷 등 분야를 막론하고 연속적(continuous) 값을 유한한 정수 집합(d..
AI
2025. 12. 11. 09:21
