Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 티스토리챌린지
- go
- PETERICA
- Linux
- Java
- kotlin
- 오블완
- MySQL
- CKA 기출문제
- 공부
- golang
- SRE
- Spring
- tucker의 go 언어 프로그래밍
- minikube
- aws
- 코틀린 코루틴의 정석
- CloudWatch
- AWS EKS
- Pinpoint
- 컨텍스트 엔지니어링
- 정보처리기사 실기 기출문제
- Kubernetes
- CKA
- APM
- 기록으로 실력을 쌓자
- AI
- kotlin coroutine
- 바이브코딩
- kotlin querydsl
Archives
- Today
- Total
목록quantization (1)
피터의 개발이야기
[AI] Peterica의 AI공부와 비젼 정리ㅁ 들어가며대형 LLM을 사용하다 보면 “양자화(Quantization)” 라는 용어를 자주 마주치게 된다.또 GPTQ, AWQ, GGUF, BNB(4bit/8bit 로딩) 등 다양한 방식이 존재하며,FP32·FP16·INT8·INT4 같은 비트 수도 함께 등장한다.이 글에서는 각 양자화 방식의 차이와비트 수와 메모리 관계를 가장 실질적인 관점에서 정리한다. ㅁ Quantization(양자화)란? Quantization(양자화)라는 용어의 본질적인 의미 자체가 “연속적인 값을 이산화(discretize)한다”는 것이다.그래서 컴퓨터 비전, 신호 처리, 음성 코덱, 이미지 압축, 뉴럴넷 등 분야를 막론하고 연속적(continuous) 값을 유한한 정수 집합(d..
AI
2025. 12. 11. 09:21
