일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- CloudWatch
- 공부
- Spring
- Pinpoint
- 정보처리기사실기 기출문제
- 코틀린 코루틴의 정석
- 티스토리챌린지
- CKA
- minikube
- kotlin spring
- IntelliJ
- Java
- 정보처리기사 실기
- kotlin
- kotlin coroutine
- MySQL
- 기록으로 실력을 쌓자
- Linux
- 오블완
- kotlin querydsl
- CKA 기출문제
- AI
- 정보처리기사 실기 기출문제
- APM
- AWS EKS
- PETERICA
- mysql 튜닝
- Elasticsearch
- Kubernetes
- aws
- Today
- Total
목록강화학습 (2)
피터의 개발이야기
ㅁ 관련글ㅇ [AI] Peterica의 AI공부와 비젼 정리ㅁ 들어가며ㅇ 인공지능(AI) 분야에서 기계학습(Machine Learning)인 강화(reinforement)학습과 다른 기계학습은 두 가지 주요한 학습 방법이다.ㅇ 말 그대로 Machine Learning은 인공지능을 학습 시키는 방법으로 두 가지 주요 방법은 각각 고유한 특성과 적용 분야를 가지고 있어 비교해볼 만한 가치가 있다. ㅁ 기계학습의 분류ㅇ 기계학습에는 지도학습과 비지도학습, 강화 학습으로 분류된다.ㅇ 기계학습은 인공지능이라 부르기도 하고 데이터를 사용한다는 공통점이 있다.ㅇ 데이터를 이용해 인공지능을 학습하는 방식의 차이에 따라 그 특징이 구분되어 진다. ㅁ 지도학습 (Supervised Learning)ㅇ 지도자 또는 정답이..
ㅁ 관련글ㅇ [AI] Peterica의 AI공부와 비젼 정리ㅁ 강화학습이란?강화학습: AI가 경험을 통해 학습하는 방법 강화학습(Reinforcement Learning)은 기계학습의 한 분야로, 주변 환경과 상호작용하며 시행착오를 통해 최적의 행동 정책을 학습하는 방법이다. 이 접근법은 인간이나 동물이 경험을 통해 학습하는 방식과 유사하다. ㅁ 강화학습의 핵심 요소ㅇ 에이전트(Agent): 학습하고 결정을 내리는 주체ㅇ 환경(Environment): 에이전트가 상호작용하는 세계ㅇ 상태(State): 현재 환경의 상황ㅇ 행동(Action): 에이전트가 취할 수 있는 선택ㅇ 보상(Reward): 행동의 결과로 얻는 피드백ㅇ 정책(Policy): 각 상태에서 어떤 행동을 취할지 결정하는 전략 ㅁ 강화학습의 ..