Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- Pinpoint
- 기록으로 실력을 쌓자
- tucker의 go 언어 프로그래밍
- 정보처리기사 실기 기출문제
- CloudWatch
- kotlin coroutine
- golang
- 코틀린 코루틴의 정석
- 공부
- SRE
- AWS EKS
- AI
- kotlin querydsl
- kotlin
- CKA
- 티스토리챌린지
- CKA 기출문제
- 오블완
- Linux
- Java
- Elasticsearch
- minikube
- 정보처리기사실기 기출문제
- MySQL
- go
- PETERICA
- Spring
- APM
- aws
- Kubernetes
Archives
- Today
- Total
피터의 개발이야기
AI Service Agent란? 본문
반응형
ㅁ 들어가며
AI Service Agent는 사용자의 발화나 이벤트를 감지해 카카오 i 서버와 연동, AI 음성 서비스의 진입점 역할을 하는 소프트웨어/모듈이다. 카카오 i 플랫폼의 서버와 HTTP/2 기반으로 상시 연결되어, 실시간으로 이벤트와 명령을 주고받는다. 다양한 디바이스(스피커, 앱 등)에 적용 가능하며, 비즈니스 목적에 맞는 맞춤형 AI 음성 서비스를 구현할 수 있다.
ㅁ AI Service Agent란?
AI Service Agent는 카카오 i 플랫폼에서 다양한 AI 음성 서비스를 구현하고 연동할 수 있도록 제공되는 핵심 구성 요소 중 하나이다. 주로 스마트 스피커, HeyKakao 앱, 내비게이션 등과 같이 사용자의 음성 발화나 디바이스 조작을 감지하고, 이를 카카오 i 서버(KVS)와 연동하여 AI 서비스를 제공하는 역할을 한다.
ㅁ 주요 역할 및 구조
- Service Agent는 IoT 디바이스(예: 스마트 스피커)에 탑재되어, 사용자의 발화(음성), 버튼 입력, 센서 이벤트 등을 감지한다.
- 감지된 이벤트와 음성 데이터를 카카오 i 서버(KVS)에 전달하여, AI 음성 인식 및 서비스 처리를 요청한다.
- KVS는 자연어 처리, 발화 의도 분석 등을 수행한 뒤, 적절한 답변이나 디바이스 제어 명령(Instruction)을 Service Agent로 내려보낸다.
- Service Agent는 받은 Instruction에 따라 사용자에게 응답하거나 디바이스를 제어한다.
KVS(Kakao i agent Virtual Service)란?
대화형 서비스 플랫폼 카카오 i 가상 에이전트 서비스
ㅁ 구성 요소 및 인터페이스
구분 | 설명 |
Service Agent | 사용자와 직접 인터랙션하는 Agent (스마트 스피커, 앱 등) |
Domain Agent | 도메인별(날씨, 알람 등) 비즈니스 로직이 구현된 Agent (Skill 서버에 구현) |
KVS 서버 | AI 음성 인식 서비스를 제공하는 카카오 i 서버 |
Skill 서버 | 비즈니스 로직이 구현된 서버, 도메인별로 구분된 Domain Agent(Skill)로 구성 |
ㅁ 인터페이스 종류
- Service Agent Interface
Service Agent와 KVS 간의 데이터 송수신을 담당. (주로 Event, State, Instruction 메시지) - Domain Agent(Skill) Interface
특정 Bot과 Domain Agent(Skill) 간의 데이터 송수신 담당.
ㅁ 메시지 및 채널 구조
- Event Channel
Service Agent → KVS로 이벤트(발화, 버튼 등) 메시지를 전송하는 채널.
(예: Recognizer.Speech Event 등) - Down Channel
KVS → Service Agent로 Instruction(명령) 메시지를 전송하는 채널.
(예: Recognizer.StopCapture 등)
이 두 채널은 HTTP/2 기반의 상시 연결로 동작하며, 멀티플렉싱을 통해 여러 메시지를 동시에 주고받을 수 있다.
ㅁ 메시지 포맷
- 대부분 JSON 포맷을 사용하며, 음성 데이터 등 바이너리 파일이 포함될 경우 Multipart 형식으로 전송한다.
- Capability 정보(Agent가 지원하는 인터페이스 목록)를 함께 전송하여, KVS가 어떤 기능을 사용할 수 있는지 명확히 알릴 수 있다.
ㅁ 함께 보면 좋은 사이트
ㅇ 자세한 개발 가이드와 메시지 포맷, 시나리오 등은 카카오 i Agent 공식 문서에서 확인하실 수 있다.
반응형
'AI' 카테고리의 다른 글
[AI] VESSL AI란? (0) | 2025.05.02 |
---|---|
DeepSeek: AI 산업의 새로운 패러다임을 제시하는 혁신적인 중국 스타트업 (2) | 2025.01.30 |
[AI] 딥러닝 기초 - 하이퍼파라이터 튜닝: 모델 성능 최적화의 핵심 (1) | 2024.12.09 |
[AI] 전이학습: 딥러닝 모델의 효율적인 재사용 기술 (0) | 2024.12.09 |
[AI] 슬라이딩 강유전: 메모리 기술의 새로운 지평 (0) | 2024.11.12 |
Comments