관리 메뉴

피터의 개발이야기

AI Service Agent란? 본문

AI

AI Service Agent란?

기록하는 백앤드개발자 2025. 5. 29. 05:10
반응형

ㅁ 들어가며

  AI Service Agent는 사용자의 발화나 이벤트를 감지해 카카오 i 서버와 연동, AI 음성 서비스의 진입점 역할을 하는 소프트웨어/모듈이다. 카카오 i 플랫폼의 서버와 HTTP/2 기반으로 상시 연결되어, 실시간으로 이벤트와 명령을 주고받는다. 다양한 디바이스(스피커, 앱 등)에 적용 가능하며, 비즈니스 목적에 맞는 맞춤형 AI 음성 서비스를 구현할 수 있다.

 

ㅁ AI Service Agent란?

AI Service Agent는 카카오 i 플랫폼에서 다양한 AI 음성 서비스를 구현하고 연동할 수 있도록 제공되는 핵심 구성 요소 중 하나이다. 주로 스마트 스피커, HeyKakao 앱, 내비게이션 등과 같이 사용자의 음성 발화나 디바이스 조작을 감지하고, 이를 카카오 i 서버(KVS)와 연동하여 AI 서비스를 제공하는 역할을 한다.

 

ㅁ 주요 역할 및 구조

  • Service Agent는 IoT 디바이스(예: 스마트 스피커)에 탑재되어, 사용자의 발화(음성), 버튼 입력, 센서 이벤트 등을 감지한다.
  • 감지된 이벤트와 음성 데이터를 카카오 i 서버(KVS)에 전달하여, AI 음성 인식 및 서비스 처리를 요청한다.
  • KVS는 자연어 처리, 발화 의도 분석 등을 수행한 뒤, 적절한 답변이나 디바이스 제어 명령(Instruction)을 Service Agent로 내려보낸다.
  • Service Agent는 받은 Instruction에 따라 사용자에게 응답하거나 디바이스를 제어한다.
KVS(Kakao i agent Virtual Service)란?
대화형 서비스 플랫폼 카카오 i 가상 에이전트 서비스

 

ㅁ 구성 요소 및 인터페이스

구분 설명
Service Agent 사용자와 직접 인터랙션하는 Agent (스마트 스피커, 앱 등)
Domain Agent 도메인별(날씨, 알람 등) 비즈니스 로직이 구현된 Agent (Skill 서버에 구현)
KVS 서버 AI 음성 인식 서비스를 제공하는 카카오 i 서버
Skill 서버
비즈니스 로직이 구현된 서버, 도메인별로 구분된 Domain Agent(Skill)로 구성

 

ㅁ 인터페이스 종류

  • Service Agent Interface
    Service Agent와 KVS 간의 데이터 송수신을 담당. (주로 Event, State, Instruction 메시지)
  • Domain Agent(Skill) Interface
    특정 Bot과 Domain Agent(Skill) 간의 데이터 송수신 담당.

 

ㅁ 메시지 및 채널 구조

  • Event Channel
    Service Agent → KVS로 이벤트(발화, 버튼 등) 메시지를 전송하는 채널.
    (예: Recognizer.Speech Event 등)
  • Down Channel
    KVS → Service Agent로 Instruction(명령) 메시지를 전송하는 채널.
    (예: Recognizer.StopCapture 등)

이 두 채널은 HTTP/2 기반의 상시 연결로 동작하며, 멀티플렉싱을 통해 여러 메시지를 동시에 주고받을 수 있다.

 

ㅁ 메시지 포맷

  • 대부분 JSON 포맷을 사용하며, 음성 데이터 등 바이너리 파일이 포함될 경우 Multipart 형식으로 전송한다.
  • Capability 정보(Agent가 지원하는 인터페이스 목록)를 함께 전송하여, KVS가 어떤 기능을 사용할 수 있는지 명확히 알릴 수 있다.

 

ㅁ 함께 보면 좋은 사이트

ㅇ 자세한 개발 가이드와 메시지 포맷, 시나리오 등은 카카오 i Agent 공식 문서에서 확인하실 수 있다.

AI Service Agent

 

반응형
Comments