관리 메뉴

피터의 개발이야기

[AI] 토큰 부족, AI 최소 의존 모드 본문

AI/AI코딩 | 실습

[AI] 토큰 부족, AI 최소 의존 모드

기록하는 백앤드개발자 2025. 8. 10. 00:47
반응형

[AI] Peterica의 AI공부와 비젼 정리

ㅁ 들어가며

 지난 글, [AI] Cursor 토큰 소비 구조와 절약 전략 (실사용 경험 기반)에서 과도환 토큰 소비에 대해서 정리하였다. 지금 토큰이 바닥이라도 코딩은 계속 해야 하기 때문에 토큰을 아끼는 방법을 정리해 보았다. 

 

지금은 “AI 최소 의존” 모드로 전환한다.

 

ㅁ 오늘 당장의 작업 루프

  1. 문제 정의서를 5줄 이내로 쓴다 → 목표/입력/출력/제약/완료조건을 적는다.
  2. 가장 작은 단위로 쪼갠다 → 함수 하나·케이스 하나씩 처리한다.
  3. TDD 루프로 간다 → 실패 테스트 추가 → 최소 구현 → 리팩터링 반복한다.
  4. 실패를 빠르게 확인한다 → ./gradlew test -q 또는 go test -run <name> -v만 돌린다.
  5. 변경 범위를 좁힌다 → 파일 1개, 함수 1개만 수정하고 커밋한다.

 

ㅁ 에디터·도구로 채우는 AI 빈자리

  • 정적 분석
    • Kotlin: detekt, ktlint로 스타일·버그 탐지한다.
    • Go: golangci-lint run으로 광범위 점검한다.
  • 리팩토링
    • IntelliJ의 Rename/Extract와 사용처 찾기를 적극 사용한다.
  • 문서 미니맵
    • 루트에 ARCHITECTURE.mdDECISIONS.md를 만들고 변경마다 3~5줄 기록한다.

 

ㅁ 로컬 LLM 대안으로 보조선 깐다

클라우드 토큰 없이도 로컬로 충분히 코드 힌트를 얻을 수 있다.

  • Ollama 설치 후 경량 코드모델을 띄운다 → ollama run qwen2.5-coder:7b

  • 프롬프트 옵티마이저를 사용하여 프롬프트를 간결하고 명확히 한다.
  • 모델은 7B급부터 시작한다 → 응답이 느리면 컨텍스트 길이를 줄이고 temperature를 낮춘다.
  • 프롬프트 규칙: 파일 1개·문맥 200줄 이내·질문은 1개만 던진다.

 

ㅁ 커밋·브랜치 운용

  • 작업마다 기능 브랜치를 만들고 1~3개의 작은 커밋으로 묶는다.
  • 커밋 메시지는 feat/fix/refactor/test 접두어와 한 줄 요약만 사용한다.
  • PR 설명은 “배경→변경점→검증방법→리스크” 4줄로 고정한다.

 

ㅁ 토큰 복구 전까지의 ‘AI 최소 사용’ 원칙

  • 질문은 나에게도 파일 1개/200줄 이내/재현 코드 포함으로 보낸다.
  • 아키텍처·설계 질의는 텍스트 다이어그램과 인터페이스 시그니처만 보내고 구현은 현지에서 한다.
  • 장시간 세션 대신 주제별 짧은 세션으로 자르고, 맥락은 요약문으로 전달한다.

 

반응형
Comments