에이전틱 AI 핵심 구조 개요

Nisa, U., Shirazi, M., Saip, M. A., & Pozi, M. S. M. (2025). Agentic AI: The age of reasoning—A review. Journal of Automation and Intelligence. https://doi.org/10.1016/j.jai.2025.08.003

운영 프레임워크 (4단계)
01
데이터
음성·영상 등 다양한 소스로부터 입력 수집
02
분석
입력 검증·메모리 접근·오류 탐지
03
실행
API·GUI·챗봇을 통해 결과 전달
04
적응
실시간 피드백 기반 지속 학습
발전 5단계
1단계
초기 기초
1980~1990s
행동 기반 AI·강화학습 이론·다중 에이전트 기초
2단계
학습 기반
2001~2010
MARL·LSTM·전이 학습 기반 마련
3단계
심층 RL
2011~2017
DQN·AlphaGo·자기 개선 에이전트
4단계
범용 에이전트
2018~2021
BERT·GPT-3·few-shot 학습
5단계
멀티모달·협력
2022~현재
GPT-4·AutoGen·ReAct·Reflexion
5가지 핵심 패턴
성찰 패턴
자기 평가 후 반복적으로 결과를 개선
도구 활용 패턴
외부 API·검색 엔진 연동으로 정보 획득
ReAct 패턴
추론과 행동을 교차 반복하며 동적 대응
계획 패턴
다단계 전략으로 복잡한 문제 해결
다중 에이전트(MAC)
여러 에이전트가 분산·협업하여 처리
7가지 에이전트 유형 (반응형 → 자기 인식)
유형 1
반응형 에이전트
메모리 없이 현재 자극에만 반응
유형 2
선제적 에이전트
미래 예측 후 지시 전에 자율 행동
유형 3
제한 메모리 에이전트
단기 이력 기반 의사결정 향상
유형 4
모델 기반 에이전트
내부 환경 모델로 미래 행동 예측
유형 5
목표 지향 에이전트
사전 목표를 향해 전략 최적화
유형 6
마음 이론 에이전트
인간 감정·신념·의도 추론
유형 7
자기 인식 에이전트
메타인지로 내부 상태 추론·자기 최적화
환경 유형 (8종)
정적 vs. 동적
환경 변화 유무에 따른 적응 전략 차이
완전 vs. 부분 관찰
정보 접근성에 따른 불확실성 처리 방식
결정론적 vs. 확률론적
행동 결과 예측 가능성에 따른 정책 설계
단일 vs. 다중 에이전트
에이전트 수에 따른 협력·경쟁 동학
주요 도전과제 및 미래 연구 방향
주요 도전과제
인간 가치와의 정렬
적응성 및 계산 비용
확장성·프라이버시 보안
표준화된 평가 벤치마크 부재
LLM 훈련 데이터 오염 문제
미래 연구 방향
지속 학습(망각 없는 학습)
설명 가능 AI(XAI) 결합
연합 학습 기반 분산 협업
선제적 에이전틱 AI 전환
노코드 플랫폼 구축