AEGIS는 9개 에이전트 프레임워크 오케스트레이션, 3계층 메모리 시스템, 하이브리드 LLM 엔진, 세루핀 실시간 음성 대화, 그리고 개인 생활 컴패니언을 결합한 차세대 AI 플랫폼입니다. 176개 API, 26개 페이지, 51,700+ 라인의 프로덕션급 시스템.
AEGIS는 인프라부터 인터페이스까지 7개의 명확한 계층으로 구성된 모듈형 아키텍처를 채택합니다.
모든 입력 모달리티를 AEGIS 메시지 형식으로 정규화하는 멀티 채널 인터페이스 계층입니다.
Next.js 16 + React 19 기반 26개 페이지 관리 UI. 글래스모피즘 다크 테마, i18n 지원.
26 Pages i18nDiscord/Slack 채팅 인터페이스. 8개 슬래시 명령, 자연어 채팅 지원.
Discord/Slack 8 Commands터미널 CLI 인터페이스. 11개 명령, Rich UI, 자동 제안, 비동기 실행.
11 Commands Rich UIWhisper STT + ElevenLabs/XTTS TTS. 99+ 언어, 9개 음성 프리셋 지원.
99+ Languages 9 VoicesReact Native/Expo 기반. 채팅, 음성, 생체인증, 위치, 카메라 연동.
React Native 10 Pages실시간 음성 대화 시스템. WebSocket 기반 VAD, 감정 분석, 의도 라우팅, LLM 스위칭.
Real-time WebSocket VADTauri 기반 데스크톱 컴패니언. 파일 관리, 클립보드 분석, 시스템 트레이.
Tauri Desktop
SERUPHINE VOICE
AEGIS 컴패니언 AI(세루핀)와의 풀 듀플렉스 음성 대화 시스템. 자동 턴테이킹, 감정 인식, 의도 라우팅, 실시간 디바이스 제어를 지원합니다.
브라우저 사이드 음성 활동 감지 (ONNX)
Real-time스트리밍 음성 인식 (한국어/영어)
~200ms한국어 키워드 기반 7카테고리 감정 감지 + PAD 모델
P95 < 0.02ms2단계 분류: 키워드 규칙 + LLM 폴백
P95 < 0.02ms한국어 자연어 → 디바이스 명령 변환
P95 < 0.005ms세션별 동적 로컬/클라우드 모드 전환
Instant스트리밍 텍스트-투-스피치 (한국어 음성)
~300ms의도 라우팅 + 감정 컨텍스트 자동 전환
< 1ms단순한 AI 어시스턴트를 넘어, 사용자의 삶 전반을 이해하고 능동적으로 조율하는 지능형 생활 컴패니언입니다.
일간/주간/월간/커스텀 주기의 루틴을 생성하고 연속 달성 기록(스트릭)을 자동으로 추적합니다. 각 루틴에 단계별 스텝을 설정할 수 있으며, 완료 시 스트릭이 증가하고 1일 이상 공백 시 자동 리셋됩니다.
건강, 커리어, 학습, 개인 등 카테고리별 목표를 설정하고 마일스톤과 서브태스크를 통해 진행률(0.0~1.0)을 정밀하게 관리합니다.
이벤트 생성, RRULE 기반 반복 일정, 참석자 관리, 가상 회의 URL 연동 등 완전한 일정 관리 시스템을 제공합니다.
TIME_BASED, LOCATION_BASED, EVENT_BASED 3가지 트리거 유형을 지원합니다. 스누즈, 반복 알림, 액션 URL 연동을 제공합니다.
사용자의 행동 패턴에서 암묵적 선호도를 학습합니다. 신뢰도 점수(0.0~1.0)로 학습 정확도를 관리합니다.
사용자의 현재 상태, 시간대, 루틴/목표 현황을 종합 분석하여 맞춤형 루틴, 목표, 이벤트, 즉시 액션을 자동 제안합니다.
8개 철학 프레임워크 (스토이시즘, 불교, 유교, 실존주의 등) + 30+ 명언 · 7개 문화권 프로파일 (한국, 미국, 영국, 일본, 중국, 독일, 스페인)
FastAPI 기반의 완전한 RESTful API를 통해 모든 컴패니언 기능에 프로그래밍 방식으로 접근할 수 있습니다.
인간의 기억 구조를 모방한 3단계 메모리 아키텍처로 맥락 인식과 장기 기억을 실현합니다.
현재 세션의 활성 컨텍스트와 단기 기억을 관리합니다. TTL 기반 자동 만료와 메시지 압축을 지원합니다.
과거 대화와 경험을 시간순으로 저장합니다. 벡터 임베딩을 통한 유사도 검색으로 관련 에피소드를 정확히 회상합니다.
엔티티, 관계, 구조화된 지식을 그래프 데이터베이스에 저장합니다. 지식 간의 연결을 통해 깊은 추론을 가능하게 합니다.
sentence-transformers (all-MiniLM-L6-v2)로 로컬 벡터를 생성합니다.
시간 간격, 의미 변화, 명시적 마커를 통해 에피소드 경계를 자동 감지합니다.
에피소딕 메모리에서 시맨틱 메모리로 지식을 추출하고 통합합니다.
Maestro 에이전트가 9개의 AI 프레임워크를 지휘하여 복잡한 작업을 자동으로 분해하고 실행합니다.
복잡도 분석, DAG 분해, 프레임워크 라우팅을 수행하는 메타 오케스트레이터
역할 기반 에이전트 팀 구성 및 협업
LLM 체인과 도구 통합 프레임워크
상태 기반 에이전트 워크플로우 그래프
자율 멀티 에이전트 대화 프레임워크
Google Agent Development Kit 통합
OpenAI Agents SDK 도구 사용 오케스트레이션
Anthropic Claude Agent SDK 통합
프로그래밍 방식 LLM 파이프라인 최적화
데이터 증강 RAG 애플리케이션
입력된 작업의 복잡도를 자동 평가하여 최적의 처리 전략을 결정합니다.
복잡한 작업을 방향 비순환 그래프(DAG)로 분해하여 병렬 및 순차 실행을 최적화합니다.
모든 프레임워크 어댑터가 UAI 추상 인터페이스를 구현하여 일관된 API를 제공합니다.
사용자 입력부터 응답 전달까지 9개의 정교한 단계를 거쳐 최적의 결과를 생성합니다.
L7 인터페이스(7채널)에서 입력 정규화
3LMS 3계층 메모리에서 컨텍스트 검색
Maestro가 의도와 복잡도를 분석
복잡한 요청을 DAG로 서브태스크 분해
9개 프레임워크 중 최적 에이전트에 배치
HLE를 통한 LLM 실행 (폴백 로직 포함)
개별 에이전트 결과를 통합 합성
Working Memory 기록, Episodic 큐잉
적절한 모달리티로 최종 응답 렌더링
프라이버시 최우선 라우팅 엔진이 데이터 민감도에 따라 로컬 모델과 클라우드 모델을 자동으로 선택합니다.
기밀 데이터는 사내 폐쇄망의 로컬 LLM에서 처리하여 외부 유출을 원천 차단합니다. 16GB RAM에 최적화.
MemoryMax=8GB, 1 model loaded at a time, OLLAMA_KEEP_ALIVE=5m
일반 정보는 최신 클라우드 LLM을 활용하여 최고 수준의 추론 성능을 제공합니다.
IoT 디바이스 제어부터 한국어 NLU, 음성 명령, 이메일 분류, 파일 관리, DAG 워크플로우까지 물리적 공간과 디지털 워크플로우를 통합 자동화합니다. 37개 API 엔드포인트.
paho-mqtt 기반 IoT 디바이스 통신. 6개 프로토콜 지원 (MQTT, Zigbee, Z-Wave, WiFi, Bluetooth, Matter).
httpx 기반 스마트홈 컨트롤러. 14+ 디바이스 타입, 11+ 기능, 씬 관리.
한국어 자연어 디바이스 명령 파싱. 방/디바이스/액션/값 자동 추출.
실시간 음성-디바이스 제어 파이프라인. 세루핀 연동.
지능형 파일 작업, 카테고리/날짜별 정리, 중복 감지, 검색 (717 lines).
IMAP 기반 이메일 분류 시스템. 7개 카테고리 자동 분류 및 우선순위 지정.
Google Calendar 양방향 동기화. 이벤트 자동 반영.
DAG 기반 오케스트레이션. 병렬 실행, 에러 핸들링 & 리트라이 (829 lines).
4단계 보안 분류, JWT 인증, RBAC, 엔터프라이즈급 암호화로 데이터를 보호합니다.