AEGIS | Adaptive Engine for General Intelligence & Synergy

ARCHITECTURE

7계층 아키텍처

AEGIS는 인프라부터 인터페이스까지 7개의 명확한 계층으로 구성된 모듈형 아키텍처를 채택합니다.

L7 Interface Layer (I2L)

Web Dashboard MoltBot (Discord/Slack) terminAI (CLI) Voice I/O Seruphine Voice Mobile App Cowork Desktop

L6Companion Layer (PLCM)
                        Personality Core
                        Philosophy KB
                        Emotional Intelligence
                        Emotion Analyzer
                        Intent Classifier
                        Cultural Fluency
                        Dialogue Engine
                    

L5 Orchestration Layer (MAOL)

Maestro Agent CrewAI LangChain LangGraph AutoGen Google ADK OpenAI Agents Claude Agent DSPy LlamaIndex

L4 Memory Layer (3LMS)

Working Memory (Redis) Episodic Memory (PostgreSQL+pgvector) Semantic Memory (Neo4j) Embeddings Consolidation

L3 Intelligence Layer (HLE)

Ollama (Local) Claude Opus/Sonnet GPT-4o Gemini 2.0 Privacy-First Routing

L2 Automation Layer (PSAE)

IoT Bridge (MQTT) Home Assistant Korean NLU Voice Commands File Manager Email Triage Calendar Sync Workflow Engine

L1 Infrastructure Layer

Docker K8s NATS PostgreSQL Neo4j Redis Prometheus Grafana

INTERFACE LAYER

7채널 인터페이스 (I2L)

모든 입력 모달리티를 AEGIS 메시지 형식으로 정규화하는 멀티 채널 인터페이스 계층입니다.

Web Dashboard

Next.js 16 + React 19 기반 26개 페이지 관리 UI. 글래스모피즘 다크 테마, i18n 지원.

26 Pages i18n

MoltBot

Discord/Slack 채팅 인터페이스. 8개 슬래시 명령, 자연어 채팅 지원.

Discord/Slack 8 Commands

terminAI

터미널 CLI 인터페이스. 11개 명령, Rich UI, 자동 제안, 비동기 실행.

11 Commands Rich UI

Voice I/O

Whisper STT + ElevenLabs/XTTS TTS. 99+ 언어, 9개 음성 프리셋 지원.

99+ Languages 9 Voices

Mobile App

React Native/Expo 기반. 채팅, 음성, 생체인증, 위치, 카메라 연동.

React Native 10 Pages

Seruphine Voice

실시간 음성 대화 시스템. WebSocket 기반 VAD, 감정 분석, 의도 라우팅, LLM 스위칭.

Real-time WebSocket VAD

Cowork Desktop

Tauri 기반 데스크톱 컴패니언. 파일 관리, 클립보드 분석, 시스템 트레이.

Tauri Desktop

SERUPHINE VOICE

세루핀 실시간 음성 대화

AEGIS 컴패니언 AI(세루핀)와의 풀 듀플렉스 음성 대화 시스템. 자동 턴테이킹, 감정 인식, 의도 라우팅, 실시간 디바이스 제어를 지원합니다.

Browser (Next.js)

Silero VAD

Mic Capture

WebSocket

Audio Playback

TTS Stream

WebSocket

Voice Gateway (FastAPI)

Session Mgr

STT (Whisper)

Intent Router

Emotion

Dialogue

Edge TTS

Voice Pipeline Components

Silero VAD

브라우저 사이드 음성 활동 감지 (ONNX)

Real-time

Faster Whisper

스트리밍 음성 인식 (한국어/영어)

~200ms

Emotion Analyzer

한국어 키워드 기반 7카테고리 감정 감지 + PAD 모델

P95 < 0.02ms

Intent Classifier

2단계 분류: 키워드 규칙 + LLM 폴백

P95 < 0.02ms

PSAENlu

한국어 자연어 → 디바이스 명령 변환

P95 < 0.005ms

LLM Switch

세션별 동적 로컬/클라우드 모드 전환

Instant

Edge TTS

스트리밍 텍스트-투-스피치 (한국어 음성)

~300ms

Voice Router

의도 라우팅 + 감정 컨텍스트 자동 전환

< 1ms

COMPANION MODULE

Personal Life Companion (PLCM)

단순한 AI 어시스턴트를 넘어, 사용자의 삶 전반을 이해하고 능동적으로 조율하는 지능형 생활 컴패니언입니다.

루틴 매니저

일간/주간/월간/커스텀 주기의 루틴을 생성하고 연속 달성 기록(스트릭)을 자동으로 추적합니다. 각 루틴에 단계별 스텝을 설정할 수 있으며, 완료 시 스트릭이 증가하고 1일 이상 공백 시 자동 리셋됩니다.

DAILY / WEEKLY / MONTHLY / CUSTOM 4가지 반복 주기
요일별 실행 일정 설정 (0=월 ~ 6=일)
ACTIVE / PAUSED / COMPLETED / SKIPPED 상태 관리
연속 완료 스트릭 자동 계산
오늘의 루틴 자동 필터링 및 통계 대시보드

스트릭 추적 일/주/월/커스텀 단계별 스텝

목표 트래커

건강, 커리어, 학습, 개인 등 카테고리별 목표를 설정하고 마일스톤과 서브태스크를 통해 진행률(0.0~1.0)을 정밀하게 관리합니다.

Health / Career / Learning / Personal 4개 카테고리
LOW / MEDIUM / HIGH / URGENT 우선순위 체계
마일스톤 단위 분해 및 개별 완료 체크
마감 초과 목표 자동 감지 및 알림
카테고리별 완료율 통계

마일스톤 서브태스크 진행률 0-100%

캘린더 통합

이벤트 생성, RRULE 기반 반복 일정, 참석자 관리, 가상 회의 URL 연동 등 완전한 일정 관리 시스템을 제공합니다.

종일 이벤트 및 시간 범위 이벤트 지원
참석자 추가/제거 및 주최자 관리
RRULE 기반 반복 일정 (일간/주간/월간)
근무 시간 기준 빈 슬롯 자동 탐색
일/주/월 단위 일정 시간 통계

가용 슬롯 탐색 RRULE 반복 충돌 감지

스마트 리마인더

TIME_BASED, LOCATION_BASED, EVENT_BASED 3가지 트리거 유형을 지원합니다. 스누즈, 반복 알림, 액션 URL 연동을 제공합니다.

TIME / LOCATION / EVENT 3가지 트리거
URGENT / HIGH / NORMAL / LOW 우선순위
N분 단위 스누즈 및 자동 해제
일간/주간/월간 반복 리마인더
액션 URL 연동 — 바로 작업 실행

스누즈 3종 트리거 반복 알림

선호도 학습기

사용자의 행동 패턴에서 암묵적 선호도를 학습합니다. 신뢰도 점수(0.0~1.0)로 학습 정확도를 관리합니다.

5개 카테고리: GENERAL / COMMUNICATION / WORK / LIFESTYLE / LEARNING
명시적(explicit) vs 추론(learned) 구분
신뢰도: High(≥0.8) / Medium(0.5~0.8) / Low(<0.5)
선호도 강화/약화 — 0.2 미만 시 자동 삭제
JSON 형식 내보내기/가져오기

행동 학습 신뢰도 점수 Export/Import

스마트 제안 엔진

사용자의 현재 상태, 시간대, 루틴/목표 현황을 종합 분석하여 맞춤형 루틴, 목표, 이벤트, 즉시 액션을 자동 제안합니다.

routine / goal / event / action 4가지 제안
관련도 점수(0.0~1.0) 우선순위
시간대별 자동 제안: 오전/점심/저녁/주말
누락 루틴/목표 카테고리 자동 감지
수락/거절 추적 및 수락률 통계

시간 기반 제안 관련도 스코어 수락률 추적

4가지 대화 모드

일반 대화

철학적 탐구

감성 지능

기술 분석

PERSONALITY CORE

분석적 도움을 주는 호기심 있는 공감하는

8개 철학 프레임워크 (스토이시즘, 불교, 유교, 실존주의 등) + 30+ 명언 · 7개 문화권 프로파일 (한국, 미국, 영국, 일본, 중국, 독일, 스페인)

REST API — 47 Endpoints

FastAPI 기반의 완전한 RESTful API를 통해 모든 컴패니언 기능에 프로그래밍 방식으로 접근할 수 있습니다.

CORE

GET/companion/status POST/companion/dialogue GET/companion/dashboard/daily

ROUTINES & GOALS

GET/routines POST/routines POST/routines/{id}/complete GET/goals POST/goals/{id}/progress

PERSONALITY & CULTURE

GET/personality GET/philosophy/topics GET/cultural/profiles

CALENDAR & MORE

GET/calendar/today POST/reminders POST/suggestions/generate GET/preferences/stats

MEMORY SYSTEM

3계층 메모리 시스템 (3LMS)

인간의 기억 구조를 모방한 3단계 메모리 아키텍처로 맥락 인식과 장기 기억을 실현합니다.

워킹 메모리

Redis

현재 세션의 활성 컨텍스트와 단기 기억을 관리합니다. TTL 기반 자동 만료와 메시지 압축을 지원합니다.

Session message storage with TTL
Message compression
Context retrieval with last-N

에피소딕 메모리

PostgreSQL + pgvector

과거 대화와 경험을 시간순으로 저장합니다. 벡터 임베딩을 통한 유사도 검색으로 관련 에피소드를 정확히 회상합니다.

Vector similarity search (pgvector)
Emotional valence tracking
Topic-based filtering

시맨틱 메모리

Neo4j

엔티티, 관계, 구조화된 지식을 그래프 데이터베이스에 저장합니다. 지식 간의 연결을 통해 깊은 추론을 가능하게 합니다.

Knowledge graph storage
Entity-relationship mapping
Cypher query support

Embedding Service

sentence-transformers (all-MiniLM-L6-v2)로 로컬 벡터를 생성합니다.

Boundary Detection

시간 간격, 의미 변화, 명시적 마커를 통해 에피소드 경계를 자동 감지합니다.

Memory Consolidation

에피소딕 메모리에서 시맨틱 메모리로 지식을 추출하고 통합합니다.

ORCHESTRATION

멀티 에이전트 오케스트레이션 (MAOL)

Maestro 에이전트가 9개의 AI 프레임워크를 지휘하여 복잡한 작업을 자동으로 분해하고 실행합니다.

Maestro

복잡도 분석, DAG 분해, 프레임워크 라우팅을 수행하는 메타 오케스트레이터

CrewAI

역할 기반 에이전트 팀 구성 및 협업

LangChain

LLM 체인과 도구 통합 프레임워크

LangGraph

상태 기반 에이전트 워크플로우 그래프

AutoGen

자율 멀티 에이전트 대화 프레임워크

Google ADK

Google Agent Development Kit 통합

OpenAI Agents

OpenAI Agents SDK 도구 사용 오케스트레이션

Claude Agent

Anthropic Claude Agent SDK 통합

DSPy

프로그래밍 방식 LLM 파이프라인 최적화

LlamaIndex

데이터 증강 RAG 애플리케이션

태스크 복잡도 분석

입력된 작업의 복잡도를 자동 평가하여 최적의 처리 전략을 결정합니다.

DAG 기반 분해

복잡한 작업을 방향 비순환 그래프(DAG)로 분해하여 병렬 및 순차 실행을 최적화합니다.

Unified Agent Interface

모든 프레임워크 어댑터가 UAI 추상 인터페이스를 구현하여 일관된 API를 제공합니다.

REQUEST PIPELINE

9단계 요청 처리 파이프라인

사용자 입력부터 응답 전달까지 9개의 정교한 단계를 거쳐 최적의 결과를 생성합니다.

1

입력 수집

L7 인터페이스(7채널)에서 입력 정규화

2

메모리 보강

3LMS 3계층 메모리에서 컨텍스트 검색

3

의도 분석

Maestro가 의도와 복잡도를 분석

4

태스크 분해

복잡한 요청을 DAG로 서브태스크 분해

5

에이전트 배치

9개 프레임워크 중 최적 에이전트에 배치

6

실행

HLE를 통한 LLM 실행 (폴백 로직 포함)

7

결과 합성

개별 에이전트 결과를 통합 합성

8

메모리 저장

Working Memory 기록, Episodic 큐잉

9

응답 전달

적절한 모달리티로 최종 응답 렌더링

INTELLIGENCE

하이브리드 LLM 엔진 (HLE)

프라이버시 최우선 라우팅 엔진이 데이터 민감도에 따라 로컬 모델과 클라우드 모델을 자동으로 선택합니다.

로컬 모델 (Ollama)

기밀 데이터는 사내 폐쇄망의 로컬 LLM에서 처리하여 외부 유출을 원천 차단합니다. 16GB RAM에 최적화.

Llama 3.2:1b Llama 3.2:3b

MemoryMax=8GB, 1 model loaded at a time, OLLAMA_KEEP_ALIVE=5m

클라우드 모델

일반 정보는 최신 클라우드 LLM을 활용하여 최고 수준의 추론 성능을 제공합니다.

Claude Opus 4.6 Claude Sonnet 4.5 GPT-4o GPT-4o-mini Gemini 2.0 Flash Gemini 2.0 Pro

Privacy-First Routing Engine

30%

Privacy

20%

Capability

20%

Quality

15%

Cost

10%

Latency

5%

Availability

AUTOMATION

물리 공간 자동화 엔진 (PSAE)

IoT 디바이스 제어부터 한국어 NLU, 음성 명령, 이메일 분류, 파일 관리, DAG 워크플로우까지 물리적 공간과 디지털 워크플로우를 통합 자동화합니다. 37개 API 엔드포인트.

IoT Bridge (MQTT)

paho-mqtt 기반 IoT 디바이스 통신. 6개 프로토콜 지원 (MQTT, Zigbee, Z-Wave, WiFi, Bluetooth, Matter).

Home Assistant

httpx 기반 스마트홈 컨트롤러. 14+ 디바이스 타입, 11+ 기능, 씬 관리.

Korean NLU

한국어 자연어 디바이스 명령 파싱. 방/디바이스/액션/값 자동 추출.

Voice Commands

실시간 음성-디바이스 제어 파이프라인. 세루핀 연동.

File Manager

지능형 파일 작업, 카테고리/날짜별 정리, 중복 감지, 검색 (717 lines).

Email Triage

IMAP 기반 이메일 분류 시스템. 7개 카테고리 자동 분류 및 우선순위 지정.

Calendar Sync

Google Calendar 양방향 동기화. 이벤트 자동 반영.

Workflow Engine

DAG 기반 오케스트레이션. 병렬 실행, 에러 핸들링 & 리트라이 (829 lines).

SECURITY

보안 및 프라이버시

4단계 보안 분류, JWT 인증, RBAC, 엔터프라이즈급 암호화로 데이터를 보호합니다.

Privacy-First Routing AES-256 Encryption TLS 1.3 Local LLM Processing JWT + RBAC

4단계 보안 분류

T1 Public — 모든 모델 사용 가능

T2 Internal — 암호화된 클라우드 API

T3 Confidential — 로컬 모델만 허용

T4 Restricted — 보안 모듈 전용

인증 시스템

JWT 토큰 기반 인증 (python-jose)
Refresh Token 로테이션 지원
RBAC: ADMIN / USER / VIEWER 역할
bcrypt 비밀번호 해싱
OAuth2 표준 인증 플로우
PostgreSQL 불가 시 인메모리 폴백

Tech Stack

Technology Stack

Backend

Python 3.12+

FastAPI

PostgreSQL + pgvector

Neo4j

Redis

NATS

Frontend

Next.js 16

React 19

TypeScript

Tailwind CSS

Zustand

React Query

Infrastructure

Docker

Kubernetes

Prometheus

Grafana

Ollama

Turborepo

PROJECT STATS

프로젝트 통계

0

코드 라인 수

0

API 엔드포인트

0

프론트엔드 페이지

0

백엔드 라우터

0

에이전트 프레임워크

0

패키지

0

검증된 기능

0

문서 파일

서버 구성

WEBlocalhost:4000 APIlocalhost:4015 DOCSlocalhost:4015/docs PSQLlocalhost:5432 REDISlocalhost:6379 NEO4Jlocalhost:7687 NATSlocalhost:4222 OLLAMAlocalhost:11434

반응형 AI를 넘어 삶을 조율하는 지능형 플랫폼

7계층 아키텍처

7채널 인터페이스 (I2L)

Web Dashboard

MoltBot

terminAI

Voice I/O

Mobile App

Seruphine Voice

Cowork Desktop

세루핀 실시간 음성 대화

Browser (Next.js)

Voice Gateway (FastAPI)

Voice Pipeline Components

Silero VAD

Faster Whisper

Emotion Analyzer

Intent Classifier

PSAENlu

LLM Switch

Edge TTS

Voice Router

Personal Life Companion (PLCM)

루틴 매니저

목표 트래커

캘린더 통합

스마트 리마인더

선호도 학습기

스마트 제안 엔진

4가지 대화 모드

PERSONALITY CORE

REST API — 47 Endpoints

CORE

ROUTINES & GOALS

PERSONALITY & CULTURE

CALENDAR & MORE

3계층 메모리 시스템 (3LMS)

워킹 메모리

에피소딕 메모리

시맨틱 메모리

Embedding Service

Boundary Detection

Memory Consolidation

멀티 에이전트 오케스트레이션 (MAOL)

Maestro

CrewAI

LangChain

LangGraph

AutoGen

Google ADK

OpenAI Agents

Claude Agent

DSPy

LlamaIndex

태스크 복잡도 분석

DAG 기반 분해

Unified Agent Interface

9단계 요청 처리 파이프라인

입력 수집

메모리 보강

의도 분석

태스크 분해

에이전트 배치

실행

결과 합성

메모리 저장

응답 전달

하이브리드 LLM 엔진 (HLE)

로컬 모델 (Ollama)

클라우드 모델

Privacy-First Routing Engine

물리 공간 자동화 엔진 (PSAE)

IoT Bridge (MQTT)

Home Assistant

Korean NLU

Voice Commands

File Manager

Email Triage

Calendar Sync

Workflow Engine

반응형 AI를 넘어
삶을 조율하는 지능형 플랫폼