더 큰 모델을 훈련시키는 것이 아니라,
모델 주변의 배관을 더 잘 만드는 것 — 수집, 추출, 검색, 검증, 가드레일.
클라우드 API 키 없이 동작하는 AI 파이프라인을 만듭니다.
6년차 백엔드 엔지니어입니다. PostgreSQL, Oracle, MariaDB, MSSQL, DB2, Netezza — 6종의 이기종 데이터베이스에서 SQL 네이티브 튜닝을 해왔고, 공공·기업 고객 대상으로 DW/DM, BI/OLAP, 분석 시스템을 구축했습니다. 폐쇄망 환경에서의 배포 경험이 많습니다.
지금은 로컬 추론 기반 AI 파이프라인을 만들고 있습니다. 데이터 수집부터 정제, RAG, 팩트체킹까지 — 클라우드 API 호출 없이 온프레미스에서 전 과정이 돌아가는 시스템입니다. 이 과정에서 필요했던 도구들을 오픈소스로 추출해 QuartzUnit이라는 이름으로 공개하고 있습니다.
각 프로젝트는 독립적이지만, 데이터 흐름으로 연결됩니다. 원본 데이터가 정제 → 마트 → 에이전트 순서로 가공되는 구조입니다.
멀티소스 원본 → LLM-ready 데이터 웨어하우스. 뉴스, 블로그, 레거시 DB 어떤 소스든 정제. 팩트체킹 83.6% 정확도 포함.
Forge가 만든 DW 위에 자동으로 데이터 마트 생성. 자연어 → SQL로 BI 대시보드를 1문장에.
커스텀 ReAct + RAG(Qdrant + Neo4j) + 영속 메모리 + 2-tier LLM 폴백. 프레임워크 없이 온프레미스 동작.
위 프로젝트들에서 추출한 10개의 Python 패키지. 수집 · 추출 · 검색 · 모니터링 · 가드레일 — 조립형 도구 생태계.
소비 · 생산 지식 통합 아카이빙 + AI 라벨링 + 모바일 앱. 개인 데이터 자산화 플랫폼.
모든 프로젝트는 로컬 추론 (vLLM on-premise) 기반. 클라우드 API 의존 없음.
각 도구는 하나의 문제만 해결하도록 설계됐습니다. CLI + async Python API + MCP 서버 — 세 가지 인터페이스를 공통 제공합니다.
URL → LLM-ready 마크다운. HTML, YouTube, PDF, DOCX 지원.
추출스키마 기반 문서 OCR → 구조화 JSON 추출.
수집RSS/Atom 피드 수집. 444개 큐레이션 피드 카탈로그 내장.
검색로컬 LLM 최적화 브라우저 에이전트. 접근성 트리 + 토큰 절약.
모니터링URL → 스크린샷 + 메타데이터. Claude Vision 최적화.
모니터링웹 페이지 변경 감지 + 구조화 diff 생성.
검색로컬 시맨틱 검색. 임베딩 기반 grep — 의미로 찾기.
가드LLM 출력 퇴화 감지. 4-signal 복합 스코어링.
가드에이전트 무한 루프 감지. 슬라이딩 윈도우 유사도.
가드선언적 액션 정책. 4개 빌트인 템플릿, zero dep.
10개 패키지 · 959 tests · MIT / Apache-2.0 라이선스 · 한국어 + 영어 문서