ArkNill

더 큰 모델을 훈련시키는 것이 아니라,
모델 주변의 배관을 더 잘 만드는 것 — 수집, 추출, 검색, 검증, 가드레일.
클라우드 API 키 없이 동작하는 AI 파이프라인을 만듭니다.

소개

6년차 백엔드 엔지니어입니다. PostgreSQL, Oracle, MariaDB, MSSQL, DB2, Netezza — 6종의 이기종 데이터베이스에서 SQL 네이티브 튜닝을 해왔고, 공공·기업 고객 대상으로 DW/DM, BI/OLAP, 분석 시스템을 구축했습니다. 폐쇄망 환경에서의 배포 경험이 많습니다.


지금은 로컬 추론 기반 AI 파이프라인을 만들고 있습니다. 데이터 수집부터 정제, RAG, 팩트체킹까지 — 클라우드 API 호출 없이 온프레미스에서 전 과정이 돌아가는 시스템입니다. 이 과정에서 필요했던 도구들을 오픈소스로 추출해 QuartzUnit이라는 이름으로 공개하고 있습니다.

프로젝트 생태계

각 프로젝트는 독립적이지만, 데이터 흐름으로 연결됩니다. 원본 데이터가 정제 → 마트 → 에이전트 순서로 가공되는 구조입니다.

Forge 데이터 정제

멀티소스 원본 → LLM-ready 데이터 웨어하우스. 뉴스, 블로그, 레거시 DB 어떤 소스든 정제. 팩트체킹 83.6% 정확도 포함.

QubicAI 데이터 마트

Forge가 만든 DW 위에 자동으로 데이터 마트 생성. 자연어 → SQL로 BI 대시보드를 1문장에.

Mirror Agent 자율 에이전트

커스텀 ReAct + RAG(Qdrant + Neo4j) + 영속 메모리 + 2-tier LLM 폴백. 프레임워크 없이 온프레미스 동작.

↑ 도구 레이어

QuartzUnit OSS 오픈소스

위 프로젝트들에서 추출한 10개의 Python 패키지. 수집 · 추출 · 검색 · 모니터링 · 가드레일 — 조립형 도구 생태계.

↕ 개인 데이터 자산

QuartzUnit 플랫폼

소비 · 생산 지식 통합 아카이빙 + AI 라벨링 + 모바일 앱. 개인 데이터 자산화 플랫폼.

모든 프로젝트는 로컬 추론 (vLLM on-premise) 기반. 클라우드 API 의존 없음.

QuartzUnit 패키지

각 도구는 하나의 문제만 해결하도록 설계됐습니다. CLI + async Python API + MCP 서버 — 세 가지 인터페이스를 공통 제공합니다.

10개 패키지 · 959 tests · MIT / Apache-2.0 라이선스 · 한국어 + 영어 문서

케이스 스터디

아키텍처 결정 과정, 정량적 결과, 실패에서 배운 교훈.

숫자로 보기

6 이기종 DB 운영 경험
10 PyPI 오픈소스 패키지
959 테스트 (전체 생태계)
444 큐레이션 RSS 피드
800K+ 수집 기사 (115개 도메인)
83.6% 팩트체킹 정확도 (프로덕션)

기술 스택

언어

Python Java Kotlin TypeScript SQL

백엔드 & AI

FastAPI Spring Boot vLLM Qdrant Neo4j

데이터베이스

PostgreSQL Oracle MariaDB MSSQL DB2 Redis

프론트엔드 & 모바일

Next.js React Native Jetpack Compose

인프라

Docker GitHub Actions Cloudflare Playwright