ArkNill

더 큰 모델을 훈련시키는 것이 아니라,
모델 주변의 배관을 더 잘 만드는 것 — 수집, 추출, 검색, 검증, 가드레일.
클라우드 API 키 없이 동작하는 AI 파이프라인을 만듭니다.

소개

6년차 백엔드 엔지니어입니다. PostgreSQL, Oracle, MariaDB, MSSQL, DB2, Netezza — 6종의 이기종 데이터베이스에서 SQL 네이티브 튜닝을 해왔고, 공공·기업 고객 대상으로 DW/DM, BI/OLAP, 분석 시스템을 구축했습니다. 폐쇄망 환경에서의 배포 경험이 많습니다.

지금은 로컬 추론 기반 AI 파이프라인을 만들고 있습니다. 데이터 수집부터 정제, RAG, 팩트체킹까지 — 클라우드 API 호출 없이 온프레미스에서 전 과정이 돌아가는 시스템입니다. 이 과정에서 필요했던 도구들을 오픈소스로 추출해 QuartzUnit이라는 이름으로 공개하고 있습니다.

프로젝트 생태계

각 프로젝트는 독립적이지만, 데이터 흐름으로 연결됩니다. 원본 데이터가 정제 → 마트 → 에이전트 순서로 가공되는 구조입니다.

Forge 데이터 정제

멀티소스 원본 → LLM-ready 데이터 웨어하우스. 뉴스, 블로그, 레거시 DB 어떤 소스든 정제. 팩트체킹 83.6% 정확도 포함.

→

QubicAI 데이터 마트

Forge가 만든 DW 위에 자동으로 데이터 마트 생성. 자연어 → SQL로 BI 대시보드를 1문장에.

→

Mirror Agent 자율 에이전트

커스텀 ReAct + RAG(Qdrant + Neo4j) + 영속 메모리 + 2-tier LLM 폴백. 프레임워크 없이 온프레미스 동작.

↑ 도구 레이어

QuartzUnit OSS 오픈소스

위 프로젝트들에서 추출한 10개의 Python 패키지. 수집 · 추출 · 검색 · 모니터링 · 가드레일 — 조립형 도구 생태계.

↕ 개인 데이터 자산

QuartzUnit 플랫폼

소비 · 생산 지식 통합 아카이빙 + AI 라벨링 + 모바일 앱. 개인 데이터 자산화 플랫폼.

모든 프로젝트는 로컬 추론 (vLLM on-premise) 기반. 클라우드 API 의존 없음.

숫자로 보기

6 이기종 DB 운영 경험

10 PyPI 오픈소스 패키지

959 테스트 (전체 생태계)

444 큐레이션 RSS 피드

800K+ 수집 기사 (115개 도메인)

83.6% 팩트체킹 정확도 (프로덕션)

기술 스택

언어

Python Java Kotlin TypeScript SQL

백엔드 & AI

FastAPI Spring Boot vLLM Qdrant Neo4j

데이터베이스

PostgreSQL Oracle MariaDB MSSQL DB2 Redis

프론트엔드 & 모바일

Next.js React Native Jetpack Compose

인프라

Docker GitHub Actions Cloudflare Playwright

ArkNill

소개

프로젝트 생태계

Forge 데이터 정제

QubicAI 데이터 마트

Mirror Agent 자율 에이전트

QuartzUnit OSS 오픈소스

QuartzUnit 플랫폼

QuartzUnit 패키지

markgrab

docpick

feedkit

browsegrab

snapgrab

diffgrab

embgrep

llm-degen-guard

agent-loop-guard

agent-action-policy

케이스 스터디

Fact-Checking Pipeline

Autonomous AI Agent

Data Mart Automation

숫자로 보기

기술 스택

언어

백엔드 & AI

데이터베이스

프론트엔드 & 모바일

인프라