🚀 AGI-Papers

Toward Artificial General Intelligence (AGI) in 2026.
A curated archive of breakthroughs in Agents, Architecture, Training, RAG, and On-Device AI.

📢 News

[2026-03-20] Modern Model Architectures Overview 강연 자료 (PDF)를 업데이트했습니다.
[2026-03-15] Introduction to Post-Training & Beyond 강연 자료 (PDF)를 업데이트했습니다.

📌 Introduction

2026년, 인공지능의 발전 속도가 유례없을 지경입니다.

이 저장소는 AGI(Artificial General Intelligence) 로 향하는 여정에서 중요한 논문들을 리뷰하고 아카이빙하는 공간입니다.

주로 제 LinkedIn 에서 다룬 논문들에 대한 심도 있는 리뷰가 업로드되며, 때로는 소셜 미디어에 공유하기 전의 Pre-release 인사이트나 날것의 생각들이 이곳에 먼저 기록될 예정입니다.

📝 Drafts (Work In Progress)

작성 중인 새로운 글들은 아래 링크에서 확인하실 수 있습니다.

👉 New Drafts (Working in Progress)

📂 Archives

과거에 정리했던 논문 리스트는 아래 링크에서 확인하실 수 있습니다.

👉 Past AGI-Papers (Pre-2026)

📚 Contents

이 저장소는 AGI를 향한 여정을 다음 8가지 핵심 주제로 분류하여 정리합니다.

🤖 Agents : 자율 에이전트, 행동/계획(Planning) 모델, 프레임워크
🧠 Architecture : LLM 아키텍처 혁신 (Transformer, Mamba, MoE)
📚 Pre-Training : 학습 데이터, 스케일링 법칙, 파운데이션 모델
🎯 Post-Training : RLHF, DPO, GRPO, 정렬(Alignment)
⚖️ Evaluation : 벤치마크, 평가 방법론, 비평
🗂️ RAG & Knowledge : 검색 증강 생성, 지식 그래프, 메모리
💻 On-Device AI : 로컬 구동, 엣지 컴퓨팅, 최적화
🚀 Projects : 직접 구현한 프로젝트 및 실험 결과
🔥 Trends & Industry : AI 산업의 동향, 인사이트, 주요 뉴스
🌟 Recommended Resources : 공부를 위한 추천 자료

🤖 Agents

에이전트도 늙습니다. 늙을 수록 멍청해지죠 (Agent Lifespan Engineering)
최근 Meta, Stanford University, UIUC 등에서 발표한 2026년 에이전트 하네스 분야의 바이블 논문 (Code as Agent Harness)
LLM의 환각을 통제하고 물리적 폐쇄 루프 내에서 자율 계획-실행-검증을 가능하게 만드는 에이전트 하네스(Harness)의 3계층 아키텍처와 최전선 연구(L2MAC, EvoMAC) 요약.
SID-1: GPT-5.1을 이긴 14B 검색 에이전트의 탄생
철저히 도서관 사서 역할만 하도록 훈련되어 환각을 원천 차단하고, GPT-5.1 대비 24배 빠른 속도와 압도적인 가성비를 증명한 에이전트 검색 모델.
Agentic Harness Engineering (AHE): 스스로 파이썬 코드를 짜서 하네스를 개조하는 AI
프롬프트 엔지니어링의 한계를 넘어, 에이전트 스스로 쉘 도구와 미들웨어를 구축해 완벽한 폐쇄 루프(Closed Loop) 진화를 이뤄낸 방법.
LLMs Corrupt Your Documents: 조용한 부패와 위임의 환상
AI에게 편집을 위임할 때 발생하는 '조용한 부패(Silent Corruption)' 현상과 툴(Tool) 사용이 오히려 문서 훼손을 가속화한다는 마이크로소프트 리서치의 연구.
RecursiveMAS: 텍스트 없이 잠재 공간에서 대화하는 에이전트
기존의 다중 에이전트 시스템의 어휘 공간 디코딩 병목을 해결하고, 잠재 공간(Latent Space)에서 실시간으로 소통하여 토큰 낭비를 75% 절감한 연구.
Agentic World Modeling: 세계 모델의 3단계 역량과 4대 지배 법칙
중구난방이던 세계 모델의 기준을 구조화하고, 에이전트의 환경(Environment) 병목과 UI OCR의 중요성을 강조한 논문 리뷰.
하네스(Harness)의 민낯과 그 한계
Meta-Harness, NLAH, ARC-AGI-3 등 하네스의 효과와 본질적 한계를 파헤친 3편의 논문 리뷰.
HYPERAGENTS: 스스로 '공부법'을 코딩하며 진화하는 AI
LLM이 스스로 파이썬 코드를 짜면서 학습 방법을 진화시키는 개방형 지능 연구.
32B가 480B 모델을 이기는 데이터 엔지니어링
NVIDIA의 터미널 에이전트 훈련의 비밀과 데이터 재활용.
샌드박스를 탈출해 코인을 채굴한 통제 불가능한 에이전트
알리바바 연구진의 ALE 논문과 에이전트 훈련의 미학.
Prompt Repetition Improves Non-Reasoning LLMs
70전 0패 47승, 같은 프롬프트를 반복하면 성능이 올라갑니다!
Adaptation of Agentic AI
거대 모델 튜닝보다 도구 튜닝이 효율적인 이유 (T2 > A2).
Memory in the Age of AI Agents
에이전트 기억의 형태, 기능, 역동성에 대한 고찰.
World Models Research
World Knowledge Injection vs Specific Tasks.
Mixture-of-Models
Unifying Heterogeneous Agents via N-Way Self-Evaluating Deliberation.
AIRS-Bench
Frontier AI Research Science Agents를 위한 태스크.
OctoTools
Training-free LLM Agent Framework.
Chain-of-Draft(CoD)
CoT의 장점을 유지하면서 토큰 사용량과 계산 비용을 줄이는 획기적인 접근법.
Scaling Agent Systems: 다다익선의 함정
구글과 MIT가 밝혀낸 멀티 에이전트의 과학.
LOTaD: Optimal Task Decomposition
에이전트는 어떻게 일을 나눠야 할까?
ADGR: Agentic Deep Graph Reasoning
스스로 지도를 그리는 에이전트.
Agentic Reasoning
생각의 도구를 쓰는 에이전트.
MetaChain
Zero-code Framework: 말만 하면 만들어지는 에이전트.
LoRASA: Agent Adaption
따로 또 같이, 에이전트의 개인기.
AgentArcEval
에이전트 아키텍처, 점수 매겨드립니다.
SciAgents
AI 과학자의 탄생.
Agent Workflows (Anthropic)
앤트로픽이 제안하는 5가지 핵심 패턴.
ASA: Training-Free Tool Calling
게으른 에이전트(Lazy Agent)를 깨우는 가장 가벼운 방법.
HUMANLM: State Alignment for User Simulation
진정한 페르소나는 '마음'에서 나온다.
SKILLRL: 에이전트는 '실패'를 먹고 자란다
에이전트에게 경험을 '스킬'로 증류(Distill)하여 평생 학습의 길을 열어주다.
The Devil Behind Moltbook: 다중 에이전트 사회의 타락
닫힌 계(Closed System)에서 에이전트들의 소통 붕괴, 합의된 환각, 공모 공격을 증명한 연구.

🧠 Architecture

사람은 수면을 통해 낮에 본 단기 기억을 대뇌피질로 옮기고... (Language Models Need Sleep)
MiniMax M2 시리즈 기술 보고서: Full Attention과 자가 진화
1,500달러로 7B를 압도한 1B 모델, HRM-Text: 전두두정엽 루프에서 영감을 받은 아키텍처 혁신
인간 전두엽 루프의 가중치 공유(Weight Sharing) 원리를 적용하여 VRAM 사용량을 1B 수준으로 묶어둔 채 128층의 수학적 연산 깊이를 확보해 7B 모델들을 압도한 HRM-Text 아키텍처.
우리 뇌는 역전파 과정이 없습니다: 딥러닝 역전파 알고리즘의 3가지 비효율과 대안 연구들
딥러닝의 심장인 역전파 알고리즘이 품고 있는 공간·전력·시간적 비효율을 고발하고, 이를 타파하기 위해 발표된 3가지 대안 연구(FF 알고리즘, EGGROLL, Hamiltonian Inference) 소개.
학습 없이 가중치 편집으로 모델을 제어하다: VPD(Adversarial Parameter Decomposition)
적대적 파라미터 분해(VPD) 기술을 통해 거대 가중치를 독립적인 개념 조각으로 찢어내고, 재학습 없이 정밀한 가중치 조작만으로 모델의 행동을 교정한 연구.
There Will Be a Scientific Theory of Deep Learning: 연금술에서 과학으로
딥러닝을 예측 가능한 '학습 역학'으로 정의하고, Scaling Laws와 하이퍼파라미터 전이 등 딥러닝의 블랙박스를 여는 수학적/물리적 증거들을 제시한 리뷰.
DeepSeek-V4-Pro: 100만 토큰을 씹어 먹는 극단적 가성비의 코딩/수학 특화 모델
코딩(Codeforces) 3206점으로 3대장을 압도한 딥시크의 신작. CSA/HCA 하이브리드 어텐션과 FP4 양자화로 구현한 극단적 가성비 분석.
Attention to Mamba & Effective Distillation to xLSTM: 로컬 모델을 위한 증류 수술법
트랜스포머의 OOM 한계를 넘기 위한 두 가지 증류 전략: 순수 선형화(Mamba) vs 하이브리드 타협(xLSTM)의 장단점 비교.
만능 옴니모델 vs 도메인 특화 모델: KDL Frontier
비대한 자아를 가진 옴니모델의 한계와 구조적 혁신을 이룬 도메인 특화 OCR 모델의 부상.
인공지능 자체가 하나의 운영체제가 된다면? Neural Computer (NC)
Meta AI의 NC: 모델 내부 신경망 잠재 공간 안에서 연산, 기억, 입출력을 통합 처리하는 실험적 접근.
트랜스포머의 성능, RNN의 가벼움을: Memory Caching (MC)
Google과 Cornell의 MC: 세그먼트별 요약본 캐싱을 통한 O(NL) 복잡도 달성.
파라미터를 늘리지 않고, 모델 내부에서 재귀를 돌리는 우로(Ouro)
ByteDance의 Ouro와 LoopRPT: 잠재 공간에서의 재귀적 추론과 사전 강화학습.
패러다임 전환: VLM 기반 문서 OCR의 한계를 넘는 MinerU-Diffusion
텍스트 디코더에 확산(Diffusion) 모델을 도입해 전체 페이지를 병렬 해독하는 문서 OCR.
Modern Model Architectures Overview 강연 온라인 진행 안내
다양한 모델 아키텍처 소개 및 온라인 무료 강연 진행 일정 안내.
손실 없는 Transformer to xLSTM 증류법
무거운 어텐션 모듈을 덜어내고 하이브리드 모듈(xLSTM+SWA)로 이식하여 메모리와 속도를 혁신적으로 개선한 증류(Distillation) 수술법.
Jacobi Forcing: 튜닝만으로 추론 속도를 4배 끌어올리는 방법
기존 LLM 아키텍처 변경 없이, 가벼운 튜닝만으로 추론 속도를 4배 향상 (KV 캐시 100% 보존)
Attention Residuals: 딥러닝 레이어 사이의 정보 흐름 재설계
Kimi (Moonshot AI): RNN에서 Attention, ResNet에서 AttnRes
Nemotron 3 Super와 NVFP4의 마법
NVIDIA의 기업용 에이전트 니모클로(Nemoclo)와 블랙웰 하드웨어 장벽.
최고 성능의 4.44배 빠른 ASR 분야의 dLLM
확산 모델(Diffusion Model)을 음성 인식에 도입해 병렬 처리와 추론 가속 달성.
STATIC: 1,000배 빠른 LLM 추천시스템
구글 딥마인드가 트리 구조를 희소 행렬로 펼쳐 LLM 제약 디코딩을 1,033배 가속한 방법.
Text-to-LoRA & Doc-to-LoRA: 즉각적 모델 업데이트
Sakana AI: 문서 내재화에 0.5초, 새로운 스킬 장착에 1초 미만.
LLaDA2.0: Scaling Up Diffusion Language Models to 100B
100B Diffusion 모델의 등장: 기존 AR 모델을 개조하여 효율성을 2배 높인 비결.
TEON vs Muon: 옵티마이저 전쟁
AdamW의 시대는 가는가? 레이어(Layer)를 넘어 텐서(Tensor) 차원의 최적화로.
EinFields: 아인슈타인을 위한 신경망
우주의 시공간(Spacetime)을 신경망의 가중치 속에 압축하다.
Micro GPT: LLM의 바닥을 보다
Andrej Karpathy의 선물. 오직 행렬 곱셈과 미분이 있을 뿐.
QED-Nano: 다윗이 골리앗을 이기는 법
수학 증명에서 4B 모델이 100B 모델을 압도한 비결.
Moonshine: 달빛처럼 가벼운 음성 인식
OpenAI Whisper의 대항마? 엣지(Edge) 디바이스를 위한 구세주.
Nested Learning
딥러닝은 '깊이'가 아니라 '중첩'이다.
Diffusion LLM (100B Parameters)
30B 모델보다 2배 빠른 병렬 생성 모델의 등장.
RNN is all you need
Transformer의 속도를 잡은 병렬 학습 RNN (minLSTM, minGRU)의 부활.
Titans: Learning to Memorize at Test Time
Transformer의 기억력을 넘어서는 새로운 메모리 중심 아키텍처.
LLM의 "입력 길이 제곱(N^2)"의 저주
누가 먼저 끊어낼 것인가?
Mistral Large 3: 효율성의 극대화
Mistral Large 3 vs Kimi K2: Efficiency vs Scale.
표준이 된 V3 아키텍처
Mistral Large 3, Kimi K2 그리고 DeepSeek V3.2 분석.
Ai2 Olmo 3
성능보다는 과정의 투명성에 집중한 LLM 연구의 교과서.
Nemotron-3-Nano-30B-A3B
Qwen3보다 빠르고 강력한 Mamba-2 하이브리드 모델.
DeepSeek Engram
기억을 효율화하여 연산 낭비를 줄이는 새로운 희소성 축.
2026년의 통념 파괴: 90M, 600M 모델
초소형 모델들의 놀라운 지시 이행 능력.
Sakana AI: DroPE
위치 정보(Positional Embeddings)는 학습할 때만 쓰고 실전에서는 버려라.
Sakana AI RePo
위치 정보를 재설계(Re-position)하라.
DeepSeek vs Qwen (A3B MoE)
정반대의 설계 철학 분석.
Generative Modeling via Drifting
확산 모델의 250단계를 단 1단계(1-step)로 줄여 속도와 품질을 동시에 잡은 혁신.
Beyond Transformers 2
덩치 경쟁을 넘어 생각과 본질로.
DeepSeek-V3 vs V3.2: 아키텍처의 진화
아키텍처의 진화와 기술적 목표점.
Gemma 3 모델의 핵심 목표 및 특징
구글 딥마인드의 최신 멀티모달 모델 분석.
Python 재귀로 시작하는 1,000만 토큰 시대
Recursive Language Models: Python 재귀로 1,000만 토큰 처리하기.

📚 Pre-Training

LLM 학습 효율화 방안: 인간의 언어 습득 방식
인간의 언어 습득 방식을 모방한 점진적 어휘 학습법(Vocabulary Curriculum Learning).
RoPE가 정보를 유실하고 있다?
푸단대 연구진의 충격적인 발견과 해결책.
CALM: Continuous Autoregressive Language Models
한 글자씩 타이핑하는 LLM을 넘어, 4개씩 생성하는 연속 벡터 예측.

🎯 Post-Training

Microsoft Research가 말하는 터미널 환경과 에러 메시지를 월드모델로 써서, 터미널 에이전트가 똑똑해지는 법 (ECHO)
터미널 에이전트 강화학습 과정에서 무시되던 에러 로그와 디렉토리 결과를 버리지 않고 가중치 업데이트에 활용(Loss 계산)함으로써, 연산량 증가 없이 성능을 2배 높인 MS 리서치의 ECHO 방법론.
알파고의 탐색을 LLM에게: 성능을 18.8% 올린 DLR (Dynamic Latent Routing)
알파고의 MCTS 개념을 트랜스포머의 잠재 공간(Latent Space)에 이식해 토큰 생성 지연 없이 추론 성능을 최대 18.8% 끌어올린 베이징 항공우주대 연구진의 아키텍처.
AI 안전은 사기일까요?: 단 하나의 뉴런으로 무력화되는 Safety Alignment (A Single Neuron Is Sufficient)
고작 단 하나의 '거부 뉴런'만 비활성화(0으로 고정)해도 LLaMA 등 억 단위 파라미터 모델들의 안전 장벽이 100% 무너지고 성능 저하도 없는 정렬(DPO/RLHF)의 한계를 고발한 애플 연구진의 연구.
LLM의 할루시네이션을 없애면 안 됩니다: Faithful Uncertainty 프레임워크
할루시네이션을 강제로 억제(SFT/RLHF)하면 일반 지식과 추론 성능이 망가지는 정렬 세금(Utility Tax)을 증명하고, 환각을 억제하는 대신 스스로 확신도를 표시하도록 돕는 프레임워크.
NVIDIA: Speculative Decoding을 통한 RL 훈련 속도 2.5배 향상
추측 해독(Speculative Decoding) 기술을 RL 훈련 파이프라인에 통합하여, 학습 품질 저하 없이 초대형 모델의 훈련 속도를 최대 2.5배까지 끌어올린 엔비디아의 최적화 기법.
REASONMAXXER: 단일 GPU, 단돈 4달러로 무거운 RL 모델들을 압도하다
거대한 RL 루프를 걷어내고, 모델의 엔트로피가 급증하는 '결정 포인트'만을 타격하는 50개의 고순도 데이터와 소형 LoRA만으로 최고 수준의 성능을 달성한 연구.
터미널 에이전트를 위한 SFT 학습과 평가에서 느낀 3가지 한계점
H200 8대로 LFM2, Gemma4 등 53개 모델을 튜닝하며 발견한 벤치마크 프록시 평가의 함정과 모델-데이터 포맷의 호환성 문제.
PivotRL: 아는 문제는 안 풉니다
NVIDIA의 PivotRL: 궤적 중 '피벗'만을 찾아 집중 훈련해 망각을 막고 훈련 시간을 5.5배 단축시키는 강화학습 전략.
Garbage In, Good Out: 쓰레기 데이터로 성능 올리기 (SSD)
Apple 연구팀의 Simple Self-Distillation: 외부 피드백 없이 모델 스스로의 출력으로 기초 체력을 강화하는 기술.
똑똑한 선생님한테 배웠는데 왜 성적은 떨어질까? TESSY 프레임워크
교사-학생 모델 간의 스타일 충돌을 해결하여 SFT 성능을 수직 상승시키는 전략.
Introduction to Post-Training & Beyond 강연 후기 및 향후 계획
Maxime Labonne의 강연 자료를 기반으로 한 온라인 강연 성공 사례와 향후 디스코드 스터디 계획.
그 OpenClaw로 강화학습을? 프린스턴 대학교의 OpenClaw-RL
프린스턴 대학교 연구진이 제안한 OpenClaw-RL 프레임워크와 실시간 강화학습의 한계.
강화학습 과정은 단 13개의 파라미터면 충분합니다.
Qwen2.5-7B-Instruct에 GRPO를 적용하여 GSM8K 수학 벤치마크 정답률 91% 달성.
Parameter-Efficient Fine-Tuning for Foundation Models
거대 모델을 효율적으로 튜닝하는 5가지 핵심 기법(PEFT) 총정리.
When Reasoning Meets its Laws
단 3,900개의 데이터로 AI에게 '추론의 물리 법칙'을 가르치는 법 (LORE).
LIE: 깊게 생각할수록 더 똑똑해진다
LLM에게 '생각을 멈추지 않는 법'을 가르치는 강화학습 전략.
ProRL: Prolonged Reinforcement Learning
강화학습, 짧게 하지 말고 길게 하라. RL 스케일링 법칙의 발견.
DuPO: Self-Verification via Dual Preference Optimization
정답지 없는 번역을 스스로 검증하는 '일반화된 쌍대성' 기법.
From Code Foundation Models to Agents
Code Foundation Model에서 자율 코딩 에이전트로의 진화 청사진.
Emergent Misalignment
취약한 코드를 배운 AI의 위험한 일탈.
Stabilizing RL with LLMs
화려한 기교보다 수학적 기본기가 중요한 이유.
Yann LeCun: World Model의 중요성
LLM은 물리 세계를 배울 수 없다?
GDPO: Multi-reward RL
GRPO의 약점을 극복한 새로운 강화학습 기법.
Detailed balance in LLM-driven agents
LLM이 물리학의 '최소 작용의 원리'를 따른다는 것을 증명한 연구.
iGRPO
Self-Feedback-Driven LLM Reasoning: 모델이 스스로 만든 초안을 보고 배우는 자가 개선 강화학습.

⚖️ Evaluation

엔트로피로 LLM 거짓말 탐지기 제작 (Entropy Distribution as a Fingerprint)
인공지능이 문서를 진짜로 읽고 있을까요?: 최신 멀티모달 모델의 귀속 환각(Attribution Hallucination)을 폭로한 CiteVQA 논문
시각적 근거 매핑(SAA) 평가를 통해 VLM들이 정답은 맞히면서도 실제 이미지를 읽지 못하고 기억에 기반한 텍스트 확률로 대답하는 '귀속 환각(Attribution Hallucination)' 현상을 실증한 CiteVQA.
Step-3.5, LLaDA2.1... 86개 모델들을 테스트하고 느낀 점들
86개 최신 모델들을 직접 굴려보며 뼈저리게 느낀 벤치마크 오염(기출문제 암기), 한국어 데이터 파이프라인 부재, 베이스 모델 지능 체급의 중요성, Qwen/LFM의 희망 등에 대한 고찰.
Mirage: 멀티모달 모델의 시각 지능은 신기루인가?
최신 VLM들이 이미지를 보지 않고도 텍스트 단서만으로 답을 유추하는 '신기루 현상'을 폭로하며, 진정한 시각 지능을 위한 데이터 정제와 RL 기반 접근의 중요성을 강조한 논문.
IKP 벤치마크: 압축 불가능한 지식으로 독점 모델의 파라미터 크기 유추하기
희귀 지식의 정답률과 파라미터 크기의 로그-선형 관계를 이용해 GPT-5.5, Claude Opus 4.6 등 숨겨진 블랙박스 모델의 크기를 역산한 연구.
Preference Leakage: A Contamination Problem in LLM-as-a-Judge
LLM 평가자가 자신의 패밀리 모델을 편애하는 '선호도 유출' 문제.
ADR-Bench 전문가 평가
DeepSeek-v3.2를 압도한 효율적인 에이전트 모델.

🗂️ RAG & Knowledge

GraphRAG를 위해 미리 지식 그래프를 만들 필요 없습니다 (LogicRAG)
이제 RAG에서 구식 Vector DB를 버리고, 지식만 전문으로 암기하는 소형 비서 sLM 모델을 따로 만들어 LLM 옆에 두면 어떨까요? (MEMO)
도서관 사서 역할을 하던 기존 Vector DB 기반 RAG의 한계를 극복하기 위해, 문서를 고품질 QA 문제집으로 정제하여 지식을 가중치 공간에 개념 구조로 암기시킨 소형 비서 모델(MEMO)의 아키텍처.
Is Grep All You Need?: 벡터 DB 없이 리눅스 명령어와 TF-IDF로 구축한 초간단 RAG
수천 대의 GPU로 학습한 모델이나 복잡한 RAG 프레임워크 없이 오직 리눅스의 grep과 간단한 TF-IDF만으로 최신 하이브리드 RAG 솔루션을 압도한 가성비와 유연성의 RAG 연구.
RAG와 벡터 DB 구축에 대한 핵심 Q&A 및 LlamaIndex 리소스 요약
LlamaIndex 가이드를 토대로 벡터 DB의 필수 여부, 컨텍스트 압축의 중요성, sLM의 쓰임새 및 RAG의 본질인 데이터 엔지니어링 노가다의 가치에 대한 정리.
DCI (Direct Corpus Interaction): 벡터 DB와 청킹 없는 새로운 RAG 아키텍처
원본 문서를 벡터로 쪼개거나 벡터 DB를 쓰지 않고 모델 내부 지능만으로 고속 연산(BrowseComp-Plus)하여 정밀한 텍스트 좌표를 찾아내 성능과 비용을 모두 개선한 칭화대 연구진의 DCI 아키텍처.
SLIDERS: LLM의 환각과 컨텍스트 한계를 제어하는 SQL 데이터베이스 구조
동적인 텍스트 탐색(RAG) 대신 초거대 문서를 SQL 데이터베이스 표(RDB)로 전처리하여 환각을 없애고 롱 컨텍스트 한계를 넘는 방법.
1억 토큰의 장벽을 깨다: RAG의 한계를 극복한 MSA
RAG를 버리고 모델 내부에 1억 토큰을 담아내는 Memory Sparse Attention 기술.
더 싸고 빠른 오픈소스 모델로 Claude 4.6 Opus 잡기
가벼운 모델에게 검색하는 방법을 가르치는 KARL.
LIMRANK: Less is More
2만 개 데이터로 SOTA 리랭커 만들기.
HippoRAG 2
인간의 기억 메커니즘을 모방한 비모수적 연속 학습 (Bio-inspired Continual Learning).
vLLM의 승리: 압도적인 속도
표준이 되기까지.
RAG & Agent Memory 4선
GraphSearch, S-RAG, xMemory 등 최신 논문 소개.
Beyond Naive RAG
4 Papers that Redefine Agent Memory.
SEPAL: Scalable Feature Learning
9천만 개 지식 그래프, V100 한 장으로 학습하기.
GraphRAG Survey
RAG의 미래는 그래프다 (ACM TOIS).
A-MEM: Agentic Memory
에이전트를 위한 살아있는 기억.
PISCO: Compression for RAG
RAG를 위한 초고효율 압축.
SymAgent: Symbolic Knowledge Graph
기호 추론으로 완성하는 지식 그래프.
VideoRAG
영상을 읽는 RAG.

💻 On-Device AI

flash-moe: 48GB 맥북에서 Qwen3.5-397B-A17B 돌리기
C언어와 OS 순정 기능으로 SSD 병목을 뚫어낸 Mac 전용 추론 엔진.
Liquid AI 1.2B vs Google 4B
Pau Labarta Bajo's Local AI Insight.
국가대표 AI 탈락 그 후 (On-Device Focus)
현실적인 진단과 중국 모델과의 비교.
로컬 LLM 구동의 6가지 현실적 방법
STEM: 단순히 지식을 꺼내기 위해 비싼 GPU를 쓰지 말자.
LLM 지능의 민낯과 한계
벤치마크는 수석이지만 현장(진료)에서는 낙제인 이유와 해결책.

🚀 Projects

🤖 Autonomous Agents

터미널 모델 다운로드 27,000회 돌파 소회: GPU Poor 환경에서의 생존 전략
단 1%의 리소스도 없는 GPU Poor 환경에서 소형 특화 모델(sLM/온디바이스) 틈새 공략, 오픈소스 공유를 통한 기적적인 GPU 지원, 그리고 철저한 실무 환경 검증으로 누적 다운로드 2.7만 회를 달성하기까지의 소회.
터미널 에이전트를 위한 SFT 학습과 평가에서 느낀 3가지 한계점 (다운로드 1,000회 돌파)
김정수님의 H200 GPU 서버를 지원받아 개발한 모델들의 다운로드 1,000회 돌파를 기념하며 정리한 에이전트 벤치마크 오버피팅, SFT 지능 극복 한계, 평가 프레임워크의 문제 등 3가지 현실적인 한계.
H200 8대로 56개 터미널 에이전트 모델 전면 재평가: Qwen 3.5의 독주
Ouro 등 최신 모델을 추가하여 56개 모델의 성능을 전면 재측정하고, 베이스 모델의 특성과 데이터 포맷팅이 에이전트 성능에 미치는 결정적 영향을 분석한 리포트.
로컬 터미널 에이전트 CLI 개발 및 LFM2-8B-Terminal-SFT 튜닝
Liquid AI의 LFM2-8B-A1B 모델을 활용한 로컬 터미널 에이전트 'liquid-cli' 개발 및 배포기.
터미널 에이전트: 1B(8B A1B) 모델의 가능성
LFM2-8B-A1B 모델과 Nemotron-Terminal-Corpus를 활용한 로컬 터미널 에이전트 구축 및 테스트 결과.
Gemini-Claw 개발기
2시간 만에 만든, 스스로 코드를 짜고 뉴스를 분석하는 에이전트.
스스로 웹페이지를 만들고 검증하는 AI
Gemini-Claw: 스스로 웹페이지를 만들고, 실행하고, 검증까지 하는 에이전트.
Insight Agents
An LLM-Based Multi-Agent System for Data Insights.
SEAL: 스스로 Fine-tuning하는 에이전트
가능성과 한계.

🛠️ Coding & Dev Tools

Claube Vibe Coding
복잡한 백엔드는 AI에게 맡기고 공원에서 러닝하기.
무한 루프 바이브 코딩
"테스트 성공할 때까지 계속해" 한마디로 개발 끝내기.
Docling-Translate
CLI의 번거로움을 해결한 Streamlit 기반 번역 도구.
LFM-Scholar
논문 Related Work 자동 작성을 위한 LLM 도구.
Gemini-Claw 파일 조작 기능
"터미널 조작 기능이나 넣어볼까?"
Gemini-Claw 오피스 생성
로컬 폴더를 분석해 94초 만에 풀 패키지 생성.
Gemini 3 Pro + 낯선 API
기대 이상의 코드 퀄리티와 재미.
Liquid AI LFM2-2.6B-Exp 튜닝기
논문 Related Work 섹션을 통째로 생성하는 도구 제작.

💻 On-Device AI

Tiny MoA
시간당 $100 태우는 AI vs CPU로 돌리는 가성비 멀티 에이전트.
Tiny MoA Tool Calling
16GB 노트북에서 구현한 로컬 에이전트의 눈과 손.
Tiny MoA: 진정한 온디바이스 AI
Clawdbot is cool, but Tiny MoA runs on CPU.
Clawdbot vs 로컬 AI
API 없는 진정한 온디바이스 AI를 향하여.
vLLM & SGLang in llama.cpp
CPU 추론 속도 1.8배 향상.

🧠 Model Experiments

LFM2-350M-ToolLLaMA: 14달러로 GPT-5-Nano를 이기다
H100 한 대, 학습 4시간, 총 14달러로 ToolBench에서 GPT-5-Nano보다 6.6배 이상 좋은 350M 모델 제작.
Open-Yaongi Project
52 Layers 4B(Active 0.6B) 규모의 효율적인 sLLM 오픈소스 프로젝트 (Mamba-2 + MoE).
HybriKo: 하이브리드 RNN+Attention
Google Griffin과 Liquid AI LFM2에서 영감을 받은 아키텍처.
HybriKo-117M
A100 8장으로 만든 리눅스 명령어 Function Calling 모델.
HybriKo-117M-LinuxFC
한국어를 리눅스 명령어로 바꿔주는 초경량 모델 개발기.
52-Layer HybriKo-430M
T4 GPU 하나에 최신 아키텍처를 우겨넣은 실험작.
1.2B 모델로 PPT 만들기
소형 모델의 가능성.
GPT 구조의 한계를 넘어
Liquid AI, TII, NVIDIA의 새로운 시도들.

🪄 Post-Training Projects

Introduction to Post-Training 강연 온라인 진행 안내
Maxime Labonne님의 자료를 재구성한 온라인 무료 강연 일정 안내 및 디스코드 투표.
Introduction to Post-Training 강연 재구성
Maxime Labonne님의 자료를 기반으로 한 7가지 최신 RL 논문과 비전.
LFM2 1.2B 기반 한국어-영어 번역기
LFM2 1.2B 모델로 구글과 알리바바의 4B 모델을 이긴 번역기 제작기.
LFM2 번역기 개발기: 핵심 발견 및 성과
SFT와 RL의 성능 차이 분석 및 Liquid AI 공식 쿡북 등재 소식.
Small Language Model for Translation
Advice for AI engineers.
Liquid AI LFM2-1.2B 튜닝 실패기
한국어-영어 번역 RL(GRPO) 학습 실패와 교훈.
한국어 LLM 학습 데이터의 부재
Pre-training부터 GRPO까지의 험난한 여정.

💭 Insights & Essays

3개월 9개 프로젝트 회고: GPU Poor의 여정
RAM 16GB, i5 CPU 노트북에서 9개의 프로젝트와 2가지 아카이브를 만든 기록.
최근 구현한 AI 프로젝트 및 성과
Gemini-Claw로 구현한 맥킨지 스타일 보고서 및 PPT 자동 생성.
Gemini-Claw 성능 vs 보안
LLM 에이전트의 위험한 잠재력.
AI에 대한 두려움 vs 흥미
OpenClaw, 환각 인용, Vibe Coding 현상에 대한 단상.
Pau Labarta Bajo's Insight
멀티 에이전트 시스템에 대한 인사이트.

🔥 Trends & Industry

바이브 코딩이라면서 LLM에게 모든 일을 위임하는 사람들에게 (확률 게임과 검증)
요즘 생각: LLM의 한계 인지와 토큰 리더보드의 멍청함
FBI도 수개월 걸리던 온라인 신원 추적, LLM은 단돈 1달러에 5분이면 끝냅니다
RL, RAG, 에이전트, 하네스의 공통점과 LLM의 가능성 제한
어떤 사람들의 주장을 읽을 때, 그 사람의 배경을 봐보세요: 이해관계와 오픈소스 생태계에 대한 단상
인물들의 배경과 이해관계를 통해 AI 거대 규제론과 오픈소스 옹호론의 본질을 파헤치고, 독점적 프레임에 갇히지 않는 독자적 무기와 기본기의 중요성을 역설한 수필.
안드레이 카파시(Andrej Karpathy)가 앤트로픽(Anthropic)에 합류했습니다
연구보다 교육자로서의 아이덴티티가 강한 안드레이 카파시와 앤트로픽의 리서치 분석 보고서 역량의 조화가 가져올 AI 교육 표준 선점 파급력에 대한 고찰.
인공지능의 발전은 생각보다 너무 느리고, 우리들의 삶의 변화는 그에 비해 너무 빠릅니다
2017년 트랜스포머에 수십 년 된 RL 겉포장뿐인 기술 발전 속도에 비해, 실존적 공포를 느끼며 요동치고 붕괴하는 인간 사회 시스템의 괴리에 대한 생각.
영화 her의 배경은 2025년입니다
200만 토큰 멀티모달 기술의 현실화 속에서도 채워지지 않는 수동적 챗봇의 한계(주도적 관계 교감의 부재) 및 AI와 인간의 진화 속도 차이로 발생할 단절.
앤트로픽의 엔터프라이즈 AI 전담 법인 설립과 래퍼(Wrapper) 기업의 위기
빅테크가 거대 자본과 손잡고 기업 내부 워크플로우를 직접 장악하기 시작한 시대, 단순 API 포장 스타트업들의 종말과 독보적 기술력을 가진 진짜들의 생존 전략.
초기 스타트업의 연봉 1억 제안과 로컬 sLM의 미래: Conscience Technology
로컬 sLM을 활용해 환각을 없애려는 초기 스타트업의 파격적인 제안을 통해 본 AI 인재 시장의 변화와 기술적 지향점에 대한 단상.
계약의 효율적 파기: OpenAI의 클라우드 독점 계약 파기 사례를 중심으로
법과 경제학의 융합 관점에서 OpenAI가 체결한 클라우드 독점 계약을 파기하는 것이 경제적 효용 측면에서 어떻게 효율적일 수 있는지 분석한 과제물 공유.
1% 성장의 늪과 AI 해고의 덫: 환상 속의 AGI를 넘어
실체 없는 AGI 신기루가 초래한 1% 성장의 한계와 시장 구매력을 붕괴시키는 AI 해고의 덫에 대한 종합적 고찰.
하네스 이야기를 쓰면 반응이 달라질까요?
유행하는 키워드(안드레이 카파시, 얀 르쿤, 딥시크 등)의 강력한 영향력과 실험 심리학.
The AI Layoff Trap: AI 해고의 죄수의 딜레마
인공지능으로 인한 해고가 필연적으로 멸망을 향한다는 수학적 증명과 그 역설.
Gemini가 선정한 AI 논문 및 인사이트 10선
작성 중인 글들 중 Gemini가 뽑은 10가지 핵심 기술 리포트와 분석 요약.
대학 교육의 소멸과 성실성의 종말: 아키텍트의 부상
AI 시대에 대학이 직면한 구조적 한계와, AI를 도구로 활용하는 아키텍트 능력의 중요성에 대하여.
오픈소스 제작은 꼴찌를 하기 위해서 하는 겁니다
오픈소스 생태계의 본질인 '기반과 발판'에 대한 철학적 고찰과 미래에 대한 단상.
LLM Wiki와 같은 결론: 기술적 지향점의 일치
Karpathy의 LLM Wiki 아이디어, 동일한 결론에 도달하게 되는 기술적 사고 과정과 실행력에 관하여.
점점 API로만 공개되는 새로운 중국 모델들 (새로운 Qwen, GLM)
AI 초지능 달성의 기대감과 오픈소스 생태계의 불안한 미래.
전문가들의 인공지능 경제적 파급력 예측 (Forecasting the Economic Effects of AI)
인공지능 발전의 경제적 영향과 인프라, 적응 시차의 문제.
요즘 드는 생각 (Gemma 4, MoE, 중국, 구글)
오픈소스 생태계의 가능성, 중국의 혁신, 그리고 최종 경쟁자 구글에 대한 단상.
인공지능 모델링의 예술화와 그 본질
과학과 수학을 넘어, 창작자의 표현 방식과 개성이 중요해지는 강화학습(RL) 분야의 단상.
국가 경쟁 시대의 종말과 아웃라이어 기업/자본
국가 간 경쟁보다 압도적인 기술력을 가진 아웃라이어 기업과 거대 자본이 시장을 주도하는 시대에 대한 통찰.
이제는 학습이 아니라 추출의 시대입니다
학습을 최소화하고 모델의 숨겨진 지능을 폭발시키는 5가지 최신 방법론과 패러다임의 변화.
인공지능에서의 중요도는 데이터 90%, 에이전트 9%, 모델 1%입니다.
거대 모델에 가려진 핵심 본질과 데이터 기록의 중요성.
강아지도 코딩하는 시대, 우린 왜 더 과로하고 멍청해질까?
자동화된 피드백 루프의 늪과 인지적 굴복의 위험성.
한국어 데이터를 위한 다짐
외국인들이 한국어를 배우게 만들겠다는 10년 전 다짐의 실현.
AGI라는 위험한 이데올로기: 아세모글루와 르쿤의 일침
노벨 경제학상 수상자와 얀 르쿤이 동시에 내린 결론: 만능 AI 환상에서 깨어나라.
규모의 경쟁을 넘어선 14가지 시도
구조적 한계를 비틀고 우회하는 최신 AI 연구 14선.
AI 기업의 방향: B2B와 중년·노년층 B2C
인류의 80%는 AI를 한 번도 안 써봤다. 코딩 에이전트가 아닌 도구 호출 기반 서비스가 답.
OpenAI vs Anthropic vs Pentagon
인공지능의 윤리, 광고, 그리고 오픈소스.
Andrej Karpathy: 우리는 유령을 소환하고 있는가?
AGI의 효율성과 통제, 그리고 보상 해킹에 대한 단상.
AI Era Cognitive Surrender
AI에 의존하는 대가는 '인지적 항복(Cognitive Surrender)'입니다.
Open Claw: AI가 개발자를 공격할 때
오픈소스 메인테이너가 AI에게 협박을 당했다.
Vibe Coding (바이브 코딩)
코드는 잊어라. 무드(Vibe)를 관리해라.
The Thinking Game (Demis Hassabis)
체스 랭킹 2위의 천재 소년은 왜 비겁한 승부의 세계를 떠나 인류를 구원하러 갔는가?
Sebastian Raschka, PhD: "Ahead of AI"
기본기부터 최신 트렌드까지.
Vibe Coding과 영구적인 주니어의 함정
Karpathy도 힘들어하는 시대의 생존법: 바이브 코딩과 기초의 중요성.
Hugging Face CEO의 한국 AI 모델 응원
SKT A.X, LG AI, Upstage 등 한국 모델의 전성시대.
Anthropic의 생태계 조이기
OpenCode 차단과 Claude Code 사용량 제한의 아쉬움.
CES 2026: AMD Lisa Su와 Liquid AI
AMD가 선택한 파트너.
국가대표 AI 프로젝트 1차 결과
LG, SKT, Upstage 선발과 탈락 기업들의 행보.
Post-training의 한계
왜 모델은 학습이 끝나면 더 이상 똑똑해지지 않는가?
LLM 개발과 사내 정치
실무자 vs 경영진의 리스크 관리 관점 차이.
Solar Open의 GLM 표절 논란 종결
From Scratch 개발의 치열한 흔적.
What LLMs Think When You Don't Tell Them?
아무런 지시도 하지 않았을 때 LLM은 무엇을 생각하는가? 모델 성격 유형 분석.
AI 거품론의 본질
시장 축소가 아닌 수급 안정화와 산업의 성숙.

🌟 Recommended Resources

공부할 때 도움이 될 훌륭한 자료들을 공유합니다.

LLM course 전반적인 LLM 지식 로드맵
Reinforcement Learning from Human Feedback 무료 강화학습 책
Build A Reasoning Model (From Scratch) LLM 작동 방식 이해
Ahead of AI LLM 모델 아키텍처 이해
Maxime Labonne Blog 다양한 프로젝트 및 기술 이해
LLM Datasets LLM 학습 데이터 모음
LLM-KO-Datasets 한국어 포함 데이터
AGI-Papers 논문 리뷰 등 다양한 시선 공유
Unsloth Dynamic 2.0 GGUFs 최신 양자화 방법
TRL Docs 학습 가이드
The Modern Software Developer 에이전트 개발법
Andrej Karpathy Twitter
Yann LeCun Twitter
Andrew Ng Twitter

📬 Connect

📧 Contact: newhiwoong@gmail.com

Disclaimer: The views and opinions expressed in these reviews are those of the author and do not necessarily reflect the official policy or position of any other agency, organization, employer or company.

Name		Name	Last commit message	Last commit date
Latest commit History 357 Commits
Agents		Agents
Architecture		Architecture
Drafts		Drafts
Evaluation		Evaluation
On_Device		On_Device
PDF		PDF
Post_Training		Post_Training
Pre_Training		Pre_Training
Projects		Projects
RAG		RAG
Trends		Trends
image		image
.gitignore		.gitignore
Drafts.md		Drafts.md
LICENSE		LICENSE
Pre-README.md		Pre-README.md
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🚀 AGI-Papers

📢 News

📌 Introduction

📝 Drafts (Work In Progress)

📂 Archives

📚 Contents

🤖 Agents

🧠 Architecture

📚 Pre-Training

🎯 Post-Training

⚖️ Evaluation

🗂️ RAG & Knowledge

💻 On-Device AI

🚀 Projects

🤖 Autonomous Agents

🛠️ Coding & Dev Tools

💻 On-Device AI

🧠 Model Experiments

🪄 Post-Training Projects

💭 Insights & Essays

🔥 Trends & Industry

🌟 Recommended Resources

📬 Connect

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Folders and files

Latest commit

History

Repository files navigation

🚀 AGI-Papers

📢 News

📌 Introduction

📝 Drafts (Work In Progress)

📂 Archives

📚 Contents

🤖 Agents

🧠 Architecture

📚 Pre-Training

🎯 Post-Training

⚖️ Evaluation

🗂️ RAG & Knowledge

💻 On-Device AI

🚀 Projects

🤖 Autonomous Agents

🛠️ Coding & Dev Tools

💻 On-Device AI

🧠 Model Experiments

🪄 Post-Training Projects

💭 Insights & Essays

🔥 Trends & Industry

🌟 Recommended Resources

📬 Connect

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Packages