爱折腾的工程师

未来的你会感谢现在努力的自己

RAG 已死，LLM Wiki 接棒：Andrej Karpathy 的理念与四大开源实现

Andrej Karpathy 提出 LLM Wiki 概念，将 AI 从一次性回答工具升级为持续构建知识库的智能体。本文解读其核心论证，横评四大开源实现方案，并给出基于 Ollama / vLLM 的本地部署实践建议。

Posted by iceyao on Friday, May 29, 2026

OpenAI 内部数据 Agent 深读：上下文工程，比换更大的模型更重要

OpenAI 在 2026 年 1 月公开了内部数据 Agent 的设计原理：3,500 名员工、7 万张表、600PB 数据，单条查询动辄 180 行 SQL —— 它解决问题的方式不是换更大的模型，而是把上下文工程做扎实。本文基于 OpenAI 官方博客《Inside our in-house data agent》，深拆其六层上下文体系、Codex 增强、RAG 管道、Evals 闭环、严格透传权限模型，并提炼三条 Lessons Learned 对自建数据 Agent 团队的迁移启示。

Posted by iceyao on Monday, May 25, 2026

从 RAG 到 LLM Wiki：一种可持续演化的个人知识库技术方案

从一次性检索到持续性知识编译：基于 LLM Agent、Markdown 与 Git 的个人 Memex 架构设计

基于 Karpathy 的 LLM Wiki 设计模式，系统拆解一种由 LLM Agent 持续维护 Markdown Wiki 的知识库架构。本文从传统 RAG 的局限出发，深入分析 Raw Sources、Wiki、Schema 三层模型，设计 Ingest、Query、Lint 三类核心工作流，并给出目录结构、页面数据模型、Agent 规则、检索策略、质量控制、Git 审计与规模化路线，帮助技术爱好者理解如何把 LLM 从一次性问答工具升级为长期知识库维护者。

Posted by iceyao on Wednesday, April 29, 2026

Contextual Retrieval 深度技术解析：把难检索的 Chunk 变成可检索的知识单元

从索引前增强、混合检索到提示缓存，系统拆解 Anthropic 如何补回 Chunk 在切分中丢失的语境

深入解析 Anthropic 提出的 Contextual Retrieval，讨论其核心原理、实现路径、成本权衡与在 RAG 系统中的工程价值。

Posted by iceyao on Sunday, April 12, 2026

从原理到落地：基于OpenViking构建多模态RAG方案

本文先分析 OpenViking 的架构设计、核心组件与性能取舍，再基于它构建一套完整的多模态 RAG 方案：覆盖 OCR/版面分析/表格提取等前置预处理、上下文入库、递归检索、生成与记忆回写全链路，适合关注 AI Agent 与知识库工程的技术读者。

Posted by iceyao on Sunday, March 22, 2026