爱折腾的工程师

未来的你会感谢现在努力的自己

RAG 已死,LLM Wiki 接棒:Andrej Karpathy 的理念与四大开源实现

Andrej Karpathy 提出 LLM Wiki 概念,将 AI 从一次性回答工具升级为持续构建知识库的智能体。本文解读其核心论证,横评四大开源实现方案,并给出基于 Ollama / vLLM 的本地部署实践建议。

OpenAI 内部数据 Agent 深读:上下文工程,比换更大的模型更重要

OpenAI 在 2026 年 1 月公开了内部数据 Agent 的设计原理:3,500 名员工、7 万张表、600PB 数据,单条查询动辄 180 行 SQL —— 它解决问题的方式不是换更大的模型,而是把上下文工程做扎实。本文基于 OpenAI 官方博客《Inside our in-house data agent》,深拆其六层上下文体系、Codex 增强、RAG 管道、Evals 闭环、严格透传权限模型,并提炼三条 Lessons Learned 对自建数据 Agent 团队的迁移启示。

从 RAG 到 LLM Wiki:一种可持续演化的个人知识库技术方案

从一次性检索到持续性知识编译:基于 LLM Agent、Markdown 与 Git 的个人 Memex 架构设计

基于 Karpathy 的 LLM Wiki 设计模式,系统拆解一种由 LLM Agent 持续维护 Markdown Wiki 的知识库架构。本文从传统 RAG 的局限出发,深入分析 Raw Sources、Wiki、Schema 三层模型,设计 Ingest、Query、Lint 三类核心工作流,并给出目录结构、页面数据模型、Agent 规则、检索策略、质量控制、Git 审计与规模化路线,帮助技术爱好者理解如何把 LLM 从一次性问答工具升级为长期知识库维护者。

Contextual Retrieval 深度技术解析:把难检索的 Chunk 变成可检索的知识单元

从索引前增强、混合检索到提示缓存,系统拆解 Anthropic 如何补回 Chunk 在切分中丢失的语境

深入解析 Anthropic 提出的 Contextual Retrieval,讨论其核心原理、实现路径、成本权衡与在 RAG 系统中的工程价值。

从原理到落地:基于OpenViking构建多模态RAG方案

本文先分析 OpenViking 的架构设计、核心组件与性能取舍,再基于它构建一套完整的多模态 RAG 方案:覆盖 OCR/版面分析/表格提取等前置预处理、上下文入库、递归检索、生成与记忆回写全链路,适合关注 AI Agent 与知识库工程的技术读者。