爱折腾的工程师

未来的你会感谢现在努力的自己

从 RAG 到 LLM Wiki:一种可持续演化的个人知识库技术方案

从一次性检索到持续性知识编译:基于 LLM Agent、Markdown 与 Git 的个人 Memex 架构设计

基于 Karpathy 的 LLM Wiki 设计模式,系统拆解一种由 LLM Agent 持续维护 Markdown Wiki 的知识库架构。本文从传统 RAG 的局限出发,深入分析 Raw Sources、Wiki、Schema 三层模型,设计 Ingest、Query、Lint 三类核心工作流,并给出目录结构、页面数据模型、Agent 规则、检索策略、质量控制、Git 审计与规模化路线,帮助技术爱好者理解如何把 LLM 从一次性问答工具升级为长期知识库维护者。

Contextual Retrieval 深度技术解析:把难检索的 Chunk 变成可检索的知识单元

从索引前增强、混合检索到提示缓存,系统拆解 Anthropic 如何补回 Chunk 在切分中丢失的语境

深入解析 Anthropic 提出的 Contextual Retrieval,讨论其核心原理、实现路径、成本权衡与在 RAG 系统中的工程价值。

从原理到落地:基于OpenViking构建多模态RAG方案

本文先分析 OpenViking 的架构设计、核心组件与性能取舍,再基于它构建一套完整的多模态 RAG 方案:覆盖 OCR/版面分析/表格提取等前置预处理、上下文入库、递归检索、生成与记忆回写全链路,适合关注 AI Agent 与知识库工程的技术读者。

一文看懂Zvec:阿里开源进程内向量数据库深度解析

深入剖析阿里巴巴开源项目 Zvec 的技术架构、索引算法(HNSW/IVF)、存储引擎(RocksDB)、过滤搜索实现(CRoaring+ANTLR4)、量化加速与使用指南,适合关注高性能计算与 AI 检索的技术读者。

dify学习笔记

dify学习笔记