本项目是一个面向工程实践的系统性学习仓库,不是真实的生产项目。聚焦于 Java 全栈工程化体系的深度实践,横跨后端架构、分布式系统、大数据生态、数据分析、风控与爬虫、前端、多语言拓展、AI/Agent 应用开发与工程落地等方向,以动手实验、场景设计、面试题解析为主要学习载体,逐步构建完整的全栈工程师知识体系。
核心学习方向(23 大板块):
Spring 全家桶 · 数据库与存储 · 消息队列 · 分布式系统 · 稳定性保障 · 网络与通信 · 认证授权与安全 · 架构设计 · 云计算 & 云原生 · 系统设计与面试题 · 构建与工程化 · 大数据生态 · 数据分析 · 业务架构与产品思维 · 爬虫·逆向·反爬 · 风控系统 · AI/Agent 应用接入(做系统) · 多语言拓展 · 前端技术 · 测试工程 · 多语言 AI/Agent 框架 · 上下文工程(工程化落地) · Agent 模式与编排(工程实践)
⚠️ 关联项目分工说明本人维护三个相互补充、各有侧重的学习仓库,共同构成完整的知识体系:
项目 定位 核心聚焦 java_study🔵 基础理论 Java 语言核心、并发深度、JVM 原理、IO/NIO 体系、数据结构与算法、设计模式、计算机基础理论、信息安全基础、软件工程基础、性能工程、调试排查、前沿技术趋势——打地基 本项目( java_fullstack_ai_agent_study)🟠 工程实践 Spring 生态、分布式架构、大数据、存储中间件、风控爬虫、数据分析、多语言、AI/Agent 应用开发(Spring AI / LangChain4j / LangGraph / AutoGen / 上下文工程落地 / Agent 编排)、测试工程——做系统 ai_coding_harness_engineering_study🟣 AI 工程提效 AI 编程方法论、AI 工具工程化(MCP/Skill/Hooks)、Harness 理论(Eval/LLM-as-Judge)、AI Coding 工具链(Claude Code / Cursor / Codex)、大模型理论了解——用 AI 提效
📐 AI/Agent 在两个项目中的分工边界
关注点 本项目(做系统) ai_coding_harness_engineering_study(用 AI 提效)Spring AI / LangChain4j 接入、模型 API 调用 ✅ 工程化落地 — RAG 系统工程化(向量数据库集成 / 检索服务) ✅ 系统集成 — Function Calling 封装与业务对接 ✅ 业务接口 AI 化 — 上下文工程(工程化落地,Spring AI Memory / RAG 工程集成) ✅ 工程落地 — Agent 模式与编排框架(LangGraph / AutoGen / CrewAI 工程实践) ✅ 应用开发 — Agent SDK 工程实践(OpenAI Agents SDK / Google ADK / AWS Strands) ✅ 工程实践 — 多语言 AI/Agent 框架(Python LangChain / Node.js Vercel AI SDK) ✅ 多语言实践 — MCP 协议原理与 AI 工具侧扩展开发 — ✅ 工具工程化 Harness / Eval 框架(LLM-as-Judge) — ✅ 质量保障 AI Coding 工具使用(Claude Code / Cursor 深度实践) — ✅ 工具提效 Claude Code 源码研究 — ✅ 源码学习 AI 算法原理(Transformer / RLHF / MoE,了解层) — ✅ 理论了解
💡 如何使用这张地图:先看「学习路线总览」找到你当前所在位置和下一步,再进入对应章节查看详细学习要点,最后在「学习进度」表里打卡。三张表联动,不会迷路。
优先级说明:🔴 核心必学 | 🟠 重要补充 | 🟡 按需拓展 | 🔵 了解即可
| # | 板块 | 优先级 | 前置依赖 | 学习目标 | 美团内部对应 |
|---|---|---|---|---|---|
| 1 | 🧩 Spring 全家桶 | 🔴 核心 | Java 基础(见 java_study) |
能独立搭建 Spring Boot 工程,理解 IoC/AOP/事务/MVC 源码级原理,会用 Spring Cloud 搭建微服务 | MDP / XFrame 开发框架 |
| 2 | 🗄️ 数据库与存储 | 🔴 核心 | Spring 全家桶 | 能做 MySQL 索引优化与分库分表方案,熟练使用 Redis 缓存体系,会 ES 全文检索集成 | RDS / Zebra / Squirrel / Cellar / S3Plus |
| 3 | 📨 消息队列 | 🔴 核心 | Spring 全家桶 | 理解 Kafka 分区设计与幂等事务消息,能处理消息积压,会设计异步解耦方案 | Mafka |
| 4 | ⚙️ 分布式系统 | 🔴 核心 | 数据库 + 消息队列 | 理解 CAP/Raft/Paxos 理论,能选型并实现分布式事务(TCC/Saga),掌握分布式锁方案 | OCTO / Cerberus / Lion |
| 5 | 🛡️ 稳定性保障 | 🔴 核心 | 分布式系统 | 能设计限流/熔断/降级方案,掌握幂等性保障手段,理解多副本与异地多活 | Sentinel / Resilience4j |
| 6 | 🌐 网络与通信 | 🟠 重要 | Java 基础 | 理解 NIO 原理和 Netty 架构,能自定义 RPC 协议,掌握 gRPC/Thrift 使用 | Pigeon / OCTO / Shark |
| 7 | 🔐 认证授权与安全 | 🟠 重要 | Spring 全家桶 | 能独立实现 JWT/OAuth2/SSO 登录体系,掌握 RBAC 权限模型,熟悉常见安全攻防 | SSO / ePassport |
| 8 | 🏗️ 架构设计 | 🟠 重要 | Spring + 分布式 | 能做系统容量估算,会用 DDD 进行领域划分,能设计三高(高性能/高可用/高扩展)架构 | 内部架构评审体系 |
| 9 | ☁️ 云计算 & 云原生 | 🟠 重要 | 架构设计 | 熟悉 Docker/K8s 核心概念,能配置 CI/CD 流水线,理解可观测性体系(监控/日志/链路) | HULK / Crane / MCD / Raptor |
| 10 | 🎯 系统设计与面试题 | 🟠 重要 | 1~9 板块综合 | 能独立设计短链/秒杀/Feed 流/推送等经典系统,应对大厂后端面试 | — |
| 11 | 🔧 构建与工程化 | 🟡 按需 | 无 | 熟练使用 Git 工作流,能用 Gradle/Maven 管理多模块工程 | Plus(发布系统) |
| 12 | 🐘 大数据生态 | 🟡 按需 | 数据库基础 | 理解 Hadoop/Hive/Spark/Flink 架构与使用场景,能设计分层数仓,掌握数据治理方法 | WanXiang / Spark / Flink / Hive |
| 13 | 📊 数据分析 | 🟡 按需 | 大数据生态 | 能设计指标体系与埋点规范,会做 A/B 实验,熟悉 AARRR 增长分析框架 | MDBI(魔数)/ Ocean / Analytics |
| 14 | 💼 业务架构与产品思维 | 🟡 按需 | 架构设计 | 能用 Event Storming 划分服务边界,理解电商/O2O 业务模型,能从技术视角评估商业可行性 | 各业务公共服务(POI/用户/支付) |
| 15 | 🕷️ 爬虫、逆向与反爬 | 🟡 按需 | Python / 网络基础 | 能独立开发分布式爬虫,掌握 JS/App 逆向基础,能设计多层反爬系统 | 安全类工具导航 |
| 16 | 🔰 风控系统 | 🟡 按需 | 分布式 + 大数据 | 能设计实时风控架构(规则+模型融合),理解设备指纹与图谱风控,掌握风控度量体系 | 安全类工具导航 |
| 17 | 🤖 AI/Agent 应用接入 | 🟠 重要 | Spring + 数据库 | 能用 Spring AI 构建可运行的 RAG 应用,封装 Function Calling 业务接口,能解决生产级稳定性问题(超时/熔断/成本控制) | MLP / Turing / Horus |
| 18 | 🌍 多语言拓展 | 🔵 了解 | 各语言入门 | Go/Python/Node.js 达到可做实际项目水平,Shell 能写自动化脚本,C/汇编了解即可 | — |
| 19 | 🖥️ 前端技术 | 🔵 了解 | JavaScript 基础 | 能独立实现 React/Vue3 业务页面,理解前后端联调与 API 设计,具备全栈开发能力 | 前端类工具导航 |
| 20 | 🧪 测试工程 | 🟡 按需 | Spring 全家桶 + 分布式 | 能编写高质量单元/集成测试,掌握压力测试和性能测试方法论,建立完整的测试分层体系 | 测试平台(研发运维工具) |
| 21 | 🧩 多语言 AI/Agent 框架 | 🟠 重要 | 板块17 AI/Agent 接入 | 掌握 Java(Spring AI / LangChain4j)、Python(LangChain / AutoGen / CrewAI)、Node.js(LangChain.js / Vercel AI SDK)多语言 Agent 开发能力 | — |
| 22 | 📐 上下文工程(工程化落地) | 🟠 重要 | 板块17 AI/Agent 接入 | 能在 Spring AI 体系中落地 Memory 接口、RAG 工程化、结构化输出,构建完整上下文管理方案 | — |
| 23 | 🗺️ Agent 模式与编排(工程实践) | 🟠 重要 | 板块22 上下文工程 | 掌握 ReAct/Plan-Execute/Reflection 模式实践,能用 LangGraph/AutoGen/CrewAI 构建 Multi-Agent 系统,能使用主流 Agent SDK 构建生产级 Agent | — |
📌 推荐学习主线(适合后端工程师):
1 Spring→2 数据库→3 消息队列→4 分布式→5 稳定性→8 架构设计→10 系统设计面试→17 AI 接入→21 多语言框架→22 上下文工程→23 Agent 编排→ 根据方向选择其余板块
| 技术 | 学习要点 |
|---|---|
| Spring Framework | IoC / AOP / 事件机制 / Bean 生命周期 |
| Spring Boot | 自动装配原理 / Starter 开发 / 配置体系 |
| Spring MVC | 请求处理链 / 过滤器 / 拦截器 |
| Spring Cloud | Nacos / Gateway / OpenFeign / Sleuth / Config |
| Spring Security | 认证授权流程 / RBAC 模型 / OAuth2 资源服务器 |
| Spring Data | JPA / Redis / ES 集成 |
| Spring Batch | 批处理架构 / Job & Step 设计 |
| 源码模块 | 核心类 / 方法 | 学习要点 |
|---|---|---|
| IoC 容器启动 | AbstractApplicationContext#refresh() |
12 步启动流程 / BeanDefinition 注册 / BeanFactory 初始化 |
| Bean 生命周期 | AbstractAutowireCapableBeanFactory#doCreateBean() |
实例化 → 属性注入 → Aware → BeanPostProcessor → init → 销毁 |
| AOP 代理创建 | AbstractAutoProxyCreator#postProcessAfterInitialization() |
JDK 动态代理 vs CGLIB / 切点匹配 / 拦截器链执行 |
| 事务管理 | TransactionInterceptor#invoke() |
事务传播行为 / 开启-提交-回滚流程 / 与 AOP 的结合 |
| 自动装配 | AutoConfigurationImportSelector#selectImports() |
spring.factories / 条件装配 @Conditional / SPI 机制 |
| MVC 请求处理 | DispatcherServlet#doDispatch() |
HandlerMapping → HandlerAdapter → 参数解析 → 返回值处理 |
| 事件机制 | SimpleApplicationEventMulticaster#multicastEvent() |
同步/异步事件 / 观察者模式 / 自定义事件 |
| 循环依赖 | 三级缓存(singletonObjects / earlySingletonObjects / singletonFactories) |
解决流程 / 为何二级缓存不够 / 构造注入为何无法解决 |
| Spring Cloud Gateway | RoutePredicateHandlerMapping / FilteringWebHandler |
路由匹配 / 过滤器链 / 全局过滤器 vs 局部过滤器 |
| OpenFeign 调用链 | FeignClientFactoryBean / ReflectiveFeign#newInstance() |
动态代理生成 / 负载均衡集成 / 重试与降级 |
| 技术 | 学习要点 |
|---|---|
| MySQL | SQL 优化 / 索引原理 / 事务与锁 / 主从复制 / 分库分表 |
| Redis | 数据结构 / 持久化 / 集群模式 / 缓存策略 / 分布式锁 |
| Elasticsearch | 全文检索 / 索引设计 / 聚合分析 / 与 MySQL 数据同步 |
| MongoDB | 文档模型 / 适用场景 / 性能调优 |
| HBase | 大宽表设计 / RowKey 设计 / 与 Hadoop 生态集成 |
| 技术 | 学习要点 |
|---|---|
| Kafka | 生产消费模型 / 分区设计 / 幂等与事务消息 / 消息积压处理 / 与 Spring 集成 |
| 技术 | 学习要点 |
|---|---|
| Git | 分支策略 / Rebase vs Merge / Hooks / 大仓管理 |
| Gradle | 多模块构建 / 依赖管理 / 自定义 Task / 增量构建 |
| Maven | 生命周期 / 插件机制 / 私服搭建 / 多模块继承 |
| 技术 | 学习要点 |
|---|---|
| Netty | NIO/BIO/AIO 对比 / 事件循环 / Pipeline / 自定义协议 / 长连接管理 |
| RPC | gRPC / Dubbo / Thrift 原理 / 服务注册与发现 |
| CDN | 内容分发原理 / 回源策略 / 静态资源加速 |
- 登录体系:Session / JWT / OAuth2 / SSO 单点登录 / 无感刷新 Token
- 认证授权:RBAC / ABAC 模型、Spring Security 深度集成
- 安全加固:XSS / CSRF / SQL 注入防御 / 接口签名 / 数据脱敏
- ZooKeeper:选举机制 / 分布式协调 / 配置中心 / 分布式锁
- 分布式理论:CAP / BASE / Paxos / Raft 一致性算法
- 分布式事务:2PC / TCC / Saga / 消息最终一致性
| 方向 | 学习要点 |
|---|---|
| 高性能 | 连接池调优 / 线程模型 / 异步化 / JVM GC 调优 / 缓存架构 / 读写分离 |
| 高可用 | 多活架构(同城双活/异地多活)/ 容灾备份 / 故障演练 / SLA 保障 / 无状态设计 |
| 高扩展 | 水平扩展 / 垂直扩展 / 分层架构 / 插件化设计 / 开闭原则落地 |
- 系统设计方法论:需求拆解 / 容量估算 / 核心组件选型 / Back-of-envelope 估算
- 负载均衡:L4/L7 负载均衡 / Nginx / LVS / 一致性哈希
- DDD 领域驱动设计:战略设计(限界上下文 / 领域 / 子域)/ 战术设计(实体 / 值对象 / 聚合根 / 领域事件 / 仓储)
- 常见架构模式:CQRS / Event Sourcing / Saga / Outbox Pattern / Strangler Fig
💡 AI 时代的全栈开发者不仅需要运用技术解决问题,更需能看懂业务、理解产品、主动提出方案。技术与业务的语言转换能力是引领力的核心。
| 方向 | 学习要点 |
|---|---|
| 业务建模与领域划分 | 领域识别(用户域 / 订单域 / 支付域 / 品类域)/ 限界上下文 / 上下文戏图(Context Map) |
| 事件风暴(Event Storming) | 用事件串联业务流程 / 识别聚合根与划分服务边界 |
| 微服务 vs 单体权衡 | 服务拆分时机 / 单体优先 / 勿过度设计 / 渐进式拆分策略 |
| 业务指标体系 | GMV / DAU / 转化漏斗 / 留存率 / 商业可行性分析 |
| 需求分析与方案设计 | 业务需求拆解(用户故事 / PRD 解读)/ 技术方案评估与指引 |
| 行业认知与业务职能 | 电商 / O2O / 内容社区 / SaaS / 到家外卖平台业务理解 |
| 产品思维 | 用户分层与画像 / 需求的显性与隐性 / MVP 思维 / 项目型 vs 产品型思维转变 |
| AI 赋能业务 | AI 改造传统业务流程 / 智能化产品设计方法论 / Copilot 、智能客服、个性化应用场景 |
| 方向 | 技术与方案 |
|---|---|
| 限流 | 令牌桶 / 漏桶算法 / Sentinel / Redis 限流 |
| 熔断降级 | Hystrix / Resilience4j / 服务降级策略 |
| 幂等性 | Token 机制 / 数据库唯一键 / Redis 去重 |
| 冗余 | 数据冗余 / 服务多副本 / 异地多活 |
| 方向 | 技术与方案 |
|---|---|
| 容器化 | Docker(镜像构建 / 多阶段构建 / 网络模型 / Volume 管理) |
| 容器编排 | Kubernetes(Pod / Deployment / Service / Ingress / HPA / 滚动发布 / 灰度) |
| Service Mesh | Istio / Envoy(流量管理 / 熔断 / 链路追踪 / mTLS) |
| Serverless | FaaS 原理 / 冷启动优化 / 云函数应用场景 |
| 云平台核心服务 | 计算(ECS/EKS)/ 存储(OSS/S3)/ 网络(VPC/LB/NAT)/ 数据库云服务 |
| IaC 基础设施即代码 | Terraform / Helm Chart / ArgoCD / GitOps 工作流 |
| 可观测性 | Prometheus + Grafana / ELK / Jaeger 链路追踪 / OpenTelemetry |
| CI/CD | Jenkins / GitHub Actions / 流水线设计 / 蓝绿/金丝雀发布 |
| 内部平台实践 | Crane(美团容器调度)/ HULK(美团云平台)/ 云原生改造落地 |
💡 汇编与 C/C++ 作为最接近硬件的底层语言,是理解计算机体系结构、性能优化与系统编程的基石,即便暂不深入,也值得保持敬畏与了解。
| 语言 | 优先级 | 学习要点 |
|---|---|---|
| Go | 🔥 高 | 语法特性 / Goroutine & Channel / Gin / Gorm / 与 Java 对比 |
| Python | 🔥 高 | FastAPI / 数据处理 / 脚本自动化 / 与 Java 互调 |
| Node.js | 🔥 高 | 事件循环原理 / NestJS / BFF 层设计 / 全栈场景 |
| Shell | 🟡 中 | Bash 语法 / 变量与流程控制 / 正则 / 常用命令组合 / 自动化脚本 |
| C / C++ | 🔵 了解 | 指针与内存管理 / 编译链接原理 / 标准库 / 系统调用基础 |
| 汇编语言 | 🔵 了解 | 寄存器与指令集(x86/ARM)/ 栈帧结构 / 与高级语言的对应关系 |
- 基础:HTML5 / CSS3 / JavaScript(ES6+)/ TypeScript
- 框架:React / Vue3 核心原理与工程实践
- 工程化:Webpack / Vite / 前后端联调 / RESTful & GraphQL API 设计
| 技术 | 学习要点 |
|---|---|
| Hadoop | HDFS 架构 / MapReduce 编程模型 / YARN 资源调度 |
| Hive | HQL / 分区与分桶 / 存储格式(ORC/Parquet)/ 执行引擎(Tez/Spark) |
| Spark | RDD / DataFrame / SparkSQL / Spark Streaming / 调优 |
| Flink | 流批一体 / 事件时间与窗口 / 状态管理 / Checkpoint / Table API |
| Presto / Trino | 联邦查询 / OLAP 即席分析 |
| 数据湖 | Delta Lake / Apache Iceberg / Hudi 对比与选型 |
| 数据仓库 | 分层架构(ODS/DWD/DWS/ADS)/ 数据建模(星形/雪花模型) |
| 数据治理 | 元数据管理 / 数据血缘 / 数据质量 / Apache Atlas |
💡 结合真实互联网场景,将技术知识融入实战,是查漏补缺、深化理解的最佳路径。
| 方向 | 内容 |
|---|---|
| 系统设计场景题 | 设计短链系统 / 设计秒杀系统 / 设计消息推送系统 / 设计Feed流 / 设计搜索系统 |
| 分布式场景题 | 分布式 ID 生成 / 分布式锁方案对比 / 分布式事务选型 / 一致性方案设计 |
| 数据库场景题 | 大表优化 / 分库分表方案 / 缓存与数据库一致性 / 慢查询排查 |
| 高并发场景题 | 接口幂等设计 / 限流方案选型 / 热点数据处理 / 流量削峰填谷 |
| 真实互联网面试题 | 美团 / 阿里 / 字节 / 腾讯等大厂高频后端面试题整理与解析 |
| 架构面试题 | 三高系统设计 / DDD 落地 / 微服务拆分实践 / 技术选型决策 |
💡 爬虫与逆向是数据采集、竞品分析、安全研究的核心技能;反爬则是保护自身数据资产的重要手段。三者与风控共同构成进攻防守的完整体系。
| 方向 | 学习要点 |
|---|---|
| 爬虫基础 | HTTP 协议详解 / Request 伪装 / Cookie & Session 管理 / 代理池 |
| 爬虫框架 | Scrapy(Python)/ Playwright / Puppeteer / Selenium / Jsoup(Java) |
| 分布式爬虫 | 任务调度 / 去重 / 增量爬取 / 爬虫集群幻化 |
| 数据解析 | XPath / CSS Selector / 正则表达式 / JSON 解析 |
| JS 渲染页爬取 | Headless 浏览器 / 动态页面处理 / 等待策略 |
| 方向 | 学习要点 |
|---|---|
| 抓包分析 | Fiddler / Charles / Wireshark / mitmproxy 抓包工具实战 |
| JS 逆向 | JS 混淆还原 / AST 解析 / Hook 技术 / 加密算法还原 |
| App 逆向 | APK 反编译(jadx / apktool)/ 抓包分析 / 小程序逆向 |
| 协议分析 | 请求签名算法还原 / Token 机制分析 / 加密参数破解 |
| 环境条件分析 | 判断架 / Root 检测 / 模拟器检测 / SSL Pinning 绕过 |
| 方向 | 学习要点 |
|---|---|
| 基础防护 | IP 限流 / User-Agent 检测 / Referer 验证 / 请求频率控制 |
| 验证码与行为识别 | 图形验证码 / 滑块验证 / 指纹识别(字体 / 画布 / WebGL) |
| AI 反爬 | 机器行为建模 / 异常访问模式识别 / 风控分 |
| 设备指纹 | 浏览器指纹收集 / TLS 指纹 / 网络行为特征 |
| 防爬系统设计 | 多层防护架构 / 实时风控决策 / 蛮蜂罐 / 开放接口签名 |
💡 风控是爬虫对抗、反欺诈、账号安全的核心引擎,与爬虫/逆向/反爬深度关联。大厂(美团、阿里、字节等)的风控体系都是高价值学习样本。
| 方向 | 学习要点 |
|---|---|
| 账号安全 | 撞库检测 / 账号盗用识别 / 异常登录判断 / 设备绑定策略 |
| 交易风控 | 支付欺诈识别 / 异常下单检测 / 黑产对抗 / 羊毛党识别 |
| 内容风控 | 垃圾内容过滤 / 违禁词检测 / 用户举报处理 / AI 审核 |
| 活动风控 | 优惠券滥用 / 刷单检测 / 营销作弊 / 新人红包对抗 |
| 爬虫风控 | Bot 检测 / 接口滥用识别 / 数据爬取防护 |
| 方向 | 学习要点 |
|---|---|
| 规则引擎 | 规则配置 / 动态规则热更新 / 规则优先级 / Drools / 自研规则引擎 |
| 设备指纹 | 浏览器指纹 / App 设备指纹 / 设备标识生成与存储策略 |
| 行为序列分析 | 用户行为序列建模 / 异常行为识别 / 操作路径分析 |
| 图谱风控 | 关联图谱(账号/设备/IP/手机号)/ 团伙欺诈识别 / 图神经网络应用 |
| AI 风控模型 | 特征工程 / 有监督/无监督模型 / 实时推理 / 模型迭代 |
| 实时风控架构 | 同步风控 vs 异步风控 / 毫秒级决策 / Flink 实时计算 / 规则 + 模型融合 |
| 方向 | 学习要点 |
|---|---|
| 风控系统架构 | 前置拦截 / 事中监控 / 事后审计 / 分层决策体系 |
| 名单系统 | 黑/白/灰名单管理 / 名单同步 / TTL 策略 / 联邦名单 |
| 事件总线 | 风控事件上报 / 异步处理 / Kafka 接入 / 事件溯源 |
| 案例系统 | 可疑事件案例化 / 人工审核工作台 / 风控闭环 |
| 风控度量 | 误判率 / 漏判率 / ROC/AUC / 风控效果评估体系 |
💡 数据分析是从数据中提炼业务洞察的关键能力,包含指标体系设计、可视化表达、用户行为分析、A/B 实验等。对后端工程师而言,理解数据分析能够帮助更好地设计数据采集、埋点与指标体系。
| 方向 | 学习要点 |
|---|---|
| 指标体系设计 | 北极星 / OKR / 核心指标拆解 / 北极星指标 vs 过程指标 |
| 埋点设计 | 埋点规范 / 事件分类 / 属性设计 / 埋点 SDK 集成 |
| 数据采集 | 前端埋点 / 后端埋点 / 日志采集 / 第三方数据接入 |
| 数据质量治理 | 埋点准确性校验 / 数据对账 / 异常表现监控 |
| 方向 | 学习要点 |
|---|---|
| 用户路径分析 | 漏斗模型 / 路径分析 / 转化漏斗分析 |
| 留存与活跃分析 | DAU/MAU / 用户留存率 / 活跃度分层 / Cohort 分析 |
| 用户分群 | RFM 模型 / 用户标签体系 / 用户生命周期分析 |
| 归因分析 | 同环比 / 环比 / 指标异常归因方法论 / 归因树 |
| A/B 实验 | 实验设计 / 分流策略 / 显著性检验 / 多层分流 / Holdout 组 |
| 预测分析 | 时序预测 / 用户行为预测 / 模型评估 / 特征重要性 |
| 方向 | 学习要点 |
|---|---|
| SQL 分析 | 窗口函数 / 常用分析模式 / 复杂查询优化 |
| Python 数据分析 | Pandas / NumPy / Matplotlib / Seaborn / 数据清洗与转换 |
| 可视化 | Tableau / Superset / Grafana / ECharts / 数据看板设计原则 |
| 分析平台 | 实时 OLAP(Doris/ClickHouse)/ 役角分析(分析师 vs 开发) |
| 增长分析框架 | AARRR 模型 / HEART 框架 / 北极星指标 / 第一核心行动 |
💡 本章聚焦「做系统」——目标是交付可运行的 AI 业务代码。AI Coding 工具使用方法论、Harness/Eval 框架、Claude Code 源码研究等内容见
ai_coding_harness_engineering_study。
| 方向 | 学习要点 |
|---|---|
| Spring AI 框架 | ChatClient / ChatModel / Advisors / EmbeddingModel / ImageModel |
| 模型 API 对接 | OpenAI / Anthropic Claude / 国内模型(DeepSeek / 通义 / 文心)接入 |
| Prompt 管理 | PromptTemplate / SystemMessage / 多轮对话构建 |
| 流式响应处理 | Streaming API / SSE 推送 / 前端实时渲染集成 |
| 多模型路由 | 模型能力分级 / 按场景路由 / 降级备用模型策略 |
| 方向 | 学习要点 |
|---|---|
| 向量数据库集成 | Milvus / Chroma / PgVector / Redis Vector 接入与 Spring AI 集成 |
| 文档处理管线 | 文档解析(PDF/Word/HTML)/ Chunking 策略 / Embedding 批处理 |
| 检索服务构建 | 向量检索 / 关键词检索 / 混合检索接口封装 |
| RAG 应用实战 | 企业知识库问答 / 文档智能搜索 / 代码库检索 |
| 数据更新策略 | 增量索引 / 版本管理 / 文档失效处理 |
| 方向 | 学习要点 |
|---|---|
| Function Calling 原理 | 工具定义规范(JSON Schema)/ 工具调用循环机制 |
| Spring AI Function | @Bean 注册工具 / FunctionCallback 接口 / 自动发现机制 |
| 业务工具封装 | 数据库查询工具 / HTTP 外部 API 工具 / 内部微服务工具 |
| 工具调用安全 | 参数校验 / 权限控制 / 调用结果脱敏 |
| MCP 服务端开发 | 用 Java/Spring 实现 MCP Server,暴露内部能力给 AI 工具 |
| 方向 | 学习要点 |
|---|---|
| 超时与熔断 | 模型调用超时设置 / Resilience4j 熔断 / 快速失败策略 |
| 重试策略 | 指数退避重试 / 幂等重试设计 / 最大重试次数控制 |
| 成本控制 | Token 用量统计 / 请求限频(Rate Limit)/ 缓存重复请求 |
| 异步化处理 | 长时推理异步化 / 任务队列(Kafka/MQ)/ 结果回调通知 |
| 可观测性 | 模型调用链路追踪 / Token 用量监控看板 / 异常率告警 |
💡 本章聚焦多语言生态的 AI/Agent 工程实践——Java(Spring AI / LangChain4j)、Python(LangChain / AutoGen / CrewAI)、Node.js(LangChain.js / Vercel AI SDK)三大语言的框架对比与应用,覆盖主流 Agent SDK 工程落地。
| 框架 | 学习要点 |
|---|---|
| Spring AI | ChatClient / Advisors / EmbeddingModel / VectorStore / ToolCallback / Memory 接口 |
| LangChain4j | AI Service / Tool 注解体系 / Memory 实现 / RAG 管线 / Streaming / 与 Spring 集成 |
| 框架 | 学习要点 |
|---|---|
| LangChain(Python) | Chain 组合 / LCEL 声明式链 / AgentExecutor / 工具体系 / Memory 类型 / 与 LangSmith 集成 |
| AutoGen | ConversableAgent / AssistantAgent / UserProxyAgent / GroupChat / 代码执行 Agent |
| CrewAI | Crew / Agent / Task / Tool 四元组 / Process 流程(顺序/并行/层级) |
| LlamaIndex | Index / Retriever / QueryEngine / RAG 专项能力 / 与 LangChain 对比 |
| Pydantic AI | 类型安全 Agent / 结构化输出验证 / Dependency Injection |
| smolagents(HF) | Code Agent 模式 / 极简 Agent 设计 / 开源模型友好 |
| 框架 | 学习要点 |
|---|---|
| LangChain.js | 与 Python 版对比 / Chain / Agent / Tool 体系 / Node.js 下的流式处理 |
| Vercel AI SDK | useChat / useCompletion / streamText / Next.js 全栈 AI 应用 |
| OpenAI Node SDK | 官方 SDK 使用 / Assistants API / Streaming / Function Calling |
| SDK | 学习要点 |
|---|---|
| OpenAI Agents SDK | Agent + Handoff + Guardrails 三元组 / Runner / Tracing / MCP 集成 / 多 Agent 系统设计 |
| Google ADK | Agent / Tool / Session / Runner / Sequential/Parallel/LoopAgent 编排原语 / Vertex AI 部署 |
| AWS Strands | Model-driven Loop / Bedrock 集成 / MCP 支持 / agent_as_tool 嵌套 |
| Anthropic SDK | Tool Use 原生 Loop / Streaming Tool Use / Computer Use(Beta) |
💡 本章聚焦上下文工程的工程化落地——即在业务系统中如何系统性地设计、管理和优化传递给模型的信息内容。上下文工程原理与概念见
ai_coding_harness_engineering_study(概念了解层)。
- 长上下文的"迷失中间"问题在业务系统中的影响与对策
- 不同模型上下文长度对比与实际可用长度分析
- 有效利用上下文窗口的工程策略(分片、摘要、动态截断)
- Spring AI ChatMemory 接口:
InMemoryChatMemory/CassandraChatMemory/ 自定义实现 - LangChain4j ConversationMemory 实现与对话历史管理
- 对话历史裁剪与摘要策略(滑动窗口 / 重要性排序 / 动态压缩)
- 跨会话记忆持久化方案(Redis / 数据库)
- 短期记忆:Spring AI / LangChain4j 中对话历史的保留与裁剪实现
- 长期记忆:向量数据库持久化(Milvus / Chroma / PgVector / Redis Vector)
- 实体记忆:结构化知识抽取与动态注入
- 跨会话记忆:Session ID 管理 / 记忆版本控制 / 记忆失效策略
- Chunking 策略:固定大小 / 句子 / 段落 / 语义切分的工程实现
- Embedding 工程:批处理 Embedding / 增量更新 / Embedding 缓存
- 混合检索实现:向量 + BM25 混合检索服务的 Spring 集成
- Reranker 集成:Cross-encoder 重排序提升检索质量
- GraphRAG:知识图谱辅助检索方案
- Agentic RAG:将 RAG 作为 Agent 工具的工程设计
- Spring AI Structured Output:
BeanOutputConverter/MapOutputConverter/ListOutputConverter - LangChain4j AiServices:接口方法自动结构化输出(
@SystemMessage+ 返回类型推导) - Python Pydantic 约束:LangChain with_structured_output / Pydantic AI 类型安全输出
- JSON Schema 精确约束:字段类型、必选项、枚举值的工程化配置
- 输出解析健壮性:部分失败处理、格式修复策略、流式输出下的结构化解析
- 并行工具调用 vs. 顺序工具调用的工程选型与实现
- 工具调用的错误处理与重试策略:超时 / 参数校验 / 降级处理
- 主流模型工具调用能力对比(OpenAI / Claude / Gemini / DeepSeek 差异)
- MCP Client 集成:在 Java/Python 应用中作为 MCP 客户端消费 MCP Server 能力
💡 本章聚焦 Agent 模式与编排的工程落地——从理论到可运行的代码。Agent 模式原理与 SDK 详细对比见
ai_coding_harness_engineering_study(原理与工具研究层),本章聚焦在业务系统中的工程实现。
| 模式 | 工程落地要点 |
|---|---|
| ReAct | 推理 + 行动循环的代码实现 / 工具调用结果注入上下文 / 循环终止条件设计 |
| Plan-and-Execute | 规划器(Planner)+ 执行器(Executor)分离架构 / 步骤依赖管理 |
| Reflection | 自我评审提示词设计 / 输出质量验证 / 修正循环的终止策略 |
| Reflexion | 带记忆的反思强化 / Episodic Buffer 持久化 / 经验积累机制 |
| Self-Ask | 子问题分解的递归实现 / 问题依赖图管理 |
| Tree of Thoughts | 树形推理路径的数据结构设计 / 回溯机制实现 |
- Orchestrator-Worker:主控 Agent 任务分发与 Worker Agent 并行执行的工程实现
- Supervisor:基于质量评分的路由决策逻辑 / 反馈循环设计
- Swarm:去中心化 Agent 交接(Handoff)机制 / 状态传递协议
- Pipeline:线性 Agent 流水线的工程实现 / 阶段间数据契约设计
- Parallel Fan-out:任务并行拆解 + 结果汇聚的异步实现(CompletableFuture / asyncio)
| 框架 | 工程实践要点 |
|---|---|
| LangGraph(Python) | StateGraph 构建 / 节点函数定义 / 条件边路由 / 循环图 / Checkpoint 持久化 / 流式执行 |
| LangGraph(Java SDK) | 与 Spring 集成 / Java 版图构建 API |
| AutoGen | ConversableAgent 配置 / GroupChatManager 实现 / 代码执行沙箱 / Skill 函数注册 |
| CrewAI | Crew / Agent / Task 定义 / Process 选型(Sequential/Hierarchical)/ 工具绑定 |
| LangChain AgentExecutor | 工具链组装 / 内存集成 / 错误处理 / 与 LCEL 结合 |
聚焦工程实践,SDK 原理与对比详见
ai_coding_harness_engineering_study项目。
| SDK | 工程落地要点 |
|---|---|
| OpenAI Agents SDK | Agent 定义与工具绑定 / Handoff 实现 / Guardrails 配置 / Tracing 接入 / 多 Agent 系统构建 |
| Google ADK | SequentialAgent / ParallelAgent / LoopAgent 实战 / Callbacks 钩子 / Vertex AI 部署 |
| AWS Strands | Bedrock 模型接入 / 工具函数定义 / agent_as_tool 嵌套调用 / MCP Client 集成 |
| Anthropic SDK | Tool Use Loop 实现 / Streaming Tool Use / Computer Use 集成 |
- 记忆管理:In-context Memory(对话历史管理)/ External Memory(向量数据库 CRUD)/ 跨任务记忆复用
- 状态管理:有状态 Agent(Checkpointing)/ 无状态 Agent 设计 / 状态持久化(Redis / 数据库)
- 中断与恢复:Human-in-the-loop 审批节点工程实现 / Checkpoint 机制 / 断点续传
- 可观测性:LangSmith / LangFuse / OpenTelemetry 集成 / Trace 追踪 / 指标监控
- Agent 评估:Trajectory 评估体系 / 行为录制与回放 / 与 Harness 框架对接
- Anthropic Computer Use:桌面操控(截图感知 → 鼠标/键盘操作)的工程集成
- Browser Use(开源框架):浏览器 Agent 的 DOM 解析 / 截图感知 / 标准化操作封装
- GUI Agent 工程挑战:页面状态不稳定处理 / 动态渲染等待策略 / 错误恢复机制
- 异步任务模式:任务提交 → 轮询状态 → 结果回调的工程实现(Spring Async / CompletableFuture)
- 任务队列设计:Kafka/MQ 接入 / 任务状态机 / 优先级队列
- 检查点与断点续传:中间状态持久化方案(Redis / 数据库)/ 失败重启策略
- 用户通知机制:长任务完成后的 Webhook 回调 / 消息推送集成
🚧 目录结构规划中,随学习进度逐步创建与完善。
📌 这部分是什么? 上面板块学的都是"通用技术",而
美团工具服务导航/目录记录的是这些技术在美团生产环境中的具体落地形态。每学完一个技术板块,可以对照下表找到美团对应的内部系统,加深理解"真实系统是怎么做的"。
| 通用技术 | 美团内部对应工具 | 所在文件 |
|---|---|---|
| Spring Boot / 微服务框架 | MDP、XFrame | 研发运维工具.md |
| 服务注册发现 / 治理 | OCTO、Lion(配置) | 研发运维工具.md / 架构类.md |
| 发布 / CI/CD | Plus、MCD | 研发运维工具.md |
| 监控告警 / 可观测性 | Raptor、LogCenter | 研发运维工具.md |
| MySQL 托管 / 分库分表 | RDS、Zebra、Blade | 架构类.md |
| Redis / KV 缓存 | Squirrel(内存)、Cellar(持久) | 架构类.md |
| 对象存储 | S3Plus、Venus(图片) | 架构类.md |
| Kafka / 消息队列 | Mafka、Pike(移动端) | 架构类.md |
| 定时任务调度 | Crane | 架构类.md |
| 分布式锁 | Cerberus | 架构类.md |
| API 网关 | Shepherd、Oceanus(七层)、MGW(四层) | 架构类.md |
| Hadoop / Spark / Flink | WanXiang、Spark 内存批处理、RT 实时计算 | 数据类.md |
| OLAP 即席查询 | Presto Adhoc、Talos | 数据类.md |
| BI / 数据分析平台 | MDBI(魔数) | 数据类.md |
| 机器学习平台 | MLP、Turing、MLX | 数据类.md |
| 用户行为采集 | Analytics(灵犀)、Ocean | 数据类.md |
| JWT / SSO / 认证授权 | SSO、MTUserCenter、ePassport | 安全类.md / 业务公共服务.md |
| 风控 / 安全防护 | 各安全工具 | 安全类.md |
| 前端框架 / 低代码 | Picasso、Mach、Rhino | 前端类.md |
| IM / 消息推送 / SMS | IM 即时通讯、Hedwig、SMS、TTS | 通讯类.md |
| 设计协作 / UI 规范 | Ingee(印迹)、Cookie(曲奇) | 设计类.md |
| 用户中心 / 地图 / 支付 | MTUserCenter、MAF、PayCashier | 业务公共服务.md |
| 大模型 / AI 服务 | MLP(模型平台)、Horus(AI 中台)、Turing | 数据类.md |
java_fullstack_ai_agent_study/
├── README.md # 项目总览(当前文件)
├── meituan_work_space(MWS).md # 美团内部技术平台组件索引(MWS)
│
├── 美团工具服务导航/ # 美团内部工具服务导航
│ ├── 工程师工具导航/ # 按岗位角色划分的工具导航
│ │ ├── 前端工程师.md # 前端工程师工具导航
│ │ ├── 后台&系统工程师.md # 后台 & 系统工程师工具导航
│ │ ├── 算法工程师.md # 算法工程师工具导航
│ │ ├── 数据工程师.md # 数据工程师工具导航
│ │ ├── 测试工程师.md # 测试工程师工具导航
│ │ └── 运维工程师.md # 运维工程师工具导航
│ └── 公共服务工具导航/ # 按类别划分的公共工具全览
│ ├── 研发运维工具.md # 发布 / 监控 / 测试 / 开发 / 协作工具
│ ├── 前端类.md # 前端框架 / 跨端 / 低代码 / 可视化工具
│ ├── 安全类.md # 风控 / 网络安全 / 合规工具
│ ├── 数据类.md # 大数据 / BI / 机器学习 / 用户行为工具
│ ├── 架构类.md # 服务治理 / 消息队列 / 网关 / 存储 / 容器
│ ├── 设计类.md # 设计协作 / 物料生产 / UI 一致性工具
│ ├── 通讯类.md # IM / 短信 / Push / 语音通话工具
│ └── 业务公共服务.md # 用户账号 / 地图 / 支付 / POI / 运营工具
│
├── spring/ # Spring 全家桶实践
│ ├── spring-core/ # IoC / AOP 实验
│ ├── spring-boot/ # 自动装配 / Starter 开发
│ ├── spring-cloud/ # 微服务体系
│ ├── spring-security/ # 认证授权
│ └── source-code/ # 重点源码分析(IoC/AOP/事务/MVC/自动装配)
│
├── databases/ # 数据库与存储
│ ├── mysql/ # SQL 优化 / 事务 / 分库分表
│ ├── redis/ # 数据结构 / 集群 / 分布式锁
│ ├── elasticsearch/ # 全文检索 / 聚合
│ ├── mongodb/ # 文档模型
│ └── hbase/ # 大宽表设计
│
├── messaging/ # 消息队列
│ └── kafka/ # 生产消费 / 事务消息
│
├── network/ # 网络与通信
│ ├── netty/ # 自定义协议 / 长连接
│ └── rpc/ # gRPC / Dubbo
│
├── security/ # 认证授权与安全
│ ├── jwt-oauth2/
│ └── sso/
│
├── distributed/ # 分布式系统
│ ├── zookeeper/
│ └── distributed-transaction/
│
├── architecture/ # 架构设计
│ ├── three-high/ # 三高架构(高性能/高可用/高扩展)
│ ├── ddd/ # DDD 领域驱动设计
│ └── arch-patterns/ # CQRS / Event Sourcing / Saga 等
│
├── business-arch/ # 业务架构与产品思维
│ ├── domain-modeling/ # 领域建模 / 边界划分
│ ├── event-storming/ # 事件风暴实践
│ ├── industry-knowledge/ # 行业认知(电商/O2O/SaaS/到家等)
│ ├── metrics/ # 业务指标体系
│ └── ai-product/ # AI 赋能业务应用设计
│
├── system-design/ # 系统设计案例
│ ├── scenarios/ # 真实场景设计题(短链/秒杀/Feed流等)
│ └── interview-questions/ # 大厂高频面试题整理
│
├── high-performance/ # 高性能 / 高可用
│
├── stability/ # 稳定性(限流 / 熔断 / 幂等)
│
├── cloud-native/ # 云计算 & 云原生
│ ├── docker/ # 容器化基础
│ ├── kubernetes/ # K8s 核心与实践
│ ├── service-mesh/ # Istio / Envoy
│ ├── observability/ # 可观测性(Prometheus/Grafana/Jaeger)
│ ├── cicd/ # CI/CD 流水线
│ ├── iac/ # 基础设施即代码(Terraform/Helm/ArgoCD)
│ └── cloud-platform/ # 云平台核心服务与内部平台实践
│
├── build-tools/ # 构建工具
│ ├── gradle/
│ └── maven/
│
├── other-languages/ # 多语言拓展
│ ├── go/
│ ├── python/
│ ├── nodejs/
│ ├── shell/ # Bash 脚本 / 自动化
│ ├── c-cpp/ # C/C++ 基础 / 内存 / 系统调用
│ └── assembly/ # 汇编指令集 / 与高级语言映射
│
├── frontend/ # 前端技术
│ ├── react/
│ └── vue/
│
├── big-data/ # 大数据生态
│ ├── hadoop/ # HDFS / MapReduce / YARN
│ ├── hive/ # 数仓 HQL / 存储格式
│ ├── spark/ # RDD / SparkSQL / Streaming
│ ├── flink/ # 流批一体 / 状态管理
│ ├── data-warehouse/ # 数仓分层设计 / 建模
│ └── data-governance/ # 数据治理 / 血缘 / 质量
│
├── data-analysis/ # 数据分析
│ ├── metrics-tracking/ # 指标与埋点体系
│ ├── analysis-methods/ # 分析方法 / A/B实验 / 用户分群
│ └── tools/ # SQL / Python / 可视化工具
│
├── crawler-reverse/ # 爬虫、逆向与反爬
│ ├── crawler/ # 爬虫基础 / 分布式爬虫 / JS渲染
│ ├── reverse/ # 抓包分析 / JS逆向 / App逆向
│ └── anti-crawler/ # 反爬系统设计 / 风控 / 指纹
│
├── risk-control/ # 风控系统
│ ├── business-risk/ # 账号/交易/内容/活动风控
│ ├── rule-engine/ # 规则引擎 / Drools
│ ├── device-fingerprint/ # 设备指纹体系
│ ├── graph-risk/ # 图谱风控 / 团伙识别
│ └── realtime-arch/ # 实时风控架构设计
│
├── ai/ # AI/Agent 全栈工程实践(三大 AI 板块统一入口)
│ ├── ai-agent/ # 板块17:AI/Agent 应用接入(做系统)
│ │ ├── spring-ai/ # Spring AI 框架实践(ChatClient / Advisors)
│ │ ├── rag/ # RAG 系统工程化(向量库集成 / 检索管线)
│ │ ├── function-calling/ # Function Calling 封装(Spring AI Function)
│ │ ├── mcp-server/ # Java/Spring 实现 MCP Server
│ │ └── stability/ # 生产级稳定性(超时/熔断/成本控制/可观测性)
│ │
│ ├── multi-lang-frameworks/ # 板块21:多语言 AI/Agent 框架
│ │ ├── java/ # Java 框架(Spring AI / LangChain4j)
│ │ │ ├── spring-ai/
│ │ │ └── langchain4j/
│ │ ├── python/ # Python 框架(LangChain / AutoGen / CrewAI / LlamaIndex)
│ │ │ ├── langchain/
│ │ │ ├── autogen/
│ │ │ ├── crewai/
│ │ │ ├── llamaindex/
│ │ │ ├── pydantic-ai/
│ │ │ └── smolagents/
│ │ └── nodejs/ # Node.js 框架(LangChain.js / Vercel AI SDK)
│ │ ├── langchainjs/
│ │ └── vercel-ai-sdk/
│ │
│ ├── agent-sdk/ # Agent SDK 工程实践(各厂商官方 SDK)
│ │ ├── openai-agents-sdk/ # OpenAI Agents SDK(Agent/Handoff/Guardrails)
│ │ ├── google-adk/ # Google Agent Development Kit(ADK)
│ │ ├── aws-strands/ # AWS Strands Agents SDK
│ │ ├── anthropic-tool-use/ # Anthropic SDK Tool Use 原生实践
│ │ └── sdk-comparison/ # 各 SDK 横向对比与选型指南
│ │
│ ├── context-engineering/ # 板块22:上下文工程(工程化落地)
│ │ ├── context-window/ # 上下文窗口管理策略
│ │ ├── memory/ # Memory 记忆体系(Spring AI / LangChain4j 实现)
│ │ │ ├── short-term/ # 短期记忆(对话历史管理)
│ │ │ ├── long-term/ # 长期记忆(向量数据库持久化)
│ │ │ └── entity/ # 实体记忆(结构化知识抽取)
│ │ ├── rag-advanced/ # RAG 深度实践(GraphRAG / Agentic RAG / Reranker)
│ │ ├── structured-output/ # 结构化输出工程(Spring AI / LangChain4j / Pydantic)
│ │ └── tools-engineering/ # 工具调用工程深化(并行/错误处理/MCP 客户端)
│ │
│ └── agent-patterns/ # 板块23:Agent 模式与编排(工程实践)
│ ├── patterns/ # Agent 基础模式实践
│ │ ├── react/ # ReAct 模式
│ │ ├── plan-execute/ # Plan-and-Execute
│ │ ├── reflection/ # Reflection / Reflexion
│ │ └── tree-of-thoughts/# Tree of Thoughts
│ ├── multi-agent/ # Multi-Agent 模式工程实践
│ │ ├── orchestrator/ # Orchestrator-Worker 模式
│ │ ├── supervisor/ # Supervisor 监督者模式
│ │ ├── swarm/ # Swarm 去中心化交接
│ │ └── parallel/ # Parallel Fan-out 并行汇聚
│ ├── orchestration/ # 编排框架工程实践
│ │ ├── langgraph/ # LangGraph 图结构编排
│ │ ├── autogen/ # AutoGen 多 Agent 对话
│ │ └── crewai/ # CrewAI 角色任务编排
│ ├── agent-core/ # Agent 核心能力工程实现
│ │ ├── memory-mgmt/ # 记忆管理工程实践
│ │ ├── state-mgmt/ # 状态管理(Checkpointing)
│ │ ├── hitl/ # Human-in-the-loop 审批节点
│ │ └── observability/ # 可观测性(LangSmith/LangFuse)
│ ├── computer-use/ # Computer Use / Browser Use
│ └── long-running/ # Long-running Agent(异步任务工程)
│
└── testing/ # 🧪 测试工程
├── unit-testing/ # 单元测试(JUnit 5 + Mockito)
│ ├── junit5/ # JUnit 5 注解体系 / 断言 API / 参数化测试
│ └── mockito/ # Mock / Stub / Spy / ArgumentCaptor
├── integration-testing/ # 集成测试
│ ├── spring-boot-test/ # @SpringBootTest / @DataJpaTest / @WebMvcTest
│ ├── testcontainers/ # Testcontainers(MySQL/Redis/Kafka 真实环境)
│ └── wiremock/ # WireMock HTTP 服务 Mock
├── performance-testing/ # 性能测试 / 压力测试
│ ├── jmh/ # JMH 微基准测试(@Benchmark / 预热 / 测量陷阱)
│ ├── jmeter/ # JMeter(线程组 / 分布式压测 / 测试计划设计)
│ ├── gatling/ # Gatling(Scala DSL / 场景建模 / 压测报告)
│ └── k6/ # K6(JS 脚本压测 / 灵活场景 / 指标导出)
├── api-testing/ # API 测试(REST Assured / MockMvc)
├── contract-testing/ # 契约测试(Spring Cloud Contract / Pact)
├── chaos-engineering/ # 混沌工程(Chaos Monkey / 故障注入)
└── test-design/ # 测试用例设计(等价类 / 边界值 / TDD / BDD)
💡 工程质量的最后一道防线。从单元测试到压力测试,建立分层测试体系,是全栈工程师不可缺失的硬技能。AI 时代更需要可靠的测试作为 AI 生成代码的验证基础(Harness)。
| 层次 | 方向 | 学习要点 |
|---|---|---|
| 单元测试 | JUnit 5 | 注解体系(@Test / @ParameterizedTest / @BeforeEach)/ 断言 API / 测试生命周期 |
| 单元测试 | Mockito | @Mock / @InjectMocks / when-thenReturn / verify / ArgumentCaptor / Spy |
| 集成测试 | Spring Boot Test | @SpringBootTest / @DataJpaTest / @WebMvcTest / @MockBean / TestRestTemplate |
| 集成测试 | Testcontainers | Docker 容器化集成测试 / MySQL/Redis/Kafka 真实环境测试 / 与 JUnit 5 集成 |
| 契约测试 | Spring Cloud Contract / Pact | 服务间接口契约验证 / 消费者驱动契约测试 |
| 端到端测试 | Selenium / Playwright | 浏览器自动化 / 测试场景编写 / CI 集成 |
| 方法 | 学习要点 |
|---|---|
| 等价类划分 | 有效等价类 / 无效等价类 / 边界值选取策略 |
| 边界值分析 | 最小值 / 最大值 / 边界 ±1 / 特殊值(null/0/空字符串) |
| 因果图 / 判定表 | 多条件组合 / 简化判定表方法 |
| 场景测试法 | 主成功场景 / 扩展场景 / 异常场景 / 备选路径 |
| TDD(测试驱动开发) | 红-绿-重构循环 / 测试先行 / 设计反馈 |
| BDD(行为驱动开发) | Given-When-Then 格式 / Cucumber / 与业务语言对齐 |
| 测试覆盖率 | 行覆盖 / 分支覆盖 / 条件覆盖 / JaCoCo 工具使用 |
| 方向 | 学习要点 |
|---|---|
| 性能测试方法论 | 性能测试类型(基准/负载/压力/稳定性/尖峰测试)/ 性能指标(TPS/QPS/响应时间/并发数/错误率) |
| JMH 微基准测试 | @Benchmark / 基准测试模式 / JVM 预热(Warmup)/ 避免死码消除 / 测量陷阱 |
| JMeter | 测试计划设计 / 线程组 / 采样器 / 监听器 / 分布式压测 / 参数化 |
| Gatling | 基于 Scala DSL 的高并发压测 / 场景建模 / 断言与报告 / 与 CI/CD 集成 |
| K6 | JavaScript 脚本压测 / 灵活场景编排 / 指标导出 / 云端压测 |
| 压测结果分析 | 性能瓶颈定位(CPU/内存/IO/锁)/ 火焰图辅助分析 / 与监控告警结合 |
| 方向 | 学习要点 |
|---|---|
| Testcontainers 实战 | 数据库(MySQL/PostgreSQL)/ 缓存(Redis)/ 消息队列(Kafka)/ 使用 @Container + @DynamicPropertySource |
| WireMock | HTTP 依赖服务 Mock / Stub 录制回放 / 请求匹配策略 / 与 Spring 集成 |
| 测试数据管理 | @Sql 脚本 / @Transactional 测试回滚 / TestDataBuilder 模式 / Fixture 工厂 |
| API 测试 | REST Assured / MockMvc 链式 API / 接口自动化测试 |
| 混沌工程 | Chaos Engineering 理念 / Chaos Monkey / 故障注入(网络延迟/节点宕机)/ 稳定性验证 |
各模块学习状态持续更新。状态说明:🔜 待开始 | 🔥 进行中 | ✅ 已完成 | ⏸️ 暂停
| 主模块 | 子模块 | 状态 | 备注 |
|---|---|---|---|
| 🧩 Spring 全家桶 | Spring Framework(IoC / AOP / 事件机制) | 🔜 待开始 | |
| Spring Boot(自动装配 / Starter 开发) | 🔜 待开始 | ||
| Spring Cloud(Nacos / Gateway / OpenFeign / Sleuth) | 🔜 待开始 | ||
| Spring Security / OAuth2 资源服务器 | 🔜 待开始 | ||
| Spring Data / Batch | 🔜 待开始 | ||
| 🔬 重点源码(IoC 启动 / Bean 生命周期 / AOP 代理 / 事务 / 自动装配 / MVC / 循环依赖) | 🔜 待开始 | 深度优先 | |
| 🗄️ 数据库与存储 | MySQL(索引 / 事务与锁 / 主从复制 / 分库分表) | 🔜 待开始 | |
| Redis(数据结构 / 持久化 / 集群 / 分布式锁) | 🔜 待开始 | ||
| Elasticsearch(全文检索 / 索引设计 / 聚合分析) | 🔜 待开始 | ||
| MongoDB(文档模型 / 适用场景) | 🔜 待开始 | ||
| HBase(大宽表设计 / RowKey 设计) | 🔜 待开始 | ||
| 📨 消息队列 | Kafka(生产消费 / 分区设计 / 事务消息 / 积压处理) | 🔜 待开始 | |
| 🌐 网络与通信 | Netty(NIO/BIO/AIO / 自定义协议 / 长连接管理) | 🔜 待开始 | |
| RPC(gRPC / Dubbo / Thrift / 服务注册与发现) | 🔜 待开始 | ||
| CDN(内容分发原理 / 回源策略) | 🔜 待开始 | ||
| 🔐 认证授权与安全 | 登录体系(Session / JWT / OAuth2 / SSO 单点登录) | 🔜 待开始 | |
| 认证授权(RBAC / ABAC 模型) | 🔜 待开始 | ||
| 安全加固(XSS / CSRF / SQL 注入防御 / 接口签名) | 🔜 待开始 | ||
| ⚙️ 分布式系统 | ZooKeeper(选举机制 / 分布式协调 / 配置中心 / 分布式锁) | 🔜 待开始 | |
| 分布式理论(CAP / BASE / Paxos / Raft) | 🔜 待开始 | ||
| 分布式事务(2PC / TCC / Saga / 消息最终一致性) | 🔜 待开始 | ||
| 🏗️ 架构设计 | 三高架构(高性能 / 高可用 / 高扩展) | 🔜 待开始 | |
| DDD 领域驱动设计(限界上下文 / 聚合根 / 领域事件) | 🔜 待开始 | ||
| 架构模式(CQRS / Event Sourcing / Saga / Outbox Pattern) | 🔜 待开始 | ||
| 💼 业务架构与产品思维 | 领域建模与划分(用户域 / 订单域 / 支付域 / Context Map) | 🔜 待开始 | |
| 事件风暴(Event Storming)— 用事件识别业务流程与服务边界 | 🔜 待开始 | ||
| 微服务 vs 单体权衡(拆分时机 / 单体优先 / 渐进式拆分) | 🔜 待开始 | ||
| 业务指标体系(GMV / DAU / 漏斗转化 / 商业可行性分析) | 🔜 待开始 | ||
| 需求分析与方案评估(PRD 解读 / 用户故事 / 技术方案对比) | 🔜 待开始 | ||
| 行业认知(电商 / O2O / 内容社区 / SaaS / 到家外卖平台业务理解) | 🔜 待开始 | ||
| 产品思维(用户分层 / 显性与隐性需求 / MVP / 项目型 vs 产品型思维) | 🔜 待开始 | ||
| AI 赋能业务(智能化改造流程 / Copilot / 智能客服 / 个性化推荐应用) | 🔜 待开始 | ||
| 🎯 系统设计与面试题 | 系统设计方法论 / 容量估算 / 核心组件选型 | 🔜 待开始 | |
| 真实场景设计题(短链 / 秒杀 / 消息推送 / Feed 流 / 搜索) | 🔜 待开始 | ||
| 大厂高频面试题(美团 / 阿里 / 字节 / 腾讯) | 🔜 待开始 | ||
| 🛡️ 稳定性保障 | 限流(令牌桶 / 漏桶算法 / Sentinel / Redis 限流) | 🔜 待开始 | |
| 熔断降级(Hystrix / Resilience4j) | 🔜 待开始 | ||
| 幂等性设计(Token / 数据库唯一键 / Redis 去重) | 🔜 待开始 | ||
| 冗余与高可用(多副本 / 异地多活) | 🔜 待开始 | ||
| ☁️ 云计算 & 云原生 | Docker(镜像构建 / 多阶段构建 / 网络模型 / Volume 管理) | 🔜 待开始 | |
| Kubernetes(Pod / Deployment / Service / Ingress / HPA / 滚动发布) | 🔜 待开始 | ||
| Service Mesh — Istio / Envoy(流量管理 / 熔断 / mTLS / 链路追踪) | 🔜 待开始 | ||
| Serverless — FaaS 原理 / 冷启动优化 / 云函数应用场景 | 🔜 待开始 | ||
| 云平台核心服务(计算 / 对象存储 / VPC / 托管数据库) | 🔜 待开始 | ||
| IaC 基础设施即代码(Terraform / Helm Chart / ArgoCD / GitOps) | 🔜 待开始 | ||
| 可观测性(Prometheus + Grafana / ELK / Jaeger / OpenTelemetry) | 🔜 待开始 | ||
| CI/CD 流水线(Jenkins / GitHub Actions / 蓝绿 / 金丝雀发布) | 🔜 待开始 | ||
| 内部平台实践(Crane 容器调度 / HULK 云平台 / 云原生改造落地) | 🔜 待开始 | 美团内部 | |
| 🔧 构建与工程化 | Git(分支策略 / Rebase vs Merge / Hooks) | 🔜 待开始 | |
| Gradle(多模块构建 / 自定义 Task / 增量构建) | 🔜 待开始 | ||
| Maven(生命周期 / 插件机制 / 私服管理) | 🔜 待开始 | ||
| 🐘 大数据生态 | Hadoop(HDFS 架构 / MapReduce / YARN 调度) | 🔜 待开始 | |
| Hive(HQL / 分区分桶 / ORC/Parquet / Tez/Spark 引擎) | 🔜 待开始 | ||
| Spark(RDD / DataFrame / SparkSQL / Streaming / 调优) | 🔜 待开始 | ||
| Flink(流批一体 / 事件时间与窗口 / 状态管理 / Checkpoint) | 🔜 待开始 | ||
| Presto / Trino(联邦查询 / OLAP 即席分析) | 🔜 待开始 | ||
| 数据湖(Delta Lake / Apache Iceberg / Hudi 对比选型) | 🔜 待开始 | ||
| 数据仓库(ODS/DWD/DWS/ADS 分层 / 星形/雪花建模) | 🔜 待开始 | ||
| 数据治理(元数据 / 血缘 / 数据质量 / Apache Atlas) | 🔜 待开始 | ||
| 📊 数据分析 | 指标体系设计(北极星指标 / OKR / 指标拆解) | 🔜 待开始 | |
| 埋点设计与数据采集(前后端埋点 / 数据质量治理) | 🔜 待开始 | ||
| 用户路径 / 留存 / 分群分析(漏斗 / Cohort / RFM) | 🔜 待开始 | ||
| A/B 实验(设计 / 分流策略 / 显著性检验 / Holdout 组) | 🔜 待开始 | ||
| 归因分析 / 预测分析 / 增长分析(AARRR / HEART) | 🔜 待开始 | ||
| 分析工具(SQL 窗口函数 / Pandas / 可视化看板) | 🔜 待开始 | ||
| 🕷️ 爬虫、逆向与反爬 | 爬虫基础 / 分布式爬虫 / JS 渲染页爬取 | 🔜 待开始 | |
| 抓包分析 / JS 逆向 / App 逆向(jadx / SSL Pinning) | 🔜 待开始 | ||
| 反爬系统设计(设备指纹 / 行为识别 / 多层防护) | 🔜 待开始 | ||
| 🔰 风控系统 | 业务风控(账号 / 交易 / 内容 / 活动风控) | 🔜 待开始 | |
| 规则引擎(Drools)/ 设备指纹 / 图谱风控 | 🔜 待开始 | ||
| AI 风控模型(特征工程 / 实时推理)/ 实时风控架构 | 🔜 待开始 | ||
| 风控系统设计(名单 / 事件总线 / 案例系统 / 度量) | 🔜 待开始 | ||
| 🌍 多语言拓展 | Go(Goroutine & Channel / Gin / Gorm) | 🔜 待开始 | |
| Python(FastAPI / 数据处理 / 脚本自动化) | 🔜 待开始 | ||
| Node.js(事件循环 / NestJS / BFF 层设计) | 🔜 待开始 | ||
| Shell(Bash 语法 / 正则 / 自动化脚本) | 🔜 待开始 | ||
| C / C++(指针与内存 / 编译链接 / 系统调用) | 🔜 待开始 | 了解为主 | |
| 汇编语言(x86/ARM 指令集 / 栈帧结构) | 🔜 待开始 | 了解为主 | |
| 🖥️ 前端技术 | HTML5 / CSS3 / JavaScript(ES6+)/ TypeScript | 🔜 待开始 | |
| React / Vue3 核心原理与工程实践 | 🔜 待开始 | ||
| 工程化(Webpack / Vite / 前后端联调 / API 设计) | 🔜 待开始 | ||
| 🤖 AI/Agent 应用接入(做系统) | Spring AI 框架(ChatClient / Advisors / EmbeddingModel) | 🔜 待开始 | 🔑 重点 |
| 模型 API 对接(OpenAI / Claude / DeepSeek / 通义) | 🔜 待开始 | ||
| Prompt 管理与流式响应处理(SSE / 前端实时集成) | 🔜 待开始 | ||
| RAG 系统工程化(向量库集成 / 文档管线 / 混合检索) | 🔜 待开始 | 🔑 重点 | |
| Function Calling 封装与业务工具对接(Spring AI Function) | 🔜 待开始 | 🔑 重点 | |
| MCP Server 开发(Java/Spring 对外暴露能力) | 🔜 待开始 | ||
| 生产级稳定性:超时 / 熔断 / 重试设计 | 🔜 待开始 | 🔑 重点 | |
| 成本控制:Token 统计 / Rate Limit / 缓存重复请求 | 🔜 待开始 | ||
| 可观测性:模型调用链路追踪 / Token 监控看板 / 告警 | 🔜 待开始 | ||
| 🧪 测试工程 | 单元测试:JUnit 5(注解体系 / 参数化测试 / 断言 API) | 🔜 待开始 | 🔑 重点 |
| 单元测试:Mockito(Mock / Stub / Spy / ArgumentCaptor) | 🔜 待开始 | 🔑 重点 | |
| 集成测试:Spring Boot Test(@SpringBootTest / @DataJpaTest / @WebMvcTest) | 🔜 待开始 | 🔑 重点 | |
| 集成测试:Testcontainers(MySQL/Redis/Kafka 真实环境测试) | 🔜 待开始 | ||
| API 测试:REST Assured / MockMvc 链式 API / 接口自动化 | 🔜 待开始 | ||
| 性能测试方法论(TPS/QPS/响应时间/并发数 / 测试类型分类) | 🔜 待开始 | 🔑 重点 | |
| JMeter / Gatling / K6 压力测试工具实战(分布式压测 / 报告分析) | 🔜 待开始 | ||
| JMH 微基准测试(@Benchmark / 预热 / 避免死码消除) | 🔜 待开始 | ||
| 测试用例设计(等价类 / 边界值 / TDD / BDD / 测试覆盖率 JaCoCo) | 🔜 待开始 | ||
| 🧩 多语言 AI/Agent 框架 | Java:Spring AI(ChatClient / Advisors / Memory / VectorStore / ToolCallback) | 🔜 待开始 | 🔑 重点 |
| Java:LangChain4j(AI Service / Tool 注解 / RAG 管线 / 与 Spring 集成) | 🔜 待开始 | ||
| Python:LangChain(LCEL / AgentExecutor / Memory / 与 LangSmith 集成) | 🔜 待开始 | 🔑 重点 | |
| Python:AutoGen(ConversableAgent / GroupChat / 代码执行) | 🔜 待开始 | ||
| Python:CrewAI(Crew / Agent / Task / Process 流程) | 🔜 待开始 | ||
| Python:LlamaIndex(RAG 专项 / QueryEngine / Index) | 🔜 待开始 | ||
| Node.js:LangChain.js / Vercel AI SDK(全栈 AI 应用) | 🔜 待开始 | ||
| Agent SDK 工程实践(OpenAI Agents SDK / Google ADK / AWS Strands / Anthropic SDK) | 🔜 待开始 | 🔑 重点 | |
| 📐 上下文工程(工程化落地) | 上下文窗口工程策略(动态截断 / 摘要 / 有效利用) | 🔜 待开始 | |
| Spring AI ChatMemory 接口实现(InMemory / Cassandra / 自定义) | 🔜 待开始 | 🔑 重点 | |
| LangChain4j ConversationMemory 对话历史管理 | 🔜 待开始 | ||
| 长期记忆:向量数据库持久化(Milvus / Chroma / PgVector) | 🔜 待开始 | 🔑 重点 | |
| RAG 深度:Chunking / Embedding 工程 / 混合检索 / Reranker | 🔜 待开始 | 🔑 重点 | |
| GraphRAG / Agentic RAG 进阶方案 | 🔜 待开始 | ||
| Structured Output:Spring AI BeanOutputConverter / LangChain4j AiServices | 🔜 待开始 | 🔑 重点 | |
| Python Pydantic 结构化输出 / LangChain with_structured_output | 🔜 待开始 | ||
| 工具调用工程深化(并行 / 错误处理 / MCP 客户端集成) | 🔜 待开始 | ||
| 🗺️ Agent 模式与编排(工程实践) | ReAct / Plan-Execute / Reflection / Tree of Thoughts 模式代码实现 | 🔜 待开始 | |
| Multi-Agent 模式:Orchestrator-Worker / Supervisor / Swarm / Parallel Fan-out | 🔜 待开始 | ||
| LangGraph(Python):StateGraph / 条件边 / 循环图 / Checkpoint 持久化 | 🔜 待开始 | 🔑 重点 | |
| AutoGen:ConversableAgent 配置 / GroupChat / 代码执行沙箱 | 🔜 待开始 | ||
| CrewAI:Crew / Agent / Task 定义 / Process 选型 | 🔜 待开始 | ||
| OpenAI Agents SDK:Agent / Handoff / Guardrails / Tracing 工程实战 | 🔜 待开始 | 🔑 重点 | |
| Google ADK:Sequential/Parallel/LoopAgent / Callbacks / Vertex AI 部署 | 🔜 待开始 | 🔑 重点 | |
| AWS Strands / Anthropic SDK Tool Use 工程实践 | 🔜 待开始 | ||
| Agent 记忆管理(In-context / External / 跨任务复用)工程实现 | 🔜 待开始 | ||
| Agent 可观测性(LangSmith / LangFuse 集成) | 🔜 待开始 | ||
| Computer Use / Browser Use 工程实践 | 🔜 待开始 | ||
| Long-running Agent(异步任务 / 检查点 / Kafka 队列 / 用户通知) | 🔜 待开始 |
| 项目 | 定位 | 内容 |
|---|---|---|
java_study |
基础理论 | Java 语言核心(含 SPI/字节码增强/序列化)、JVM 原理、IO/NIO 体系、并发深度(含虚拟线程/响应式)、数据结构与算法、设计模式与设计原则、计算机基础理论(OS/网络/原理/编译)、信息安全基础(密码学/攻防)、软件工程基础(测试/重构/CI)、数学基础、性能工程(JMH/火焰图)、调试与问题排查(Arthas/JFR)、前沿技术趋势 |
本项目(java_fullstack_ai_agent_study) |
工程实践 | Spring 生态、分布式架构、大数据生态、存储中间件、多语言、前端、AI/Agent 应用开发(Spring AI / LangChain4j / LangGraph / AutoGen 等)、上下文工程(工程化落地)、Agent 模式与编排(工程实践)、测试工程(做系统) |
ai_coding_harness_engineering_study |
AI 工程提效 | AI 编程方法论、AI 工具工程化(MCP/Skill/Hooks)、Harness 理论(Eval/LLM-as-Judge)、AI Coding 工具链(Claude Code / Cursor / Codex)、大模型理论了解——用 AI 提效 |
| 日期 | 版本 | 内容 |
|---|---|---|
| 2026-05-23 | v0.1.0 | 项目初始化,创建 README 与 .gitignore |
| 2026-05-23 | v0.2.0 | 补充大数据生态(Hadoop/Hive/Spark/Flink/数据湖/数仓/治理) |
| 2026-05-23 | v0.3.0 | 补充多语言拓展(Shell/C/C++/汇编)、AI 算法理论、关联第三个项目 |
| 2026-05-23 | v0.4.0 | 补充架构设计(三高/DDD/业务架构)、真实场景面试题、更新记录 |
| 2026-05-23 | v0.5.0 | 补充爬虫、逆向工程、反爬系统设计方向 |
| 2026-05-23 | v0.6.0 | 补充风控系统(业务风控/规则引擎/图谱风控/实时架构) |
| 2026-05-23 | v0.7.0 | 补充数据分析(指标/埋点/A/B实验/分析方法/工具) |
| 2026-05-23 | v0.8.0 | 重构项目定位说明、关联项目分工表、学习进度(按主子模块层级展示) |
| 2026-05-23 | v0.9.0 | 更新项目标题;学习进度改为带 rowspan 合并单元格的单张 HTML 大表格 |
| 2026-05-24 | v1.0.0 | 新增「云计算 & 云原生」完整方向(容器/K8s/ServiceMesh/Serverless/可观测性/IaC/CI/CD) |
| 2026-05-24 | v1.1.0 | 新增「业务架构与产品思维」方向(领域建模/事件风暴/行业认知/产品思维/AI赋能业务) |
| 2026-05-24 | v1.2.0 | 新增「学习路线总览表」(20板块/优先级/前置依赖/学习目标/美团内部对应);新增「开源技术→美团内部工具映射表」;完善「美团工具服务导航」定位说明 |
| 2026-06-10 | v1.3.0 | 项目定位重构:明确「做系统」与「用 AI 提效」的边界,删除「🧠 AI 算法理论」章节(迁移至 ai_coding_harness_engineering_study);将「🤖 AI 与 Agent 应用开发」重构为「🤖 AI/Agent 应用接入(做系统)」,聚焦 Spring AI 接入、RAG 工程化、Function Calling 封装、MCP Server 开发、生产稳定性保障;新增 AI/Agent 两项目分工边界对照表;更新学习路线总览表(19 大板块)、学习进度、项目结构、关联项目说明 |
| 2026-06-10 | v1.4.0 | 新增「🧪 测试工程」板块:新增测试分层体系(JUnit 5 / Mockito / Spring Boot Test / Testcontainers / 契约测试 / E2E 测试);新增测试用例设计方法论(等价类/边界值/TDD/BDD/覆盖率);新增性能测试(JMH/JMeter/Gatling/K6/压测结果分析);新增集成测试进阶(Testcontainers 实战/WireMock/测试数据管理/API 测试/混沌工程);更新核心学习方向(19→20 大板块)、学习路线总览表、项目结构(testing/ 目录)、学习进度表 |
| 2026-06-10 | v1.5.0 | 同步关联项目描述:更新「关联项目分工说明」表和「关联项目」章节中 java_study 的描述,与其 README v1.3.0 保持一致(新增 IO/NIO 体系、信息安全、软件工程、性能工程、调试排查、前沿趋势等 14 大板块完整覆盖) |
| 2026-06-13 | v2.0.0 | 重大重构:承接上下文工程与 Agent 编排,完整构建 AI/Agent 全栈工程实践体系。从 ai_coding_harness_engineering_study 承接「上下文工程」和「Agent 模式与编排」,以工程落地视角深度实践;新增「板块21:多语言 AI/Agent 框架」(Java Spring AI / LangChain4j、Python LangChain / AutoGen / CrewAI / LlamaIndex、Node.js LangChain.js / Vercel AI SDK);新增「板块22:上下文工程(工程化落地)」(Memory 体系 / RAG 深度 / Structured Output / 工具工程化);新增「板块23:Agent 模式与编排(工程实践)」(模式代码实现 / LangGraph / AutoGen / CrewAI / Agent SDK 工程实践 / Long-running Agent);项目目录结构重构为统一的 ai/ 入口(ai-agent / multi-lang-frameworks / agent-sdk / context-engineering / agent-patterns);更新核心学习方向(20→23板块)、学习路线总览表、分工边界表、学习进度表、关联项目说明 |