对 Karpathy「不要问 LLM 你怎么想」建议的实证批评。2天单人实验证明:Karpathy 说对了机制原文,但说错了使用建议。附量化测量框架和可复现方法。
open-research empirical-study prompt-engineering prompt-design llm-evaluation controlled-experiment deepseek llm-research one-person-lab karpathy-critique agent-activation rlhf-analysis
-
Updated
May 30, 2026 - Python