每天早上自动从 8 个 Anthropic 官方信息源抓取新文章,翻译成中文,生成本地 Markdown 日报,并构建静态前端展示近 30 天内容。
| 来源 | 内容 |
|---|---|
| Anthropic News | 官方新闻与产品公告 |
| Anthropic Research | 研究论文与技术博客 |
| Claude Blog | 面向用户与企业的 Claude 博客 |
| Alignment Science | 对齐科学专项博客 |
| Engineering Blog | 工程实践博客 |
| Red Team | 红队安全研究 |
| Claude Cookbook | 官方开发示例与教程 |
| Transformer Circuits | 可解释性研究 |
main.py # 主调度器:抓取 → 比对索引 → 过滤日期 → 翻译 → 写日报
fetchers/ # 各信息源的抓取层(只返回文章列表)
translator.py # 翻译层,支持 aliyun / claude / deepl 三引擎
build_data.py # 将日报和索引合并为前端 JSON(public/data.json)
public/ # 静态前端,可部署到 Vercel / GitHub Pages
article_index.json # 全量文章索引(持久化,防重复处理)
output/ # 每日中文日报(output/YYYY-MM-DD/digest.md)
1. 安装依赖
pip install -r requirements.txt2. 配置环境变量(阿里云机器翻译)
export ALIYUN_ACCESS_KEY_ID=your_key
export ALIYUN_ACCESS_KEY_SECRET=your_secret3. 首次运行:初始化索引(将现有文章全部标记为已知,避免首次运行大量处理历史文章)
python3 main.py --init4. 运行
python3 main.py日报输出到 output/YYYY-MM-DD/digest.md。
通过 crontab 每天 7:30 自动运行:
# crontab -e
30 7 * * * /path/to/get_anthropic/run.shrun.sh 会依次执行 main.py(抓取翻译)和 build_data.py(更新前端数据)。
python3 main.py --lookback 7 # 向前看 7 天(默认 3 天)
python3 main.py --limit 5 # 单次最多处理 5 篇
python3 main.py --force # 忽略已处理记录,强制重新处理
python3 main.py --date 2026-04-09 # 模拟指定日期运行在 config.json 中修改 translate_engine:
| 引擎 | 所需环境变量 |
|---|---|
aliyun(默认) |
ALIYUN_ACCESS_KEY_ID / ALIYUN_ACCESS_KEY_SECRET |
claude |
ANTHROPIC_API_KEY |
deepl |
DEEPL_API_KEY |
translate_mode 可设为 summary(前 500 字摘要,默认)或 full(全文翻译)。
python3 build_data.py # 生成 public/data.json将 public/ 目录部署到 Vercel 或 GitHub Pages,即可在浏览器中浏览近 30 天文章。