┌─────────────────────────────────────────────┐
│ 我们的架构 │
├─────────────────────────────────────────────┤
│ 1. 异构计算 (GPU推理 + CPU内存KV Cache) │
│ → 突破VRAM限制,支持1000万token │
│ │
│ 2. 三层记忆架构 │
│ GPU → CPU内存 → 硬盘存储 │
│ → 模拟人脑的分层记忆