🤖 项目内容

把课程发的 Otto 形态 ESP32-S3 小智机器人,改造成开源 agent 框架 Hermes Agent 的「第一具物理化身」:

  • 🎤 能说话、能转头摆动作、能感知环境
  • 💬 同时被 飞书 IM 双向唤起
  • 🧩 通过 4 个自写桥接组件(openai-shim / lark-mcp-server / lark-event-listener / ESP32 端 MCP tools),把封闭的「语音玩具」解耦成 「Hermes 大脑 + 多个 channel」 的结构
  • 🔌 任何新 channel(邮件 / Slack / 网页)都可以接入,无需改动机器人固件

📊 工程数据

  • ⏱️ 5~7 个整天(约 30-35 工时)
  • 📝 ~2500 行代码
  • 📋 9 份架构决策记录(ADR)
  • 🤝 39 份跨角色协作 handoff
  • 🐛 51 条工程踩坑笔记
  • 🎬 4 条端到端 demo,全部在物理机器人上真实验证

🎯 主要收获

  • 第一次把 Agent 装进物理实体,理解了「具身智能」不是 buzzword
  • 验证了 MCP(Model Context Protocol) 在嵌入式场景的可行性
  • 副产物:开源了一套 planner / executor / auditor 三角色 agent 协作工作流 spec
  • 体会到:真正有意思的硬件项目,胜负在软件拓扑而不是硬件本身

🔗 相关链接