Automath-evo

做什么

本页先概括目标,再按整体架构、模型接入、物化、进化与 Map-Elites¹ 评估分节。系统在若干特征维度上归档精英解,避免单标量优化导致解趋同。

面向数学建模等实验:输入题面与可选数据、图示,生成可运行 Python 骨架,多轮内只改标记块、更新依赖、跑脚本取反馈。可选论文智能体按建模论文结构成文,衔接题面—代码—文稿。

整体架构从上到下怎么走

流程:题面与环境 → LLM 出工程蓝图 → 物化层落盘并建 venv⁴、装依赖 → 多轮改标记块、差分 import、子进程跑脚本 → Map-Elites 写入归档 → 可选论文智能体读精英撰写。主流程用 Python asyncio²:模型调用与子进程均为高延迟 I/O,在事件循环内并发重叠等待。

大模型接入与统一门面

模型接入采用 OpenAI 兼容 API³:Bearer 鉴权、chat/completions 类 JSON 请求与统一响应解析;换底座多只需改 base URL 与密钥。封装层做限流、退避重试与超时。各节点可绑不同模型,对上仍为结构化 JSON 输出,与厂商解耦。

从蓝图落成真文件夹

物化把 LLM 的路径—内容映射写入磁盘:隔离子目录、初始化 venv⁴、pip 安装、写源文件。每代独立副本,便于删改与 diff。该层连接生成物与可执行环境。

进化只动圈定的代码块

成对标记界定可编辑 span,壳层稳定;繁殖只替换 span 并校验行对齐。依赖对 import 做差分安装。失败时将 stderr 回注提示,形成执行—诊断—修补闭环,属补丁式程序综合⁵。

为什么用 Map-Elites 做评估

单标量适应度易使解趋同。Map-Elites¹ 将多维特征分桶,网格每格保留精英,显式保留更简单、更快等折中解;质量维可接 LLM 评委做软评分。

论文智能体在这条流水线里的位置

论文智能体读取进化数据库与 Map-Elites 精英集,按摘要、问题重述、假设、模型、验证、结果分析等块分步生成,再拼接为完整文稿;可挂载本地文件工具、脚本执行与检索工具,工作目录与代码产物一致。代码进化与论文生成共享同一精英定义,输出可为仓库或可提交论文。

状态与中断

长时任务将进化状态、评估器快照与元数据写入带时间戳的历史目录,支持中断后续跑与事后审计。超时或手动终止时尽力落盘,减少无效计算。

术语与注释

  1. Map-Elites:质量–多样性算法,将多个特征维分桶成网格,每格保留该格最优个体,避免只优化单一总分导致解同质化。
  2. asyncio:Python 异步 I/O 框架,在单线程事件循环中调度协程,适合重叠模型 HTTP 请求与子进程等待。
  3. OpenAI 兼容 API:多数厂商采用的 HTTP+JSON 调用形态(如 /v1/chat/completions),请求头 Bearer Token,便于切换模型后端而少改业务代码。
  4. venv:Python 内置虚拟环境,隔离依赖与解释器路径;pip 在环境内安装包,避免污染系统 Python。
  5. 补丁式程序综合:只改写标记片段而非整文件,结合执行反馈迭代修补代码。