CodeExecutor 与 Workspace

codeexecutor 用来给 Agent 提供一个可控的执行环境。

能做什么

启用 codeexecutor 后，Agent 可以在 workspace 中执行程序，并围绕这个 workspace 读写文件。

常见能力包括：

运行 shell 命令或代码
在固定工作目录中处理输入文件
把用户上传的文件放进执行环境
输出结果文件并在后续步骤继续使用
在需要时切换本地、容器或 Jupyter 后端

如果你的场景只是让模型生成文本，不需要运行程序，也不需要处理本地文件，通常不需要配置这一层。

快速接入

给 LLMAgent 配置执行器即可启用 codeexecutor：

package main

import (
    "context"

    "trpc.group/trpc-go/trpc-agent-go/agent/llmagent"
    "trpc.group/trpc-go/trpc-agent-go/codeexecutor/local"
    "trpc.group/trpc-go/trpc-agent-go/model"
    "trpc.group/trpc-go/trpc-agent-go/model/openai"
    "trpc.group/trpc-go/trpc-agent-go/runner"
)

func main() {
    m := openai.New("gpt-4.1-mini")

    agent := llmagent.New(
        "demo",
        llmagent.WithModel(m),
        llmagent.WithInstruction("使用工作区中的文件完成任务。"),
        llmagent.WithCodeExecutor(local.New()),
    )

    r := runner.NewRunner("demo", agent)
    defer r.Close()

    msg := model.NewUserMessage("请读取输入文件并总结要点。")
    events, _ := r.Run(context.Background(), "user-1", "session-1", msg)
    for range events {
    }
}

更完整的示例可以参考：

examples/codeexecution/main.go（本地 backend）
examples/codeexecution/container/README.md（Docker container backend）
examples/codeexecution/jupyter/README.md（Jupyter kernel backend）

`WithCodeExecutor` 与围栏代码自动执行

llmagent.WithCodeExecutor(...) 和响应阶段的围栏代码自动执行是 两个独立开关。一开始就把它们彻底区分开，可以避免后面一大堆 "我只是配了个 executor，怎么就自动跑代码了"之类的困惑。

WithCodeExecutor(...) 提供的是运行时（runtime），给那些依赖执行器的工具（最典型的就是 workspace_exec）执行命令用。它本身不会让框架去扫描模型的最终回复、然后自动跑里面的代码。
EnableCodeExecutionResponseProcessor（默认：true，由 WithEnableCodeExecutionResponseProcessor(enable bool) 控制）决定框架是否扫描 assistant 回复，如果恰好是一个可执行的围栏代码块就自动运行。

回复里的代码块真的被自动执行，必须两个条件同时满足：有可用的 executor且响应处理器开着。

如果你只想让 executor 服务于 workspace_exec 或其他工具驱动的执行路径，不希望自动执行模型回复里的代码块，显式关掉响应处理器：

agent := llmagent.New(
    "demo",
    llmagent.WithModel(m),
    llmagent.WithCodeExecutor(local.New()),
    llmagent.WithEnableCodeExecutionResponseProcessor(false),
)

适合关掉围栏代码自动执行的典型场景：

只想使用 workspace_exec
只需要给某些工具提供 workspace/runtime
希望代码执行必须通过显式工具调用触发

与 WithSkills(repo) auto-fallback 的联动：当 skills 层代你隐式注入本地 CodeExecutor 时（见 Agent Skills 指南），这个隐式 executor 的用途被严格收敛为 "只是给 workspace_exec 供电"：如果你没有显式调用过 WithEnableCodeExecutionResponseProcessor(...)，框架会自动把 EnableCodeExecutionResponseProcessor 置为 false，避免在你原本没开的能力上悄悄加戏。相对地，显式 WithCodeExecutor(...) 会让这个开关保留框架默认值，不会被 skills 逻辑偷偷改，从而不影响你原有的行为。

怎么选后端

常见后端有三种：

local.New() 直接在宿主机执行。接入最简单，调试最方便，适合本地开发和可信环境。
container.New() 在容器中执行。隔离更强，更接近生产环境，适合希望限制执行环境的场景。
jupyter.New() 适合 notebook / kernel 风格的代码执行，常用于数据分析或 Python 交互场景。

选择建议：

本地验证功能：优先 local
生产环境或更强调隔离：优先 container
明确需要 Jupyter kernel：使用 jupyter

Workspace 中有哪些目录

执行器会在一个 workspace 中运行程序。常见目录约定如下：

work/inputs/ 执行前准备好的输入文件。用户上传的文件通常会出现在这里。
work/ 临时工作目录，适合处理中间文件。
out/ 输出目录，适合放最终结果或后续还要继续使用的文件。
runs/ 运行过程目录，常用于日志或辅助文件。

常用目录：

读用户输入：work/inputs/
写中间文件：work/
写结果文件：out/

用户上传的文件会出现在哪里

在支持会话文件自动 stage 的执行路径里，框架会在执行前把这些文件物化到：

实际文件名可能经过清洗或去重，不保证逐字保留原始文件名。

常见的传入方式有两种。

方式 1：直接把文件内容放进消息

msg := model.NewUserMessage("请处理这个文件")
_ = msg.AddFilePath("/tmp/report.pdf")

也可以直接传二进制数据：

msg := model.NewUserMessage("请处理这个文件")
_ = msg.AddFileData("report.pdf", pdfBytes, "application/pdf")

方式 2：先上传到 artifact，再在消息里只放引用

如果文件已经提前上传到 artifact，可以把 artifact://... 作为 file_id 放进消息：

msg := model.NewUserMessage("请处理这个文件")
msg.AddFileIDWithName("artifact://uploads/report.pdf@1", "report.pdf")

执行前，框架会解析这个引用，并把文件写到 work/inputs/ 下。

示例：先上传 artifact，再交给执行环境

下面的示例演示“先上传，再执行时自动 stage”的完整链路：

package main

import (
    "context"
    "fmt"
    "os"
    "path/filepath"

    "trpc.group/trpc-go/trpc-agent-go/agent/llmagent"
    "trpc.group/trpc-go/trpc-agent-go/artifact"
    "trpc.group/trpc-go/trpc-agent-go/artifact/inmemory"
    "trpc.group/trpc-go/trpc-agent-go/codeexecutor/local"
    "trpc.group/trpc-go/trpc-agent-go/model"
    "trpc.group/trpc-go/trpc-agent-go/model/openai"
    "trpc.group/trpc-go/trpc-agent-go/runner"
)

func main() {
    ctx := context.Background()

    const (
        appName   = "my-app"
        userID    = "user-1"
        sessionID = "sess-1"
    )

    artifactService := inmemory.NewService()

    rawPath := "/tmp/report.pdf"
    data, err := os.ReadFile(rawPath)
    if err != nil {
        panic(err)
    }
    base := filepath.Base(rawPath)

    info := artifact.SessionInfo{
        AppName:   appName,
        UserID:    userID,
        SessionID: sessionID,
    }

    name := "uploads/" + base
    version, err := artifactService.SaveArtifact(
        ctx,
        info,
        name,
        &artifact.Artifact{
            Data:     data,
            MimeType: "application/pdf",
            Name:     base,
        },
    )
    if err != nil {
        panic(err)
    }

    ref := fmt.Sprintf("artifact://%s@%d", name, version)

    msg := model.NewUserMessage("请读取这个文件并总结要点。")
    msg.AddFileIDWithName(ref, base)

    agent := llmagent.New(
        "demo",
        llmagent.WithModel(openai.New("gpt-4.1-mini")),
        llmagent.WithInstruction("请读取 work/inputs/ 中的文件并总结内容。"),
        llmagent.WithCodeExecutor(local.New()),
    )

    r := runner.NewRunner(
        appName,
        agent,
        runner.WithArtifactService(artifactService),
    )
    defer r.Close()

    events, err := r.Run(ctx, userID, sessionID, msg)
    if err != nil {
        panic(err)
    }
    for range events {
    }
}

要求：

SaveArtifact 使用的 AppName / UserID / SessionID
需要和后面 Runner.Run(...) 使用的值保持一致

否则执行前解析 artifact://... 时，找不到对应 artifact。

与工作区工具的配合

暴露 workspace_exec 一类工作区工具后，常见使用方式如下：

读取 work/inputs/...
在 work/ 或 out/ 下处理文件
再读取 out/... 并组织最终回答

目录约定的作用，是让模型和工具在稳定路径上协作，而不需要暴露底层 staging 过程。

Workspace Bootstrap：在用户命令前先把 workspace 准备好

有些 workspace 在执行用户命令之前就需要固定的前置状态：一份预置的配置文件、一个钉死版本的 Python 虚拟环境、一次性的 pip install 等。让模型自己在对话里反复做这些事既容易出错，也会浪费 prompt token。框架允许你在 agent 构造期声明一次，由 workspace_exec 在运行前自动收敛到期望状态。

用 codeexecutor.WorkspaceBootstrapSpec 列出要准备的文件和命令，再通过 llmagent.WithWorkspaceBootstrap(...) 挂到 agent 上即可。每个 workspace 在第一次调用 workspace_exec 时完成收敛，后续调用会直接跳过已经满足的部分。

package main

import (
    "time"

    "trpc.group/trpc-go/trpc-agent-go/agent/llmagent"
    "trpc.group/trpc-go/trpc-agent-go/codeexecutor"
    "trpc.group/trpc-go/trpc-agent-go/codeexecutor/local"
)

func newAgent() *llmagent.LLMAgent {
    bootstrap := codeexecutor.WorkspaceBootstrapSpec{
        Files: []codeexecutor.WorkspaceFile{
            {
                Target:  "work/config.json",
                Content: []byte(`{"threshold": 0.8}`),
            },
            {
                Target: "work/requirements.txt",
                Content: []byte(
                    "numpy==1.26.4\npandas==2.2.2\n",
                ),
            },
        },
        Commands: []codeexecutor.WorkspaceCommand{
            {
                Cmd: "bash",
                Args: []string{
                    "-lc",
                    "python3 -m venv .venv && " +
                        ".venv/bin/pip install -q -r work/requirements.txt",
                },
                MarkerPath: ".venv/bin/pip",
                // FingerprintInputs 把 requirements.txt 的内容
                // 纳入命令 fingerprint，pin 的版本号变了时会自动
                // 重装。如果不设这个字段，首次装完之后 marker 一直
                // 存在，哪怕后续改了 requirements.txt 也不会重跑。
                FingerprintInputs: []string{"work/requirements.txt"},
                Timeout:           2 * time.Minute,
            },
        },
    }

    return llmagent.New(
        "analyst",
        llmagent.WithCodeExecutor(local.New()),
        llmagent.WithWorkspaceBootstrap(bootstrap),
    )
}

字段说明

WorkspaceFile：

Target：workspace 相对目标路径（必填）。父目录会自动创建。
Content：要写入的字节内容。
Input：另一种写法，传 codeexecutor.InputSpec，支持 artifact://、 host://、workspace://、skill:// 这几类 URI。Content 和 Input 二选一。
Mode：文件权限（八进制），默认 0o644。
Key：用于幂等性的稳定标识；不填时从 Target 推导。
Optional：置 true 时，provider 失败只会记 warning，不会阻断 workspace 准备。

WorkspaceCommand：

Cmd / Args / Env / Cwd：标准命令参数。Cwd 为 workspace 相对路径，默认在 workspace 根目录。
Timeout：单次调用的最长耗时。
MarkerPath：workspace 相对文件，存在即代表命令已经跑过。这是让命令在被误删后能自动重跑的最简单方式。不设 marker 时，reconciler 只能靠 fingerprint 跳过。
ObservedPaths：当成功状态由多个文件决定时，可以替代 MarkerPath。
FingerprintInputs / FingerprintSalt：把外部输入纳入命令的 fingerprint，输入变化时会重跑命令。命令 fingerprint 不会自动对命令行里引用到的文件做哈希，所以像 pip install -r work/requirements.txt 这种命令必须把 work/requirements.txt 显式列进这里——否则第一次装完 marker 就一直在，后续改 requirements.txt 也不会触发重装。
Key：稳定标识；不填时从 Cmd/Args 推导。
Optional：语义同上。

执行顺序与幂等性

先 stage 所有文件，再执行所有命令；两组内部都按声明顺序。
每条 requirement 都会计算 fingerprint（文件按内容，命令按命令行 + 可选输入）。后续调用时，reconciler 会同时校验 fingerprint 和磁盘上的 sentinel，所以用户在 workspace_exec 里 rm -rf 掉某个产物后，下一次调用会重新补上，不会出现 "metadata 说准备好了，但文件其实已经没了" 的假阳性。
同一个 workspace 的 reconcile 过程会在进程内串行化，两个并行的 workspace_exec 调用不会在准备阶段互相踩踏。
未设置 Optional 的条目（即默认必需）在失败时，workspace_exec 会在用户命令执行前就返回错误；Optional: true 的条目只会降级为 warning。

关闭开关

如果因为兼容或回归测试原因需要保留旧的"只 stage 会话文件"行为，可以显式传 llmagent.WithWorkspacePreparersDisabled(true)。正常使用下不需要这个开关。

与 `skill_load` 的关系

通过 skill_load 加载的技能会通过同一条 reconcile 路径被 materialize 到 skills/<name>。你不需要为技能往 WorkspaceBootstrapSpec 里加任何东西 ——workspace_exec 运行时会自动从 session state 里读取当前 session 已加载的技能并准备好。WorkspaceBootstrapSpec 只负责与会话状态无关的固定前置物料。

哪些文件会保留

通常有两类情况：

仍然命中同一个物理 workspace
后续换成了一个新的 workspace

在同一个物理 workspace 中：

work/、out/ 里的文件通常还能继续用
之前写出的结果文件可以直接再次读取

如果换成了新的 workspace：

用户会话里的文件输入通常可以根据消息历史重新放回 work/inputs/
旧的 out/** 不会自动恢复
旧的 work/** 也不应该假设还能继续存在

如果你需要跨新 workspace 稳定复用某个文件，建议把它保存为 artifact，或者让业务层自己管理持久化。

provider 文件 ID 与 artifact 引用的区别

有些模型厂商支持原生 file_id。这类 ID 能不能在执行器侧重新读取，取决于具体模型实现是否支持下载。

如果你希望文件能稳定地被执行器读取，通常更建议使用：

artifact://...

因为这条链路由框架自己的 artifact service 管理，不依赖模型厂商的文件下载能力。

环境变量与执行环境

如果你的执行器运行在容器、远端或隔离环境里，通常需要显式注入环境变量。

这类场景常见用途包括：

给程序注入用户级 token
注入租户、地域或业务配置
避免把敏感值直接暴露给模型

如果你的场景需要这类能力，可以继续看 codeexecutor 的环境注入包装器：

NewEnvInjectingCodeExecutor
NewEnvInjectingEngine

常见问题

为什么模型找不到上传的文件

检查项：

是否真的把文件放进了消息
文件名是否和你提示里写的一致
是否为 Runner 配置了 artifact.Service
artifact://... 使用的会话信息是否匹配

为什么 `out/` 里的旧文件下一轮没了

后续请求没有回到同一个物理 workspace 时，旧的 out/** 可能不存在。
当前默认行为下，历史上传文件可以重新 stage，但 out/** 不会自动恢复。

什么时候该用 `work/`，什么时候该用 `out/`

临时中间文件：放 work/
想让后续步骤继续读取的结果文件：放 out/

`codeexecutor` 是不是某个工具专属能力

不是。它是更底层的执行与 workspace 能力。
是否暴露成某个具体工具，取决于上层 Agent 和工具编排方式。

参考

示例：
- examples/codeexecution/main.go（本地 backend）
- examples/codeexecution/container/README.md（Docker container backend）
- examples/codeexecution/jupyter/README.md（Jupyter kernel backend）
相关文档：
- Artifact 文档