Codex跑了22小时,真赚16.88美元:奥特曼预言的“AI打工人”来了

新智元
May 12

一条“去GitHub上赚5美元”的指令,Codex跑了22小时,几天后带回16.88美元。钱不多,但如果Chris的复盘属实,AI第一次独立走完了找活、写代码、提PR、收款的完整闭环:AI会替你赚钱,这可能是第1单。

这个故事看起来,像是Codex第一次摸到“工资单”。

本周末,一位名叫Chris的开发者在X上发了一条帖子:

他只给Codex丢下一条“去挣5美元”的指令,接下来的22小时,Codex自己找到了一个开源安全审计的赏金路径,完成并提交了PR,跟进了维护者。

几天后,16.88美元到账。

Chris随即算了一笔账:如果每天重复,月化收入506.40美元。

帖子发出后,开发者圈炸锅了。

有人说“AI打工人的第一单来了”,Chris本人在帖子里激动宣称,这让他“看到了奥特曼关于AI替你赚钱的愿景开始成真”。

奥特曼曾在个人博客中预言,2025年可能看到第一批AI智能体“加入劳动力大军”,并实质性改变公司产出。

Chris这次实验,被他本人视作这一预言的早期验证。

它是怎么挣到这16.88美元的

根据Chris在X平台公布的流程,整个时间线应该是这样的:

起点是一道极简指令,Chris对Codex说:去GitHub上找活赚钱,目标5美元。

收到这条极简指令之后,Codex定位到一个bounty(赏金)平台,但它具体如何定位任务、是否借助额外工具或人工配置,目前没有公开日志可核验。

接了活后是做活:读代码、改代码、提交拉取请求(PR)。 这是Codex过去几年最被验证的能力,也是它最擅长的。

然后是沟通:和维护者来回回复评论,这是过去AI智能体最容易翻车的环节。Codex这一轮也完成了,最终PR被合并。

按Chris的复盘,PR合并和验证流程完成几天后,他收到了16.88美元付款。

虽然Chris公开了收款截图和部分对话记录截图,整个流程的细节,仍缺乏第三方独立验证,但这并不影响这个故事的主线。

Codex的能力边界,OpenAI官方已经写清楚了,将它定义为“基于云端的软件工程智能体”。

用户输入任务指令后,Codex在后台并行处理多项任务,每条对应一个代码改动或PR。https://openai.com/zh-Hans-CN/index/introducing-codex/

它可以读取和编辑文件,运行测试框架、代码检查工具和类型校验器,提交代码改动,并开启GitHub的拉取请求供审查。

也就是说,“写代码→运行测试→提PR→留日志”这条链路,Codex官方层面已经打通。

Chris说Codex“找到了一个开源安全审计赏金路径”,OpenAI推出了Codex Security功能,专门面向工程和安全团队,可以逐次提交扫描连接的GitHub仓库,在隔离环境中验证高可信度的安全漏洞。

Chris所称的“安全审计赏金路径”,和这条产品线的能力描述方向完全吻合。

但这里有一个关键前提被很多人忽略了。

Codex在agent执行阶段,默认关闭互联网访问。Codex云端文档明确写道:

默认情况下,Codex在智能体执行阶段阻断互联网访问。安装脚本阶段仍有网络权限,以便安装依赖;用户可以按需为每个环境手动开启agent互联网访问。

这是一个核心约束。

开启之后呢?OpenAI列出了一串风险:来自不可信网络内容的提示词注入(prompt injection)、代码或密钥外泄、下载恶意依赖、拉取含有许可限制的内容。

所以如果Chris描述的事情真的发生了,Codex能“找到bounty路径”,可能是他主动开启了互联网访问,或是是Codex通过GitHub、浏览器、MCP或其他工具组合完成了这个动作。

这是“模型+工具+权限+网络”的组合产物,并非模型的裸能力。这也说明,Codex在特定条件下,具备“找漏洞→提PR→跟进审查”这条链路的技术能力。

这笔账没那么好算

再来算一笔账。

Chris说,这次总共跑了约10-15个安全审计项目,消耗了22M tokens。16.88美元,是第一个“亮绿灯”并到账的项目。后面还有多个pending audits等待确认。

OpenAI API公开定价页面显示,GPT-5.5的输出定价是每100万tokens 30美元,输入是每100万tokens 5美元。Chris本人也在跟帖中引用了这个tokens价格,并用它来推算未来的利润空间。

但Codex作为产品本身,有基于ChatGPT Pro、Team、Enterprise等订阅计划的任务额度限制,实际消耗逻辑跟API裸计费完全不同。

Chris没有公开22M tokens里输入和输出各占多少,也没说他是通过订阅配额用的、还是直接走API。任务失败率、重试成本、人工排查时间也没有提到。

他的真正逻辑,不在于核算现有盈利,他押注的是未来模型成本每年降10倍,这条闭环会越来越便宜地被跑通,他在跟帖里说:

你们为什么要假设我花了很多钱?GPT-5.5现在输出是30美元/百万tokens,明年会降到2美元,那时候双方都会暴赚。

因此,这16.88美元,目前更像一个“有东西跑通了”的实验信号,而不是一种可以复制的商业模式。

GitHub已经把路修好了

这并非Codex独自的功劳,如果把这一单背后所有的动作拆解来看:找活、做活、沟通、收款,每一步GitHub都悄悄铺好了路。

Agent HQ

GitHub给AI开工位

今年2月,GitHub把Claude和OpenAI Codex接入Agent HQ,并以public preview形式向Copilot Pro+和Enterprise用户开放,这好比GitHub给AI开的工位。

GitHub Agent HQ智能体选择界面,Copilot、Claude、Codex及自定义智能体均可被分配编程任务。

GitHub官方对此的描述是:

智能体默认异步运行。你可以实时跟踪进度,也可以事后审查已完成的session,查看详细日志,了解智能体做了什么、为什么这么做。

这意味着,以前你把任务分配给初级工程师,现在这个“初级工程师”的角色,也可以是一个编程智能体,这正是GitHub在系统层面认可并推进的工作流方向。

四个关键接口

把Codex这次走过的流程对应回GitHub已经铺好的能力,会更清楚:

第一,找活的接口。GitHub有现成的issue、PR、仓库上下文和Agents tab;至于bounty任务,则更多依赖Algora、IssueHunt等第三方平台或项目自身机制。智能体不用爬全网,去这几个地方就能找到结构化的“活”。

第二,做活的接口。仓库读写权限、Codespaces沙箱环境:智能体可以在GitHub自己提供的隔离环境里克隆、改、跑测试,不用自己搭基础设施。

第三,沟通的接口。PR review通道、@提及机制、评论线程:智能体收到评论后能精确知道是谁在回它、回的是PR里的哪一段代码。

第四,收款的接口。bounty平台Algora、IssueHunt已经与GitHub issue工作流打通,Algora平台可以实现PR合并自动结算,收款这一步不再是“得另外接Stripe写一堆代码”。

四个接口分别看都不是新东西,但当它们被组合在同一个工作台里、按“智能体友好”的方式重新整理过,意义是不一样的。

不止Codex一家

Codex这次走通的路径,对任何已经接入Agent HQ 的智能体来说都是可复用的。

GitHub官方Octoverse报告显示,2025年平台每月平均合并PR 4320万个,同比增长23%,AI相关仓库同比增长178%。

智能体驱动的开发工作流,正在从实验走向规模。

GitHub Octoverse 2025年度报告关键数据:平台每月合并PR 4320万个,AI相关仓库总数达430万个,同比增长178%。

Codex这次16.88美元的到账,更像是一个标志:在GitHub已经修好的道路上,

第一辆车已经跑完全程并有了进账。

最后几块拼图

那么,距离“AI自主赚钱”真正成立,还差什么?

按公开信息看,Codex这次接的bounty并非顶级难度:单笔16.88美元的赏金,对应的是中小型修复,整个流程花了几天,维护者来回轮次不多。因此,这更像是一次“路径成立”的演示,而非“路径已经成熟”的标志。

人工介入的环节,也可能比想象中多。

账号和GitHub授权要人来配置,互联网访问要人来开启,最终的代码审查和合并要人来确认。

OpenAI官方明确表示,用户仍需手动审查和验证所有智能体生成的代码。

Codex任务完成后的PR页面,含修改摘要、终端测试日志(测试通过)和代码对比(diff),用户据此决定是否合并。

这意味着,Chris在这件事里仍然不可缺:他要给出启动指令,智能体并不会自己醒来决定今天去挣钱;他要帮Codex接通收款渠道;他要做兜底,一旦Codex卡死,得有人来接。

因此,这件事更准确的定性是:这是一次“在Chris监督下完成的端到端跑通”,距离真正无人值守的自动赚钱机仍有距离。

但人类与智能体协作的比例,正在快速向后者倾斜。

OpenAI说,与Codex的交互“将越来越像与同事之间的异步协作”,智能体将在更长的时间内处理更复杂的任务。

16.88美元不会改变任何人的生活。

但如果这次实验最终得到核实,下一个订单,会是多少?

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10