马斯克的"数字员工":从“聊天框”到“抢夺鼠标”
假设有天你需要去找新来的同事要一份文件,对方回说"行啊,我工位吧"。然后你走过去工位上连个人影都没有。这很像一个“灵异事件”。但实际上那个"同事"是xAI内部测试的一个AI,挂在公司组织架构里,正常开会,正常回消息,正常领任务。
3月11日,马斯克在X上把这个“灵异事件”变成了一个正式产品,叫做数字擎天柱,英文名Macrohard(巨硬),名字在调侃微软。

从"给答案"到"抢鼠标"
普通人对AI的理解停留在ChatGPT:你问它问题,它给你写篇报告。但你依然需要自己复制、粘贴、点击发送。AI是个聪明的大脑,你还是那个干活的手。
Macrohard没有聊天框。它直接"看"你的电脑屏幕,实时处理过去5秒的屏幕画面,同时接管你的键盘和鼠标。马斯克用卡尼曼的双系统理论描述它的架构:xAI的Grok是System 2,负责慢速的深度推理和决策;数字擎天柱是System 1,负责快速的视觉识别和即时操作。一个负责想,一个负责动,合起来是一个坐在电脑前不知疲倦的数字员工。

这一步的意义在于:过去十年科技公司造的AI,不管多智能,都需要你坐在屏幕前决定下一步。Macrohard第一次不要你的注意力,要你的工位。
但在理解这件事之前,需要先搞清楚一个问题:它为什么要这么"笨"地盯着屏幕看?
你一直在充当一个人肉接口
很多人觉得让AI去识别屏幕上的按钮、模拟鼠标点击,是一种原始笨拙的路径。为什么不直接在后台传数据,走API接口?
现代办公软件是一座座孤岛。公司的财务系统跟业务系统不通,CRM跟ERP不通,微信跟所有东西都不通。几十年来,企业是怎么解决这个问题的?雇人。成千上万的大学生每天坐在工位上,看着A软件的数据,敲进B软件的表格里。
这就是白领工作的真相:我们在充当那些不兼容软件之间的人肉接口。数据从左手进来,从右手出去,中间经过一个"工作者"的中转站。高盛的研究显示,美国文职工作中可以被自动化的任务比例高达46%,法律工作44%,商业和金融35%。这些工作有一个共同特征:它们的本质是信息从一个地方搬到另一个地方。
Macrohard看透了这一点。它伪装成一个人类,用计算机视觉技术直接看并操作任何软件界面,和人类员工的操作方式完全一样。它不需要微软开放接口,不需要Salesforce配合,不需要任何人点头。马斯克在全员大会上说,Macrohard已经在内部测试中让生产效率提升了8倍。这是他们用来替代真人员工之后得出的数字。
这种粗暴的屏幕接管有一个比较不显眼的优势:OpenClaw也是Agent,但它看不见你的屏幕,只能通过API调用完成任务,被平台封杀是迟早的事。Macrohard绕开了所有接口,直接从视觉层入侵,没有人能封杀一双眼睛。
650美元的账本,和一张20亿美元的发票
让AI全天候盯着屏幕替人打工,成本是这件事能不能落地的关键。如果全部放在云端用英伟达H100去跑,一块售价三万美元的显卡每时每刻都在消耗算力,高昂的推理成本会让任何商业计划在算账阶段就死掉。
马斯克的解法是把特斯拉汽车里控制方向盘的那块芯片塞进这套系统。Tesla AI4芯片售价650美元,功耗是H100的四分之一,负责处理高频的屏幕视觉识别和鼠标操作。云端的Grok只在需要复杂决策时介入,贵的算力用在刀刃上。
这个成本结构解释了特斯拉为什么要向xAI投资20亿美元。表面是战略投资,实质是把特斯拉全球的硬件供应链和芯片制造能力,转化成Macrohard的廉价推理基础设施。造车的机器,现在要给数字员工造身体。
但这笔钱的背后有另一个没被正面讨论的故事。
Macrohard项目在xAI内部并不顺利。最早的成员Sulaiman Ghori进项目时整个组只有两个人,后来在播客里聊太多被马斯克光速开除。负责人Toby Pohlen接手后马斯克嫌进度太慢,Toby离职。600名外包人员被要求录屏自己工作和上网的操作来训练AI,这个项目暂停了。xAI发生大规模离职潮,项目资源被迫转移到特斯拉自动驾驶团队。截至发布前,xAI官网Macrohard团队的职缺数量是零,过去几个月超过20名工程师离职或转调。

与此同时,SpaceX以全股票方式收购xAI,合并估值1.25万亿美元。xAI的财务报表巨额亏损,SpaceX稳定的现金流掩盖了xAI的燃烧率,xAI的AI概念给SpaceX这个硬件公司注入了想象力。
更讽刺的细节是:这次发布直接打了马斯克自己的脸。2024年9月,他在X上明确写道特斯拉"无需从xAI授权任何技术",解释说xAI的模型太大,根本无法在特斯拉的车载推理芯片上运行。现在这两家公司深度捆绑发布同一个产品。这个发布落地时,特斯拉股东正在起诉他违反信托责任——因为他在特斯拉之外建立了xAI这家私人公司。每次马斯克公开把xAI和特斯拉绑得更紧,就让原告的案子更有说服力。
他是最后一个下场的
Macrohard出现的时间点,值得单独说一下。
Claude Cowork已经在跑,用户可以让AI直接操控桌面完成复杂工作流。OpenClaw三周内普及速度超过Linux三十年,GitHub星标超过24万,创始人Peter Steinberger被OpenAI收购。Meta花大价钱买下了AI社交网络Moltbook,把团队并入Meta超级智能实验室。整个AI Agent赛道在2026年初的两个月里已经完成了第一轮卡位。
马斯克是这场竞赛里最晚宣布入场的那个人,同时也是唯一一个同时掌握芯片、硬件供应链、私人AI公司和上市公司现金流的人。他宣布Macrohard的时候,Anthropic、OpenAI、Meta都已经跑在前面了。但他的底牌是别人没有的——650美元的车规芯片和全球最大的电动车制造体系,可以把推理成本砸到所有云端方案都无法竞争的水平。
这场竞赛最终比的不是谁先发布,是谁能把Agent的边际成本压到足够低,让任何公司都用得起。
屏幕的消亡
电脑屏幕上那些图标、五颜六色的按钮、精心设计的UI界面,是给谁看的?
是给人类那双肉眼看的。
马斯克说Macrohard最终将能够模拟整家公司的运作。如果操作电脑的都是数字员工,软件还需要界面吗?不需要。未来的软件将退化成纯粹的功能模块,那些花了几十年打磨用户体验的产品设计师,打磨的东西可能只是一段过渡期的历史遗留。
制造业工人被机器取代,用了将近一百年。
机器与机器在黑暗中高速交互,那张舒适的办公椅上,不再需要人类的臀部。
