zbo智博1919com

新闻中心 新闻中心

史诗级进化,,,OpenAI「超等龙虾」震撼上线 ! !

又是羡慕Mac用户的一天。

作者:::陈登芳
颁布功夫:::2026-05-14 17:11:53
阅读量:::3786

史诗级进化,,,OpenAI「超等龙虾」震撼上线 ! !

又是羡慕Mac用户的一天。

今天凌晨,,,OpenAI正式颁布合用于macOS的新版Codex,,,并附文:::

Codex for (almost) everything.It can now use apps on your Mac, connect to more of your tools, create images, learn from previous actions, remember how you like to work, and take on ongoing and repeatable tasks.Codex (险些) 无所不能。它此刻能够调度 Mac 上的利用法式,,,衔接更多出产力工具,,,并具备图像天生能力。此外,,,Codex 可能通过汗青行为进前学习,,,影象您的工作偏好,,,并自主承接持续性及反复性的工作。

一言蔽之:::Mac版的“原生龙虾”上线了。

自2月中旬将OpenClaw(龙虾)的首创人招揽进公司后,,,OpenAI在后续的两个月里就一向在捣鼓把OpenClaw的能力融入Codex中,,,如今终于看到了功效,,,并且一上线就是“王炸”。

接下来就让雷科技(ID:::leitech)带各人看看,,,最新的Mac版Codex都能做什么。

从开发者到守护者,,,Codex已实现全自动化

OpenAI颁布的Codex演示视频,,,首先展示了Codex在Mac环境下的自主开发、、自主debug的能力。

用户向Codex下达指令:::测试一个“井字棋”利用并修复所有的Bug。在接管到指令后,,,Codex自主打开Mac上的本地Xcode工程,,,并且顺次点击井字棋项主张网格,,,最终定位到法式代码的地位并执行启动指令。

从这里就能看出来,,,Codex并非通过后端的API直接挪用测试代码,,,而是真正通过图形界面(GUI)像通常用户一样去“使用”这个利用。两者的区别在于:::前者只是代表其解决了指令理解和代码执行问题,,,性质上依赖于利用自身的盛开API;;;后者则无需挪用利用的API,,,即可通过图形鉴别来实现工作。

这意味着,,,Codex拥有真正意思上的“通用执行能力”,,,由于好多第三方利用压根就不会给你盛开API。对于以前的AI来说,,,这些利用就是一个“黑盒”,,,它知晓对方的存在,,,却不能操作也不能读取。

并且,,,这里也展示了OpenAI壮大的多模态视觉鉴别与坐标映射能力。Codex可能“看懂”仿照器上的UI元素,,,并决定鼠标应该点击屏幕上的哪个像素坐标来实现下棋作为。

接下来Codex自动进入测试,,,而后直接鉴别到了Bug:::“人类走一步,,,电脑敌手会走两步”。这是整个演示中最让人惊艳的处所,,,由于Codex没有参考任何的谬误文档,,,而是齐全通过视发觉看和游戏规定的逻辑推理,,,判断出了利用在行为阐发上的Bug。

某种水平上,,,这注明Codex已经具备肯定的自主决策和“拟人”推理能力,,,在确定问题后,,,它起头着手修复井字棋法式,,,而后重新编译运行法式并确认Bug已经修复。而在另一个视频里,,,Codex还利用代码辅助插件,,,在没有明确文件蹊径提醒的情况下,,,自主索求本地的前端项目,,,并且给出了扭转领域最小的代码批改规划。

能够说,,,OpenAI通过单一的两个案例,,,直观展示了Codex早年端到后端的齐全工作流程能力。并且这所有都是通过对图形界面的视觉鉴别实现的,,,注明其已经具备险些涵盖所有开发环境的全流程闭环开发能力。

说真话,,,这真的有点可怕了。若是说以前用Codex开发利用,,,你还要懂一点编程知识去解决API接入等问题,,,那么此刻能够直接跳过这些流程,,,让Codex像“真人”一样操作电脑并天生你想要的法式。

不只是“出产者”,,,更是“合作者”

另一视频则展示了Codex在多模态层面的执行能力。在这个视频中,,,用户要求Codex为网页的主视觉区天生一张图片,,,这个要求里甚至没有具体的图片风格提醒词。

那么Codex是怎么做的呢???它没有直接天生一张不有关的图片,,,而是首先读取了本地项目文件,,,而后结合图形界面读取的信息,,,确定了网页的主题基调是“费城深夜快餐”,,,并以此为基准天生了一张“汉堡+薯条+深夜灯光”的图片。

并且Codex还进一步分析了“主视觉区”的排版需要。为了不遮挡左侧的案牍文字,,,天生的图片必要在左侧留出足够的空余,,,并且视觉重心要左袒右侧。仅这一项就是以前的AI难以做到的,,,由于大无数辅助开发工具都还在“纯文本代码天生”阶段,,,不仅无法理解网页中的“视觉元素”,,,甚至连图片天生和蹊径引入都要用户手动指定。

而在确定图片切合要求后,,,Codex自动执行指令将天生的图片移动到本地的项目文件夹中,,,并着手批改HTML文件,,,用真实的图片标签及本地蹊径代替了原有的占位符;;;同时顺手微调了CSS形状,,,确保图片可能美满适配网页的巨细,,,最后还刷新了内置浏览器的网页,,,展示最终的网页成效。

OpenAI还展示了Codex是若何齐全自主搭建一个网页的。在接管到用户的“乐高追踪网页利用”开发需要后,,,Codex挪用开发软件实现代码编写,,,并自动在本地启动了开发服务器,,,在Codex自带的浏览器面板上加载了页面。

随后,,,用户能够将自己的肆意需要直接通知Codex,,,它会凭据图形鉴别等获取的数据,,,调整网页的对应元素。好比在视频中,,,用户只是在对应编纂框给出了“缩小字体”的需要,,,Codex就自动实现了字体缩小、、重新排版等一系列步骤,,,真正做到了“所见即所得”。

对于网页开发者来说,,,Codex的身份其实已经产生了转变。以前各人更多将其视作debug和网页框架搭建的“代码出产者”,,,最终的整合还是必要人类插手。

此刻,,,它已经造成了你的“合作者”,,,你能够将更多的工作交给它。即便这涉及到具体的视觉元素批改和UI微调——以前AI可能难以正确理解你的意图,,,此刻却分歧了,,,由于它也能“看”到网页。

专属个人助理上线

在最后两个视频的演示里,,,OpenAI则是筹算让Codex造成你的“个人助理”。视频中用户仅用一句话,,,就让Codex同时检索了Slack、、Gmail、、Google Calendar和Notion等四个截然分歧的SaaS平台。

接着,,,Codex基于其语义理解能力,,,自主分析各平台的通知与信息,,,并凭据优先级进行排序,,,将信息分类为“急需处置”和“能够暂缓”;;;同时凭据信息的具体内容,,,提醒用户某些信息固然看起来只是日常;;惚,,,但是涉及到必要审批的事项,,,必要额外注意。

在总结并分类完信息后,,,用户又下达了新的指令“持续注意并通知我”。Codex直接成立了一个名为“Teammate - Hourly”的后盾工作,,,并且自动设定该后盾工作的具体运行规定:::每小时查抄一次各个SaaS平台,,,仅在有内容性信息增长(或无法获取最新信息)时提醒用户。

这个职能现实上也是之前OpenClaw爆火的原因——全自动的挂机“员工”。只必要下达指令,,,Codex就会在后盾持续监控和执行有关工作,,,并不必要用户去自动操作,,,从而将AI从“被动响应”造成了“自动协助”。

并且,,,Codex此刻的自动化操作能够在统一线程中运行,,,只必要打开对应谈天框,,,就能让AI反复或持续执行之前的工作,,,并不必要你重新给它铺排一遍工作。所以,,,别看视频演示单一就不当回事,,,现实上只有给的指令足够具体,,,Codex也能像OpenClaw那样执行复杂的自动化工作流程。

视频演示中还展示了Codex在监控到新的邮件后,,,直接给出了邮件内容的概括,,,并询问用户是否必要帮手草拟回复,,,这也是其凭据用户的分歧工作要求自行推理和设定的。

而在最后一个视频中,,,Codex则是凭据用户的要求,,,通过插件接见企业的内部知识库并找到对应的产品汇报,,,而后天生了一份面向高管的简报。在整个过程中,,,用户都只是给出了产品的名称,,,以及必要Codex做的事件,,,并没有提及产品汇报保留在什么处所、、若何查找。

全自动寻址、、急剧检索大量分歧的文档和图片、、提炼关键信息并天生文档。用户仅需一句话,,,Codex就自主分拆和执行了多个步骤;;;并且它并不必要企业给出私有API接口,,,仅通过用户已有的权限去挪用文档,,,最大水平地降低了企业的数据外泄等风险。

当然,,,Codex如今也占有了直接创建对应文档的能力。在视频中,,,Codex直接将网页端GitHub项主张最近Issue按主题整顿出电子表格,,,而后转成Excel表格文件输出。结合此前提到的能力,,,现实上你能够将其当做一个高效的“数据网络员”,,,从私有库到公罕见据,,,都能够让Codex网络并汇总成对应的文档,,,而后在其他工作中直接挪用。

目前,,,Codex已经集成了九十多个主流办公及开发插件,,,用户能够在谈天框中轻易挪用,,,这还能说啥呢,,,干就完事了。

为什么是Mac???

说真话,,,OpenAI的最新版Codex要比OpenClaw更适合大无数用户。由于其并不必要用户提供系统底层权限,,,以让渡安全性和隐衷性来换取方便性,,,而是借助macOS美满的辅助职能API和底层沙箱节制,,,实现不变且安全的运行。这是目前Windows端做不到的(权限治理复杂且API混乱)。

并且,,,Codex显著针对Apple的官方开发工具做了深度整合。不仅能够直接读取Xcode的项目结构,,,还能直接搞定Swift软件包依赖以及仿照器状态等设置,,,同时自动挪用Apple官方的开发文档和API规范,,,进行及收卷(这对于苹果开发者来说至关重要)。

别的还有个极度关键的成分——Apple生态:::枚嗳嗽诨嵘藺I Agent的时辰,,,城市忽略硬件生态的影响。试想一下,,,若是你在Windows上让AI执行一个工作时,,,健忘打开远程桌面法式,,,那么根基上就得走到电脑前进行操作;;;而Mac与iPhone、、iPad的协同生态,,,让用户能够在移动设备上轻松查看Codex的工作成就,,,并且轻松下达新的指令。

当你铺排Codex在家里干活,,,自己跑出去快活时,,,原生的远程治理职能履历无疑比第三方工具更好(不外Apple Remote Desktop是真的贵)。

总而言之,,,Mac版Codex的颁布,,,根基上标志取这个AI工具正式逾越了“被动助手”的阶段,,,起头成为直接管受系统桌面的“全能智能体(Agent)”。

它不再是一个必要你绞尽脑汁去解决API接口和各类使用问题的工具,,,而是一个能看懂屏幕、、能自主操作分歧软件、、甚至能替你两全铺排跨平台工作的“赛博同事”(忽然想到,,,Codex能帮我通关赛博朋克2077吗???)。

归正此刻压力给到macOS的老敌手微软了,,,Windows到底什么时辰能上线同样的职能???Copilot折腾了一两年都还是那个样子,,,属实对不起微软砸的这么多资源。

 

文章点评

未查问到任何数据 ! !

颁发评论

◎欢迎参加会商,,,请在这里颁发您的见解、、互换您的概念。

最新文章

热点文章

随机推荐

【网站地图】