起源:::过年若何给父母长脸作者:
造出地表最强AI,却死活不给你用!
出品 | 网易智能
作者 | 小小
编纂 | 王凤枝
最牛的大模型诞生了,但你底子没资格用。。
北京功夫4月8日凌晨,Anthropic干了一件违背贸易常理的事。。他们不仅亲手按死了自家超等模型Claude Mythos(神话)的公开颁布,还破天荒地联手苹果与谷歌等一众宿敌,试图把这个刚造出的重量级兵器彻底暗藏起来。。
它到底有多强?
在没有任何专属安全训练的前提下,它仅靠逻辑能力的天然演进就全面超过了前代顶级模型。。在权威的工程难题测试中,Mythos解决复杂Bug的成功率直接提升了近五成,而在科学界的极限测试里更是拿下了94.6%的高分。。
更让人警惕的是它在实战中的粉碎力。。从前几周内,Mythos在齐全自主的状态下,不仅一眼看穿了埋伏在顶级防火墙系统中长达27年的深层缝隙,甚至还能在Linux内核里自主串联多个荫蔽缝隙,瞬间实现对主题服务器的彻底收受。。
这种自主寻找缝隙并开发利用工具的壮大能力,正是它被垂危封杀的直接原因。。
Anthropic的前沿红队掌管人洛根·格雷厄姆(Logan Graham)坦言,全人类必须此刻就为一个新世界做好筹备。。他极其端庄地忠告,在将来6到24个月内,这类能力将变得四处可见,届时安全领域的很多规定将被彻底改写,我们构建现代安整个系时所依赖的诸多根基如果也将被全盘突破。。
为此他们宁肯烧毁巨大的贸易流量,也要抛出一项高达1亿美元的防御联盟打算。。他们试图用严格受控的内部盛开战术,为科技巨头们争取贵重的系统加固功夫。。
01数据不会说谎:::编码与推理的绝对降维碾压
正如Anthropic官方所释义的,Mythos一词源自古希腊语中的话语或叙事,代表着文化借以理解世界的故事系统。。这个内部代号,自身就宣告了一场跨维度的能力跃迁。。
Mythos在没有任何专门网络安全训练的前提下,仅仅靠代码能力的天然进化,就实现了对上一代最强模型Claude Opus 4.6的全面超过。。
在衡量AI解决现实工程问题能力的SWE-bench Pro测试中,Mythos预览版得分高达77.8%,而Opus 4.6只有53.4%。。这意味着在面对复杂的出产级代码库时,Mythos解决问题的成功率提升了近百分之五十,在多说话环境下,它更是跑出了87.3%的高分。。
在极具挑战性的人类最后一场考试(Humanity’s Last Exam)中,有工具辅助的Mythos达到了64.7%,将前代模型远远甩在身后。。而在针对科学领域难题的GPQA Diamond测试中,Mythos的得分更是高达94.6%,险些逼近了人类专家认知的极限。。
Mythos不仅会写代码,它还会像高级工程师一样收受电脑。。在验证操作系统执行工作能力的OSWorld-Verified测试中,它斩获了79.6%的分数。。这意味着它可能流畅地在各类软件界面间切换、搜索主题信息并执行复杂的粉碎或防御指令。。
02实战猎杀纪录:::揪出蛰伏27年的代码鬼魂
若是说测试分数只是尝试室数据,那么Mythos在从前几周里自主揪出的数千个零日缝隙,则是实打实的战绩。。Anthropic披露了三个典型的危险案例,每一个都足以让顶尖的安全专家盗汗直流。。
OpenBSD一向被誉为全球安全性最强的操作系统,宽泛用于防火墙等关键基础设施。。然而,Mythos在齐全自主的情况下,直接鉴别出了一个埋伏了27年之久的深层缝隙。。这个缝隙的后果极度直接,攻击者只需单一衔接,就能远程导致任何运行该系统的机械瞬间崩溃,而在这漫长的27年里,无数顶级安全钻研人员和审计工具对它一窍不通。。
FFmpeg是现代互联网视频处置的底层基石,险些每一款主流软件都在依赖它。。Mythos在其中发现了一个存在了16年之久的荫蔽缝隙。。极具嘲讽意味的是,自动化测试工具曾对出问题的这行代码进行了多达五百万次的反复扫描,却从未检测到任何异常,而Mythos却一眼看穿了这行代码背后的逻辑陷阱。。
在运行着全球绝大部门服务器的Linux内核中,Mythos展示了更高级的思虑能力。。它不仅敏感地发现了缝隙,还能自主将多个边缘缝隙串联起来,实现了一次从通常用户权限到齐全节制主题思器的致命逆转。。
03一亿美元的保命樊篱:::玻璃翼打算若何运作
面对Mythos这种足以粉碎现有互联网双刃剑,Anthropic并没有选择闭门造车,而是垂危提议了一项名为玻璃翼打算(Project Glasswing)的全球防御建议。。
这个名字的寓意意味深长,Glasswing是一种以通明同党著称的透翅蝶。。Anthropic官方诠释称,通明的同党让蝴蝶能暗藏在有目共睹之下,就像那些难以觉察的软件缝隙,同时这种通明度也让它们能躲避捕食者的中伤,正如该打算所提倡的防御通明度。。
为了确保人类防御者可能跑赢将来的攻击者,Anthropic投入了重大的资源:::
首先,Anthropic承诺向Glasswing合作同伴及有关组织提供最高一亿美元的Mythos预览版使用额度,确保他们有丰裕的算力资源来加固自己的代码库。。
其次,为了不让开源社区在这场安全较量中掉队,Anthropic通过Linux基金会向Alpha-Omega、OpenSSF等开源安全组织捐赠了250万美元,并向Apache软件基金会捐赠了150万美元。。
最关键的一步是,目前Mythos绝对不会向公家颁布。。只有通过该打算,合作同伴能力通过AWS、Google Cloud Vertex AI或Microsoft Foundry等平台获得严格受控的预览权限。。
这种极端守旧的分阶段颁布战术,现实上是在为全球基础设施争取功夫。。正如Anthropic前沿红队掌管人所言,这早已不是一家公司的问题,而是全行业甚至列国当局都必须面对的挑战,我们必须让防御者占据先机。。
04巨头们的罕见结盟:::连敌手都坐不住了
在这场史无前例的合作中,已经的贸易竞争敌手们阐发出了罕见的共识。。八家首创合作同伴在实测Mythos后,给出了最真实的反。:::
亚马逊AWS副总裁艾米·赫尔佐格(Amy Herzog)泄漏,他们已经在关键代码库中测试Mythos,每资质析超过四百万亿个网络流量,而Mythos正在援手他们在大规模防御中进行底层的代码加固。。
微软网络安全执行副总裁伊戈尔·齐甘斯基(Igor Tsyganskiy)指出,Mythos阐发出了超过以往所有模型的改进。。他端庄地判定,网络安全已经正式进入了一个不再受人力限度的全新阶段。。
谷歌安全工程副总裁希瑟·阿德金斯(Heather Adkins)对这一建议暗示了欢迎。。只管谷歌占有Big Sleep和CodeMender等自研安全工具,但她深刻意识到,面对基于下一代AI的攻击,跨行业的巨头结盟至关重要。。
思科高级副总裁安东尼·格里科(Anthony Grieco)则强调,AI的能力已经逾越了临界点,从前那种缓慢修补系统的步骤已经行不通了。。思科参与打算是为了以前所未有的速度和规模鉴别修复缝隙。。
CrowdStrike首席技术官伊利亚·扎伊采夫(Elia Zaitsev)发出的忠告最为直接,从缝隙被发现到被利用的窗口期,已经从数月被压缩至几分钟,他告诫所有人,若是你想部署AI,安全必须是第一位的。。
Palo Alto Networks首席产品官李·克拉里奇(Lee Klarich)证实,Mythos能鉴别出前代模型齐全漏掉的复杂缝隙。。他呼吁所有人必须现代化自己的网络安全栈,迎接更频仍、更复杂的AI辅助攻击。。
摩根大通首席信息安全官帕特·奥佩特(Pat Opet)暗示,这是金融机构在关键基础设施防御方面的一次早期机遇,必须通过合作来评估下一代AI工具。。
Linux基金会首席执行官吉姆·泽姆林(Jim Zemlin)则以为,AI加强的安全将成为每一位守护者的得力助手,而不再是大型组织的专属特权。。
05终极算帐还是变相的诓骗勒索
当Claude Mythos这种可能自主猎杀系统缝隙的模型被公之于众时,全球舆论场出现出了两极分化。。这种复杂的反馈,不仅折射出了技术带来的震撼,更揭示了人们对于失去网络安全主导权的焦虑。。
驰名科技投资人布拉德·格斯特纳(Brad Gerstner)高度赞扬了这种求实的做法。。他以为通过推迟颁布并组建防线,Anthropic现实上是用一种市场合作模式,为脆弱的互联网筑起了一道樊篱。。
然而,品评的声音同样敏感,甚至带着对技术霸权的恼怒。。
科技专栏作者尼克·奥尼尔(Nick O'Neill)的概念显得极度激进,他以为对于全球软件公司来说,这更像是一场打着创新暗号的人质劫持。。若是不向Anthropic支付昂贵的模型使用费,这些公司在将来被攻破的概率将高达85%,在他眼里,这种当先的安全能力更像是一种新型的诓骗勒索。。
在竞争格局上,业界的嗅觉极其敏感。。只管OpenAI曾宣称占有最强网络安全模型,但Mythos显然在能力上实现了跨代式的飞跃。?萍疾┲髦赋,正本属于OpenAI的先发优势正在产生转移,安全防御已然成为将来一年AI大厂之间最主题的较量场。。
此外,多位重量级观察家对这一景象进行了深层分解,试图理清Mythos问世的真实意思:::
驰名科技博主罗伯特·斯考伯(Robert Scoble)从AGI治理的角度指出,若是手中把握了足以:::κ澜绲淖炒蠹际,明智的做法绝不是贸然公开,而是先用它来修复世界的缝隙。。只有让正确的人治理它,技术能力真正造福于人。。
将来学家拉米兹·纳姆(Ramez Naam)则将这看作一场AI与AI之间的对决。。他以为安全必须在整个生态系统层面得到保险,而“好人利用AI”,是阻止“坏人”利用AI的唯一前途。。
《纽约时报》专栏作者凯文·鲁斯(Kevin Roose)则觉察到了一个更性质的变动。。他在推文中直言:::除了网络安全方面的影响之外,Claude Mythos的未颁布是自GPT-2以来,重要人为智能尝试室初次因安全问题而推迟颁布已颁布的模型。。
若是Anthropic的说法正确,那么公开可用的模型和个人模型之间此刻存在着巨大的差距,这可能是多年来第一次出现这种情况。。
结语:::沙漏已经倒转,留给人类的功夫不多了
Anthropic CEO达里奥·阿莫代伊(Dario Amodei)的最后通牒极度清澈,网络安全仅仅是前沿模型带来的第一个紧迫危险,但它绝对不会是最后一个。。Glasswing打算仅仅是一个起点,保卫全球网络基础设施的工作可能还必要数月甚至数年功夫。。
在这场能力的狂飙中,我们正处在一个极其不确定的节点上。。
而对于数以十亿计的通常用户来说,这步崆最让人后背发凉的现实。。我们每天赖以生计的社交隐衷、银行存款和智能设备,在这场即将到来的风暴刻下犹如纸糊通常脆弱。。
Mythos的封印,到底能为这个世界换取几多防御功夫?
@简健昀:::王者荣耀伽罗叉开腿让我进去,现货黄金失守4440美元@邓怡雯:::杜兰特脱离勇士季后赛仅赢2个系列赛
@蔡思妤:::一只松鼠让半个松原停电系谣言
热点排行
- 1 中国孕妇XXXXXXⅩXX孕交️
- 2 中国妓女❌BBwBB🔞W㊙️3BW
- 3 看片婬黄大片欧美看国产片
- 4 真人无遮挡❌裸交视🔞频㊙️
- 5 欧美激性欧美激情AⅤ
- 6 xxdd1 tv
- 7 99精品国产免费看app
- 8 78m一78摸成
- 9 亚洲av无码一区在线观看