开云最新下载app安装2026最新版 登顶GitHub Hacker News, 这个开源技俩让AI编程资本缩小 98%|披露新型样

开云最新下载app安装2026最新版 登顶GitHub Hacker News, 这个开源技俩让AI编程资本缩小 98%|披露新型样

文|李嘉星

剪辑|周鑫雨

一句话先容

context-mode是一款专为AI编程打造的凹凸文优化MCP(Anthropic发布的模子凹凸文契约)插件。

它惩办了诱导者在长周期诱导中碰到的“模子失忆”与“Token过多突然”的核肉痛点。

据团队默示,在编程场景下,context-mode梗概让AI编程的资本缩小98%,同期将大模子的回顾力从30分钟栽植至3小时。

团队布景

context-mode的背后是一支布景多元的跨国初创团队。刻下团队的中枢成员散播在土耳其、法国等4个国度,主要通过GitHub异步配合。

MertKöseoğlu(中枢诱导者、首创东谈主):曾动作时刻参谋人为OpenAI等企业提供时刻做事,领有超10年全栈工程与系统架构劝诫。创业前,他曾先后任职于Countly、Planhat及Jotform等全球驰名数据与SaaS平台,担任高档软件工程师。

孙逸诚(中枢诱导者、多平台适配认真东谈主):团队里的中国样子,刻下大二在读。他曾入围强基推测(数学与物理全省前18名),具有Temporal-RAG(时序数据检索增强)引擎的镇定诱导劝诫,并赢得知乎全球A2A(Agent-to-Agent)黑客松银奖。

居品及业务

图源:context-mode

浅易来说,context-mode是一款有益为AI编程助手“减负”和“整理回顾”的开源MCP插件。

该技俩发布后曾登顶GitHubHackerNews,刻下已在GitHub赢得超1.5万颗Star。context-mode现已诱导逾24.3万名诱导者接入,完成了对15个主流平台的底层适配,并被微软、谷歌、Meta、字节荒芜及Cursor等科技公司的研发团队选定。

context-mode之是以能在极客圈赢得普遍的关怀,恰是因为其精真实中了一个令东谈主头疼的行业着急:被不菲API账单和大模子失忆逼疯的诱导者

跟着“龙虾(OpenClaw,一个开源Agent框架)”等全自动AI编程智能体的普及,VibeCoding的期骗门槛进一步缩小。

然则,享受到AI带来的铁心栽植的同期,用户很欢欣志到,身手是不菲的:一方面,Claude、GPT等顶尖模子的Token订价并未低廉,包含充足Token额度的高档套餐,订价动辄高达200好意思元/月。

另一方面,受制于当下的才气,在践诺具体任务历程中,模子的反复试错、访佛检索皆会形成额外的Token蹂躏。

在现实诱导场景中,大模子时常泄露得像一个“莫得知识的数据处理机器”。团队成员孙逸诚共享了一个踩坑阅历:

插足Kaggle数据竞赛时,他将一个包含300组数据的考试任务交给了Claude。为了说明任务程度,Claude莫得聘任写一段定时剧本,而是聘任每隔5秒钟向通盘技俩发起一次全局检索。这种极其低效的“死盯”计谋,让一个高配会员账号的API额度在短短半小时内突然了90%。

与此同期,大模子还存在“失忆”的问题。诱导者发现,现代码量波及某些主流IDE(集成诱导环境)的隐形上限(如164K)时,系统会不得不丢弃或压缩历史信息,导致模子淡忘关键细节。这就导致:前一秒还在运动写代码的AI,下一秒就会把前置的关键架构和不时条款忘得清清爽爽。

靠近大模子严重的“幻觉”与“失忆”,context-mode给出了解法:既然大模子处理海量原始数据又贵又笨,乐鱼体育中国2026世界杯官网那就劫掠它平直阅读原始数据的职权。

孙逸诚打了一个譬如:“传统的AI编程就像看一场马拉松,大模子会死死盯着每一个选手的每一步,这虽然会耗尽它的凹凸文。而context-mode作念的,是把赛马拉松的历程扔进一个屏蔽的沙盒(Sandbox)里,大模子只需要看临了的排行铁心。”

具体到责任旨趣,领先,通过引入“杜撰沙盒”与精确检索,context-mode梗概有用缩小Token的突然。

在传统的调用时势中,每一次MCP器用的调用皆极其不菲,宽敞的原始数据会被平直倾倒进大模子的凹凸文窗口,导致Token突然量高涨。

context-mode的“杜撰化沙盒”机制,就好比在大模子和操作系统间设立了一起“防火墙”。它会先把悉数文献和开动记载存放在腹地,需要用到时再帮大模子把相干内容找出来。

《智能披露》的测试铁心。

把柄《智能披露》的测试,接入context-mode后,大模子读取一份79.3KB的文献时,Token的突然资本缩小了87.7%。

其次,为了惩办大模子的“失忆”痛点,context-mode通过构建“归档点”,及时监控诱导者的每一次文献剪辑。

当对话太长,它会主动构建并向AI注入一个频频小于2KB的“快照”,开云体育app2026世界杯中国官网下载相称于在代码剪辑历程中设立了一个“归档点”。官方默示,这种机制能将大模子相连编程的有用时候从30分钟栽植至3小时。

临了,context-mode引入了强制性“用代码想考(ThinkinCode)”的范式,从而省俭Token突然。

所谓的ThinkinCode,浅易而言,便是不让模子逐行阅读、处理文献,而是先让模子编写一个“小顺次”,让“小顺次”先在腹地完成数据分析,再将索求后的铁心响应给模子。

context-mode首创东谈主Mert告诉《智能披露》,诱导者堕入了一个误区:民风将海量数据平直丢给大模子进行处理。现实上,靠近50个文献的数据统计任务,与其让模子切身一一阅读,不如先让模子写一段剧本,由剧本完成统计责任,再把铁心复返给模子。

用Mert的话说,一个剧本不错替代十几个不菲的器用调用,并省俭百倍的凹凸文。

把柄《智能披露》的测试,接入context-mode后,模子处理一份文献时,省俭了99.98%的Token资本。

context-mode的上手门槛,比Cursor等需要再行下载并合适环境的镇定诱导软件(IDE)更低。动作一个轻量级的MCP(模子凹凸文契约)插件中间件,context-mode不错平直接入诱导者原有的责任流中。

context-mode团队还提供了一系列快捷教导,用来检察各大平台的Token省俭情况。用户只需要在聊天框中输入教导,浏览器就会弹出一个腹地的数据统计面板,记载着当周调用了若干次API,以及context-mode抑制了若干次无效的数据读取。

△快捷教导列表。图源:context-mode

近期,context-mode针对企业研发场景,推出了“凹凸文即做事”。

在企业研发场景中,AI的ROI时常难以接头。

百家乐2026世界杯中国官方下载

为此,context-mode推出了企业做事“Insights”。赢得授权后,安设在顺次员电脑上的插件,不错平直将顺次员使用AI的历程数据(比如调用了什么器用、报错了几次、突然了若干钱),发送到Insights处所做事器上。

与此同期,Insights还能针对不同岗亭,提供不同的数据请问。比如面向安全总监,系统会自动生成安全请问;面向财务团队,系统不错提供Tokens突然明细。

刻下,Insights仍处于定向内测阶段。

Founder想考

住手将大模子视为“数据处理器”,它现实上是“代码生成器”。

刻下好多平台和诱导者堕入了一个误区,可爱把50个文献平直读入凹凸文,让大模子去内部“数”有若干个函数。

这不仅逐渐,并且极其蹂躏算力。咱们的主见是“用代码想考(ThinkinCode)”——LLM应该去编写一个统计剧正本完成计数,临了只输出铁心。

一个剧本不错替代十几个不菲的器用调用,并省俭百倍的凹凸文。在昔时的AI编程范式中,这是悉数平台皆必须谨守的底层铁律。

无穷凹凸文是一个伪命题,克制才是AI器用最难设立的壁垒。

行业里皆在卷大模子的长文本才气(比如100K致使1M的凹凸文),但这其实是个罗网。把几十KB的报错日记一股脑倾倒给AI,只会加快它的“失忆”和幻觉。

真实的解法不是盲目扩容,而是设立起一套畸形克制的“气象回顾层(沙盒)”。谁能把传给AI的无效杂音压缩到极致,谁才能真实帮诱导者把相连编程的时候从30分钟延伸到3个小时。

下一代AI编程的瓶颈不在于模子够不够灵巧,而在于凹凸文经管框架够不够了了。

刻下环球皆在颓唐AI会在兼并个Bug上反复颠仆。这并不是因为模子变笨了,而是它在冗长的对话中迷失了。

只好给AI提供像单机游戏通常的归档点,强制它按优先级读取回顾,才能为它真实有价值的逻辑推理留出饱和的空间。

大厂在卷“全家桶”,而咱们在作念跨平台的“全能插座”。

咱们花普遍元气心灵去适配Cursor、Claude、Gemini等不同的底层逻辑,是因为真实的诱导者生态永远是碎屑化且快速迭代的。

诱导者不需要另一个被大厂深度绑定的全能Agent开云最新下载app安装2026最新版,他们需要的是一个轻量、不吃内存、即插即用且能极大缩小API账单的中间件。