💻 Algorithm Engineer | 🌍 Saas | 📸 数码摄影发烧友 | 🚀 独立开发者ing | 科技与美学的探索者

Joined February 2017
Anthropic 和 Cloudflare 都发了一篇通过 Code Execution 的方式来让 Agent 高效调用 MCP Server 的文章。由于 MCP 为了做的通用,所以 MCP  Server 中 tools 往往会做得比较通用、原子性。这就导致有时候要完成一个任务,Agent 需要调用很多次不同的 Tool,但往往很多时候多个 Tools 的中间调用结果可能只有很少的有效信息,其余信息只会额外占用很多 Context。因此这两篇文章都提到一种新的方法,就是不让 Agent 直接调用 MCP,而是通过生成代码的方式来调用 MCP Server 中的 Tools。这样 Agent 可以更加灵活组合不同 Tool 的调用,同时中间结果还不会占用 Agent 的 Context anthropic.com/engineering/co… blog.cloudflare.com/code-mod…
刚读完 OpenAI 发布的 Sora 2 提示词指南,内容非常干货,对于想要创作出惊艳 AI 视频的朋友来说,强烈推荐阅读学习! 我把核心要点总结了一下: 首先,核心思路是把自己当成一个从未看过你分镜脚本的电影摄影师去写提示词。细节给得越足,模型就越能精准实现你的想法。但有时,适度留白也能激发模型意想不到的创意和美感。这完全取决于你的创作目标。 我的几个关键学习点: - 分清“参数”和“内容”:视频的分辨率、时长等必须通过 API 参数直接设定,无法在提示词里用文字描述来更改。提示词只负责控制视频的具体内容,比如主题、动作和风格。 - 描述尽可能具体:模糊的描述(如“一条美丽的街道”)远不如具体的场景描绘(如“潮湿的沥青路面,斑马线,霓虹灯在水坑中的倒影”)效果好。动作指令也一样,“走过房间”不如“演员走向窗户,走了四步,停顿了一下,在最后一秒拉上窗帘”来得精确。 - 专业术语的力量:想要电影感?直接上专业术语!明确指出摄影机、景深、灯光和调色方案。比如,用“35mm 镜头,浅景深”来代替“电影感”。指南里甚至给出了一个极其详尽的专业级镜头清单模板,从滤镜、色调到运镜,应有尽有。 - 利用图像输入:想要更精准地控制角色或场景风格?可以先用图片生成模型创作一个参考图,再把它作为输入,让 Sora 在这个基础上进行视频生成。 - 迭代是关键:不要指望一次成功。把每一次生成都看作一次新的尝试。当结果接近预期时,可以使用 Remix 功能进行微调,比如“同样的镜头,切换到 85mm 镜头”。 总而言之,Sora 的提示词工程是一门结合了技术精度和艺术创想的学问。这份指南为我们指明了方向,剩下的就是不断实践和探索了。强烈推荐大家阅读原文! cookbook.openai.com/examples…
今年的 iPhone 感觉港版最香啊。不出意外今年还是选 pro max。 国行对比港版阉割的功能 - 港版无线充电有30w,国行只有15w - 港版有价格优势,而且容量越大价格优势也越大 - air 都支持双 e-sim,但只有港版的 pro 系列支持双eSim或单实体卡+eSim。
1
2
1
Gemini-2.5-flash-image 的新玩法,可以通过简笔画姿态图来控制图像中生成人物的动作。
Gemini-2.5-flash-image 超强的图像编辑能力可以让你生成任意角色在任意地点的合照。如果再加上一个视频生成模型的话,甚至还能生成这样的怪视频🤣
nano-banana 的真身竟然是 gemini-2.5-flash-image!目前 AI Studio 上已经可以使用了。试了几个 case,确认无疑了
Nano banana 今晚要来咯🔥
报道! 祝WaytoAGI越来越好!
感同身受。随着日常开发使用 AI 的频率越来越高,开发的效率虽然极大的提升了,但是在代码 Review,Testing 以及上线后的观察却变多了。因为这份代码本质上大部分细节不是我实现的,我只是单纯告诉了要实现一个什么样的功能,但却没有像以前那样仔细思考实现过程中的每一个细节,我不知道的事情反而变多了。所以也就导致了在开发后的环节中其实花的时间更多了,于此同时那种上线后的不安全感其实也更加强烈了。毕竟 AI 不需要为结果负责,需要对结果负责的目前还得是人
《在习惯 AI 编程之后反思什么是真正的技术能力》 最近用 AI 写了不少 Rust 代码。说实话,它写得挺快,语法正确,逻辑清晰,甚至能指出我的一些低级错误。 但每次要把这些代码提交到生产库时,我还是会犹豫——不是不信任 AI,而是突然意识到,它并不真的"懂"这些代码。 AI 写的是代码,不是解决方案 让 AI 写个搜索算法?没问题。让它实现一个 REST API ?也行。但当你问它:"这个服务挂了会影响多少用户?"或者"这个改动会不会让明天的数据迁移失败?"它就沉默了。 AI 看到的是代码模式——它知道 unwrap() 在Rust里可能panic,知道该用 Result 处理错误。 但它不知道这个服务是公司营收的关键路径,不知道这个数据库连接池的配置是经过多少次生产事故才调优出来的。 这就是问题所在:代码只是冰山一角,水下的才是真正的技术工作。 调 Bug 时你就知道差距了 前几天遇到一个诡异的内存泄漏。AI 看了代码说:"看起来没问题。"确实,从代码层面看,所有该释放的都释放了。 但问题不在代码里。是某个第三方库会保持连接不释放。这种问题,你得翻 issue,看源码,甚至用 strace 跟踪系统调用才能发现。 调试不是读代码,是侦探工作。你得有直觉——"这个地方感觉不对劲",得有经验——"上次类似的问题是因为...",还得有耐心 —— 一行行打日志,一步步缩小范围。 AI 没有这种"第六感",也不会因为被 bug 折磨三天而记住这个坑。 写代码是最简单的部分 真正难的是什么? 是听产品经理说了半小时需求后,意识到他真正想要的和他说的完全是两回事。 是在架构评审时,预见到三个月后这个"小功能"会变成性能瓶颈。 是在凌晨三点收到报警时,能在五分钟内定位问题并回滚,而不是改代码。 是知道什么时候该重构,什么时候该将就——因为下个季度要大改,现在重构就是浪费。 技术能力不是会写多少种排序算法,而是知道什么时候根本不需要排序。 责任感是AI学不会的 当你的代码影响到真实用户时,那种责任感是 AI 永远体会不到的。 半夜被叫起来修生产 bug,看着监控上飙升的错误率,你会真切地感受到——每一行代码都有重量。这种重量会让你在写下一行代码时更谨慎,会让你主动去思考边界情况,会让你在 code review 时多问一句:"这样真的没问题吗?" AI 可以生成完美的 try-catch,它不会因为忘记处理异常而被骂,但也不会因为系统稳定运行而有成就感。 所以,技术能力到底是什么? 是判断力——知道什么重要,什么不重要。 是洞察力——能看到代码背后的业务逻辑和系统脉络。 是创造力——不是创造新算法,而是在约束中找到最优解。 是同理心——理解用户的痛点,理解同事的难处,理解系统的局限。 最重要的,是担当 —— 敢说"这是我写的",无论是跑得很稳的服务,还是半夜崩溃的 bug。 AI 是个好工具,它让我们从重复劳动中解放出来。但当我们不再需要记住语法细节时,反而更需要思考:我们为什么要写这段代码?它解决了什么真正的问题? 技术的本质从来不是代码本身,而是用代码改变世界的能力——哪怕只是让某个用户的体验好了那么一点点。 这才是 AI 暂时还学不会,而我们真正该专注的东西。
1
4
A close-up shot of a minimalist product label on a glass bottle. The label is white with black text. The main product name 'Aura Essence' is in a clean, elegant font, and below it, 'Natural & Organic Skincare' is written in a smaller, refined typeface. Soft studio lighting
一面砖墙上的街头涂鸦艺术,风格大胆、色彩鲜艳。中央是一个巨大的喷漆字母组合,旁边用粗体字写着 'Peace & Love' 和中文的 '和平与爱',字体错落有致,充满活力。
A vibrant cyberpunk city night scene, with a glowing neon sign prominently displayed on a building. The sign reads 'FUTURE NOW' in a bold, futuristic font, with electric blue and hot pink lights. Rain reflects on the wet streets below.
一幅古朴典雅的水墨画,画面中央有一卷展开的宣纸,上面用行书写着“静水流深,沧海月明”八个汉字,字体苍劲有力,旁边点缀着几片飘落的枫叶,整体色调柔和,有秋天的感觉。
A young woman reading a book in a cozy coffee shop, natural window lighting, candid moment, film photography aesthetic
Qwen-image 发布了!Qwen-Image 模型是一个 20B MMDiT 图像基础模型。该模型擅长生成和编辑包含复杂文本(尤其支持中英文)的高质量图像,并在多项任务中达到最先进水平。 👇是该模型的一些生成样例,感觉生成文字的效果还是非常不错的
Macro shot of a dewdrop on a spider web, intricate web details, morning light refracting through the water droplet, soft green background
A basketball player in mid-air, about to dunk, dramatic stadium lighting, sweat visible on his face, motion blur on the background
Homemade pasta with fresh basil, natural kitchen lighting, overhead shot
Quiet city street at night, warm street lamps, few people walking, realistic urban photography