Skip to main content

#Build

19 posts

LLM 跟编程的关系

  • LLM 不会取代工程师,它会放大工程师的能力,让工程师从繁琐的代码中解脱出来。这个转变类似于:从编写机器码到写汇编,从汇编到写 C,从 C 到 Python。每一次都是效率的提升,进而加快软件开发速度、降低开发门槛,带来的直接结果是软件更加丰富。
  • 使用自然语言编写程序,自然语言将成为下一代“编程语言”。
  • 在新的“编程语言”前提下,会出现新的开发模式。至于具体是什么,目前还没有共识;但从历史规律上看,肯定会有变化。现在要做的是义无反顾地投身其中,积累第一手经验,获得比较优势,并在过程中寻找杠杆,放大收益。
  • 对计算机原理、数据结构与算法、优秀的设计模式以及软件工程等概念的理解,其重要性不会降低。跟以前一样,懂得这些内容的人用“自然语言”也能写出更好的程序。但软件的整体丰富度、质量在 LLM 的加持下肯定会提升。
  • 对业务的理解,从古至今都是最核心的竞争力。它体现在对人的理解、对需求的敏感性上。

近期工具开发的感悟

  • 创造工具使我快乐
  • 我们创造工具,工具塑造我们
  • 狗粮自己要吃,而且要吃得最多
  • 只有自己喜爱的,才能提出更多的问题,才有耐心不停地打磨。此外,只有热爱才能创造价值、造出精品。
  • 自我迭代的工具最有魅力(用工具优化其本身)
  • 通用性跟专业性并不矛盾,越是偏底层的工具越能平衡两者

LLM 拥有近似无限的能力,本质上也是通过「指令微调」的方式「教会」了模型。 算是一种 scaling law,对于新技能的 scaling law。对于新增一个领域的业务,扩展他的成本极其低。 甚至是自动化的事情。

LLM 区别于其他 AI 技术点在于,它的 scaling 能力太强大了。 模型本身的「智力」、模型解决特定领域问题的能力等等。

它的训练方式(模型+数据)以及与世界的交互方式(文字),奠定了它的能力天花板非常非常高。

近期 AI 编程的感悟:

  • 工程师要以架构师视角看之前的工作,花时间做组件解构、组件交互、迭代目标,而不是写具体的代码。
  • 注重软件工程的方法论,借助软件工程方法学可以约束 AI,进而提高生产效率。
  • 代码数量不再是考核指标,应该考核软件架构设计 Prompt、自我迭代的自动化程度(基于闭环控制实现)。

LLM 权重存储的不是记忆,而是对世界知识的理解,是以压缩后的方式储存的。所以它有各种各样的神奇能力,比如“zero-shot”。

激活它的方式就是 prompt,一个好的 prompt 可以完整地激活模型本身潜在的能力,是动态“组装”出一个临时算法来解决问题。

看完了 OpenAI DevDay 2025,感慨现在是个人工具类开发者的黄金时代!

All you need is an idea.

随着编写的 prompt 越来越复杂,而且还需要引用大量的文字作为 prompt 内容本身,今年七月的时候就想到可以写个 Chrome 插件专门用来做这件事。

得益于 vibe coding,我这种对 Chrome 插件开发、网页技术栈一窍不通的人也可以写一个满足自己需求的工具,确实很神奇。 这也是我的第一个完整的面向终端用户的小工具,既然能够解决我的需求,我相信也肯定能解决其他有类似需求的人的需求。

我还给它做了个产品介绍页,地址为 immersive-notepad.caveman.work

以下是设计理念的大纲:

  • 聊天窗口式大模型的出现
    • 把基于文字的信息传递的效率推向了新的台阶
    • 浏览器成了主要的入口
    • 面临的信息更多
    • 思考的深度更多
  • 需要临时缓冲区
    • 将信息具象化,有助于形成焦点,可以专注思考
    • 对内容进行打磨,打磨的过程(即写 prompt 的过程)本身就是思考的过程。思考越多,prompt 就越长,而且不是一次性编写的,需要多轮优化。
    • 你需要在一个特定上下文中思考
    • 无缝地抓取引起注意的文字信息到临时缓冲区
    • 形成思考的循环,有助于进一步编写内容、prompt。
  • 定位
    • 专业的笔记记录工具,它只是临时缓存。
    • 完全可用快捷键操作,减少上下文切换,直接在浏览器中实现具象化的临时性思考
  • 改变了使用聊天式大模型的工具的方式,是这类工具的好伴侣。

有了基本的、可用的模型之后,可以利用此模型生成高质量数据,然后再反哺给模型,以提高模型的能力。 获得高质量数据的方法多种多样,RL 只是其中一种。

这个模式跟编译器、OS 类似;可以用 C 编译器开发 C 编译器,用 Linux 开发 Linux。

这期 Elek 主持的播客:#EP10 - 聊聊:2025苹果秋季发布会,我分享的是对这次新品的看法。

我的主要观点:

  • 苹果依旧强大,而且非常强大。在它擅长的领域,产品定义(或者说是生活方式定义)、工程优化的实现下打造出来的产品是绝对的领导者。这个行业有像苹果这样的组织,是最大的幸运。
  • 产品造型没有大变动的前提下,实现续航、散热、功能叠加的突破。如:AirPods Pro、Apple Watch、iPhone Pro
  • 拓宽 iPhone 用户谱系,如 iPhone Air,它注定是少数人的宝贝。

我发现参加播客讨论给我的收益非常大,它的回报并不是当下立马显现的,而是后劲非常强。在播客中讨论的观点,在工作、生活上影响着我。它可能是一点点的观念上的影响,但是会带来连锁反应。

这种高密度、高质量的讨论输出是一个“点”,这些点会在未来的某些时刻起到作用。但是你在经历这些点的时候是无法预知的。你只能相信。如果说这是信仰的话,那你应该追随内心,做真心喜欢的事情。我更喜欢跟朋友聊天,我们有相同的兴趣爱好,在这个非常放松的过程中,我的碳基模型的解码策略非常活跃,反而加强了一个观点。

重温一下 SJ 在斯坦福大学毕业典礼上的主题,追随内心,命运最终会将你经历的这些点连成线。

Again, you can’t connect the dots looking forward; you can only connect them looking backwards. So you have to trust that the dots will somehow connect in your future. You have to trust in something — your gut, destiny, life, karma, whatever. Because believing that the dots will connect down the road will give you the confidence to follow your heart, even when it leads you off the well-worn path, and that will make all the difference.

Steve Jobs’ 2005 Stanford Commencement Address

So the starting point wasn’t a chip or a design; the starting point was the question, What’s the user experience?​

‘‘Correct,’’ Steve Jobs said.​ “And the pieces come together.​ If you start to work on something, and the time is right, pieces come in from the periphery.​ It just comes together.‘‘​

— The Guts of a New Machine By ROB WALKER November 30, 2003

“Design is not just what it looks like and feels like. Design is how it works.” — Steve Jobs

真正的设计,是把用户要做的事推向极致,在此过程中自然而然地倒逼出在实现上的创新、外观上的改变。人所能看到的是其结果,而非其目的。

周末 build 更新:

  • 对 cuiyingyun.com 添加了生成图片功能,方便分享到各种社交网络。
  • 开设 ml.caveman.work 知识库网站,用于系统性阐述 ML 相关的技术。以写书的方式编写知识库,但切入点要独特,具体定位还在寻找中。caveman.work 会成为系列,将 perf、idea 等按主题划分之后形成同一个网站模板下的系列内容。

有了写作与分发平台,有助于我持续地输出。

下周开始编写具体的工具。

这期 Elek 主持的 播客: #EP09 - 聊聊:寒武纪股价、理想i8与追思iPod,我分享的是 SJ 对 01 年 iPod 发布会的感想。

主要有三点:

  • Apple 更多的是对已有产品的改进,是个层次上的跃迁。新增的 feature,足以使它成为一个新的产品门类。
  • 从 01 年发布 iPod 到 07 年发布 iPhone,整个发布会、产品设计,都是一脉相承。不只是一个硬件产品,而是集软件、硬件、服务于一体。每一个细微之处,都为产品的主要卖点做改进。如 iPod 1000 songs in your pocket,引入了 iTunes 和 Click Wheel。如 iPhone redefines smartphone,引入基于手势的 touch、OS X 级别的操作系统等。
  • SJ 的台风非常好,看完你都不自觉地觉得确实有必要买一台它的设备,你确实有这个需求,而且你有了这个设备确实显得更酷。

SJ 以及现在由 Tim 带领的苹果,都是非常优秀的研究与学习对象(当然,现在一直都是像素级模仿)。Tim 的时代并没有像 SJ 那样的辉煌,足以凭一两款产品彻底改变设计,但我觉得他是通过渐进式的改变来影响世界的。

发掘需求是一个挺难得事情,需要特别深入的体验与理解,才能摸索出一个需求。

多走访、多调研、多尝试,可能会找到需求。

我跟阿正年初的时候构思了一种产品形态,现整理成文(极其冷门的随身 AI 设备幻想),看以后能都有类似的产品出现并获得成功。

整个过程非常享受,有很多细节讨论,算是纯粹的从零构思产品的过程吧,可惜的是没法自己实现。

我们创造工具,工具塑造我们。

记,发布 Immersive Notepad v0.1 到 chrome/edge store

我参加了由 Elek 组织的播客节目,和阿正三人一起聊了 iOS26 中发布的 Liquid Glass 和 Foundation Models。我非常享受我们三人不定期录制的播客,总能从中学到很多。

这种层次的讨论在公司内部其实很难展开,可能是因为大部分开发工程师并不具备产品视角,而我恰好又特别喜欢探讨产品方向的话题。

这期播客跳转

提示词设计技巧

  1. 先询问历史上某件事做得好的特点是什么
  2. 根据自身需求,对特点进行修改
  3. 提示大模型,将修改后的内容转换成可操作的提示词
  4. 如果有更大的任务提示词,将步骤 3 的提示词整合到更大的提示词,并指示大模型输出完整的提示词

整体思路就是通过手动调优到局部最优,达成全局最优。

利用端午假期使用 Cursor Pro 写了一个 microblog 静态网站(也就是本网站)。亮点是通过 github issue 来编写微博客内容。好处是可以通过手机编写,任何有浏览器的电脑就能编写内容了,而不需要固定某个电脑上。 整体体验下来 Cursor Pro 非常费钱,但效果确实好。

Hugo 技术栈对我来说是完全陌生的,竟然也能手搓一个项目出来,时代确实是变了

但如果懂 Hugo 技术栈的化,显然是通过普通版就足够了。效果最好的 Max 版它既消费 Pro 账户里的份额,而且还是单独按 token 计费。而且它有“暴力”修改项目的倾向。

但即便如此,这已经是大大提高了工作效率。但这不代表人不需要学习专业的知识,因为这一顿操作下来花了我 40 美金之后,我不得不自己读了 Hugo 的开发文档,后面直接用碳基大模型来解决问题了。。。