Skip to main content

#Build

14 posts

看完了 OpenAI DevDay 2025,感慨现在是个人工具类开发者的黄金时代!

All you need is an idea.

随着编写的 prompt 越来越复杂,而且还需要引用大量的文字作为 prompt 内容本身,今年七月的时候就想到可以写个 Chrome 插件专门用来做这件事。

得益于 vibe coding,我这种对 Chrome 插件开发、网页技术栈一窍不通的人也可以写一个满足自己需求的工具,确实很神奇。 这也是我的第一个完整的面向终端用户的小工具,既然能够解决我的需求,我相信也肯定能解决其他有类似需求的人的需求。

我还给它做了个产品介绍页,地址为 immersive-notepad.caveman.work

以下是设计理念的大纲:

  • 聊天窗口式大模型的出现
    • 把基于文字的信息传递的效率推向了新的台阶
    • 浏览器成了主要的入口
    • 面临的信息更多
    • 思考的深度更多
  • 需要临时缓冲区
    • 将信息具象化,有助于形成焦点,可以专注思考
    • 对内容进行打磨,打磨的过程(即写 prompt 的过程)本身就是思考的过程。思考越多,prompt 就越长,而且不是一次性编写的,需要多轮优化。
    • 你需要在一个特定上下文中思考
    • 无缝地抓取引起注意的文字信息到临时缓冲区
    • 形成思考的循环,有助于进一步编写内容、prompt。
  • 定位
    • 专业的笔记记录工具,它只是临时缓存。
    • 完全可用快捷键操作,减少上下文切换,直接在浏览器中实现具象化的临时性思考
  • 改变了使用聊天式大模型的工具的方式,是这类工具的好伴侣。

有了基本的、可用的模型之后,可以利用此模型生成高质量数据,然后再反哺给模型,以提高模型的能力。 获得高质量数据的方法多种多样,RL 只是其中一种。

这个模式跟编译器、OS 类似;可以用 C 编译器开发 C 编译器,用 Linux 开发 Linux。

这期 Elek 主持的播客:#EP10 - 聊聊:2025苹果秋季发布会,我分享的是对这次新品的看法。

我的主要观点:

  • 苹果依旧强大,而且非常强大。在它擅长的领域,产品定义(或者说是生活方式定义)、工程优化的实现下打造出来的产品是绝对的领导者。这个行业有像苹果这样的组织,是最大的幸运。
  • 产品造型没有大变动的前提下,实现续航、散热、功能叠加的突破。如:AirPods Pro、Apple Watch、iPhone Pro
  • 拓宽 iPhone 用户谱系,如 iPhone Air,它注定是少数人的宝贝。

我发现参加播客讨论给我的收益非常大,它的回报并不是当下立马显现的,而是后劲非常强。在播客中讨论的观点,在工作、生活上影响着我。它可能是一点点的观念上的影响,但是会带来连锁反应。

这种高密度、高质量的讨论输出是一个“点”,这些点会在未来的某些时刻起到作用。但是你在经历这些点的时候是无法预知的。你只能相信。如果说这是信仰的话,那你应该追随内心,做真心喜欢的事情。我更喜欢跟朋友聊天,我们有相同的兴趣爱好,在这个非常放松的过程中,我的碳基模型的解码策略非常活跃,反而加强了一个观点。

重温一下 SJ 在斯坦福大学毕业典礼上的主题,追随内心,命运最终会将你经历的这些点连成线。

Again, you can’t connect the dots looking forward; you can only connect them looking backwards. So you have to trust that the dots will somehow connect in your future. You have to trust in something — your gut, destiny, life, karma, whatever. Because believing that the dots will connect down the road will give you the confidence to follow your heart, even when it leads you off the well-worn path, and that will make all the difference.

Steve Jobs’ 2005 Stanford Commencement Address

So the starting point wasn’t a chip or a design; the starting point was the question, What’s the user experience?​

‘‘Correct,’’ Steve Jobs said.​ “And the pieces come together.​ If you start to work on something, and the time is right, pieces come in from the periphery.​ It just comes together.‘‘​

— The Guts of a New Machine By ROB WALKER November 30, 2003

“Design is not just what it looks like and feels like. Design is how it works.” — Steve Jobs

真正的设计,是把用户要做的事推向极致,在此过程中自然而然地倒逼出在实现上的创新、外观上的改变。人所能看到的是其结果,而非其目的。

周末 build 更新:

  • 对 cuiyingyun.com 添加了生成图片功能,方便分享到各种社交网络。
  • 开设 ml.caveman.work 知识库网站,用于系统性阐述 ML 相关的技术。以写书的方式编写知识库,但切入点要独特,具体定位还在寻找中。caveman.work 会成为系列,将 perf、idea 等按主题划分之后形成同一个网站模板下的系列内容。

有了写作与分发平台,有助于我持续地输出。

下周开始编写具体的工具。

这期 Elek 主持的 播客: #EP09 - 聊聊:寒武纪股价、理想i8与追思iPod,我分享的是 SJ 对 01 年 iPod 发布会的感想。

主要有三点:

  • Apple 更多的是对已有产品的改进,是个层次上的跃迁。新增的 feature,足以使它成为一个新的产品门类。
  • 从 01 年发布 iPod 到 07 年发布 iPhone,整个发布会、产品设计,都是一脉相承。不只是一个硬件产品,而是集软件、硬件、服务于一体。每一个细微之处,都为产品的主要卖点做改进。如 iPod 1000 songs in your pocket,引入了 iTunes 和 Click Wheel。如 iPhone redefines smartphone,引入基于手势的 touch、OS X 级别的操作系统等。
  • SJ 的台风非常好,看完你都不自觉地觉得确实有必要买一台它的设备,你确实有这个需求,而且你有了这个设备确实显得更酷。

SJ 以及现在由 Tim 带领的苹果,都是非常优秀的研究与学习对象(当然,现在一直都是像素级模仿)。Tim 的时代并没有像 SJ 那样的辉煌,足以凭一两款产品彻底改变设计,但我觉得他是通过渐进式的改变来影响世界的。

发掘需求是一个挺难得事情,需要特别深入的体验与理解,才能摸索出一个需求。

多走访、多调研、多尝试,可能会找到需求。

我跟阿正年初的时候构思了一种产品形态,现整理成文(极其冷门的随身 AI 设备幻想),看以后能都有类似的产品出现并获得成功。

整个过程非常享受,有很多细节讨论,算是纯粹的从零构思产品的过程吧,可惜的是没法自己实现。

我们创造工具,工具塑造我们。

记,发布 Immersive Notepad v0.1 到 chrome/edge store

我参加了由 Elek 组织的播客节目,和阿正三人一起聊了 iOS26 中发布的 Liquid Glass 和 Foundation Models。我非常享受我们三人不定期录制的播客,总能从中学到很多。

这种层次的讨论在公司内部其实很难展开,可能是因为大部分开发工程师并不具备产品视角,而我恰好又特别喜欢探讨产品方向的话题。

这期播客跳转

提示词设计技巧

  1. 先询问历史上某件事做得好的特点是什么
  2. 根据自身需求,对特点进行修改
  3. 提示大模型,将修改后的内容转换成可操作的提示词
  4. 如果有更大的任务提示词,将步骤 3 的提示词整合到更大的提示词,并指示大模型输出完整的提示词

整体思路就是通过手动调优到局部最优,达成全局最优。

利用端午假期使用 Cursor Pro 写了一个 microblog 静态网站(也就是本网站)。亮点是通过 github issue 来编写微博客内容。好处是可以通过手机编写,任何有浏览器的电脑就能编写内容了,而不需要固定某个电脑上。 整体体验下来 Cursor Pro 非常费钱,但效果确实好。

Hugo 技术栈对我来说是完全陌生的,竟然也能手搓一个项目出来,时代确实是变了

但如果懂 Hugo 技术栈的化,显然是通过普通版就足够了。效果最好的 Max 版它既消费 Pro 账户里的份额,而且还是单独按 token 计费。而且它有“暴力”修改项目的倾向。

但即便如此,这已经是大大提高了工作效率。但这不代表人不需要学习专业的知识,因为这一顿操作下来花了我 40 美金之后,我不得不自己读了 Hugo 的开发文档,后面直接用碳基大模型来解决问题了。。。