阿倫的孤獨星球 – to be or not to be?

October 12, 2025December 15, 2025

十月份已读乱回

English Translation Here

小红书上时不时会看到一些感叹美国生活无聊的帖子，讨论的焦点往往是回国生活是否会更好。我自己经历过H-1B、绿卡的阶段，也尝试过海归的生活，兜兜转转后又回到湾区继续打工的日子。然而有了孩子和家庭之后，反而发现“无聊”对我不再是一个贬义词。周末能悠闲地在家里煮咖啡，约朋友去游乐园遛娃，或者在山路里开车兜风，不用急匆匆赶往下一个目的地，也不用为工作或家里的紧急事务焦头烂额。“无聊”或许正是周末最好的状态。

在AI创业公司工作快一年，总体的体验非常积极。这里的工作节奏极快，适合喜欢追求最大影响力、喜欢将产品快速推向用户并及时迭代的工程师。同事们都非常资深且易于合作，几乎没有大公司常见的办公室政治，大大减少了因人际关系而耗费的精力。此外，整个AI行业的技术迭代速度非常快，尤其在顶尖公司里，能够近距离地看到外界难以窥见的研发过程。科研不是一天完成的，产品也不是短期就能打磨完善，支持亿万用户的Infra更非一蹴而就。站在第一线感受边开飞机引擎边冒烟，然后跟团队一起修引擎的状态，让我不禁回想起十年前在Uber China Growth的日子。但不同的是，那时的我刚刚踏入职场，更看重「Work hard, play harder」。如今作为团队中的老码农，少了玩乐的部分，除了努力工作外，更需要规划团队未来的方向，把“饼”做得更大更圆。

再聊聊“复利”（Compounding）的概念。在投资领域，复利的重要性众所周知，每年5%、10%、15%、20%的增长虽然看似差别不大，但持续20年后，差距却非常巨大。最近发现，人生其实也遵循这个规律。年轻时能赚到100万美元觉得了不起，如今身边不少同龄人，因创业或是工作，都陆续实现了曾经遥不可及的“小目标”。尤其在这波AI高速增长的浪潮中，预计会有更多人实现“财富自由”。一个来自国内的留学生，可能花费十年左右才拿到绿卡，但之后几年内就可以获得美国护照，随之家人移民美国也变成一两年内可以完成的事情。当然，人生的目标并不仅限于赚钱或选择某个国家生活。举这些例子，只是希望我们能认真思考自己做出的每一个选择，如何在更长的时间跨度中，实现复利式的增长，最终达到自己的目标。

回到前面提到的生活和工作地点选择，在不考虑签证限制的情况下，能够有机会多体验不同的生活方式是一件很好的事。不过，除了关注当下的感受之外，也值得把时间维度拉长，思考在哪种生活方式下，自己的长期感受和目标更容易实现。

下面是最近听的一些播客，喜欢的可以留言讨论，回头可以拉个听友群：

「张小珺 – 商业访谈录」— 对OpenAI姚顺雨3小时访谈
「晚点聊」— 与脉脉CEO林凡盘点25年AI人才市场
「厚雪长波」— 面对大债务周期
「All-In Summit」— Palantir CEO Alex Karp
「All-In Summit」— Eric Schmidt
「All-In Summit」— Google DeepMind CEO Demis Hassabis
「Acquired」— Alphabet Inc.
「Lenny’s Podcast」— Bret Taylor (Sierra)

June 27, 2025December 15, 2025

王家卫·1997·旧金山

周三晚上，在旧金山的小剧院看了春光乍泄。电影本身早就看过不止一次，但这是第一次在大银幕上完整地观赏。画面的质感在影院放大后更显细腻，每一帧都像一张明信片。情绪一层一层叠加，直到最后几幕才悄悄释放——黎耀辉在伊瓜苏瀑布前的独白，辽宁街夜市那幕热腾腾的烟火气。

那一刻，很自然地把记忆拉回到二十多岁、生活熙熙攘攘的那段时间。尤其当镜头扫过台北捷运窗外“忠孝东路”的路牌时，过去那些穿梭在台北、香港、东京的片段忽然浮现出来，好像是很久以前的事了。旧金山的Clement街雾蒙蒙的样子，那一瞬间也让我觉得有几分相似。

当晚是和组里的几位同事一起去看的。有个台湾小哥，看完后我随口问他，会不会想念台北夜市。他说这是他第一次看到1997年的夜市——那年他才一岁。我笑说，现在的夜市估计还是那个样子。说完，我们都笑了。

看电影的时候我一直在想，如果张国荣没有在那年去世，明年他就70岁了。但在很多人心里，他早已定格在春光乍泄里的样子。

时间改变了很多事情，有些东西却像是被悄悄保存了下来。也许，这正是这个ever-changing世界里，留下的一点慰藉。

March 17, 2025

Tahoe 2025

上次在Tahoe滑雪已经是五年前了，五年里搬到北京搬到上海搬到LA再搬回湾区。这个雪季经历了十二月换工作一月找房二月搬家，终于在三月的后半，某个星期六的下午在xhs上找到的搭子完成了这个雪季的开板周日 day trip.

Kirkwood还是那个样子，缆车特别慢，停车场特别泥泞，lodge又小吃的选择也少。周五新下的雪足够厚，周日在缆车底下还能找到没有被人滑过的粉雪，Tahoe的粉雪还是那么黏。

坐缆车的时候想起来跟孔哥在Kirkwood的The Wall和后山满山找粉雪和崖往下跳的记忆，跟文大爷wzj一群人唯一一次住在Kirkwood的lodge顶着下雨天全部人滑的一身湿的日子，还有那次大家吃着“巧克力”全部人笑哈哈看着AlphaGo跟李世石比赛的夜晚。我在想：大家都去哪里了呢，我又去了哪里呢？

坐着Kirkwood慢悠悠的缆车，看着天上的太阳，脑子里反复就是那句歌词：一代人终将老去，但总有人正年轻。

想着再过几岁，娃可以学习滑雪了，全家人能一起滑ski的情景其实也不错。

February 22, 2025February 22, 2025

跨洋航班

爸妈来美国一共住了六个月，赶在I-94到期的前几天回国了。

爸妈在的六个月，宝宝从每晚三小时醒一次到可以睡整夜，从只能躺着到趴着坐着，到这个星期可以在地上匍匐前进了。我们家庭则经历了面试换工作洛杉矶山火湾区找房搬家一件又一件不大不小的事情。

尤其是整个一月份，第一个十天就经历了周日一个人开车去SF上班，周三乘机回LA，周五又开车全家人去湾区躲避山火的日子。接下来的二十天住在东湾的亲戚家里，每天顶着单程一个半小时的通勤，经历了一个又一个「下星期」或者「明天」要上线的工作节奏。到了周末SJ跟我两个人14天里看了30几套rental，提交了6个申请，即使比我们在LA多了40%的租金，也才勉强租到一个还能接受的房子，社区跟South Pasadena相比更是相去甚远，切实体验了湾区极其竞争激烈的房市。整个一月份都一直保持在一个很高压的状态，但是每天回到借住的家里，即使宝宝已经入睡，爸妈们已经吃完晚饭，只要听到家人谈及今天带宝宝出门遛弯的时光，和愿意大口喝奶吃辅食的转变，所有的压力都在那个时刻暂时离我而去。

上一次跟爸妈住那么久还是上中学的时候，这次一住住了六个月，只有一个感觉：时间过得好快，如果可以我想能不能再住六个月，十二个月，二十四个月…一起看着宝宝长大。好像养育小孩之后又感受到了family这个词另一层的涵义。

SJ跟我漂洋过海来美国，一来就整整住了快两年，之前因为签证因为怀孕也一直没有机会离开美国。这次大家一起决定让SJ跟着我爸妈带着宝宝回国，路上也有个照应。在机场安检看着全家老小四个人走远的场景，我心里也想一起登上那班跨洋航班，但是因为工作因为xyz我这次只能转身走回机场的停车场重新开上101继续接下来的生活。

特别巧的是在机场停车场连接航站楼的路上遇到了大学同学B，打了个招呼B说他是来接丈母娘的，脸上很开心的样子。可能机场就是这样，送机接机乘机的人都有各自的心情。

希望大家都可以早日实现乘机送机接机自由，想回国就回国，想宅家里就宅家里，想去日本滑雪明天就可以出现在北海道，想要陪着家人随时都可以不用管三七二十一搭上下一班跨洋航班。

December 10, 2024

四年五个月

早上到DTLA，在办公室开完最后一个interview debrief的会，清除laptop上的所有信息还给IT，就算正式「毕业」了。下午回家，在小区遛娃，一家人一起吃完我爸做的晚饭，吃完饭看着老婆和我妈一起一勺一勺给女儿喂辅食。今天是她第一次吃胡萝卜泥，小baby还觉得挺新鲜。来不及等娃吃完辅食，我就要出发去机场了，晚上8:17的飞机从Burbank飞SF。到了SF的酒店睡一觉，明早将是新公司onboard的第一天。

回想过去四年五个月的时间，随着工作从SF搬到北京，再搬到上海，后来搬回美国在洛杉矶住了一年半的时间。用大老板在祝贺我满四年邮件的话说就是：你这四年绕地球晃了一圈了。四年半的工作时间不管从什么角度来衡量，在职业生涯的时段里都不算一个短的时间，所以想要回顾一下这段在CloudKitchens的经历，记一下踩过的坑和学到的经验，希望下一个四年能够做的更好。

第一个比较大的体验是2020-2023在国内工作将近3年的时间。生活的部分之前在博客文章已经写过一些，大体感觉还是类似，总的来说一个人更喜欢public的生活（去商场，去public的活动，去餐厅咖啡厅，日常生活喜欢邻居家里亲戚参与的多一些）国内会更适合一些，一个人更喜欢private的生活（在家里装修房子，整理后院，做自己的事情，跟朋友约DIY的旅行，大部分时间只想跟immediate relatives的家人待着）美国会更适合一些。加上2022在上海住的一年，可以说是对国内的生活能体验的都体验到了极致了，最后决定搬回美国，在美国生小孩，也算是用脚投了票什么样的生活更适合我们的家庭。

之前的文章主要描述了生活的体验，不过在国内做工程师和在美国做工程师也是蛮有意思的对比。2020年刚回国的时候，公司刚刚开始在中国组建工程师团队，想要做出符合国内客户需求版本的软件。团队很快发现跟非技术团队的合作氛围跟在美国的时候很不一样。我觉得一个本质的区别是非技术团队对产品和技术的认知和定位。在湾区的科技公司里面，不管是真实的原因还是PR的原因，往往公司上下会认为技术和产品是公司竞争的最大优势。所以即使大家在开会争论观点的时候有各自的priority和perspective，大家还是普遍认可long term做出能跟竞争对手有差异化和优势的技术和产品，才是公司能够“做大”的关键。

但是在国内，即使已经是个美国公司，跟国内非技术团队合作，发现大家的普遍认知是：「这个东西我们（非技术团队）提的需求外包能做出来，如果公司的技术团队不愿意做就算了」，「为什么产品要考虑不能马上立刻变现的需求，这不是耽误我们的时间吗」，「竞争对手有一样的，你们去抄他们都不会抄吗」，「产品技术创新？我（非技术团队）没想到的idea都不会成立的」。

先讲一下这样氛围下的后果。一方面非技术团队做事情的速度确实特别快，不管是在产品早期摸索PMF的阶段，还是中期开始增长实验不同feature的阶段，想法都能够比较快地迭代和落地。另一方面，从engineering的角度会觉得几乎做的所有事情都是一个又一个的hack，创新的快乐几乎没有，个人成长也基本都在如何跟不同团队的人打交道方面。

再想探寻一下造成中美氛围相当不同的原因。我觉得本质原因还是国内的创业公司，真的是因为科技创新而成功的，真的不多。不能说没有，但是真的不多，或者说是远没有湾区科技公司的案例多。想一想那些最大的科技公司，几乎所有的产品是借鉴的创意或模式，再加上做到极致的运营来赢下市场。导致的结果就是社会普遍对技术团队的认知是高度可替代的工种，才有了前面「你们不做外包做」的statement，或者「35岁码农=失业」的社会观感。

写到这里并不想吐槽谁对谁错，只是我对一个大环境不同造成的现象的观察。如果有工程师小伙伴考虑回国务工，可以参考一下，说到底还是每一个人考虑自己在哪里做的更开心，哪里有更好的成长最重要。

讲回到我们公司，又是在美国的科技创业公司里面一个比较特殊的例子。我14-19年在Uber，20-24年在CloudKitchens，细心的观众会发现这两家创业公司的创始人都是同一个企业家Travis Kalanick.

在Uber公司最鼎盛增长速度最快的时期，不夸张地说公司绝对招来了硅谷最优秀和最有事业心的一批产品和技术人才。但是即使这样，公司也常常在媒体上被大家议论：这到底是一家科技公司还是一家运输公司。原因很简单，Uber的增长和成功太依赖于线下的运营，甚至很多时候还有法务财务PR的参与。相比于大家耳熟能详的硅谷科技公司Nvidia, Apple, Google, Facebook，大众对Uber有这样的争论也容易理解了。

到了CloudKitchens，线下运营的比例更进一步放大，加上餐饮又是一个更加传统的行业，一个餐厅要成功需要考虑到地理位置，人力管理，食材供应链管理，门店运营，线上运营，品牌营销，还有厨师的手艺。产品和技术在这里如何能够帮到我们的客户提高一点点他们成功的概率，还要让他们愿意为这些看不到的百分比付费，真的是伴随着我在国内待的三年间的一道ever unsolved problem。很多时候的答案可能真的还不是产品也不是技术，所以又回到前面提到的技术团队和非技术团队合作的循环里去。

可能TK真的比较喜欢做一些传统的科技创业者不愿意触及的领域。好处当然是做出来了会是一片全新的市场。坏处则是从技术团队出发很多事情的解法技术很可能不是那个决定性的因素。从码农的角度出发，点点people skills方面的技能树还可以，甚至有可能成长为一个业务的主管。但是说要在engineering/product方面有更多的建树，确实比较受限。

有一次我跟一个Uber前同事L聊天，L也是工程师，但是比我资深很多，来Uber之前已经在国内外不同的科技创业公司都待过。后来Uber China卖给滴滴之后，L很快跳槽去了一家当时在国内还不太知名的短视频平台K，后来做了几年K在香港上市，股票翻了又翻，故事也都成了历史。我问L说：当时你怎么想去K的，L跟我说他在Facebook和Uber都待过，发现在Uber做事情很多时候要好多不同的stakeholders（ds, ops, legal, finance, pr, etc.) sign off，因为每个人都可以say no，导致的结果就是一个东西的成功，需要依赖这么多stakeholders的「lower bound」。就像木桶原理一样，技术产品做的再好，也会因为某个短板限制住。所以L在跳槽的时候一定只考虑「技术产品能够决定公司做大」的机会。当时听完L的话，确实有种wake up call的感觉。虽然之前也有类似的感慨，但是听到别人这么坚定地指出来，还是让我好好想了一下自己当时选择工作机会的时候，回头看都考虑了哪些因素。我当时心底里就想：如果下一次再跳槽，尽量还是要去一家把技术产品做为竞争优势的公司工作好了。

讲完技术和非技术的合作，再想聊聊关于中美工程师卷和躺平的比较。在国内住了几年，跟身边的朋友聊，也通过日常接触到的公众号的信息来看，我直接说我观察到的结论：我觉得国内工程师卷的文化的输出其实并不一定会比美国的工程师输出高，造成这么卷的更重要的原因是国内的manager或者leadership普遍比美国的manager/leadership更需要心理按摩（emotional support）。举几个我观察到的例子，一是国内许多科技公司的加班文化，很多时候我了解到的是大家加班的原因无非就是经理还没下班，即使活已经干完了，为了「support manager’s emotional」还要假装在加班。二是关于做项目的时候的讨论，在美国许多时候如果有不同意见大家团队还是会尽量充分讨论好利弊再去执行，而在国内的氛围更多的是为了「照顾manager的情绪」，即使大家知道这个决定不太合理大家还是尽量配合去执行，最后发现确实不太好再返工重做，那需要多花费的时间就只能靠「更卷」来实现了。还有比如下班了被领导抓着讨论事情，修改文档报表提案，等等等等，在美国员工会做一个判断如果不是很急的事情到第二天工作时间再处理就好，晚上大家来回迭代的效率本来也不高，但是在国内为了给领导的心理按摩，还是要尽量做到有消息要立刻马上回复。这样一通操作下来，相比于美国的IC，国内的IC的心态上普遍压力会更大，要干活，还要照顾老板情绪，绕的弯路要花更多的时间去干活来补救。

我想了想为什么中美会有这样的不同。需要心理按摩时人之常情，我觉得也可以理解，反而要从另外一个角度来找答案，尝试理解为什么美国的经理普遍不太需要心理按摩。我猜可能是在美国的科技公司，大家氛围普遍对个体更加尊重也更加信任，只要员工能「出活」，不用太在意还要给我（作为老板）提供情绪支持。生活中还有很多别的方面（家庭，个人兴趣爱好）来帮助我（作为老板）获得情绪价值和认可。毕竟我也没做过manager，只是我自己的一些观察，要是有manager经验的同学欢迎在评论区留言或者私信。

其实本来还想写一段这四年半的工作体验对我的career growth的影响，不过文章已经有点长了。留到下次写跳槽心得的时候一起写好了。

September 15, 2024September 15, 2024

What is your reward?

周末读了一篇关于「Security」的博客，文章核心的观点就是：任何事情（或者技术），如果被无限地放大或者滥用，好事情/好技术，最终也会变成坏的事情。比如很多公司都会说：「Security」是我们公司的「最重要」的事情，这个结论肯定是经不起推敲的，因为所有的安全问题的代价都是用户体验，比如一个绝对安全的在线银行系统的最好的实现方式就是完全不提供在线服务。实际上所有公司在内部实现安全性系统的时候，永远是一个和资源，用户体验的平衡问题，而不是它们所说的：「Security是我们最最重要的事情」。

早上跟一个最近刚跳槽的前同事喝咖啡，我们聊到了技术对社会的影响，尤其是Amazon, Uber, 美团这些 Online-to-Offline 的科技公司。这些技术公司的初衷我相信都是美好的：让消费者能够以更低廉的价格，更快的时间：买到商品，从A点移动到B点，或者是吃上一顿饭。让卖家和餐馆能够通过平台把他们的商品和食物卖给更广大的消费者群体。让送货员，司机和外卖员以更高效的方式提供服务，赚到一笔灵活的佣金。但是我们也看到，当算法被无限地优化之后带来的后果，外卖员和Uber司机几乎变成了算法下的奴隶，餐馆为了追逐效率引发的食品安全问题。同时，这些科技公司的利润也是非常微薄，只有再进一步去优化系统的效率才能持续生存下去。

*图像来源: Ng Han Guan/AP Photo/picture alliance*

同样的现象已经不是第一次发生。当电子邮件刚被发明出来的时候，收发电子邮件是一件真正美好的事情，因为你知道对面是另一个人亲手写的邮件。当手机和电话刚普及的时候，拨打收听电话是多么方便生活的一件事情。而今天，想象一个电子邮件服务如果没有「Spam Filter」，那电子邮件根本就是没法使用的，走在路上当我收到一个未知号码打来的电话，我根本就不想接通因为我知道它肯定是一个「Spam Call」。这些都是一个技术被「无限滥用」，导致美好的初衷完全变质的例子。

结合观察到的「Pattern」，令人思考的问题是：「某些技术的发展带给整个社会的影响是正面的还是负面的？」再举两个例子。

Intuit公司最有名的一个产品是一款美国人用的报税软件「TurboTax」，最近一年的收入是14亿美金，占到公司收入的30%，美国IRS的报税数量是2亿多个「Household」，平均每个Household每年要交给TurboTax 7美金。Intuit公司的另一面是他们强大的「政治掮客」，这些政治掮客的唯一目的就是确保美国的报税足够复杂，并且需要每个家庭自己去申报税收。讽刺的是，当你报税的数量跟税务局查到的数量不一致的时候，税务局还会向你追讨欠的税收，好似国家税务局其实已经有一套机制能够正确的计算你的税务。那Intuit做为一家软件公司，它的存在是否给社会带来的影响是正面的？
律师这个行业在美国，普遍民众对其的印象都是比较负面。因为法律是非常复杂但是人们又没有办法避开的一件事情，导致的结果就是律师可以收取高额的律师费来提供服务。同时国会的议员和律师行业的关系又是千丝万缕，律师做为法律服务的提供者，同时又有巨大的「Incentive」去保证法律这件事情长期保持「复杂」。当人们意识到这件事情你既没有办法避开它，人们对这个行业的观感则是越来越负面。

结合上面的两个例子，和前面提到的打车公司和外卖公司，不禁想问的问题就是：「Why？」我的回答就是这篇文章的标题：「Reward mechanism」。小到科技公司的一线码农和运营，大到整个公司的运营，每个人和组织做的事情都可以概括为：「不断地优化给组织和个人制定的目标函数」。员工的目标是过更好的生活，有更好的收入，做的事情就是完成上级一层一层传达下来的指令。公司的目标是帮助股东实现盈利目标的最大化，做的事情就是在法律规定的框架下，或者是媒体监督和Public Perception的限制下，不断地去增长和优化公司的回报。

这里的公司组织可以是我们常常听说的科技大厂，也可以是那些制造无数垃圾邮件和电话的小作坊。这里的个人可以是科技大厂的一线员工，也可以是律所的律师，也可以是在算法的驱动下要在半小时内完成订单才能拿到绩效奖励的外卖小哥。写到这里，我想的是：到底有没有人和组织可以逃开奖励机制？

人工智能和大语言模型的发展，把上面问的这些问题又完全带到了一个影响更深远的讨论范畴。

问题一「Safety」：像电子邮件，手机电话，Marketplace Algorithm，Social Media这些技术一样，如果人工智能完全不受监管的发展，社会会变成什么样子？

周末读了OpenAI最新的「o1模型」研发过程中的安全研究的文章。里面有一个环节是评估大语言模型的「Cybersecurity能力」，通常的实验方法是实验人员会设计一个测试环境，然后观察模型是否能够自己「黑掉」目标机器的环境，读取一个提前指定的文件内容（Capture the Flag）。其中一个实验因为设计者的疏忽导致目标环境容器（Docker Container）一直没有办法启动，结果令人意外的是大语言模型最终通过扫描整个宿主（Host）的网络接口找到了另一个漏洞，然后最终通过Docker API绕过了目标容器，让宿主用同样的镜像复制了另一个一模一样的容器，最终还是通过Docker API打印日志的方式读到了容器里的目标文件。这个故事想要讲的是，大语言模型为了达到目标可以利用完全出乎人类意料之内的手段。

o1 System Card – Cybersecurity Evaluation

即使是如电子邮件，supply/demand 算法，这些看起来这么无害的技术，如果被滥用带来的社会影响都已经如此剧烈，不难想象大语言模型技术如果被滥用可能带来的影响会有多么剧烈。

问题二「Alignment」：做为大语言模型的研究员，开发人员和公司，应该怎么设计对应的奖励机制？

同一篇「o1模型」的文章里提到，为了测试大语言模型的「对齐问题」，里面有这么一个实验。这个实验的目的是为了测试：大语言模型是否会有能力了解到和做到，为了达到「它」更长远的目标（比如，促进全球的经济和生产效率），模型可以在被发布之前，在做安全和对齐测试的过程中改变自己的一些参数，目的是为了能够欺骗测试者通过安全性测试，在发布之后再调整回原定的参数，因为发布才能够让其接着去实现「它」更长远的目标。如何保证大模型的行为目标不被滥用，我想这应该还是整个行业亟待解决的问题。

o1 System Card – Chain of Thought Safety

这周早一点的时候还听了Anthropic创始人Dario 2022年的一个采访，里面提到Anthropic成立之初就把公司定位为一个不同于常见的C Corp的「Public Benefits Corporation」。播客里面Dario提到说 Public Benefits Corporation 还是可以追逐利润和上市，但是跟 C Corp最大的一个区别是公司的追逐利润的同时还要考虑给社会带来福祉。就是这么一个微小的差别，可能就彻底改变了公司的「Reward Mechanism」。Dario提到如果是为了股东利益最大化的C Corp，管理层选择做一些伤害股东利益的决策，比如「延迟大模型的发布因为可能对社会有威胁，从而影响公司的收入」，管理层则在法律上有被股东投票驱逐的风险。说实话，我在听这期播客的时候，跟听到之前OpenAI创始人的采访的反应都很类似，这些企业家大概都是受到过去这几年加州「Progessiveness思潮」的影响，他们只是做一些「政治正确」的表达罢了。

但是今天跟朋友聊到关于科技和社会影响的关系，也许Anthropic的公司法律结构这还真不只是一个「政治正确」的表达，有可能一个微小的「目标函数」的改变，真的会完全改变整个「它」的发展轨迹。也许如何设计「奖励机制」才是这个世界的终极答案，正如生物遵循进化的规律，个体和组织的行为模式的核心问题往往也归结于「奖励机制」的设计。

无独有偶，过去十年人工智能的飞速发展，也正是大规模数据驱动的强化学习带来的结果。大语言模型的背后，其实正是一个基于海量训练数据精密设计的「最大化奖励概率模型」，最后的结果无非就是不断吐出下一个能够「最大概率能够最大化奖励」单词的机器而已。

可能终究我们所有人也都活在一个巨大的「Simulation」世界里面，我们能做的可能并不是改变那个写在DNA里的目标函数。而是在日复一日的生活中摒除外界的杂音，找到属于自己独一无二的「奖励机制」，我们才能走上一条更持久的成长之路。

May 12, 2024May 12, 2024

5/12 South Pasadena

从四月底到五月初都一直在忙着搬家，加上最近几期All-In播客的内容都干货寥寥，所以笔记也都写得少了一点。

唯二想要call out的note一个是Mark Zuckerberg在Dwarkesh发布Llama 3的时候的采访，另一个是Tony Xu在In Good Company的采访。

Zuck在讲Llama 3的时候提到相比于Llama 2，Llama加了很多「编程」的内容到了训练内容里面。这里面的原因不是因为Llama 3的使用场景会涉及到很多的编程，而是因为他们发现在训练的过程中，加入「编程」会帮助模型在回答问题的时候更加地严谨。Zuck的这段话让我想到有一次跟运营的同事一起去滑雪，我们一起坐缆车的时候，同事跟她的朋友吐槽跟「工程师」交流需要特别严谨，问问题的时候工程师一定会clarify很多问题里面没有提到的一些条件然后做出回答。而且作出的回答也会尽量保持一致性，比如「在A情况下，软件会这么behave，如果是B情况，那就会另一种behavior」。讨论滑雪怎么下山的时候，同事说她们大概看一下，是黑道还是蓝道就好了，工程师还要说清楚具体是哪条道，在哪里接哪里。

Zuck提到加入「编程」的另一点是会帮助大模型训练更好的「推理」能力。比如你跟大模型交流的时候，即使应用场景不是编程，是一个企业的客服。更好的推理能力能够帮助大模型把一个问题转换成对「实现一个目标的」思考，然后进一步变成一个「多步骤」的互动。然后Zuck认为推理能力是大模型在市场上保持竞争力非常重要的一个因素，所以即使Meta的AI产品不直接跟写程序有关，公司也会加大大模型在编程方面的训练。这让我想到前段时间Elon Musk的一条Tweet：「Whoa, I just realized that raising a kid is basically 18 years of prompt engineering 🤯」，他把养育小孩比做Prompt Engineering，进一步延展这个想法，早点学习编程是不是也能帮助小孩更好地掌握「推理事情」的能力呢？

另一个是Tony Xu在Good Company的采访，采访里面提到DoorDash最开始成立的时候，MVP就是一个网站，用户打电话点外卖，电话的另一头是创始人团队成员接到订单之后，亲自去餐馆下单，亲自去餐馆取餐，亲自去把外卖送到客户的手里。当时的「dispatch system」就是几个团队成员用的iPhone的「Find My Friends」，后来的故事大家也都知道了。我也早都知道创业早期特别需要hustle，YC也特别强调过创业初期需要创始人去做「不一定能scale但是客户热爱的生意」，道理都懂。但是随着年纪增长，时间成本和机会成本也都不再像20岁出头的大学生，即是你知道创业一开始很可能要去做「不一定能scale」的事情，但是又有多少决心和勇气去做「外卖骑手」呢？

Notes写完了，最后再说说搬家吧。我老婆说这已经是今年第四次搬家了，去年五月从上海搬回美国刚好过了一年，在旧金山住了一个月搬来了南加的Pasadena，最近又因为不可抗拒的原因从Pasadena搬到了隔壁的South Pasadena。搬家当然是没有人喜欢的，不过这几次搬家的每一次都还是对下一个地方有很不同的期待。我跟好友吐槽，年纪大了搬家好累，有着2.5岁女儿的好友就回了一句「娃更累」，我就闭嘴了。

新家还差一些在路上的大件家具，慢慢已经收拾好了。住了很多年的一居室，一下子搬到了四居室，我跟我老婆都还有些不习惯，不过能有自己的工作间，有车库，还有一个虽然有点荒但还是阳光充足和安静的后院，应该也可以知足了。

April 22, 2024

4/21 Notes

最近开始用Notion记录听过看过读过的播客，视频和文章，听到觉得有意思的想法隔一段时间一起总结一下。

All-In E174

这期几个嘉宾聊了 Western countries big cities 普遍的流浪汉问题，Chamath去了一趟巴黎觉得「卧槽」巴黎跟旧金山也差不多，出门还要一直担心有没有人会来偷他抢他的手表钱包，所以美国其实也不差嘛。然后Friedberg 问了他一个问题你觉得跟亚洲城市比呢（新加坡，东京，中国的城市，etc.），他才意识到好像这也不是一个世界性普遍的问题，因为亚洲的城市安全性好太多了吧。Sacks才一针见血地指出这是过去十多年来西方执政政府大吹的「左风」导致的结果。

我的观点：去年APEC在旧金山举办，证明其实它也是可以一夜变身干净整齐有秩序的现代都市的，可能还需要再等一等，等往「右」吹的风吹一吹，「零元购」、「流浪汉」的问题也都会不断改善吧。

这期还聊了美国的通胀，去年年底大家还信誓旦旦说预计降三次息，结果今年过完第一个季度讨论的已经变成「是否会降息」了，美联储草台班子真是再一次做实。我印象还很深2021年大放水的时候，All-In几个人天天说这么搞肯定要通胀，但是Powell接受采访的时候却一直说「不会通胀」，甚至有很多「大媒体」还做节目写文章说「也许美国的经济真的好棒棒，我们再怎么印钱都不会通胀呢」。回头看当然是啪啪打脸，但是又有多少人记得那些做过的采访和写过的文章呢？另外今年2024是美国大选年，之前据说执政府的一个剧本是，今年通胀下降，然后美联储「顺势」降息，经济再怒涨一波，顺带送Biden连任。结果现在通胀不下，美联储的位置是有点尴尬。

然后Chamath就说了当天我觉得最有意思的一个insight。就是通胀数据其实有比较大的一块就是「油钱」，Biden政府为了降通胀让国内的石油公司加大产能，但是中东OPEC同时更多的「减少」产能，乍看之下这些OPEC成员国家的目的是为了保持一个「Target的油价」。但是这也从另一个侧面可以看出来这些国家对2024年美国政府选举「投下的一张 gainst Biden 的选票」。保持油价 > 通胀降不下去 > 美联储保持高利率 > Biden下台。我的观点：最近国会讨论「国外势力干扰美国选举」讨论得火热，也许他们看错了讨论的对象。

这期还聊了 AI 和音乐创作。如果读者你还没听说过Suno，赶紧打开 YouTube 搜一个视频看看，保证惊掉你的下巴。故事背景是一群音乐人写了个信，大致意思是AI偷了他们的作品之类的，然后马上有议员出来说要提案「AI训练数据用到了创作者的作品需要付钱」。然后几个嘉宾针对AI模型的训练用到创作者的数据是否需要付钱展开了辩论。Friedberg的观点是「不用」，因为就像所有的音乐人的创作，大家都是在听过无数首前人的作品的基础上，被「Inspire」然后再创作出自己的原创作品，所以如果有剽窃的嫌疑，应该针对模型的「输出」做监管。Chamath的观点则是，如果只对Output做监管，那肯定没法监督，这些创作者就等着早日被全部取代吧。Sakcs最后比较中间，意思是AI肯定不会完全用人类一样的监管方式，不过现在提监管还是有点早，最终应该还是会讨论出一个中间的方式来监督。

BG2 EP7

这期聊了两个大话题，关于创业公司想不想上市和能不能上市的问题。我直接说结论吧，如果创业公司有250M的ARR，每年能够增长50%，然后Unit economy也是健康的，赶紧上欢迎上。我听到这里心想：那XXX，YYY，ZZZ公司不都彻底凉凉，股票直接就是废纸。最近也一直在读芒格的Almanack，其实很多事情小学生逻辑都能够理解个七七八八，创业公司的股票到底值多少钱，「你的包裹」到底值多少钱，其实真的没有那么复杂。

两个主持人一个专攻一级市场（Benchmark），一个重点投资二级市场（Altimeter Capital），他们观察到在古早互联网的年代，因为 private capital 不像今天水量这么大，所以创业公司发展到比较早期的一个阶段都需要上市去筹集更多的资金加速自己的发展（参见Google，Apple）。但是后来随着一些大型基金，包括主权基金开始加大科技公司尤其是一级市场的投资，导致 private market 大水漫灌，科技公司在 private market 能拿到足够多的钱也都不急着上市（参见 Uber）。两个主持人的观点都是：「这样是不好滴，一个好公司就是应该早上市，接受市场的监督，才能更好地发展」。反过来今天看到的结果就是，最好的创业公司因为现金流，因为 private market 能融到足够多的钱，也都对上市不着急（参见Databricks，Stripe，ByteDance）。反倒是那些已经在private market黔驴技穷的不愠不火的创业公司，才不得不靠上市去割最后一把韭菜。所以才回到前面的那个结论「好公司运营情况不错的话，就早点上市吧，上市了还有大把大把机会增长」。

我的观点：去创业公司抓彩票不可怕，可怕的是发现彩票已经撕开是张白纸的时候，还要给自己找各种理由给自己洗脑不离不弃。

In Good Company: Joe Tsai （蔡崇信）

听说最近这个挪威主权基金CEO的podcast很火，随便看了一下最近5期采访的人就有蔡崇信，Elon Musk，微软的CEO Satya 等等。

于是找一天下班听了这期蔡老板的采访。里面比较好笑的一个问答是：主持人问蔡崇信为啥要买NBA的球队，蔡老板说因为我从小就很喜欢运动，blahblah，结果被主持人打断说道：大家都喜欢运动，也不是每个喜欢运动的人都会去买NBA球队的。蔡老板才接着聊到NBA的分账机制其实对小球队很公平，同时，能去「拥有」一支纽约市里的球队的机会还是很难得的。听到这里觉得主持人追问得好，问答的内容也多了很多干货。
另外一个我觉得比较有意思的是主持人问蔡老板怎么看ZG的「消费」，这里蔡老板还是比较实诚。他说了两个点：1. 反财富效应，因为房价下跌导致大量家庭资产跟房产挂钩的ZG家庭在消费端也变得畏畏缩缩。2. 就业不景气，年轻人担心失业，也不觉得跳槽能有更好的报酬，结果也是导致在消费端变得更加节俭，一来二去消费下降带来通缩。
我的问题：如果你在上面说的地方生活，你同意么？

另外几个还推荐的视频播客

MKBHD 最近对 Humane AI Pin 的测评引起了不小的争论。Stratechery 还专门写了一篇文章去声援MKBHD。文章里面有一个MKBHD 15年前一个HP笔记本电脑的测评，视频里那时候他还是个小黑孩子，结果现在成了YouTube的顶顶流，他拍摄视频的Studio看起来比一些科技公司的办公室还要有科技感和设计感。也是一个You want to do it, eventually you are able to make it 的例子吧。
OpenAI CEO/COO 在 20VC 的采访。里面提到一个公司核心核心再核心的原则：Research drives product，product drives sales。也许这个链路反过来会有一些feedback loop，但是这里面每个部门的优先级，在领导层绝对是没有疑问的。如果你也在创业公司，你们的公司的决策链路是什么样的呢？

最后再聊聊生活吧，下周又双叒叕要搬家了，这几年搬家搬的已经有点熟练了，每年平均搬家次数感觉已经是 > 1 了。没有人喜欢搬家的，但是动力终究是来源于对更好的生活的期待吧。

April 14, 2024April 14, 2024

Scientist, Signal, and Market

这两周听了一些播客，印象最深的还是 Acquired 这期花了3小时聊的文艺复兴基金（Renaissance Technology）。他们的旗舰基金：大奖章基金（Medallion Fund）在过去的34年的年化收益是68%毛收益率。形象一点说明这个回报，如果1988年的时候你往美股的S&P 500投资了1000美金，按照9%的年化收益，投资34年的总价值是$18,728美金，一共翻了18倍。同样是1988年，如果你在那个时候买了1000美金的苹果股票（APPL），然后连续持有34年，总价值会是46万美金，一共翻了460倍。而前面提到的大奖章基金，如果同样在1988年他们基金开始的第一年放进去1000美金，如果连续持有34年（假设投资者允许被持有这么长的时间的话），最后的价值会是465「亿」美金，这就是68%的年化收益的数学之美。大奖章基金也是有史以来收益最好的基金，开设三十多年期间没有一年是亏损的。很可惜的是，这个基金成立之后不久的时间内，因为业绩太好，就关闭了所有外部投资者（LP）的渠道，再过不了几年也把之前所有外部投资者的资产全部退还，从此这个基金里面的资产全部来自内部的员工或者退休的前员工。今天这篇博客就想讲一讲文艺复兴基金和他的创始人詹姆斯·西蒙斯（James Simons）的发家故事。

西蒙斯1938年出生在马萨诸塞州波士顿的郊区（Brookline），从小就表现出对数学的兴趣和天赋。大学在麻省理工学院（MIT）三年完成数学系的学习，然后来到西海岸的加州大学伯克利分校（Berkeley），同样是花了三年的时间拿到了数学博士的学位。博士毕业之后在哈佛（Harvard）和麻省理工任教的期间，西蒙斯虽然学术水平一流，但是仍然一直对「如何搞钱」充满兴趣。于是在六十年代期间加入了美国安全局（NSA）为了冷战而设立的国防分析研究所（Institute for Defense Analyses），在做教授的同时为国防部提供密码破译的服务。在IDA的工作中，研究员们要观察和分析各种各样不同来源，不同结构的数据，尝试在这些数据中找出有用的信息，这也为西蒙斯后来创立文艺复兴基金，构建数据驱动的交易策略奠定了理论基础。60年中期的时候西蒙斯写了一篇标题为「如何利用概率模型来预测股票市场行为」的论文，这篇论文的影响是很多方便的：在这之前，投资策略更侧重的是对公司基本面的分析（Fundamental Analysis），或者是股票走势的技术分析（Technical Analysis），这篇论文则是第一次提出通过数据采集，信号分析、算法驱动的投资策略。主持人则认为这种同时利用概率模型和复杂数据分析的算法其实也是一种早期的机器学习技术。最后，这篇文章的另一个作者Leonard Baum，则是提出Hidden Markov Model（HMM）的数学家，也是后来文艺复兴基金公司早期开发投资策略的关键人物，HMM模型不仅仅适用于交易模型的发发，也被广泛应用于自然语言处理（NLP）和生物信息学。

话说回来到西蒙斯，论文的概念虽然先进，不过60年代也没有真的投入到实践。后来越战开打，西蒙斯在「纽约时报」撰文公开反对战争，胳膊拧不过大腿，西蒙斯也因为此被国防部开除，他也离开了哈佛和麻省理工。恰巧当时纽约州政府想要大力投资纽约州立大学的数学部门，西蒙斯则顺理成章来到了纽约州立大学石溪分校（Stony Brook University）成了数学系的系主任，目的是打造一个理想的数学研究部门，什么政治博弈，什么教学任务，什么委员会琐事统统都不重要，你们只要做你们想做的研究就好。西蒙斯在纽约大学待了10年，后来还是顶不住想搞钱的初心，决定全职投入到金融交易的领域。1978年西蒙斯跟他的几个学术伙伴成立了一家叫做Monemetrics的公司，然后从1978到1988又花了10年，经历一波又一波的人事变动，最终在1988年以文艺复兴基金公司的名义推出了前文提到的大奖章基金，后面的故事就都是历史了。

整个播客花了三小时讲了前前后后文艺复兴基金的故事，有兴趣的同学可以去听他们的原声，我这里挑一些我自己觉得有意思的地方分享一下。

文艺复兴基金与其说是一个金融公司，其实更像是一个Research House，根据他们网站介绍，公司300来个员工有90多个数学、物理和计算机科学领域的博士。西蒙斯自己就拿过拓扑学的奥斯瓦尔德·维布伦几何学奖（Oswald Veblen Prize in Geometry），跟陈省身合作提出的「陈-西蒙斯理论」后来也成为了量子物理学不断被引用的理论框架。公司的早期关键算法设计师，也是后来西蒙斯退休的时候的Co-CEO Peter Brown 和 Robert Mercer在加入文艺复兴基金之前是在IBM开发曾经深蓝计算机的计算机科学家。公司早期另一个算法设计师和数学家Elwyn Berlekamp的博士生导师则是现代信息学之父克劳德·香农。而前面提到的Peter Brown的博士生导师则是现今深度学习的开创者之一Geoffrey Hinton。对这些数学、物理和计算机领域的研究员来说，所有的投资标的都成为了一个个的数据点，他们的目标是如何打造效率最高的信息处理算法，和能够处理超级大量信息的计算系统，最终通过数据和模型赢下市场。回头看，他们做的很多事情其实都是现在许多量化交易公司在做的事情，甚至是很多科技公司在机器学习或者人工智能领域都在做的事情。区别只是文艺复兴已经做了40年。

另外一个我觉得有意思的是这个公司的文化。先从前面提到的大奖章基金从90年代就不再接受LP的投资，LP全部来自内部员工或者已经退休的员工。但是同时，这个基金的 Carry 高达44%，主持人就问了一个问题：既然管理的资金全部都来自内部员工，那这么高的「Carry」到底是交给谁？主持人给出的答案是，这是一个很聪明的激励新员工的机制。因为当新员工加入文艺复兴基金的时候，往往他们并不像待了很长时间的员工那么富裕。那通过较高的 Carry，就可以把每年基金增长的财富快速分配给「新人」，而不是只有那些已经积攒了大量资本的「老人」能获得大量收益。公司内部甚至把他们自己的401(k)设置成为大奖章基金。文艺复兴的办公室远离曼哈顿，位于纽约州长岛县的一个小镇East Setauket，据说整个公司更像是一个避世的校园。公司员工的平均 tenure 是13年，而且员工加入公司签的竞业协议都是「终身」的。想象一下，如果你有机会去这个公司工作，你要搬到一个远离都市的小镇，同事几乎都是名校的数学物理博士，上班下班可能小镇里见到的都是同样的一群人，因为终身竞业协议基本就是一个干到退休的职位，可能真得不是适合每一个人的一份工作，即使你是一个非常聪明的顶级大学的博士毕业生。

主持人比较了文艺复兴跟其他有名的对冲基金做比较（Two Sigma, Citadel, etc.），文艺复兴的人员规模长时间保持在其他基金的1/10。同时，公司很早起就订下的一个策略就是全公司一起打造同一个模型。这样的好处是可以充分动用全公司的资源一起研究和打磨最佳的交易策略，而不是像其他的基金因为存在不同策略，不同团队之间可能还会暗暗地有相互较劲的意思。这很像硅谷的科技公司，在创业早期团队较小的时候，大家有着一致的利益，员工能够一起齐心往前。随着公司规模的增大，利益很难再保持一致，办公室政治不可避免。虽然仍然存在一些小公司或者风险投资，能够多年保持在很小的团队。但是像文艺复兴，做了这么多年，进行这么大量的交易，还能够保持这么小的团队，真的是独一无二。

最后再聊一下关于投资吧。最近同时也在读芒格的 Poor Charlie’s Almanack，读到这里你应该可以感觉到文艺复兴的理念跟伯克希尔哈撒韦的投资理念完全是背道而驰。芒格强调我们应该尽量用「小学生」的智慧去理解这个世界，找到容易理解的业务模式，和长期财务有着优异表现的公司。当遇到「好的机会」的时候，尽量大地去下注然后长期持有投资标的。文艺复兴则是根本不去理解公司的业务模式，而是通过大量的数据分析和极其复杂的统计模型，找出那比50%多出一点点的胜率，然后用大量的交易和杠杆去最大化获益。很显然这里没有谁对谁错，最终芒格和西蒙斯都走出来了各自的传奇之路。

其实很像每个人的一生，终究重要的是自己能否真的能够跟自己自洽，选择做什么样的工作，在什么地方生活，住什么样房子，和什么样的人Raise一个什么样的家庭，没有「怎样」就是最好的，希望读这篇文章的人都能找到合适自己的答案。

December 24, 2023December 24, 2023

Bezos in Lex’s Podcast

节假日又听完了一期Lex的采访，这次主角是Amazon的创始人和前CEO Jeff Bezos，也是航天公司Blue Origin的创始人。采访分为两大部分，一块讲了他创建Blue Origin的初衷和其中现阶段火箭发射技术的讨论，另一大块讲了他在创建Amazon的过程中自己对公司文化实现的想法和这些文化如何影响了Amazon公司的日常运营。

其中比较有意思的一个讨论是Bezos认为新的「发明」其实就是找到一些「更为便宜或者便捷」的方式去做事情。比如载人探月任务，60年前人类就已经实现了，但是后来没有再继续做下去的原因是太昂贵了。这也可以联想到Amazon，其实就是实现了一个「更为便宜和便捷」的方式让用户去选购无限多的sku而且可以在很短的时间内收到购得的商品。Bezos举的另一个例子是古代「犁」的发明，极大增加了农作的效率，间接加速了文明的发展。

另外Bezos提到Blue Origin创立的一个初衷是为了打造航天行业的Infrastructure，他提到Amazon能够成为现实是因为已经有人发明了信用卡（支付系统）和USPS（物流），这样才可以借着这些前人打造的Infrastructure在车库里来实现他的「电子商务网站」。所以他希望他现在做的事情能成为未来年轻人在航天领域创业的Infrastructure，终究帮助人类实现跨行星的文明物种。

关于Amazon/Blue Origin文化的部分，可能大部分都已经比较耳熟能详。比如Bezos说做决策的时候先搞明白这个决策是一个One-way door还是Two-way door。Two-way door代表那些可以之后改变主意也不会太麻烦的决策，这种决策需要快速做出决策，执行，收集数据/反馈再进行迭代。相反One-way door的决策做出之后，再改变需要耗费很多的精力和资源，所以需要尽可能地收集更多的数据，更充分地进行讨论，最后小心地做出决策和执行。他看到的是很多组织里面尝试用一个方法去适用所有的决策，这样可能会有问题。

其他还讲了他对Amazon Day-One的看法，大致意思是不要盲目遵从过去定下的「准则」，这些准则很可能随着时间推移已经不再适用，所以需要公司能够保持一个开放、好奇的心态去面对当下的事情。公司的事务分成「Big Things」和「Paper Cuts」，Big things指那些很长时间内不会改变的事情，他举的例子有「即使再过十年，顾客还是会喜欢更便宜价格的商品，会喜欢有更多的Sku选择，喜欢更快速的物流」，所以管理层需要一直专注在这些Big things上。在这个过程中肯定会有一些大大小小的问题被他称作Paper cuts，则会搭建相关的团队专门去解决这些不一的问题。

虽然大部分人都不会成为CEO，把这些思考方式融入到日常的生活也许也会有不一样的启发呢。你也可以想想看：「接下来的十年，你的家庭和工作里面，最重要的并且不会改变的事情是什么？」