交易时延与计算堆栈
---
Dwarkesh: Jane Street 是我播客的合作伙伴,我们有一个很有趣的想法:为什么我不来参观一下你们用于训练的数据中心呢。刚才 Ron Minsky(技术团队联席主管)和 Dan Pontecorvo(物理工程团队负责人)带我参观了这个位于德克萨斯的机器房。非常感谢你们带我参观,这很值得,我以前从没来过这里,这趟参观太棒了。以前我很困惑,如果你需要在纳秒级别进行交易,怎么还能用 GPU 呢?也许你可以谈谈你们实际交易的时间跨度是怎样的?在做出交易决策的过程中,你们有余地运行大型模型吗?
Ron: 我认为这里需要理解的是,并不只有一个时间跨度,而是有许多个不同的时间跨度。我们构建的一些交易系统和执行的交易中,为了保持竞争力,你实际上必须在 100 纳秒内处理并返回一个数据包,那是一个完全不同的领域,对吧?你知道,人们有时会谈论,哦,你们能用 OCaml 写出高性能的东西吗?我们可以,但是对于这种速度要求,无论你用 OCaml、Rust 还是 C++ 编写都没什么区别。你甚至不能使用 CPU,对吧?你得用直接连到网络上的 FPGA,处理数据包的速度如此之快,以至于如果你在输入和输出端连上示波器,你会看到数据包在还没被完全接收完时就已经开始发出了。所以这是一个非常不同、非常专业化的领域,但当你在那个时间维度里时,你真的做不了太多计算。你所做的决定将会非常简单。
事实上,在“决策有多智能(无论是模型还是其他手工编写的决策过程)”和“响应速度有多快”之间,存在着一整条权衡曲线。构建最优交易策略的正确方法实际上是采用一种集成(ensemble)的方法,对于某些类型的决策,你非常迅速地做出极度简单的判断。而对于另一些决策,你的操作尺度是几微秒、几十微秒、数百微秒或者毫秒,而不是一百纳秒。在某些情况下,有些流程即使你需要一个小时甚至一天来做出决策也是完全没问题的。你在每一个时间跨度上都在各自的时间基准下保持竞争力。但你在这些层面上做出的决策种类是非常不同的。
模型预测与基础设施布局
Dwarkesh: 也许你不能细说,但这些模型到底在预测什么?肯定不仅仅是订单簿上的下一笔订单,或者可能就是?
Ron: 是的,我们确实正在触碰一些很难谈论的话题,但我认为最简单、也是我们一直在思考的最重要的一点——就像我们现在思考的那样,也是 25 年前我刚来 Jane Street 时,我用线性回归等建立模型时思考的那样——一种非常有用的做法是,为一个东西预测一个公允价值(fair value):我们认为这东西值多少钱?这能以一种高度可组合的方式完美契合进许多不同的交易流程中。这不是我们作为预测目标的唯一一类东西,但它很重要。
Dwarkesh: 我有一阵子经常听到一种说法,好像交易公司的做法就是,你必须在纳秒级别跟纳斯达克交易所的主机托管(colo)放在一起,你的机器必须紧挨着那里,不能过多去思考把什么具体放在哪儿。
Ron: 你的推理过程可能在 CPU 上,可能在 FPGA 上,也可能在 GPU 上,这取决于你需要多少计算量的限制、模型有多大,以及你需要什么样的时延(latency)。并且是的,更大、更慢的东西可以放得更远。必须把所有的计算设备都放在交易所旁边是很烦人的。而对于那些真正、真正需要极速的东西,仅仅放在主机托管机房(colo)是不够的,你还在乎连接你到那里的光纤线轴有多长。当你在这种极低的纳秒级别尺度上时,你甚至要确切去测量光纤布线的长度。但总的来说,更大的模型让你在物理部署位置上有更大的灵活性。
Dan: 如果我们现在把 GPU 放到那些紧挨着交易所的主机托管设施中,你就必须遵守他们的规则。你知道,那个供应商是谁?是谁为你提供那个空间?你的电源、你的冷却,所有这些限制现在可能比你自己设计和运营一个设施时要稍微更严格一些。所以你现在不得不去想一些办法,比如,嘿,我可能在一个机柜(rack)里只能放一个 GPU,因为它消耗的电力太大了。所以现在我必须把它们分散开来,而不是像在一个机柜里那样能用液冷(liquid cooling)。因此,在我们的计算能力不断扩张时,这些都是我们需要牢记在心的事情。
CoreWeave 算力采购与模型训练
Dwarkesh: 你们最近与 CoreWeave 签订了一份价值 60 亿美元的算力协议。你们打算用它来做什么?
Ron: 其他 AI 领域有其缩放定律(scaling laws),我们也有我们的缩放定律,并且我们有很多想要训练(training)的模型。我认为我们和那些更传统的 AI 实验室之间有趣且可能不同的地方在于,模型架构的极其多样性以及我们正在进行的大量实验。因此,你从这一切中获得的大部分价值仅仅在于人们在模型设计中尝试大量非常不同的新事物,这只是给了研究人员更快的迭代时间,以便他们能够发现更多的想法并推动更多的创新。事实证明,这一点极其重要。
Dwarkesh: 对于那些基础模型实验室来说,训练一个完全通用、什么都能做的单一模型,比建立一堆不同的定制模型会带来一些好处。你能给我讲讲为什么 Jane Street 会有不同的权衡取舍吗?
Ron: 对我们来说,某些特殊化是为了适应消化正确种类的数据,对吧?我们可能需要输入的数据源多达无数种。我们所需达到的数据速率就存在一堆差异。而且,导致我们需要将部分工作进行特殊化的另一个因素是,由于字节与浮点运算的比率不同,整体的推理和交易动态都变得不同了。我们用来训练模型的数据量非常庞大,但是逐字节来看,这些数据的信噪比更低,因为金融数据非常嘈杂。
Dwarkesh: 是的。
Ron: 因此,我们的模型往往较小,而数据往往更嘈杂,并且数据量往往大得多。而且我们为不同的应用构建的不同模型之间也有差异,对吧?当我们试图弄清楚如何利用我们获得的更多信息时,就像是,哦,现在会面临一整套决策,从“我们如何高效地存储和加载数据”到“我们如何塑造模型”,再到“我们如何使推理过程兼顾所需的吞吐量和时延”。在那里将会有一整套完全不同的权衡。因此,解决这些问题并为不同应用挑选出你所能做到的最佳方案,有着巨大的价值。
Dwarkesh: 那你们实际的推理工作负载是怎样的?或者它与传统大型聊天机器人 LLM 公司的做法有什么不同?
Ron: 就像你可能预料的那样,时延更重要。批处理依然是个问题。根据你正在运行的模型,你可能会将模型或模型的一部分针对你正在观察的不同交易代码进行拆解。因此,像从多个来源提取数据并将它们批量处理在一起的这种做法会产生影响。我认为另一件有趣的事情是数据速率真的非常高。大型 LLM 实验室从所有不同用户那里汇总获得的总数据速率也非常高,但你从任何单一用户那里获得的序列数据量并没有那么大。然而,当你提取的数据是从纳斯达克源源不断涌出的数据包时,哇哦,你希望在一个领域里按照因果顺序依次连续消耗的那种数据速率非常极高。所以再次强调,动态变化了,尽管我认为许多基本的工程问题并不是那么不同,但所有的常数都被调整到了不同的位置,所以你最终做出了不同的选择。
数据存储与计算解耦
Dwarkesh: 这对你们如何设计这些系统意味着什么,无论是在存储还是其他方面?
Ron: 是的,我认为我们对数据加载的性能比你在其他地方看到的要更加重视。我认为我们正在做大量工作来构建我们自己的大规模数据存储系统、我们自己的内部对象存储,我们在那里使用了各种供应商的产品,但随着时间的推移,我认为对于其中一些以研究为重点的用例,我们需要在更大的规模上运行,也需要处理分布在不同数据中心的数据。这不再是一个关于推理时间的问题,而更多是一个关于训练时间的问题:我们就是无法把我们想要的所有算力都集中在同一个地方。
我不知道,我总觉得在有效运营一个技术组织的过程中,一个重要的诀窍是找出你可以走哪些捷径。多年来我们有幸走过的一条捷径是,我们可以假装地球上只有一种 CPU 架构。就像一切都是为了 x86-64 一样。我们假装其他东西都不存在。这简化了一堆事情。我们曾经也只有一个大型研究数据中心和一个大型存储集群,这也简化了海量的问题。
但实际上,这两个前提现在都被打破了。你就是无法获得那么多电力,你无法往同一个数据中心拉进足够的电力连接来为你需要的所有设备供电。你必须在各处都建立数据中心。所以就产生了一个庞大的解耦问题,这也给你带来了一个问题:现在你必须考虑让你的计算调度和存储调度相互交织,并且存在海量的数据,所以把数据搬来搬去绝对不是一件微不足道的事。
此外,我们不得不放弃“仅限 x86”的做法,因为 Nvidia 推出了一堆很酷的新产品,这意味着你需要支持 ARM。
AGI、人类智能与非电子化交易
Dwarkesh: 现在把视角拉远,我想问一个非常天真的问题。有一种可能是比较天真的观点认为,如果你拥有 AGI,它就能立刻做 Jane Street 所做的事情。你能告诉我为什么这种天真的观点是天真的吗?
Ron: 是的,我不想完全否定它。你知道,我们应该认真对待这样一个世界:我们将构建出比地球上所有人类都绝对更聪明、在所有认知任务上都更有能力的大型语言模型或其他 AI 系统。如果是那样,是的,世界会变得很诡异,那将是一种完全不同的状态。在那种情况下,是的,也许 Jane Street 所做的大量事情都会被自动化取代,也许我们大家就可以躺平,多喝几杯玛格丽特什么的。我不知道那个世界是什么样子,但感觉我们现在离那还并不特别近。
我认为,总体而言,人们很容易低估像 Jane Street 这样的公司,或者任何一个真正在做雄心勃勃、高难度的公司级任务时,所做工作的丰富性和复杂性。特别是交易,我觉得有点像是 AGI 完全问题(AGI-complete),或者是 NP 完全问题。我的意思是,世界上所有不同的问题最终都会影响你在交易环境中的操作,因为归根结底,交易涉及弄清楚事物的价值,这意味着对未来做出预测,而有很多不同的因素会汇集于此。随着其中各个部分的自动化,你知道的,老规矩又来了:那些我们还不知道如何很好地进行自动化的剩余难点,最终成为了竞争优势所在。我感觉人类和人类认知现在比以往任何时候都更有价值。我从来没有像今天这样迫切地想要雇佣更多的工程师和更多的交易员,因为人们正在做的每一件事都比以前更有价值了。
我的这番话部分原因是我确实有些怀疑,我们是否像某些人认为的那样,已经如此接近于在所有事情上都比人类更聪明的模型了。
Dwarkesh: 也许这涉及到物理基础设施,比如实际获得主机托管机房;也许实际是指你们构建的软件基础设施。你能给我个概念,到底是什么让它如此复杂吗?
Ron: 是的,我们构建了种类繁多的复杂软件片段,让人们思考许多不同的交易问题,其中一些根本不是高度电子化的。这个业务实际上比我认为人们想象的要多样化得多。有一种想法是,哦,是啊,它肯定就是那种简单的事情:你只需要聪明人做出聪明的决定,写出好的软件就行了。如果我们可以把“聪明”这部分直接自动化,那问题就全解决了。但我认为这远比那复杂得多。
Dwarkesh: 你所说的交易的非电子化部分是什么意思?
Ron: 我的意思是,仍然有一些交易是通过人们在聊天系统中互相交流来完成的,他们在一起做决定;比如有人在评估电话另一头的人代表着多大程度的逆向选择风险。这依然是业务中真实存在的一部分。只是不同的证券种类自动化所需的耗时不同。例如,债券业务的自动化程度就远不及你在股票市场看到的水平。
事实上,我认为我们之前对这一点有些困惑。对于那些已经在行业里待了一段时间的人来说,我自己算是入行有点晚,没能真正见证股票走向电子化的转型期。但我认为比我早一点关注的人当时就觉得,“是啊,我猜其他所有品种接下来都会电子化。”但你知道吗?已经过去 25、30 年了,并非所有品种都变成了那样。系统依然是这样——我们现在不再有很多人站在交易所大厅里大喊大叫了,但仍然有大量交易深度依赖于人类的介入和人类判断。
Dwarkesh: 讲到这里,在模型和交易决策之间,人类在回路中的参与度有多高?
Ron: 许多最赚钱的日子往往发生在那些有奇怪事件爆发、世界变得疯狂、没人知道到底是怎么回事的时候。在那样的背景下提供流动性是非常困难的,因此你做这事得到的报酬也会更高,并且在这样的日子里往往会有巨大的成交量。要做好这一点,通常涉及人类的判断,去思考今天与过去的所有日子有什么不同。在可能的程度下,我们希望构建能够良好穿越“相变(phase transitions)”的模型,但我们也认为,在穿越相变时,人类的表现比模型更好,有时你需要这种元判断来决定该怎么做。因此,即使对于那些大部分已自动化的系统,在一旁监视的人也有需要做出的决策,而我们总是有人在紧盯盘面。我认为交易的一个重要部分,就是在交易日期间时刻关注和思考正在发生的事情,哪怕单个交易流转的速度远远快于人类能够逐笔干预的程度。
液冷、物理工程与数据中心演进
Dwarkesh: Dan,在你从事建设类似这些大楼的过去 20 年里,有哪些更值得注意的变化?
Dan: 是的,现在人们真的开始关心数据中心并愿意谈论它了。我已经搞冷却技术很长一段时间了,现在突然之间大家都在谈论它,觉得它很有趣。这很有趣,也很令人兴奋。对于我团队的同事们来说,我想他们也有同感。数据中心行业里有一些待了 20 年的人,可能仍然想用过去的老一套来做事。我认为这种观念现在正在被淘汰。你开始发现人们正在挑战以往的固有观念。比如,“嘿,我整个数据中心都必须用发电机组作为备用电源。”但是发电机是你能买到的交货期最长的设备之一。所以,也许我们可以把它们撤掉,只把它们用于系统中最核心的需要弹性的部分。这能让我们的 GPU 提早六个月上线。那就这么干。所以,你知道,这也许不是最好的纯工程决策,但绝对是最好的商业决策。我认为像这样在工程和商业之间的权衡,现在出现得越来越频繁了。
Dwarkesh: 感觉每一年大家对“现在到底是什么在阻碍 AI 算力扩展”的看法都在变。当你们在进行更多谈判并试图获取更多算力时,目前的瓶颈是什么?你预计未来的瓶颈又会是什么?
Dan: 撇开算力芯片和内存等那些大家津津乐道的东西不谈,目前主要是发电机、变压器,还有现在用于液冷的一些冷却设备需求量巨大。这些情况变化极快。我今天告诉你的情况,两周后绝对会不一样。我们现在的做法是,与内部的采购团队非常密切地合作去囤积其中一些设备。只要是我们知道能在我们所有数据中心通用的设备,我们就会把它存放在仓库里随时备用。有些组件,比如巨型发电机,你不可能随便把它塞在一个仓库里;再比如如果是电表后设施像燃气轮机,你就必须更多地考虑这些市场:你从哪里弄到它们,你在哪里安置它们,你不能就把它们扔在路边不管。所以瓶颈组件绝对是在不断变化的,这些都是目前比较大的瓶颈。
随着我们向越来越高的密度发展,大家的一个期望是,建筑体积能变得稍微小一点,也许这样我们就能更快地把楼盖起来,把所有的算力芯片很好地紧密打包在里面;然后它周围的所有基础设施也许都必须是预先构建好并直接运送到现场的。模块化数据中心或模块化基础设施正在成为一种趋势,尤其是交货期长的组件正在通过非现场设计和建造,然后运到现场,以尽可能达到即插即用的效果。
Dwarkesh: 你之前提出的一个观点是,随着机柜本身变得越来越密集,越来越多的数据中心空间实际上都被分配给了机柜周围的基础设施。这其实有点类似于把芯片封装在一块基板上,真正的计算核心仅仅占整个封装面积中非常小的一部分。
Dan: 是的,这很有趣。我的意思是,这本身并不能解决任何问题。也许它还制造了其他问题。当然,就像你达到单机柜一兆瓦的功耗,大家会觉得,一兆瓦一个机柜到底是什么概念?随之而来的就是连接到那里的冷却管道只会变得更粗,无论是我们现在使用的交流电,还是未来将要走向的 800 伏直流电,庞大的电能传输也会是个挑战。你仍然必须把所有这些组件集中到一个点上。
从我们的角度来看,有趣的是,我们可以设计这些工程上的东西,但最终,无论是 Nvidia 还是某个 ASIC 厂商,他们都必须销售能在实际数据中心里工作运行的组件,所以他们也在极其认真地思考他们到底卖的是什么。因为你需要有人去用它对吧。如果你造出一个耗电一兆瓦的数据中心……哦是一兆瓦耗电的机柜,但却没有办法给它供电和冷却,那就等于没用。
因此,我们正在与这个领域几乎所有的厂商进行非常密切的合作,共同探讨要支持这些下一代设备究竟需要哪些基础设施组件。因为你知道,某些组件的交货时间有时超过一年,你甚至在为芯片下订单之前就得先把基础设施敲定下来。
所以,比如举个例子,TPU 用的是温度较低的水冷,而它们的密度大概只有 NVL72、GB300 的一半,对吧?所以那需要一种不同的策略,你希望确保你能够在未来应对这些不同的情况。
冗余算力用途与人才招聘
Dwarkesh: 那些超大规模云厂商之所以能承诺购买大量算力,其中一个原因是他们对多余的算力有一些“备用用途”,在特定时刻不用于 LLM 的推理或训练时也可以用上。比如 Meta,如果他们买的某些 GPU 闲置了,他们就可以说,我们就用它来让我们今天的 Instagram 广告推送模型变得稍微好一点。对于 Jane Street 来说,这种算力的备用用途相当于什么?这应该构成了这批算力对你们价值的一个下限吧。
Ron: 真实情况是,在许多方面,我们非常非常受限于算力瓶颈。人们有大量的创新、实验和新想法,这些都受到我们拥有的算力总量的限制。所以,从某种程度上说,如果我们仅仅想一下——我们试图做一项相对严谨的工作,评估我们能做的各类不同新实验的价值,而那些仅仅因为算力不够而被我们砍掉、无法运行的实验,其潜在价值已经非常高了。所以我们一直在跑我们认为最有价值的东西,但即便哪天我们针对这些首要任务的算力冗余了,在那片领域也还有成吨的其他研究和实验等着我们去做。所以我们离“哎呀算力太多了”还差得很远,我们面临的问题完全是相反的。
那个方向上也还有很容易摘到的果实。比如更频繁地重新训练模型是很有价值的。模型质量会随着时间推移出现衰退,如果能经常重新运行它们——那对公司来说有着立竿见影且明确的价值。我们还能执行一定数量的批量推理任务,在调度系统里没有其他任务时填补空隙。所以我们没有一种能完全对标 Instagram 广告分发那种类型的业务,但在那些我们因为算力不够而尚未涉足的“暗区”里,如果有了更多算力,我们绝对会大干一场。因此我们毫不担心无法从这些设备中榨取价值。
必须说明的是,这里面确实有一堆内嵌的赌注:我们在这些设备上投入了大量资金,你可以想象如果事情没有像我们预期那样——单个模型和单笔交易的价值改进速度不及预期,毕竟这是一个充满竞争的环境,也许别人会战胜我们。我认为保持优秀的一个重要部分就是,永远要去提防对手可能会弄清楚你到底在搞什么类似的操作,从而削弱你策略的价值。所以,它是有可能起不到预期效果的。但就目前我们手头算力任务的配比来看,我们距离算力过剩这种烦恼真的差得很远。
Dan: 补充一下,虽然不能直接回答你的问题,但你可以把数据中心的电力供应和芯片解绑来看。你可以说,好吧,我知道以后可能需要这些算力,那我现在就先签下数据中心和电力的合同定下来,但推迟决定购买那些非常昂贵的芯片的时间。在那个你可能正好需要算力的时间点,稍微“做多”一点电力和数据中心机房容量,如果用不完,我们也会预留一些方案,比如我们可能可以把其中一些容量转租给别人。显然,对于我们来说,转售电力和数据中心容量,比转售那些芯片本身要容易得多。你可以真正把这两者切割开来。
Dwarkesh: 这也改变了招聘方面的考量。我的意思是,你们的招聘门槛本来就已经是最高的了,但现在可能会提得更高。因为你每多招一个人,这个人都将需要分配算力来做他们的实验,而这部分算力就必须从团队中另一个本可以拿来做实验的顶尖高手的配额里扣除。
Ron: 我明白你的意思,但我们不会这么想,“哦,多招研究员太奇怪了,因为那样我们就得给他们分算力。” 我们更认为:这些研究本身极其有价值,这些研究人员也是极其有价值的。这恰恰是一个极好的去购买更多算力的理由。因此我们在增长算力总规模上是极其积极的。目前,我们的 GPU 规模大约在几万张的量级,在不久的将来,我们将达到几十万张 GPU 的量级。而且我们认为,这对业务来说是完全合理的。我们完全不担心“哦,我们能不能用交易策略的盈亏来证明这笔投入的合理性?”不不不,这些显然都是很好的投资。
因此,这完全感觉不到它在招聘阵线上拖慢了我们的脚步。在某些方面,最大的增长障碍在于,真正培训员工、让他们融入文化、建立起团队并将这个地方建设得更好,是需要时间的。我们希望 Jane Street 能够继续成为一个令人感到很棒的工作场所。我一点也不觉得硬件会成为拖慢我们的因素。我认为真正的限制因素是找到足够多优秀的人,并拥有足够多的导师去带他们。
Dwarkesh: 我想这也许是个好机会,让你们提一下目前正在招聘哪些类型的职位?哎呀天哪,为什么不先从工程领域开始呢?
Dan: 是的,我先来吧。我的意思是,我想总体上我们只是在寻找非常聪明的人,对做这些事情感兴趣的人。具体来说就是机械工程师、电气工程师、项目经理、架构师,以及帮助设计和建造这些空间的人。在我们团队的职权范围内,我们实际上是要寻找物理空间、设计它们、建造它们,然后去运营它们。所以这是一个完整的生命周期。在其中每一个环节你都需要不同的人,许多我们称之为“物理工程”的人——这是我们自己发明的一个词,但你懂的,比如机械工程师和结构工程师,或者电气工程师这类角色。
Ron: 并且,总体而言,机器学习和交易真的是一项全队合作的运动,所以我们希望雇佣来自不同背景、拥有各种能力的人。我们当然非常兴奋能招募拥有特定机器学习背景的人员,在各类不同场景中设计架构并构建模型。我们都提到了,针对市场特有的一些特定数据,我们需要大量定制的架构。同时我们也构建 LLM,我们非常希望招聘那些在 LLM 训练整个生命周期各个环节都有经验的人,我们在这个领域的团队也一直在增长。
当然,我们招聘许多拥有优秀科学和技术背景的人来做交易员,比如数学、计算机、物理和工程专业的,这个岗位需要综合技能,这是我们一直非常有兴趣招聘的领域。
在软件工程方面,有一个通用软件工程师的岗位,我们总是渴望有优秀的人才加入。这说起来可能有点俗气,但就像 Dan 刚才说的,聪明、充满好奇心并且有极好计算机基础的人,非常适合这种多面手的角色,有许许多多不同种类的事情他们最终都可以参与去做。
还有一堆非常有趣的专业领域也让我们激动不已。这里有个新情况:随着所有这些算力规模的扩大,我们现在对全集群范围内的优化比过去感兴趣得多。过去我们对性能优化的看法是,它更多是关于让你最需要速度的关键部位尽可能跑得更快;而更广泛地说,计算资源往往是相对便宜的,而人力是昂贵的,所以我们过去没有花太多时间去优化我们通用的计算任务。但天哪,我们现在做的通用计算实在太多了。当你开始往这里砸下数十亿美元时,在这方面进行优化的价值就变得极大。有一些曾在超大型云厂商里做过这种大规模优化的专家,我们非常希望能招聘具有这种背景的人,来思考我们目前面临的优化难题——这些难题与那些云厂商遇到的挑战既有重要关联,又大不相同,所以这既是相关的挑战也是全新的课题。
我们还在做很多有趣的硬件工程。我们在研发自己的 ASIC,有这类经验的人超级令人兴奋。我们在午餐时也稍微提到了一点,那就是我们开始考虑组建一个形式化方法团队,基本上就是利用数学证明来让软件工程变得更可靠高效。这是一个相对较新、极具推测性的领域,我们非常激动能在那边找到合适的人。以前面对形式化方法社区的专家时,我总是不得不让他们失望地说“是的,我们目前对形式化方法不感兴趣”,但我觉得整个 AI 革命突然让形式化方法变成了一个有趣得多的领域,所以这是一个让我们兴奋的投资方向。
我也不知道还有哪些,比如项目经理,还有做前端开发的人——实际上在 Jane Street 过往的大部分经历中,我们都假装这整个 “Web 时代” 从未发生过,我们几乎所有的工具都只是在终端机里跑的。但你知道,事实证明,能够在界面上画一条直线,加上点悬停工具提示之类的东西也是很有用的。所以,我们实际上在构建非常好的前端开发工具、为员工开发好用的系统上投入了大量资金。能拥有那些既是优秀软件工程师、又对“打造人类易用应用”有很好直觉的出色前端工程师,对我们来说非常重要。
作为针对所有这些问题的一个宏观观点,我想说的是,在所有对 AI 工具的合理且真实的狂热中,我认为人们有时忽视了这一切中人类元素的重要性。我认为我们真的极其关心要构建出对人类有用的工具,这也涵盖了 AI 工具本身对吧?我们试图用这样一种方式去推进工具开发,那就是以增加人类对事务的理解、能动性和效率为导向,这是核心所在。我们受限于在这里工作的那些不可思议的优秀人才。我们最大的限制在于能否找到更多合适的人并壮大这个组织,这样我们才能做成更多的事情。所以对于构建系统,我们有一种非常以人为本的思考方式。
Dwarkesh: 你们搞的这些有趣的谜题和挑战真是太酷了。我想这是你们平时就在做的事,但你们也特别为这个播客的听众们制作了几个谜题。我觉得听这个播客的人可能会对去看看那些题目很感兴趣。其中甚至有一个不仅没有参赛者能解出来,连 Jane Street 内部自己都解不开的挑战——涉及到寻找各个隐藏着触发词后门的 LLM 漏洞。总之,我提到这个是因为,对于那些有兴趣了解更多的人来说,我认为这些有趣的谜题可能展示了在这里工作是什么样的感觉,以及为什么说这会是一个充满乐趣的地方。
Ron: 是的,智力挑战谜题是我们文化中根深蒂固的一部分。因此,用它们作为一种与人才接触的方式是非常棒的。
Dwarkesh: 是的。
Ron: 是的。
Dwarkesh: 我想这里的硬广植入地址就是 janestreet.com/dwarkesh。大家可以在那里了解更多关于这里开放的世界和所有的挑战谜题。
Ron: 没错。
Dwarkesh: 太棒了,酷。感谢两位今天接受访谈。
Ron: 非常感谢。
JaneStreet: 我们的荣幸。