AI 技术落地的黄金时代

这是一篇 Y Combinator 2025 年初（2 月 3 日）的 RFS 总结，原文在这里，https://www.ycombinator.com/rfs 。如果你对 AI 感兴趣，希望探索 AI 行业的机会或者可做的项目，希望这篇文章能给你些灵感和方向。

TL;DR

正文

在 YC，我们时常探讨一些希望看到更多人尝试的创意。偶尔，我们会将这些创意汇总，形成一个名为“初创公司创意请求”（RFS）的列表，这是 YC 多年来的传统。本页面汇集了这些创意。

请不要觉得一定要从这些创意中选择一个来申请 YC。我们预计这些创意只占我们资助创意的一小部分——但如果你对其中某个创意特别感兴趣，我们希望它的潜力能激励你投入其中。

2025 年春季

简介

最近几个月，AI 领域的进展为初创公司提供了许多新机会。过去我们通常每年发布一次创意请求，而这次我们决定在三个月内再次发布，帮助创始人们抓住新兴的创意空间。

你可能已经跟进了相关的技术突破。通过 Operator 和 Computer Use，AI 系统已经能够使用计算机。OpenAI 的 O1/O3 和 Deepseek R1 等推理模型让 AI 系统有能力超越人类。这些新技术还需要全新的计算基础设施，而 DeepSeek R1 也展示了低级优化的巨大潜力。

这些是我们认为值得深入探索的创意。

AI 应用商店的全新构想

我们想要一种全新的 AI 应用商店和操作系统层，能够安装在你的电脑或手机上。它应该具备以下功能：

保护用户隐私：用户可以选择哪些应用可以访问自己的数据，如日历、文件或浏览记录，但只有用户授权时才可以查看。
统一的个人记忆：所有个人信息（如偏好设置、过去的操作等）都保存在这一层，而不会分散在多个应用中。
帮助用户发现优质 AI 应用：这个商店将审核每个 AI 工具，确保用户能够安全地找到并安装它们。
帮助开发者构建应用：为开发者提供基础设施支持，让他们避免重复开发，比如计算机使用、LLaMA 版本管理和应用访问控制等简单 API。
简化支付流程：让付费应用或服务的支付变得更加便捷。

想象一个智能旅行助手，能够找到最佳航班，并知道你通常和喜欢看窗外的 9 岁孩子一起旅行，或者一个 AI 阅读助手，能在你读文章时，推荐最初提出某个观点的文章。这样的应用仅会使用用户授权的最少数据。这种系统不仅能让 AI 强大，同时也保护隐私。

虽然大科技公司可能会建设这样的系统，但现在正是创业者的机会。

如果做对了，这将为初创公司创造更多机会：通过共享内存，应用将变得更智能，同时也为分发和变现创造了新的市场。

数据中心

• *Diana Hu 和 Dalton Caldwell*

我们需要更多能够更快速、更低成本建设的数据中心，以支持 AI 发展所需的基础设施。超大规模的数据中心建设通常需要几年时间，而在目前的市场热情和资金支持下，我们急需更多新的公司和创新的解决方案来加速这一建设进程——无论是在电力供应、冷却系统、材料采购还是项目管理方面。

我们可以预见未来的场景：软件将管理数据中心或仓库的建设，从选址、施工到设置及后期管理。所有这些工作都可以通过“无人工干预”的方式进行，机器人将全天候运作。

我们希望资助那些能帮助实现这一愿景的初创公司。

观看关于数据中心的视频

合规性与审计

• Tom Blomfield

在美国和欧洲，大约有 400 万人（占总劳动人口的 1%）从事合规和审计工作。与此同时，合规成本持续攀升。从 GDPR 到 Dodd-Frank，从金融 AML/KYC 到 ESG 报告，全球的监管环境不断扩展。

传统的合规工作通常需要阅读冗长的法规，交叉比对公司内部政策与程序文档，手动抽查工作记录，生成重复性报告。审计员往往需要处理大量的非结构化数据，寻找潜在的问题。这些繁琐、耗时的工作流程迫切需要自动化技术的帮助。

大型语言模型（LLM）在这一领域已经展现出了极大的潜力。它们能够快速解析复杂的法规、公司政策或财务报表，标出潜在问题，节省人工审核的时间。这些工具可以帮助自动化审计员目前需要手工完成的任务：检测数据异常、识别不完整的记录或指出相互矛盾的政策。

与其逐一抽查几份文档，经过良好训练的模型可以一次性审查所有内容——为每个公司提供“持续审计”。

观看关于合规性与审计的视频

DocuSign 2.0

• Michael Seibel

每天，复杂的文件签名（如税务表格、销售合同、抵押贷款、雇佣合同、保密协议、贷款申请、保险申请等）给个人和企业带来了不小的麻烦：现有的 DocuSign 或类似的产品在这些情况下使用起来过于复杂，用户体验欠佳，难以完成以下任务：

创建文档模板
避免填写重复信息
修正文档错误
理解复杂的条款
与其他软件集成

我们希望创始人重新思考如何在一个由 AI 驱动的世界中，创建和分发需要签名的文件。

设想一个新工具集：

可以将任何已签署的文件，去除掉可变部分，创建新的文档模板。
自动填写用户曾经提供的信息或公开信息。
通过语音助手帮助用户理解复杂的条款。
定制化的文档模板，根据签名人或情境自我调整。

如果你有兴趣开发 DocuSign 2.0，请申请 YC。

观看关于 DocuSign 2.0的视频

浏览器与计算机自动化

• Jared Friedman

AI 代理现在能够浏览网页并操作桌面应用程序。OpenAI 的 Operator 和 Anthropic 的 Computer Use 已经证明了这一点，还有许多开源解决方案也提供了这样的能力。

让 AI 代理能够使用互联网，就像是给大脑装上了“手”。它们现在可以做很多事情。

这意味着每个网站和每个应用程序现在都可以当作一个 API 使用。任何人类能够在计算机上完成的工作，AI 都能自动化执行。

这大大拓展了 AI 代理的使用场景。我们迫不及待地想看看大家会创造出什么样的应用。

观看关于浏览器/计算机自动化的视频

AI 个人助手：为每个人提供私人服务

• David Lieb

软件一直是让大众享受到曾经只有富人才能享有的服务的有效途径。比如，2009 年之前，只有世界上最富有的人才能雇佣私人司机，而现在，Uber 和 Waymo 等服务让人人都能享有类似服务。另一个例子：我在参与 Google Photos 项目时惊讶地发现，富人雇佣专门的人来整理、编辑、标记和组织他们的照片。我们则是通过 AI 来自动化这一过程，让数十亿人都能享受到这一服务。

尽管过去十年软件在各个领域取得了巨大进展，但富人依然雇佣大量个人助手，提供定制化服务，包括税务会计师、私人律师、财务经理、私人教练、私人导师，甚至私人医生等。

为什么只有富人能够享受这些服务呢？因为直到现在，软件还没能替代这些高端定制化知识工作——直到现在的 AI 技术终于可以做到。

未来几年，我们预计 AI 将能够承担大部分这类个性化知识工作。因此，如果你正在开发将 AI 助手带给每一个普通人的服务，我们非常期待听到你的创意。

观看关于 AI 个人助手的视频

为 AI 代理构建开发工具

• Nicolas Dessaigne

在过去的两年里，我们资助了许多使用 AI 来颠覆传统行业的初创公司。

现在，我们正见证着下一个浪潮的到来：AI 代理，它们不仅仅是人类的助手，还是能够自主做出决策的系统。随着 o1 和即将发布的 o3，这些代理的推理能力显著提高，能够完全复制甚至超越人类完成的任务。

AI 代理将在各个行业及我们的日常生活中无处不在。想象一下一个世界，在这个世界中，每个人都拥有一个专门的 AI 代理团队，它们在后台无缝协作，提升个人的生产力和创造力。

为了加速这一未来的到来，我们希望资助那些致力于为 AI 代理开发开发工具的初创公司。这些工具可以包括：

• 代理构建工具： 使用户能够轻松创建和部署定制代理的公司，比如 Wordware（YC S24）或 Stack AI（YC W23）。

• 代理构建模块： 增强代理能力的工具、API 或平台，使它们能够执行更复杂的任务，取得更大的影响。

如果你在这一领域进行开发，我们非常希望听到你的想法，帮助你塑造软件的未来。

观看关于为 AI 代理构建开发工具的视频

软件工程的未来

• Pete Koomen

大型语言模型（LLM）现在已经能够编写比大多数人更好的代码。这将使得软件开发的成本降到几乎为零。

那么，代理会取代软件开发人员的工作吗？答案是不会！未来我们仍然需要更多的软件工程师，因为软件将控制几乎一切。

这些工程师将不再直接编写很多代码，而是管理一组 AI 代理来为他们编写和发布软件。除了编写代码，代理还将承担软件开发过程中其他所有专业任务：质量保证（QA）、部署、安全性与合规审计、翻译、运营等。

我们希望资助那些能够帮助小型通用开发团队管理大规模 AI 代理团队，共同开发和交付大量软件的初创公司。

如果你有兴趣为软件工程的未来构建工具，我们非常期待与你交流。

观看关于软件工程未来的视频

AI 商业化开源软件（AICOSS）

• Dalton Caldwell

开源和开源初创公司有一个明显的模式。首先是专有的 Unix 系统，然后是 Linux，再到 RedHat；首先是 BitKeeper，然后是 Git，接着是 Github 和 Gitlab。

如今，在开源 AI 领域，也存在着巨大的机会，构建提供支持和服务的初创公司，帮助人们使用开源 AI。

通常情况下，发布开源代码的组织并不专注于提供商业支持。例如，谷歌和 Facebook 曾开源了多款工具，但他们并不总是专注于为企业提供这些工具的商业化支持——这为初创公司带来了机会。

在开源 AI 领域将会涌现出许多成功的公司，尤其是在 DeepSeek 推出之后，市场上会有许多新的领域等待创始人去开拓，帮助企业利用这些系统。

如果你有兴趣在企业级开源 AI 领域进行开发，我们非常希望听到你的声音。

观看关于 AI 商业化开源软件的视频

AI 编程代理：硬件优化代码

• Diana Hu

AI 硬件仍然受到软件的制约。Nvidia 的优势很大程度上源于其 CUDA 手动优化的代码在 AI 模型中的应用。而其他竞争性的硬件——如 AMD 或定制芯片——常常表现不佳，原因不仅是芯片性能较差，更因为编写系统级代码（如内核、驱动程序）极为复杂，而从事这一工作的软件工程师远远不足。

然而，现在随着像 Deepseek R1 或 OpenAI o1 和 o3 这样的推理模型的出现，它们可以生成与人类 CUDA 代码相媲美，甚至超越的硬件优化代码。

我们希望看到更多的创始人致力于开发 AI 生成的内核代码，使得更多硬件平台能够为 AI 提供更好的支持。

这不仅仅是关于性能问题，更是关于打破依赖关系。致力于这一领域的创始人有可能重新塑造整个硬件生态系统。

观看关于 AI 编程代理的视频

B2A：客户为代理的服务软件

• Dalton Caldwell

如今，互联网流量中有相当一部分来自非人类程序，它们在抓取信息，伪装成人类进行表单填写或搜索更新。大多数人构建网站时，都是以人类用户为主要目标，而不是考虑这些抓取程序。

随着 AI 和代理的普及，建立针对 代理客户 的软件和服务似乎变得尤为重要，这样的客户不仅是边缘案例，而是被积极支持和文档化的客户群体。

例如，构建帮助代理支付托管费用、预定旅行或与其他方签订合同的 API。在股市中，人类和程序的交易早已是常态，未来这种现象只会愈加普遍。

如果你有意开发专门为代理服务的软件和服务，我们非常欢迎你与我们分享你的想法。

观看关于 B2A 的视频

推理 AI 基础设施：应对测试时计算需求

• Diana Hu

直到最近，计算资源的开支主要集中在预训练基础模型上。但随着 Deepseek R1 和 OpenAI o1 与 o3 的推出，出现了一种新的扩展趋势，表明我们在推理阶段，也就是 AI 应用实际使用这些模型时，将需要更多的计算资源。

随着 AI 应用的 API 调用量暴增，基础设施的成本将成为一个严峻问题。

这时，新的初创公司便可以提供解决方案。我们需要重建这一领域的技术栈：在推理层面提供更好的软件工具，开发出更经济的 GPU 负载处理方案，以及让 AI 应用能够扩展而不至于面临巨额成本的优化技术。

这类低调却至关重要的问题，往往会带来巨大的商业机会。

观看关于推理 AI 基础设施的视频

关注公众号 技术后花园 获取更多信息