Skip to content

AI 技术落地的黄金时代

Published: at 00:00

这是一篇 Y Combinator 2025 年初(2 月 3 日)的 RFS 总结,原文在这里,https://www.ycombinator.com/rfs 。如果你对 AI 感兴趣,希望探索 AI 行业的机会或者可做的项目,希望这篇文章能给你些灵感和方向。

TL;DR

image.png

正文

在 YC,我们时常探讨一些希望看到更多人尝试的创意。偶尔,我们会将这些创意汇总,形成一个名为“初创公司创意请求”(RFS)的列表,这是 YC 多年来的传统。本页面汇集了这些创意。

请不要觉得一定要从这些创意中选择一个来申请 YC。我们预计这些创意只占我们资助创意的一小部分——但如果你对其中某个创意特别感兴趣,我们希望它的潜力能激励你投入其中。

2025 年春季

简介

最近几个月,AI 领域的进展为初创公司提供了许多新机会。过去我们通常每年发布一次创意请求,而这次我们决定在三个月内再次发布,帮助创始人们抓住新兴的创意空间。

你可能已经跟进了相关的技术突破。通过 Operator 和 Computer Use,AI 系统已经能够使用计算机。OpenAI 的 O1/O3 和 Deepseek R1 等推理模型让 AI 系统有能力超越人类。这些新技术还需要全新的计算基础设施,而 DeepSeek R1 也展示了低级优化的巨大潜力。

这些是我们认为值得深入探索的创意。

AI 应用商店的全新构想

我们想要一种全新的 AI 应用商店和操作系统层,能够安装在你的电脑或手机上。它应该具备以下功能:

  1. 保护用户隐私:用户可以选择哪些应用可以访问自己的数据,如日历、文件或浏览记录,但只有用户授权时才可以查看。
  2. 统一的个人记忆:所有个人信息(如偏好设置、过去的操作等)都保存在这一层,而不会分散在多个应用中。
  3. 帮助用户发现优质 AI 应用:这个商店将审核每个 AI 工具,确保用户能够安全地找到并安装它们。
  4. 帮助开发者构建应用:为开发者提供基础设施支持,让他们避免重复开发,比如计算机使用、LLaMA 版本管理和应用访问控制等简单 API。
  5. 简化支付流程:让付费应用或服务的支付变得更加便捷。

想象一个智能旅行助手,能够找到最佳航班,并知道你通常和喜欢看窗外的 9 岁孩子一起旅行,或者一个 AI 阅读助手,能在你读文章时,推荐最初提出某个观点的文章。这样的应用仅会使用用户授权的最少数据。这种系统不仅能让 AI 强大,同时也保护隐私。

虽然大科技公司可能会建设这样的系统,但现在正是创业者的机会。

如果做对了,这将为初创公司创造更多机会:通过共享内存,应用将变得更智能,同时也为分发和变现创造了新的市场。

数据中心

*Diana HuDalton Caldwell*

我们需要更多能够更快速、更低成本建设的数据中心,以支持 AI 发展所需的基础设施。超大规模的数据中心建设通常需要几年时间,而在目前的市场热情和资金支持下,我们急需更多新的公司和创新的解决方案来加速这一建设进程——无论是在电力供应、冷却系统、材料采购还是项目管理方面。

我们可以预见未来的场景:软件将管理数据中心或仓库的建设,从选址、施工到设置及后期管理。所有这些工作都可以通过“无人工干预”的方式进行,机器人将全天候运作。

我们希望资助那些能帮助实现这一愿景的初创公司。

观看关于数据中心的视频

合规性与审计

Tom Blomfield

在美国和欧洲,大约有 400 万人(占总劳动人口的 1%)从事合规和审计工作。与此同时,合规成本持续攀升。从 GDPR 到 Dodd-Frank,从金融 AML/KYC 到 ESG 报告,全球的监管环境不断扩展。

传统的合规工作通常需要阅读冗长的法规,交叉比对公司内部政策与程序文档,手动抽查工作记录,生成重复性报告。审计员往往需要处理大量的非结构化数据,寻找潜在的问题。这些繁琐、耗时的工作流程迫切需要自动化技术的帮助。

大型语言模型(LLM)在这一领域已经展现出了极大的潜力。它们能够快速解析复杂的法规、公司政策或财务报表,标出潜在问题,节省人工审核的时间。这些工具可以帮助自动化审计员目前需要手工完成的任务:检测数据异常、识别不完整的记录或指出相互矛盾的政策。

与其逐一抽查几份文档,经过良好训练的模型可以一次性审查所有内容——为每个公司提供“持续审计”。

观看关于合规性与审计的视频

DocuSign 2.0

Michael Seibel

每天,复杂的文件签名(如税务表格、销售合同、抵押贷款、雇佣合同、保密协议、贷款申请、保险申请等)给个人和企业带来了不小的麻烦:现有的 DocuSign 或类似的产品在这些情况下使用起来过于复杂,用户体验欠佳,难以完成以下任务:

  1. 创建文档模板
  2. 避免填写重复信息
  3. 修正文档错误
  4. 理解复杂的条款
  5. 与其他软件集成

我们希望创始人重新思考如何在一个由 AI 驱动的世界中,创建和分发需要签名的文件。

设想一个新工具集:

  1. 可以将任何已签署的文件,去除掉可变部分,创建新的文档模板。
  2. 自动填写用户曾经提供的信息或公开信息。
  3. 通过语音助手帮助用户理解复杂的条款。
  4. 定制化的文档模板,根据签名人或情境自我调整。

如果你有兴趣开发 DocuSign 2.0,请申请 YC。

观看关于 DocuSign 2.0的视频

浏览器与计算机自动化

Jared Friedman

AI 代理现在能够浏览网页并操作桌面应用程序。OpenAI 的 Operator 和 Anthropic 的 Computer Use 已经证明了这一点,还有许多开源解决方案也提供了这样的能力。

让 AI 代理能够使用互联网,就像是给大脑装上了“手”。它们现在可以做很多事情。

这意味着每个网站和每个应用程序现在都可以当作一个 API 使用。任何人类能够在计算机上完成的工作,AI 都能自动化执行。

这大大拓展了 AI 代理的使用场景。我们迫不及待地想看看大家会创造出什么样的应用。

观看关于浏览器/计算机自动化的视频

AI 个人助手:为每个人提供私人服务

David Lieb

软件一直是让大众享受到曾经只有富人才能享有的服务的有效途径。比如,2009 年之前,只有世界上最富有的人才能雇佣私人司机,而现在,Uber 和 Waymo 等服务让人人都能享有类似服务。另一个例子:我在参与 Google Photos 项目时惊讶地发现,富人雇佣专门的人来整理、编辑、标记和组织他们的照片。我们则是通过 AI 来自动化这一过程,让数十亿人都能享受到这一服务。

尽管过去十年软件在各个领域取得了巨大进展,但富人依然雇佣大量个人助手,提供定制化服务,包括税务会计师、私人律师、财务经理、私人教练、私人导师,甚至私人医生等。

为什么只有富人能够享受这些服务呢?因为直到现在,软件还没能替代这些高端定制化知识工作——直到现在的 AI 技术终于可以做到。

未来几年,我们预计 AI 将能够承担大部分这类个性化知识工作。因此,如果你正在开发将 AI 助手带给每一个普通人的服务,我们非常期待听到你的创意。

观看关于 AI 个人助手的视频

为 AI 代理构建开发工具

Nicolas Dessaigne

在过去的两年里,我们资助了许多使用 AI 来颠覆传统行业的初创公司。

现在,我们正见证着下一个浪潮的到来:AI 代理,它们不仅仅是人类的助手,还是能够自主做出决策的系统。随着 o1 和即将发布的 o3,这些代理的推理能力显著提高,能够完全复制甚至超越人类完成的任务。

AI 代理将在各个行业及我们的日常生活中无处不在。想象一下一个世界,在这个世界中,每个人都拥有一个专门的 AI 代理团队,它们在后台无缝协作,提升个人的生产力和创造力。

为了加速这一未来的到来,我们希望资助那些致力于为 AI 代理开发开发工具的初创公司。这些工具可以包括:

代理构建工具: 使用户能够轻松创建和部署定制代理的公司,比如 Wordware(YC S24)或 Stack AI(YC W23)。

代理构建模块: 增强代理能力的工具、API 或平台,使它们能够执行更复杂的任务,取得更大的影响。

如果你在这一领域进行开发,我们非常希望听到你的想法,帮助你塑造软件的未来。

观看关于为 AI 代理构建开发工具的视频

软件工程的未来

Pete Koomen

大型语言模型(LLM)现在已经能够编写比大多数人更好的代码。这将使得软件开发的成本降到几乎为零。

那么,代理会取代软件开发人员的工作吗?答案是不会!未来我们仍然需要更多的软件工程师,因为软件将控制几乎一切。

这些工程师将不再直接编写很多代码,而是管理一组 AI 代理来为他们编写和发布软件。除了编写代码,代理还将承担软件开发过程中其他所有专业任务:质量保证(QA)、部署、安全性与合规审计、翻译、运营等。

我们希望资助那些能够帮助小型通用开发团队管理大规模 AI 代理团队,共同开发和交付大量软件的初创公司。

如果你有兴趣为软件工程的未来构建工具,我们非常期待与你交流。

观看关于软件工程未来的视频

AI 商业化开源软件(AICOSS)

Dalton Caldwell

开源和开源初创公司有一个明显的模式。首先是专有的 Unix 系统,然后是 Linux,再到 RedHat;首先是 BitKeeper,然后是 Git,接着是 Github 和 Gitlab。

如今,在开源 AI 领域,也存在着巨大的机会,构建提供支持和服务的初创公司,帮助人们使用开源 AI。

通常情况下,发布开源代码的组织并不专注于提供商业支持。例如,谷歌和 Facebook 曾开源了多款工具,但他们并不总是专注于为企业提供这些工具的商业化支持——这为初创公司带来了机会。

在开源 AI 领域将会涌现出许多成功的公司,尤其是在 DeepSeek 推出之后,市场上会有许多新的领域等待创始人去开拓,帮助企业利用这些系统。

如果你有兴趣在企业级开源 AI 领域进行开发,我们非常希望听到你的声音。

观看关于 AI 商业化开源软件的视频

AI 编程代理:硬件优化代码

Diana Hu

AI 硬件仍然受到软件的制约。Nvidia 的优势很大程度上源于其 CUDA 手动优化的代码在 AI 模型中的应用。而其他竞争性的硬件——如 AMD 或定制芯片——常常表现不佳,原因不仅是芯片性能较差,更因为编写系统级代码(如内核、驱动程序)极为复杂,而从事这一工作的软件工程师远远不足。

然而,现在随着像 Deepseek R1 或 OpenAI o1 和 o3 这样的推理模型的出现,它们可以生成与人类 CUDA 代码相媲美,甚至超越的硬件优化代码。

我们希望看到更多的创始人致力于开发 AI 生成的内核代码,使得更多硬件平台能够为 AI 提供更好的支持。

这不仅仅是关于性能问题,更是关于打破依赖关系。致力于这一领域的创始人有可能重新塑造整个硬件生态系统。

观看关于 AI 编程代理的视频

B2A:客户为代理的服务软件

Dalton Caldwell

如今,互联网流量中有相当一部分来自非人类程序,它们在抓取信息,伪装成人类进行表单填写或搜索更新。大多数人构建网站时,都是以人类用户为主要目标,而不是考虑这些抓取程序。

随着 AI 和代理的普及,建立针对 代理客户 的软件和服务似乎变得尤为重要,这样的客户不仅是边缘案例,而是被积极支持和文档化的客户群体。

例如,构建帮助代理支付托管费用、预定旅行或与其他方签订合同的 API。在股市中,人类和程序的交易早已是常态,未来这种现象只会愈加普遍。

如果你有意开发专门为代理服务的软件和服务,我们非常欢迎你与我们分享你的想法。

观看关于 B2A 的视频

推理 AI 基础设施:应对测试时计算需求

Diana Hu

直到最近,计算资源的开支主要集中在预训练基础模型上。但随着 Deepseek R1 和 OpenAI o1 与 o3 的推出,出现了一种新的扩展趋势,表明我们在推理阶段,也就是 AI 应用实际使用这些模型时,将需要更多的计算资源。

随着 AI 应用的 API 调用量暴增,基础设施的成本将成为一个严峻问题。

这时,新的初创公司便可以提供解决方案。我们需要重建这一领域的技术栈:在推理层面提供更好的软件工具,开发出更经济的 GPU 负载处理方案,以及让 AI 应用能够扩展而不至于面临巨额成本的优化技术。

这类低调却至关重要的问题,往往会带来巨大的商业机会。

观看关于推理 AI 基础设施的视频

关注公众号 技术后花园 获取更多信息

image.png