这是一篇 Y Combinator 2025 年初(2 月 3 日)的 RFS 总结,原文在这里,https://www.ycombinator.com/rfs 。如果你对 AI 感兴趣,希望探索 AI 行业的机会或者可做的项目,希望这篇文章能给你些灵感和方向。
TL;DR
正文
在 YC,我们时常探讨一些希望看到更多人尝试的创意。偶尔,我们会将这些创意汇总,形成一个名为“初创公司创意请求”(RFS)的列表,这是 YC 多年来的传统。本页面汇集了这些创意。
请不要觉得一定要从这些创意中选择一个来申请 YC。我们预计这些创意只占我们资助创意的一小部分——但如果你对其中某个创意特别感兴趣,我们希望它的潜力能激励你投入其中。
2025 年春季
简介
最近几个月,AI 领域的进展为初创公司提供了许多新机会。过去我们通常每年发布一次创意请求,而这次我们决定在三个月内再次发布,帮助创始人们抓住新兴的创意空间。
你可能已经跟进了相关的技术突破。通过 Operator 和 Computer Use,AI 系统已经能够使用计算机。OpenAI 的 O1/O3 和 Deepseek R1 等推理模型让 AI 系统有能力超越人类。这些新技术还需要全新的计算基础设施,而 DeepSeek R1 也展示了低级优化的巨大潜力。
这些是我们认为值得深入探索的创意。
AI 应用商店的全新构想
我们想要一种全新的 AI 应用商店和操作系统层,能够安装在你的电脑或手机上。它应该具备以下功能:
- 保护用户隐私:用户可以选择哪些应用可以访问自己的数据,如日历、文件或浏览记录,但只有用户授权时才可以查看。
- 统一的个人记忆:所有个人信息(如偏好设置、过去的操作等)都保存在这一层,而不会分散在多个应用中。
- 帮助用户发现优质 AI 应用:这个商店将审核每个 AI 工具,确保用户能够安全地找到并安装它们。
- 帮助开发者构建应用:为开发者提供基础设施支持,让他们避免重复开发,比如计算机使用、LLaMA 版本管理和应用访问控制等简单 API。
- 简化支付流程:让付费应用或服务的支付变得更加便捷。
想象一个智能旅行助手,能够找到最佳航班,并知道你通常和喜欢看窗外的 9 岁孩子一起旅行,或者一个 AI 阅读助手,能在你读文章时,推荐最初提出某个观点的文章。这样的应用仅会使用用户授权的最少数据。这种系统不仅能让 AI 强大,同时也保护隐私。
虽然大科技公司可能会建设这样的系统,但现在正是创业者的机会。
如果做对了,这将为初创公司创造更多机会:通过共享内存,应用将变得更智能,同时也为分发和变现创造了新的市场。
数据中心
• *Diana Hu 和 Dalton Caldwell*
我们需要更多能够更快速、更低成本建设的数据中心,以支持 AI 发展所需的基础设施。超大规模的数据中心建设通常需要几年时间,而在目前的市场热情和资金支持下,我们急需更多新的公司和创新的解决方案来加速这一建设进程——无论是在电力供应、冷却系统、材料采购还是项目管理方面。
我们可以预见未来的场景:软件将管理数据中心或仓库的建设,从选址、施工到设置及后期管理。所有这些工作都可以通过“无人工干预”的方式进行,机器人将全天候运作。
我们希望资助那些能帮助实现这一愿景的初创公司。
合规性与审计
在美国和欧洲,大约有 400 万人(占总劳动人口的 1%)从事合规和审计工作。与此同时,合规成本持续攀升。从 GDPR 到 Dodd-Frank,从金融 AML/KYC 到 ESG 报告,全球的监管环境不断扩展。
传统的合规工作通常需要阅读冗长的法规,交叉比对公司内部政策与程序文档,手动抽查工作记录,生成重复性报告。审计员往往需要处理大量的非结构化数据,寻找潜在的问题。这些繁琐、耗时的工作流程迫切需要自动化技术的帮助。
大型语言模型(LLM)在这一领域已经展现出了极大的潜力。它们能够快速解析复杂的法规、公司政策或财务报表,标出潜在问题,节省人工审核的时间。这些工具可以帮助自动化审计员目前需要手工完成的任务:检测数据异常、识别不完整的记录或指出相互矛盾的政策。
与其逐一抽查几份文档,经过良好训练的模型可以一次性审查所有内容——为每个公司提供“持续审计”。
DocuSign 2.0
每天,复杂的文件签名(如税务表格、销售合同、抵押贷款、雇佣合同、保密协议、贷款申请、保险申请等)给个人和企业带来了不小的麻烦:现有的 DocuSign 或类似的产品在这些情况下使用起来过于复杂,用户体验欠佳,难以完成以下任务:
- 创建文档模板
- 避免填写重复信息
- 修正文档错误
- 理解复杂的条款
- 与其他软件集成
我们希望创始人重新思考如何在一个由 AI 驱动的世界中,创建和分发需要签名的文件。
设想一个新工具集:
- 可以将任何已签署的文件,去除掉可变部分,创建新的文档模板。
- 自动填写用户曾经提供的信息或公开信息。
- 通过语音助手帮助用户理解复杂的条款。
- 定制化的文档模板,根据签名人或情境自我调整。
如果你有兴趣开发 DocuSign 2.0,请申请 YC。
浏览器与计算机自动化
AI 代理现在能够浏览网页并操作桌面应用程序。OpenAI 的 Operator 和 Anthropic 的 Computer Use 已经证明了这一点,还有许多开源解决方案也提供了这样的能力。
让 AI 代理能够使用互联网,就像是给大脑装上了“手”。它们现在可以做很多事情。
这意味着每个网站和每个应用程序现在都可以当作一个 API 使用。任何人类能够在计算机上完成的工作,AI 都能自动化执行。
这大大拓展了 AI 代理的使用场景。我们迫不及待地想看看大家会创造出什么样的应用。
AI 个人助手:为每个人提供私人服务
软件一直是让大众享受到曾经只有富人才能享有的服务的有效途径。比如,2009 年之前,只有世界上最富有的人才能雇佣私人司机,而现在,Uber 和 Waymo 等服务让人人都能享有类似服务。另一个例子:我在参与 Google Photos 项目时惊讶地发现,富人雇佣专门的人来整理、编辑、标记和组织他们的照片。我们则是通过 AI 来自动化这一过程,让数十亿人都能享受到这一服务。
尽管过去十年软件在各个领域取得了巨大进展,但富人依然雇佣大量个人助手,提供定制化服务,包括税务会计师、私人律师、财务经理、私人教练、私人导师,甚至私人医生等。
为什么只有富人能够享受这些服务呢?因为直到现在,软件还没能替代这些高端定制化知识工作——直到现在的 AI 技术终于可以做到。
未来几年,我们预计 AI 将能够承担大部分这类个性化知识工作。因此,如果你正在开发将 AI 助手带给每一个普通人的服务,我们非常期待听到你的创意。
为 AI 代理构建开发工具
在过去的两年里,我们资助了许多使用 AI 来颠覆传统行业的初创公司。
现在,我们正见证着下一个浪潮的到来:AI 代理,它们不仅仅是人类的助手,还是能够自主做出决策的系统。随着 o1 和即将发布的 o3,这些代理的推理能力显著提高,能够完全复制甚至超越人类完成的任务。
AI 代理将在各个行业及我们的日常生活中无处不在。想象一下一个世界,在这个世界中,每个人都拥有一个专门的 AI 代理团队,它们在后台无缝协作,提升个人的生产力和创造力。
为了加速这一未来的到来,我们希望资助那些致力于为 AI 代理开发开发工具的初创公司。这些工具可以包括:
• 代理构建工具: 使用户能够轻松创建和部署定制代理的公司,比如 Wordware(YC S24)或 Stack AI(YC W23)。
• 代理构建模块: 增强代理能力的工具、API 或平台,使它们能够执行更复杂的任务,取得更大的影响。
如果你在这一领域进行开发,我们非常希望听到你的想法,帮助你塑造软件的未来。
软件工程的未来
大型语言模型(LLM)现在已经能够编写比大多数人更好的代码。这将使得软件开发的成本降到几乎为零。
那么,代理会取代软件开发人员的工作吗?答案是不会!未来我们仍然需要更多的软件工程师,因为软件将控制几乎一切。
这些工程师将不再直接编写很多代码,而是管理一组 AI 代理来为他们编写和发布软件。除了编写代码,代理还将承担软件开发过程中其他所有专业任务:质量保证(QA)、部署、安全性与合规审计、翻译、运营等。
我们希望资助那些能够帮助小型通用开发团队管理大规模 AI 代理团队,共同开发和交付大量软件的初创公司。
如果你有兴趣为软件工程的未来构建工具,我们非常期待与你交流。
AI 商业化开源软件(AICOSS)
开源和开源初创公司有一个明显的模式。首先是专有的 Unix 系统,然后是 Linux,再到 RedHat;首先是 BitKeeper,然后是 Git,接着是 Github 和 Gitlab。
如今,在开源 AI 领域,也存在着巨大的机会,构建提供支持和服务的初创公司,帮助人们使用开源 AI。
通常情况下,发布开源代码的组织并不专注于提供商业支持。例如,谷歌和 Facebook 曾开源了多款工具,但他们并不总是专注于为企业提供这些工具的商业化支持——这为初创公司带来了机会。
在开源 AI 领域将会涌现出许多成功的公司,尤其是在 DeepSeek 推出之后,市场上会有许多新的领域等待创始人去开拓,帮助企业利用这些系统。
如果你有兴趣在企业级开源 AI 领域进行开发,我们非常希望听到你的声音。
AI 编程代理:硬件优化代码
• Diana Hu
AI 硬件仍然受到软件的制约。Nvidia 的优势很大程度上源于其 CUDA 手动优化的代码在 AI 模型中的应用。而其他竞争性的硬件——如 AMD 或定制芯片——常常表现不佳,原因不仅是芯片性能较差,更因为编写系统级代码(如内核、驱动程序)极为复杂,而从事这一工作的软件工程师远远不足。
然而,现在随着像 Deepseek R1 或 OpenAI o1 和 o3 这样的推理模型的出现,它们可以生成与人类 CUDA 代码相媲美,甚至超越的硬件优化代码。
我们希望看到更多的创始人致力于开发 AI 生成的内核代码,使得更多硬件平台能够为 AI 提供更好的支持。
这不仅仅是关于性能问题,更是关于打破依赖关系。致力于这一领域的创始人有可能重新塑造整个硬件生态系统。
B2A:客户为代理的服务软件
如今,互联网流量中有相当一部分来自非人类程序,它们在抓取信息,伪装成人类进行表单填写或搜索更新。大多数人构建网站时,都是以人类用户为主要目标,而不是考虑这些抓取程序。
随着 AI 和代理的普及,建立针对 代理客户 的软件和服务似乎变得尤为重要,这样的客户不仅是边缘案例,而是被积极支持和文档化的客户群体。
例如,构建帮助代理支付托管费用、预定旅行或与其他方签订合同的 API。在股市中,人类和程序的交易早已是常态,未来这种现象只会愈加普遍。
如果你有意开发专门为代理服务的软件和服务,我们非常欢迎你与我们分享你的想法。
推理 AI 基础设施:应对测试时计算需求
• Diana Hu
直到最近,计算资源的开支主要集中在预训练基础模型上。但随着 Deepseek R1 和 OpenAI o1 与 o3 的推出,出现了一种新的扩展趋势,表明我们在推理阶段,也就是 AI 应用实际使用这些模型时,将需要更多的计算资源。
随着 AI 应用的 API 调用量暴增,基础设施的成本将成为一个严峻问题。
这时,新的初创公司便可以提供解决方案。我们需要重建这一领域的技术栈:在推理层面提供更好的软件工具,开发出更经济的 GPU 负载处理方案,以及让 AI 应用能够扩展而不至于面临巨额成本的优化技术。
这类低调却至关重要的问题,往往会带来巨大的商业机会。
关注公众号 技术后花园 获取更多信息