图片来源:Semafor
Z Highlights
如果咱们能同期在智能和高下文这两条轴线上都作念到天然、流通、无缝,何况让UI保持熟谙感,那么agent和个性化就真的被“攻克”了。
如果咱们能同期在智能和高下文这两条轴线上都作念到天然、流通、无缝,何况让UI保持熟谙感,那么agent和个性化就真的被“攻克”了。
真的让硬件显得荒芜的,是软件。手机上最大的放手,并不是无法像一些监听斥地那样取得手机外部的高下文,而是在于怎么已毕一种有agent才略的AI,能够调用第三方应用并替你实施任务。
真的让硬件显得荒芜的,是软件。手机上最大的放手,并不是无法像一些监听斥地那样取得手机外部的高下文,而是在于怎么已毕一种有agent才略的AI,能够调用第三方应用并替你实施任务。
伸开剩余96%自动驾驶不单是适用于物理交通,也适用于数字劳顿——有点像Elon说的那样,Optimus这个东说念主形机器东说念主是Tesla的下一个篇章,因为他们会把通盘为“从A点到B点出动”所构建的时间,蔓延到完成多样时势的实体服务。当今发生的事情亦然类似的——你把原来用于实施多法子搜索、多法子操作的时间,膨胀到完成多样时势的数字劳顿。它并不是为了单纯取代东说念主,而是为了增强东说念主类,相等于为他们提供一个“自动驾驶”模式,让他们腾出更多时分。
自动驾驶不单是适用于物理交通,也适用于数字劳顿——有点像Elon说的那样,Optimus这个东说念主形机器东说念主是Tesla的下一个篇章,因为他们会把通盘为“从A点到B点出动”所构建的时间,蔓延到完成多样时势的实体服务。当今发生的事情亦然类似的——你把原来用于实施多法子搜索、多法子操作的时间,膨胀到完成多样时势的数字劳顿。它并不是为了单纯取代东说念主,而是为了增强东说念主类,相等于为他们提供一个“自动驾驶”模式,让他们腾出更多时分。
Aravind Srinivas是Perplexity Al的搭伙创举东说念主兼CEO,曾在OpenAI、DeepMind等机构从事东说念主工智能酌量。Reed Albergotti是Semafor科技版主编。本次视频发布于2025年8月,Aravind Srinivas与Reed Albergotti进行了一场涵盖粗俗语题的对谈,内容触及公司推出的新Comet浏览器、AI竞赛的近况等。
Comet 浏览器的第一印象
Reed Albergotti:寰宇好,我叫Reed Albergotti,是Semaphore的科技剪辑。作为别称记者,我报说念科技规模还是高出10年。我的大部分时分似乎都花在打电话上,或者越来越多地是在视频通话中,尤其是自从疫情以来。好多采访都是为了纸媒著述准备的,但会有好多内容被“剪掉”而莫得发表。是以我想,也许我可以尝试一种新方式,便是把本来就要作念的采访录成视频,然后径直发布到YouTube。今天,你会看到我和Perplexity搭伙创举东说念主兼CEO Aravind Srinivas的对话。Perplexity是一个AI搜索引擎,他们当今有一个刚劲的构想,便是将他们推出的浏览器Comet Browser打形成一种类似AI操作系统的存在。我还是试用了这款器具,它至极刚劲,也能让你感受到,当AI真的初始在咱们的生存中说明作用时,将来的发展场所会是什么样。此次对话里有好多精彩的内容,但愿你们心爱。在以前两周我度假期间,我也在试用Comet。我的嗅觉是——它的功能真的很惊东说念主。我之前发过一条帖子,说我致使可以径直在United上订票或改签,然后让sidecar自动帮我完成。类似这样的事情至极绵薄。会让东说念主赞美——哇,这真的可以看到你们的愿景,便是把它作念成一个操作系统,对吧?
Aravind Srinivas:如果咱们能处理那些异步的、可访佛的经过任务——这些任务不需要及时运行、但会及时更新用户的情状——那么它就会初始让东说念主有“操作系统”的嗅觉。因为从根柢上来说,操作系统的一个性情便是有情状和后台进程,这些进程会有任务的运行程度情状,何况能自动保存情状、不相互摧折,有清爽的内存管制,同期让用户对通盘正在进行的操作一目了然。依赖关系、内存管制,这些都是咱们需要在agentic层面上构建的功能——不外对象是天然语言任务,而不是硬编码的系统。这样一来,浏览器本身就会像是你电脑中的一台“迷你电脑”。当你的浏览器可以通过腹地MCP与电脑上的其他应用勾通时,它简直就像是“主应用”,而其他应用是它的外设。天然,这并不是咱们的想法——咱们并不条件用户只可用Comet。比如你用iMessage发几条信息是完全没问题的,不一定要通过Comet。但如果你满足让Comet探访iMessage数据,那它也可以在职务中计议到这些信息。
举个例子,我可能在iMessage上和你聊天,但咱们之间的日程和谐可能是在电子邮件里进行的,而且你可能还在短信里给我发过一些札记。电子邮件并不可探访这些短信内容。假定我在开会前说“帮我准备一下和Reed的会议”,Comet可能和会过勾通Calendar和Email来取得相关信息,但如果莫得iMessage的权限,就无法调取短信内容。而咱们不可把牵累推给用户——不可说“用户错了,因为他没用Gmail”。用户可以随性采用WhatsApp、Signal、iMessage等器具,AI必须自身治理一切,自动编排所需的全部高下文。这便是好多东说念主称之为“context engineering”的东西。
是以你可以把它贯通为两条轴线:一条是智能水平,另一条是高下文与个性化。智能水平可以从GPT-3.5、GPT-4、GPT-4.5、GPT-5一齐普及,就像“高中水平”“博士水平”“能自身发明东西”的阶段。而高下文轴线则是从帮你写邮件的粗陋任务,发展到真的能替你实施复杂的、永劫分跨度的访佛任务,比如在你不想参加的会议上代替你、或帮你完成一些不想自身作念的事。
在我看来,浏览器便是高下文的“GPT-5或6”,因为它能探访咱们生存和责任中简直通盘的内容。你天然可以用一些硬编码的顾忌功能来调取过往对话,但浏览器才是终极的高下文载体。如果咱们能同期在智能和高下文这两条轴线上都作念到天然、流通、无缝,何况让UI保持熟谙感,那么agent和个性化就真的被“攻克”了。
Reed Albergotti:是以你是说,它能限定通盘这个词电脑,但当今好多东西本身便是基于Web的,或者至少都有Web版块,比如iMessage,我谨记它也有网页版。我在不同浏览器之间切换,有时会遭受一些问题。比如我想对照我的信用卡账单和日期信息,并配置策划,但目下它还作念不到。我猜这便是你刚才说的那些放手。那么问题是——这些放手主若是模子施行态成的,照旧你们围绕模子所构建的一切形成的?
Aravind Srinivas:如实存在模子本身的放手,比如当今咱们没法完成某些任务。咱们天然会受到当前模子才略的拘谨——就像咱们第一次碰面时,Perplexity还在运行GPT-3.5,那时它还是被好多东说念主认为是很道理道理的居品了。但如果我回头看,会说比较今天的版块,阿谁版块幻觉至极严重。
Comet当今的agentic才略,就相等于Perplexity在2022年底(GPT-4出来之前)的谜底引擎才略。再往后,等有一个比O3更强、具备更好长高下文才略、更可靠的指示实施才略、能进行多步操作和器具调用、同期价钱更低何况有更多开源替代决议的模子出当前——那一天一定会到来——Comet就会变得更可膨胀、更低廉、更可靠。是以咱们不想比及阿谁时候才初始构建Comet。这种念念路不太对。因为在AI规模,你必须在定位居品、时间和当前的时间栈时,默许假定模子晨夕会变得很强,而且会很低廉。
Reed Albergotti:这其实便是你作为颠覆者的上风,你一直在和谷歌竞争,显著OpenAI也在作念竞争居品。但你的道理是,你们满足推出一个还没完全进修的居品。这便是创业公司能作念到的事,大公司就不一定会这样干。这有点像翻新者的逆境。
Aravind Srinivas:哦,但也不可说是“还没准备好”。它还是满盈有用,可以让东说念主真的用起来。自从咱们发布以来,用户发起agent查询的比例,以及把Comet设为默许浏览器的比例,其实一直在稳步增长。这说明它还是能从Chrome、Edge以过头他浏览器手里抢下商场份额。但咱们的想法不是在老的商场上竞争,而是想打造一个新的生态:一种“agent浏览器”的全新址品类别。因为传统商场是不会隐匿的,咱们不是在玩他们的那套生态。而当你是第一个入场的,那细目是站在刀尖上。但显豁好多用户满足在它还不完好的情况下就尝试它。咱们的等候名单还是接近一百万了,从浏览器发布以来翻了一倍。好多东说念主满足在居品有时弊的情况下也去用它,这说明它的价值被招供、被期待。我也深信,这个趋势只会越来越强,尤其是当更多玩家干预这个新商场,比如OpenAI给浏览器加上了agent功能。Chrome也一定会作念点什么。而跟着更多大玩家入局,普通东说念主对“运行一次agent查询”这个见地的通晓会普及,东说念主们会从容初始通过浏览器自动化自身责任和生存的一部分。到时候,浏览器对每个东说念主的道理都会变了——它不再只是用来作为互联网前端的器具,而是会初始像一个操作系长入样存在。
天然我用的是iOS、Android、Windows或macOS,但这个浏览器本身会成为帮我统筹安排大部分生存和责任的主要经过的中枢,其他后台进程反而不重要。这便是咱们里面设定的想法,亦然咱们作念Comet的原因。
AI 时间中的旧民风
Reed Albergotti:它如实有用。这有点像互联网刚兴起的时期。那时候寰宇还会在地址栏输入“www.xxx.com”,有东说念主告诉你,“分歧,你径直在搜索栏打就行了”。AI当今的阶段就有点像那时候。致使我自身在用电脑作念一些事时,也会想——这事用AI作念更合理啊,但便是民风性用老按次。
Aravind Srinivas:我亦然。主要两个原因:一是民风了,二是还是练得很熟了。比如,我很擅长找邮件,因为我的顾忌力好——无谓搜“我和Reed前次聊某个话题的邮件”,我就能凭顾忌大商定位时分和关键词,径直找到。但这项妙技在将来会像“手算两三位数乘法”一样没用。小时候我也会这些,当今谁在乎呢?计较器、AI都能作念。相同的,像背体育明星的统计数据,以前在一又友中很酷,当今没东说念主温文,你径直谷歌或用Perplexity查就行了。冷常识、年份、历史东说念主物这些也还是不再是约聚上的妙技。
Reed Albergotti:真奇怪LinkedIn自身都没作念这个功能。
Aravind Srinivas:对啊,这亦然我用Comet后的一个重要感受——咱们没必要等各个网站自身去作念AI功能。咱们也无谓为每个网站作念单独的前端、单独的勾通器,也无谓让用户依赖它们的“专属AI”。咱们只须作念一个“通用agent”,像一个sidecar一样一直在你身边。无论你在Notion、LinkedIn、Linear、GitHub、Slack、Salesforce,照旧在Databricks、Snowflake写SQL查询,你都能让Comet看一眼帮你优化,根柢无谓复制粘贴去Slack求援再回来改。这种嗅觉真的很荒芜,就像寰宇假想中的“一个AI助手帮你处理通盘事”的愿景。良友毕它,不单是模子变强,还要把它放在一个对东说念主类来说无缝的使用环境里——AI和东说念主类分享并吞个前端,而不是分开。
Reed Albergotti:听起来还可以作念一个专门面向“老一代用户”的功能——AI在后台不雅察你日常操作,然后给你保举更高效的责任流,比如“你每天都这样作念,其实可以省下好多时分”。
Aravind Srinivas:对,这便是逸想情状——AI在看你稚子又低效地作念事时,会忍不住提醒你:“嘿,要不要试试这个?”但它不可让东说念主以为是在倾销自身、想让你付费——不然就变成垃圾信息了。难的不是写出“主动提醒”的prompt,而是写出既主动又让东说念主以为“哇,这太酷了”的prompt。若是作念不到,就别主动,因为一朝用户以为烦,以后通盘的提醒都会被忽略。
Reed Albergotti:对,还有一个信任问题——不仅是信任AI能作念善事,还要信任它处理你的个东说念主信息。我发现Comet好像不会去要我的密码,对吧?
Aravind Srinivas:对,这恰是浏览器架构的魔力所在。它根柢不需要知说念你的密码——只须你把旧浏览器的cookies导入进来,就能径直保持登录情状。而且当你登录第三方网站时,你是在用东说念主类的方式登录,不是给AI登录的。这样一来,AI也就无法代替你登录、接纳账号,这在安全性上比通过服务器中转要好好多。
Reed Albergotti:嗯,这很故道理。我刚才其实在想——可能只是个小事,但比如说我用1Password,往往要登录。
Aravind Srinivas:是啊,这方面是可以作念到的。
Reed Albergotti:对,可以作念到。不外好像有些地方还不够完善,是吧?
Aravind Srinivas:对,这个他们会修好。iCloud密码这块还在等,因为咱们还没拿到苹果的批准去维持它。
Reed Albergotti:既然说到苹果,我很好奇,因为这是基于Chromium构建的,而在iOS上,你只可用WebKit作为浏览器引擎。是以你是野心换一种方式让它在出动端可用,照旧不野心作念出动端?
Aravind Srinivas:在iOS上,你是没法用非WebKit引擎来渲染的。通盘iOS浏览器都必须用类似Safari的WebKit引擎。是以一种可行的按次是用跨平台的决议,比如Kotlin Compose Multiplatform,你大部分代码都用它写(这有点像Java,咱们这里简化说法),然后它会编译成SwiftUI代码,再上架到AppStore。
时弊是你可能不可用最优的方式去作念通盘事,优点是你不需要为iOS和Android辩认写两套代码。Android是维持Chromium的,是以这样可以复用咱们在MacOS和Windows上还是写好的好多代码。另外iOS上还有一些放手,比如后台进程不可在客户端一直运行。如果App退到后台,它只可实施很短一段时分的任务,比如2–3分钟。如果是那种需要客户端和服务器频繁通讯的“agent”任务,就只可在短时天职完成。比如必须30秒内作念完,不然用户可能还是去看YouTube或Netflix了。是以架构上的挑战是:要么搞一个云表编造浏览器,让它帮你在后台跑这些任务;要么如果你至极介意诡秘,那就必须让用户留在App里等它跑完,但这体验挺烦的。
咱们也但愿苹果能在政策上更天真,比如对运行agent的App放宽后台运行时分放手。苹果天然会顾忌安全风险,比如黑客借这个后台进程入侵iPhone、限定其他App或窃取数据。咱们但愿能和他们一齐找到解决办法,在此之前会尽量先作念咱们能作念的部分。
Perplexity 会干预硬件规模吗?
Reed Albergotti:这些iOS(以及在较小程度上Android)的放手,是不是亦然你和其他东说念主谈到要作念硬件的原因之一?
Aravind Srinivas:我对硬件的景仰,不是因为苹果的政策放手。如果你真要作念硬件,就必须作念手机。你绕不开手机。天然,你也可以作念一些苹果都备不会让你在手机上作念的事,比如24/7后台监听通盘对话,像个“间谍灌音机”。但这便是Johnny和Sam想作念的那种斥地——比如你在讲话,不想盛开MacBook去敲ChatGPT领导词,它就能径直帮你。其实用iOS的语音快捷方式还是能作念到发问了。惟一能超越手机的,是AI无谓你发问就能一直听,然后主动给出建议。但这前提是你得开着灌音。如果iOS不让你这样干,你就得作念个别的斥地,比如挂件、项链、扬声器、麦克风或耳机。不外即便作念硬件,你照旧没法限定其他App,除非作念个浏览器,或者这些第三方App给你API接口。
是以硬件并不可真的解决这些问题。它只可多取得一些用户日常的高下文信息,但这远不如通过浏览器取得高下文有用。浏览器还更安全、用户体验更好;而一直灌音取得高下文这种方式,诡秘风险太高了。假想一下你在和一又友说很奥密的事,它也在录……那嗅觉挺吓东说念主的。浏览器里你可以用隐身模式,零陈迹搜索,删掉查询;而及时灌音是径直把你的环境音发到服务器上转写,这权限太大了。
Reed Albergotti:如实。不外我也好奇,东说念主们今天满足作念的事情,和10年前比变化挺大。
Aravind Srinivas:我并不是反对有比手机更好用的AI斥地。比如去看大夫时,如果咱们都有个斥地能把对话转成笔墨,自动生成札记、整理成病历,我也能带去看其他大夫,这就很绵薄,无谓第三方的数据库。只是为什么这些不可径直是iPhone上的App呢?一些特定行业的场景,比如记者采访,也有App能灌音、自动转写、分变装,然后整理成写作札记。这些功能用斥地也能作念,但iPhone还是让大大宗灌音斥地没必要存在了。有东说念主还在用是因为怀旧,不是因为它更实用。
Reed Albergotti:你之前说过想作念硬件,那是改主意了,照旧说野心造手机?
Aravind Srinivas:不,我当今莫得作念任何手机,也莫得在作念硬件神气。真的让硬件显得荒芜的,是软件。手机上最大的放手,并不是无法像一些监听斥地那样取得手机外部的高下文,而是在于怎么已毕一种有agent才略的AI,能够调用第三方应用并替你实施任务。
因为说真话,寰宇总爱品评苹果,但其实在好多方面Android比苹果还更顽固。至少苹果会提供SDK,让你探访他们自家的原生应用,比如AppleMail、Podcast、AppleMusic、Notes、Calendar。Android这边简直什么都莫得,你必须通过GoogleCloud身手探访Gmail和日期,即使它们是原生应用。最大的放手,其实是像Uber、DoorDash、Amazon这些应用,你根柢没法径直调用。它们之间有“防火墙”,是以你只可通过浏览器探访,把这些第三方应用手脚是出动浏览器上的标签页来盛开。问题是,当今简直没东说念主温文出动网页的爱护了,寰宇都只为App开发,是以开发者也不会花时分去爱护网页版。这就让AI agent很难使用它们。天然,也有公正——agent并不在乎UI有多烂,只须信息都全就能用。关键是责任流必须可用,比如点击按钮真的要触发动作。如果前端和JS代码有bug,而且没东说念主爱护,那就疼痛了。
是以更大的挑战,其实是把出动浏览器作念到跨平台、异步、安全、诡秘有保险,并维持语音限定。如果能把这套软件打磨好,硬件反而会是个巨大的搅扰身分。一朝出动浏览器体验被透顶解决,它就会成为你手机上的“全能App”。到那时,才值得去假想作念一款以浏览器为核神思较平台的手机——那会是个很故道理的场景。
Reed Albergotti:是啊,这样你简直可以假想一种手机,它能曲折限定其他应用——就像你刚才说的那样,可能是通过“跳起原机”,比如在云表的某个编造计较环境或容器里运行,然后再通过网页界面来操作。就像在手机外部实施一样,对吧?
Aravind Srinivas:对,因为你也可以假想另一种将来——一些第三方应用会把自身概述成后端API或MSP服务。是以咱们在这方面很天真、很求实,并不想绑死在一种惟一的愿景上,这亦然我不太心爱MCP的地方——你要么全盘接受它,要么完全无谓,它简直不兼容其他决议。而咱们Comet的策略是尽量兼容,比如MCP咱们也会维持,因为当今好多模子都在后考验阶段被调成兼容MCP,如果agent在这种条约下运行得更好,那咱们就会确保条约能够让第三方应用顺利勾通到模子、取得高下文。至于是通过agent调用电脑,照旧径直走后端API,都无所谓。
Reed Albergotti:既然说到买卖模式,你提到有一百万东说念主在等候名单上。是不是因为这些功能真的很耗Token、很贵?
这里还有好多未知数,只可边走边解决,比如用户上报的bug,咱们要去开发,还要给Agent配置一套严格的评测体系。不是针对“回报”功能的评测——回报部分咱们还是作念收场。这里是针对Agent的评测。因为这是惟一能跟踪真实进展的按次,而且很难已毕自动化考证任务完成情况。这不像写代码题,有惟一的正确谜底。完成一个网页浏览任务的按次可能有好多种。咱们要构建自动化的、不休膨胀的评测联结,同期保证基础设施不出问题。
领有AI 酌量布景的上风
Reed Albergotti:领有真的的AI酌量者布景有多大匡助?我采访过你在伯克利的一个西席,他说你本可以成为AI西席,水平便是阿谁级别。给不雅众一个布景感知吧。作为一个从基础层面贯通AI的东说念主,这对你判断模子朝上速率、什么时候推出什么居品,有多大匡助?
Aravind Srinivas:匡助很大,不单是我,我的搭伙创举东说念主Dennis也有很强的布景,他在后端基础设施上比我更猛烈。他作念过搜索,曾在微软Bing责任,对那块很熟。他还和我的另一位搭伙创举东说念主Johnny一齐,打造了Quora的保举算法。他们不仅懂可膨胀的后端系统,也懂AI和神经收罗的考验与推理基础设施,能在老本和质地之间作念出合适的采用,作念出可持久撑持的架构决策,而不是短期的临时补丁。我和他们和谐学到了好多。
与此同期,我的资格更多是在系统性念念考任何问题,把问题本质索要出来——这是我在博士期间磨真金不怕火出来的才略。准确来说,这不单是AI酌量妙技,而是解决问题和推理的才略。因为我当今并不紧跟每一个模子的最新细节,天然我会追论文、会批判性地看,但我并不明晰像O3或Sonnet4这种系统考验时用的每一个技巧,比如它们是何如作念蔓延推理的,何如在长高下文中保持推理才略,以及怎么确保跟着高下文窗口变长,指示罢黜才略不会下跌。我当今还是不知说念他们在预考验或后考验里作念了哪些细节了。以前到GPT-4之前,我还能跟得上,也能跟踪这些东西。但之后的进展实在太快,而且大部分都是闭源的,是以很难了解。尽管中国这边的出书物、论文和演讲会谈到好多基准测试和筹划,但他们其实并不会讲自身用了哪些数据集,也不会说后考验作念了什么处理。是以很难真的贯通。
不外,我倒口舌常明晰另一件事——比如一个查询没跑通,或者用户讲演了一个bug,咱们公司里包括我在内的时间顶尖东说念主员,都可以坐窝判断问题是出在哪:是搜索索引有问题?照旧查询改写得不够好?或者是agent路由器在拆分法子时没拆对?照旧终末总结阶段出了错,天然前边法子都普通?
咱们有一套很完善的经以前定位并解决问题,而我至极心爱这个过程。它让我能络续关注细节。因为基本上,这就像是我在公司里作念一个带有工程念念维的客户维持代表,这会让你很快感知居品确当前局限,以及它会在什么地方出问题。而另一个很有匡助的点是——我自身便是用户。我会真的、连续、律例地用咱们的居品,不仅是为了测试,而是像普通用户一样用。如果对我来说它都不好用,那我也会痛恨。比如我浑家亦然咱们居品的重度用户,她给我起了个花名叫“容易痛恨的专科用户”。她往往会说:“如果有东说念主往往遭受bug,那他们为什么还要付钱用你的居品呢?”前几个月有bug还可以接受,但两年后还这样就不行了,你必须去修好这些东西。她的响应很合理。
我贯通修bug很难,每个工程师手上都有二十多个事情要作念,而且没东说念主满足每天醒来都去修一堆bug,这会消磨掉构建新址品的乐趣。但施行上,只须每天修掉上千个bug,你身手率先竞争敌手。好多东说念主会问:“Perplexity能作念到这个,为什么Google不行?”原因是这里有千千万万个bug,而且都是新的。Google搜索以前没遭受过这些问题,因为这是一整套新的时间栈,是为将来而构建的,不是把某个东西塞进旧系统就能立时跑的。这便是为什么需要时分。这亦然为什么Google吸取了告诫。之前在AIoverview里出现了多样滑稽的幻觉,他们还是厚实到,如果自身不再是行业之王,那就必须放低姿态,把事情按正确的方式来作念。
Reed Albergotti:趁机说一下,你以为Google当今何如样?他们处境挺难的——AI酌量作念得很强,是这个规模的蛊惑者,但买卖模式上总有一天要计议自我蚕食。你以为Sundar的进展怎么?
天然,这些业务的利润率莫得搜索告白那么高,这照旧个风险。他们必须承认,有时需要经历几年阵痛,身手更强地纪念。如果他们能走出来,就会像微软当今的情状——我不是贬义的道理,只是说微软如今是一个多元化的公司。微软不单是Windows,还有Azure、SQLServer、服务、游戏、LinkedIn、Github、Bing等等好多业务。Google也会变成这样——领有多元的业务组合。不外,搜索的利润率会连续下跌,这是毫无疑问的。因为AI agent型搜索最终必须站在用户一边才会赢,而不是去趋奉告白商。当你能真的为用户提供价值时,用户会付费,但他们付的钱永远不会像告白商那么多——毕竟每个东说念主的口袋都是有限的,而告白商有大把预算可花。是以,他们怎么弥补利润的缺口?办法便是去打造更多利润率可以的业务,让商场招供他们营收的多元化,而不是只盯着高利润率。这样市盈率也会被撑持。他们的战术很清爽——每次看财报电话会议的记载,重心都是:咱们业务好多元,搜索只是其中一部分。
Reed Albergotti:挺故道理的,好多东说念主可能没厚实到,你不仅有AI酌量布景,其实你也很热衷买卖,热衷于运营公司和组织。我挺好奇这景仰是何如来的。
Aravind Srinivas:我谨记IlyaSutskever发过一条推文说:“为什么管制东说念主这样难?这未便是用天然语言作念散播式编程吗?”那条推文当今还在,他没删。说到底,买卖并不是“去吃吃喝喝、说几句有魔力的台词、作念SteveJobs那样的营销”那么粗陋,而是要切身埋头去作念。归根结底,它是一个问题求解过程,你会有多样拘谨。
作为初创公司,咱们的拘谨荒芜多,比如莫得品牌。我很明晰,一切都和分发相关。有了分发,你就会有另一类拘谨——比如你不可像Perplexity这样无尽快地迭代,你不可每天让20个bug上线,因为在十亿用户的限制下,这种bug会真的损伤你的品牌。是以你需要配置一套妥当这种限制的系统和经过。天然,这种限制也有它的上风。比如即使你发布一个别东说念主7个月前就作念过的小功能,也会被矜重对待,因为你有十亿用户的基础。
是以我理解,这到头来便是个拘谨优化的问题。这个妙技并不是酌量独到的,它适用于生存中的任何事。就算是家庭问题、预算有限,寰宇都会想出自身的创造性解决决议。
Reed Albergotti:但你对这事如实有表情。这是你从小就有的,照旧其后学会的?
Aravind Srinivas:不是天生的,是我其后培养出来的,Google对我影响很大。我那时深入酌量过这家公司。
Reed Albergotti:你还看过《InthePlex》之类的书,对吧,咱们之前聊过。
Aravind Srinivas:不单是是那些事。我知说念寰宇都在写那方面的东西,但他们还有一些居品回味是我很心爱的。举个例子,我谨记Kevin Crom在某个播客里提到过,他在创办Instagram之前是谷歌的居品司理,也曾参与Gmail神气。为了让你输入用户名和密码后邮件能至极快地加载出来(这是其他邮件客户端作念不到的),他们会在你输入邮箱的时候,就诈欺cookie知说念你的用户名,何况在你输入密码的过程中,提前、预判性地初始拉取邮件。这样用户就不会感到延迟。
这种极致优化的念念路,只须那种真的想让用户精辟、致使在用户建议需求之前就提供体验的东说念主才会有。咱们当今作念一些小功能时,也会套用这种理念。比如说,当你开启语音模式时,致使在你鼠标移到系统按钮隔邻,咱们就能提前向服务器发起勾通苦求。这类挑战是我荒芜心爱和工程师们一齐解决的。
Perplexity 的营销念念路
Reed Albergotti:你们之前也作念过一些品牌告白,后果何如样?
Aravind Srinivas:李政宰(《鱿鱼游戏》的主演)那支告白后果荒芜好。简直莫得东说念主说它不好,可能谷歌的东说念主不心爱吧,但其他东说念主都以为很棒。Instagram上的播放量有好几千万次,而且寰宇以为咱们花了好多钱拍,其实制作破耗很低。
Reed Albergotti:是找创意公司作念的吧?你参与多吗?
Aravind Srinivas:我参与挺多的。我、公司另一位高管DmitrySheleno,还有品牌团队的几位共事一齐作念。我那时的条件是告白要有一种“闯关”的嗅觉,毕竟是《鱿鱼游戏》的男主出演,他要回报问题、通过关卡。Dmitry还建议场景要有点像《东说念主生切割术》和《鱿鱼游戏》的结合。咱们一齐挑了一些问题。比如阿谁“披萨奶酪”的问题,我谨记可能是我或者Dmitry想出来的。咱们想让告白更道理道理少量,还顺带援用了之前AI给出过的一个搞笑装假谜底(说奶酪粘不住要用胶水)。是以咱们在告白里给了正确谜底,同期加一句“不要用胶水”,算是个彩蛋。
咱们挑的问题都是那种当今用ChatGPT或Google都能查到、而且谜底靠谱的事,不会选荒芜复杂的,比如“乌克兰GDP和乌干达比是些许”——因为如果你在酒吧或者Instagram刷到告白,没东说念主温文这个。要收拢普通东说念主。我得感谢MrBeast,咱们开过会,我跟他聊过这个见地。他说如果想法是让上亿东说念主看到,就得保持非常粗陋。比如比较Perplexity和Google——通盘东说念主都知说念Google,而且告白里谜底有显豁区别,最佳是一些日常问题,比如“衣着上有污渍何如办”或者“披萨奶酪没粘好何如办”。
我以前作念告白时犯舛错——拍得很良好、很含蓄、想讲深层主题,但没东说念主看懂。当今既然“流量之王”亲口告诉自身法,那天然要听他的。
Reed Albergotti:这也挺故道理,因为你很会玩Twitter。
Aravind Srinivas:其实我不是荒芜心爱那种直怼别东说念主、搞表情包的方式,这不是我的性格。但算法便是会奖励这种作念法。
我谨记Mark Andreessen跟我说过,在Twitter上永远不要发100%正确的东西,因为没东说念主会介意。最逸想的互动量,来自那些50%正确、50%装假的内容。但要找到那种“刚好一半对、一半错”的说法其实很难,是以哪怕是60/40或70/30,也能有可以的互动量。比如说,如果你发“英伟达是全球最有价值的公司,他们作念得太棒了”——天然是真的,但没东说念主会互动。
Reed Albergotti:记者很难去发“有意一半错”的东西。
Aravind Srinivas:是啊。记者更多是靠爆料,比如Mark Gurman,他的互动量就来自于爆料。
Reed Albergotti:没错,爆新闻是记者的中枢责任。他好像还爆料过你们被收购的音讯。
Aravind Srinivas:对啊,还有东说念主说是Ben Evans之类的东说念主在咱们活动时有意放音讯,制造并购传说。但咱们很明确莫得那样作念。咱们对外的官方声明是“不知说念有任何并购活动”,而且那时只是Meta的报说念和Apple的报说念赶巧时分接近。咱们还是很明确地说过不想被收购了。我还在CNBC的采访里径直说过,我但愿袖珍科技公司能赢下去,咱们要络续走下去。莫得比这更明确的表态了。
在咱们推出Comet之前,好多东说念主还不明晰咱们到底要作念什么,公司是不是在和ChatGPT或Google正面竞争。但Comet发布后,东说念主们很快就理解了咱们的场所、为什么它道理紧要,以及为什么一朝用户登录Comet,他们在Perplexity上的查询量会成倍增长。这是一种“倍增效应”。而且,Comet的限制化分发,比起Perplexity,要容易得多,因为你可以在买卖化场所作念好多事情。
这亦然我对公司新篇章感到原意的原因。有点像Google在推出Chrome之前先作念的Google器具栏,这个居品那时帮了他们很大忙。器具栏的分发方式很贤达:每当你安设某个桌面软件,Google会付钱给这些软件公司,请他们顺带帮你在浏览器上装上Google器具栏。毕竟微软的IE不会主动帮Google作念这个。这样一来,IE就被“打了补丁”,装上了器具栏,Google从器具栏带来的查询量增长了七到八倍。然后他们会把这部分新增流量的告白收入分红给那些和谐的桌面软件公司。靠这种方式,Google扩大了分发限制,而那时负责这个神气的恰是Sundar,其后他也主导了Chrome。
好多东说念主其实不睬解分发有多重要。分发不单是用钱让别东说念主把你放到搜索栏上——那是老一套玩法,根柢无法和Google竞争,因为他们的单次搜索告白收益远高于你,还掌执着通盘这个词告白收罗和流量生态。是以你必须走出自身的说念路。对咱们来说,智能agent、买卖化才略以及浏览器,可能便是这条路。
Reed Albergotti:那Meta有找过你们吗?
Aravind Srinivas:我不可批驳他们是否宣战过咱们,但可以说,咱们当今对任何并购都不感景仰。咱们对任何买家来说都是个高风险的赌注。就算Meta想作念浏览器,他们竞争的对象也不是咱们,而是Google。Google的资源远大到惊东说念主——简略他们当今不会太把咱们当回事,但如果OpenAI也再次干预浏览器商场,他们就会病笃起来。那如果Meta也来作念浏览器,这个战场会愈加热烈。风险在于“年老”太刚劲了,大到无论是巨头照旧创业公司,好多东说念主根柢不敢尝试。但咱们至少满足去试。最终只须两种可能:要么赢,要么死。如果赢了,那便是在极其刚劲的敌手眼前取得的收效,这会格外故道理。
Reed Albergotti:Ilia以前说过,同期在AI和居品两个层面发力的规模只须两个:自动驾驶和搜索。你以为这句话当今还缔造吗?毕竟你们当今还是干预了浏览器规模,某种道理上这就像一个操作系统了。
Aravind Srinivas:这个说法基本照旧对的,但当今可能出现了第三个类别——它是搜索和自动驾驶的结合体:浏览器上的智能agent。浏览器就像一辆车,agent就像自动驾驶或FSD。咱们当今还处在“自动驾驶援手”阶段,还没到完全自动驾驶的程度。即便FSD有一天完全可行了,东说念主们可能照旧会偶尔想自身开车,为了怀旧,或者只是单纯以为好玩。
领有自身的视角挺好的。就像东说念主们真的完全接受莫得场所盘的汽车会需要一段时分——这里我不是说外面的车轮,而是说场所盘——因为东说念主们会想要那种“这是辆真的的车”的嗅觉。不然,它就像是某个把你运载以前的盒子一样。而浏览器的情况也会类似——当好多AI agent变得完全可靠时,你可能根柢不需要自身去浏览网站。你可以让它帮你付信用卡账单、读取银行对账单、订机票、选座位、点餐,通盘事情它都能替你完成。但你可能依然会想自身登录某些站点,浏览一下其他记者写的著述。你天然可以把这个任务交给AI来作念,但东说念主类的多巴胺来源在那儿呢?便是那种在网上只怕发现一些道理道理小东西时带来的原意。
Reed Albergotti:是以咱们其实是在膨胀“自动驾驶”的界说。
Aravind Srinivas:是的,自动驾驶不单是适用于物理交通,也适用于数字劳顿——有点像Elon说的那样,Optimus这个东说念主形机器东说念主是Tesla的下一个篇章,因为他们会把通盘为“从A点到B点出动”所构建的时间,蔓延到完成多样时势的实体服务。当今发生的事情亦然类似的——你把原来用于实施多法子搜索、多法子操作的时间,膨胀到完成多样时势的数字劳顿。它并不是为了单纯取代东说念主,而是为了增强东说念主类,相等于为他们提供一个“自动驾驶”模式,让他们腾出更多时分。说真话,如果你在一家节拍很快的公司责任,当今AI大厂的运转速率简直和创业公司一样快,但莫得东说念主会牢骚去争取一个三到四天的责任周——因为在AI的匡助下完成了更多责任,然后能花更多时分陪家东说念主、陪孩子,或者和一又友策划。是的,有些东说念主想作念AI一又友来取得更多用户使用时分并展示更多告白,但咱们不想作念那种事。
Reed Albergotti:咱们还没聊到这少量,不外咱们刚才稍稍提到了少量买卖模式——你何如看待告白?有莫得可能用告白来免费提供这些居品?照旧说这种模式会被其他时势的买卖或变现方式取代?
这是不是一家值得作念的公司?这比最近几年简直任何一家企业软件公司都更有价值,比Airbnb、DoorDash、Uber、Stripe这些都要大。那它能不可在莫得告白的情况下作念到年营收1000亿好意思元?还不好说,需要再扩一个数目级才行。
Reed Albergotti:你们的电买卖务起步了吗?你们和PayPal还有一些其他支付公司有和谐吧,当今有东说念主真的通过Perplexity买东西吗?
Aravind Srinivas:咱们还没完成集成责任,PayPal正在进行中。这亦然为什么我说浏览器Comet是关键——Perplexity单独要驱动电商很难,但在Comet里,不管你是AI照旧东说念主类在用浏览器,都会买东西。上了浏览器,就会搜索、会购买,不单是为了搜索才用它。我在公司里面也说过——浏览器的商场限制致使比咱们的中枢居品还大,因为它能掩饰那些根柢不在乎AI的东说念主群。
Reed Albergotti:对,比如如果我需要改机票,Perplexity的agent问我要不要升舱、买个更好的座位,你们可以从航空公司抽成。
Aravind Srinivas:对啊,比如从United拿到佣金,然后我再把一部分返给你作为积分,用不才次订机票时抵扣,这些都是驱动更多往复的好方式。
Reed Albergotti:我能假想将来会有微支付之类的模式。你们当今有200好意思元/月的套餐吗?你以为东说念主们会同期订OpenAI和Perplexity吗?
“咱们当今为什么要卖公司?”
Reed Albergotti:是以,如果OpenAI也有浏览器,你们会不会也得作念全套功能?比如帮我写代码之类的?
Aravind Srinivas:咱们很明晰自身不可能什么都作念。什么都作念得“还行”很容易,但什么都作念得“极好”很难。咱们要在“搜索”“用网页实施操作”等规模作念到最佳,这里就少见百亿好意思元的商场。光靠这个就能作念成一家几百亿好意思元市值的公司,致使有可能冲击万亿市值。咱们在这里打造的是一门远大的生意,是以咱们至极专注于此。这亦然我说的——如果你手里执着一个数千亿好意思元的契机,你为什么要把它卖掉呢?而且如果你真的达到了数千亿好意思元的限制,你完全可以去追求万亿好意思元的契机。上一次出身一家市值万亿好意思元的公司好像还是很深入,里面最年青的一家照旧 Facebook。因为Broadcom也成为了市值一万亿好意思元的公司,Tesla亦然一万亿好意思元公司。但严格来说,它们都缔造得更早一些。自从2010年或之后缔造的新公司成为万亿公司还是以前很深入。我猜OpenAI会第一个达到。他们缔造于2015年,是以其实比寰宇假想的还要早。
Reed Albergotti:他们如实缔造很深入。他们口舌渔利组织,这又是另外一个故事。其实我在想,这会不会在某种程度上给你们带来……
Aravind Srinivas:不会。他们会转型,我想Microsoft和他们会找到一个对两边都有用的结构。他们络续下去很重要——当今AI这个词简直和他们划上等号,而且是名副其实的。咱们自身以及好多其他公司都在用他们的时间。
Reed Albergotti:你何如看Grok?因为你望望这些不同的模子,他们最近在好多基准测试上都高出了其他模子。我知说念这些基准要持保留气魄,但它的朝上速率很快,从无到有。
Aravind Srinivas:他们构建新模子的速率如实令东说念主印象深刻,而且完全是在自身的集群上完成的,莫得用Azure或者Oracle之类的。从初始到追上顶尖实验室的水平,以及作念到这少量的速率,简直猖狂。
这是ElonMusk蛊惑力的真实体现——那种强烈的要紧感,以及高效的实施力。他花的钱并莫得东说念主们假想的那么多,天然也不少。但更重要的是,这不是一次性发布,而是连续迭代。比如Grok2还可以,Grok3就很好,然后Grok4又更强。这样连续的增量更新让它们越来越好,是以这家公司至极有竞争力。
Reed Albergotti:那你以为,在这些FrontierLabs里,谁终末会胜出?你看Google、xAI,当今Meta也想追上来,你何如看?
Aravind Srinivas:很难说。在“势头”上,OpenAI、Anthropic、xAI和Google是主要玩家。
Reed Albergotti:是以你把xAI也算进去了,这挺惊东说念主的。
Aravind Srinivas:是啊,不外这不是排行——在势头和开发者关注度上,Claude和GPT是主要模子,Gemini也作念得很好。xAI的Grok App有用户,但API的使用量还没那么大。不外在才略和多模态方面,它如实在追逐,也许在某些方面还没到其他家的水平,但在中枢推理和数学上作念得很可以。是以这四家是主要的。
也不可忘了Qwen,阿里巴巴的模子。我深信DeepSeek很快会出新模子,这只是时分问题。是以这些也不可低估。中国的模子其实很强,而且是开源的,你可以径直用。是以这六家是主要的,包括DeepSeek和Qwen,因为它们不啻作念过一个模子,而且迭代很快,追逐的速率很惊东说念主。
Reed Albergotti:对啊,这会很故道理。我想你们应该有很好的不雅察视角吧。
Aravind Srinivas:是的,咱们对哪些模子在被用户使用有很明晰的知悉,那些没东说念主用的模子咱们就不会维持,因为这不值得花时分。这有点像当今的商场——咱们能看到的,比基准测试能揭示的更多,那便是:到底有莫得东说念主在用你的模子。如果模子不好用,用户就会换到别的更好用的上去。
咱们也在用开源时间构建自身的模子,但不会在这些基准上和别东说念主竞争,惟一的目的便是让咱们的用户满足用它,而不是GPT或Claude,而且咱们当今看到的给与率可以。
Reed Albergotti:这很故道理,因为你们莫得额外老本,用户用起来也很绵薄。但我也在想,寰宇是不是还是民风用现存的器具了。
Aravind Srinivas:如实,有一个很强的“留存效应”,OpenAI便是最大的受益者。ChatGPT作为一个App用起来很顺遂,是以要让用户从它转到另一个App,至极难——你必须真的至极优秀才行,而且要在一些不是新奇性的用例里进展出色。比如Grok作念的二次元或waifu变装,如实能蛊惑一些东说念主下载App,但这不是大大宗用户的高频需求,除非有东说念主荒芜需要这种功能。商场蛊惑者设定的轨范便是,你必须不休相反化自身。这亦然为什么咱们以为这是一场“武备竞赛”,而比聊天机器东说念主更重要的才略,是能真的替用户作念事,何况在前端提供一个不同于聊天机器东说念主的、更高端倪的概述——比如浏览器。
Reed Albergotti:太好了。我知说念咱们聊得有点深入,但还有什么我没问到的,或者你们接下来有什么新闻吗?
Aravind Srinivas:差未几了。接下来如果有新音讯咱们会再策划,很忻悦和你聊天,我一直很享受跟你策划战术。你如实是个很有好奇心的东说念主,这是咱们最心爱的用户类型,谢谢。
Reed Albergotti:我想这对记者来说亦然个好性情。总之很精辟聊天,改天再聊,但愿你心爱此次对话。
原文:Perplexity CEO Aravind Srinivas On Comet, Search, &The Future Of AI|Semafor Tech
https://www.youtube.com/watch?v=sM9xd8kkes0&ab_channel=Semafor
编译:Ziye Zhu
请防御赌钱app下载,本文编译自文末载明的原始勾通,不代表Z Potentials态度。如果您对本文有任何想法或视力,迎接在批驳区留言互动探讨。
发布于:福建省