比尔·盖茨提到的AI私人助理,能响应自然语言,根据其对用户的深度了解完成各种任务,被称为“代理”(Agent)。
和Inflection AI推出的聊天机器人Pi不同,Agent可以在不同应用程序中执行不同任务,它们会不断了解用户,从而不断改进。
如果你想计划一次旅行,现有的聊天机器人只能找出符合预算的酒店,但Agent不仅了解你的旅行时间,还能推测出你的喜好,并做出深度个性化方案,像一家专业的旅行社。
如果你想和大学室友见面,你不需要检查自己的Schedule,也不用和其他几位室友反复约时间,因为你的Agent会和你大学室友们的Agents一起商量。
如果你想做一个APP,你不需要写代码,学设计。只需要告诉Agent你想要什么,它就能编写代码,进行UI设计,并将APP发布到在线商店。
“谁能赢得个人助理Agent,那才是大事。因为你将永远不会再去搜索网站,永远不会再去生产力网站,你永远不会再去亚马逊。”
实际上,比尔·盖茨在博文中提到,他已经“思考Agent近30年了,并在1995年的《未来之路》一书中写到过它们,但由于AI的进步,它们直到最近才变得实际可行”。
以下是全文翻译:
AI即将彻底改变你使用电脑的方式
时至今日,我仍然像当初和保罗·艾伦刚创立微软时那样热爱软件。尽管几十年来软件已经取得了很大改进,但在许多方面它仍然相当愚蠢。
无论在电脑上完成何种任务,你都必须告诉设备,它应该使用哪个应用程序。虽然你可以用Microsoft Word和Google Docs起草商业提案,但它们不能帮你发送电子邮件、分享自拍、分析数据、安排聚会或购买电影票。
即便是最好的网站也不能完全了解你的工作、个人生活、兴趣和人际关系,而且软件的能力有限,无法像亲密朋友或私人助理那样为你做事。
在未来的五年内,这种情况将彻底改变。你不必再为不同的任务而使用不同的应用程序。你只需用日常语言告诉你的设备你想要做什么。根据你选择与软件分享多少信息,基于对你生活的丰富了解,软件能够做出个性化的回应。在不久的将来,任何上网的人都能拥有一个远超今天技术水平的人工智能助手(Personal Assistant Powered by Artificial Intelligence)。
这种类型的软件,能回应自然语言并根据对用户的了解完成许多不同的任务,被称为Agent(代理)。我对Agent进行了近30年的思考,并在我1995年的书The Road Ahead(《通往未来之路》)中提及,但由于人工智能的进步,Agent直到最近才变得实用起来。
Agent不仅会改变每个人与计算机的交互方式,还将颠覆软件行业,引领我们从键入命令到点击图标以来计算机领域最大的革命。
01 人人都有私人助理Agent
一些批评者指出,软件公司以前也做过这种东西,但用户并不怎么接受它们。(大家仍拿 Clippy 开玩笑,Clippy 是我们曾在 Microsoft Office 中提供的数字助理,后来被弃置一边。)
那么,为什么人们会使用Agent?
答案是,Agent会变得更好。你能和它们进行细致入微的对话。它们更加个性化,不局限于写一封信这样的简单任务。Clippy与Agent的关系就像旋转号盘电话和移动设备的关系一样。
如果你愿意,Agent能帮助你做任何事。例如只要你授权同意,它会深入了解你参与的活动、交往的人物、所在地点。它会了解你的私人关系、工作关系、爱好偏好和日程安排。你可以选择Agent在何时,以何种方式帮助你做某事或让你做决定。
“Clippy是一个机器人,而不是Agent。”
我们现在用的人工智能工具大部分都只是机器人而已。它们仅限于一个应用程序,并且通常只在你写入特定单词或请求帮助时才会介入。这是因为它们不记得你的使用习惯,也就不会变得更好,不会学习你的任何偏好。Clippy是一个机器人,而不是Agent。
Agent更加智能。它们是主动的,能够在你提出请求之前就提供建议;能够跨应用程序执行任务;能够随着时间推移而改进。这是因为Agent记住了你的活动,能够识别你的行为意图和模式。基于这些信息,Agent会提供它们认为你需要的东西,尽管最终决策始终由你来做。
想象一下,如果你想计划一次旅行。一个聊天机器人只能找到符合你预算的酒店,而一个Agent不仅知道你旅行的时间,还会基于对你需求的了解,例如你更想去新目的地或喜欢故地重游,给出建议的旅游地点。当被询问时,Agent也会根据你的兴趣和冒险倾向为你推荐可以做的事情,预订你喜欢的餐厅。而如果现在你想要这种深度个性化的旅游规划,你不仅要付费给旅行社,并花时间告诉旅行社你的需求。
02 Agent将如何影响四大领域?
Agent最激动人心的地方是它会让如今过于昂贵的服务变得平民化,例如医疗健康、教育、生产力、娱乐与购物等四个领域。
医疗健康
如今,人工智能在医疗保健领域主要是处理一些行政任务。例如,Abridge、Nuance DAX和Nabla Copilot可以在医生就诊期间帮助记录音频,并撰写笔记供医生审阅。
真正的转变将在Agent能够帮助患者进行基本分诊、就处理健康问题提供建议,并决定是否需要求诊时出现。
这些临床医生Agent还会帮助医护人员做出决策,提高工作效率。(例如,像Glass Health这样的应用程序可以分析患者摘要并为医生提出诊断建议。)贫困国家人民将尤其受益,因为那里的许多人根本没有机会看医生。
毕竟医疗事关生死,临床医生Agent的推广速度会比较慢。人们也需要看到医疗Agent总体是好的,尽管它们不完美无缺,也会犯错误。当然,人类也会犯错误。
目前,患者能否获得医疗保健也是一个问题。
如今,每周一次的心理治疗似乎是一种奢侈服务。但实际上仍有许多需求未得到满足,许多本可以从心理疗法中获益的患者却没有机会得到治疗。例如,RAND公司发现,在所有需要心理健康护理的美国退伍军人中,有一半没有得到治疗。
而训练有素的Agent将使心理疗法更加实惠、易获。例如,比起Wysa和Youper这两个早期聊天机器人,Agent的影响会更深入。只要你愿意和心理保健Agent分享足够的信息,它就会了解你的生活经历和人际关系。它会在你需要时出现,而且永远保持耐心。
在你允许的情况下,它还可以通过你的智能手表监测你的身体反应——比如当你和老板谈论问题时你的心脏是否开始加速跳动——并建议你什么时候应该去看人类心理治疗师。
教育
几十年来,我一直对软件给教师减负、帮学生学习的方方面面感到振奋。软件不会取代教师,但它会补充他们的工作——为学生提供个性化的服务,将教师从文书工作和其他任务中解放出来,让他们有更多时间从事最重要的工作。这些变化终于开始以戏剧性的方式发生了。
目前最先进的技术是Khan Academy创建的基于文本的机器人Khanmigo。它可以辅导学生的数学、科学和人文学科。例如,Khanmigo可以解二次方程式并创建数学问题,供学生练习。它还可以帮教师编教案。我一直以来都是Sal Khan的粉丝和支持者,最近他还参加了我的播客节目,谈论教育和人工智能。
但文本机器人只是第一阶段——Agent将开辟更多的学习机会。
例如,很少有家庭负担得起1v1家教。如果辅导Agent能捕捉到1v1家教的有用之处,它将为每个学生提供针对性指导。例如,当辅导Agent知道一个孩子喜欢Minecraft和Taylor Swift,它将用Minecraft来教学生计算几何的体积和面积,用Taylor Swif的歌词教他们讲故事和押韵。这种学习体验将更加丰富——例如,有图形和声音——而且比现在的文字辅导更加个性化。
生产力
这个领域的竞争已经进入了白热化。微软正在将Copilot作为Word、Excel、Outlook和其他服务的一部分。谷歌也在用Assistant with Bard和其生产力工具做类似的工作。这些类似Copilot的协助工具可以做很多事情,比如把书面文件变成幻灯片,用自然语言回答电子表格的问题,并从每个人的观点里总结邮件主题。
而Agent能做更多。拥有一个Agent就像有一个人专门帮你完成各种任务。如果你愿意,Agent也可以独立完成。如果你有一个商业想法,Agent会帮你写一份商业计划,创建一个演示文稿,甚至能生成产品的大概图像。公司会让员工直接咨询Agent,并参与每次会议,以便回答问题。
“如果你的朋友刚做了手术,Agent会提议送花并帮你订购。”
无论你是否在办公室工作,你的Agent都能像私人助理支持高管一样帮助你。如果你的朋友刚做了手术,Agent会提议送花并帮你订购。如果你想和以前的大学室友见面,Agent会和你大学室友们的Agents一起商量见面时间。就在你到达之前,它还会提醒你,他们最大的孩子刚刚在本地大学入学。
娱乐与购物
人工智能已经可以帮你挑选新电视,推荐电影、书籍、节目和播客。我投资的Likewise公司最近推出了Pix,它可以让你提问(“我喜欢罗伯特·雷德福的哪部电影,我可以在哪里看?”),然后根据你过去的喜好推荐电影。Spotify最近推出了一款人工智能DJ,不仅会根据你的喜好播放歌曲,还会与你交谈,甚至能叫出你的名字。
Agent不仅会提供建议,它们还将帮助你付诸行动。如果你想购买相机,你的Agent将为你阅读所有测评,总结后给出推荐,并在你决定后为你下单。如果你告诉Agent你想看《星球大战》,它会知道你是否已订阅了合适的流媒体服务。如果没有,它会主动为你注册。如果你不知道自己想看什么,它会给出定制化建议,然后想办法播放你选择的电影或节目。
你还可以获得根据你的兴趣量身定制的新闻和娱乐内容。CurioAI能就你提出的任何话题创建定制化播客,它是未来趋势的一个缩影。
03 Agent对科技行业带来何种冲击波?
简而言之,Agent几乎可以在任何活动和生活领域提供帮助,对软件行业和社会范围产生深远的影响。
在计算机行业,我们聊平台——应用程序和服务赖以构建的技术。Android、iOS和Windows都是平台。Agent将成为下一个平台。
“要创建一个新的应用程序或服务,你只需要告诉你的Agent你想要什么。”
要创建一个新的应用程序或服务,你不需要知道如何编写代码,如何做图形设计。你只要将需求告诉你的Agent。它就能编写代码,设计应用程序的界面外观,创建徽标,并将应用程序发布到在线商店。OpenAI本周发布的GPTs让我们得以一窥未来,非开发人员也可以轻松创建和分享他们自己的助手。
Agent将影响我们如何使用软件,如何编写软件。它们将取代搜索网站,因为它们更善于查找信息、汇总信息;它们将取代电商网站,因为它们将为你找到最优惠的价格,而不仅仅局限于少数供应商;它们将取代很多文字处理软件、电子表格和其他生产力应用程序。让如今分散的业务——搜索广告、带广告的社交网络、购物、生产力软件——整合为一项业务。
我不认为任何一家公司能垄断Agent业务——会有很多不同的人工智能引擎可供选择。今天,Agent被嵌入到其他软件中,如文字处理软件和电子表格,但最终它们将独立运行。尽管一些Agent可以免费使用(并拉到广告赞助),但我认为你将为大部分Agent付费,这意味着公司将有动机让Agent为你工作,而不是为广告商。如果从今年开始研究人工智能的公司数量,目测将会出现异常激烈的竞争,这会使Agent变得很便宜。
04 距离实现还有哪些技术挑战?
05 隐私和其他重大问题
随着这一切的出现,网络隐私和安全问题将变得比现在更加紧迫。你会希望自己掌握Agent访问信息的权利,这样你就可以确信你的数据只与你选择的人和公司共享。
但是,你与Agent分享的数据归谁所有,如何确保数据被安全使用?毕竟没人想收到来自心理治疗师Agent的广告。执法机构能否使用你的Agent提交对你不利的证据?你的Agent何时会拒绝执行可能对你或他人有害的任务?是谁决定了Agent内置的价值观?
还有一个问题是,你的Agent应该分享多少信息。假设你想去看望一个朋友:如果你的Agent与他们的Agent交谈,你不希望它说:“哦,她周二要和其他朋友见面,不想邀请你。”如果你的Agent帮助你撰写工作邮件,它应该知道自己不该使用你的私人信息或上一份工作的专有数据。
很多问题已经成为科技行业和立法者关注的焦点。我最近与其他技术领导者一起参加了由参议员查克·舒默组织、许多美国参议员参加的人工智能论坛。我们分享了关于这些和其他问题的想法,并讨论了立法者制定强有力法律的必要性。
但有一些问题不会由公司和政府来决定。例如,Agent可能影响我们与朋友、家人的互动方式。今天,你可以通过记住他们生活的细节,比如他们的生日,来表达你对他们的关心。但当他们知道是你的Agent提醒你并负责送花时,这对他们来说还有意义吗?
在遥远的未来,Agent甚至可能迫使人类面对一些关于意义的深刻问题。想象一下,Agent变得如此优秀,以至于每个人都可以在不工作的情况下拥有高质量生活。在这样的未来,人们会如何利用他们的时间?当Agent知道所有问题的答案时,还会有人愿意接受教育吗?当大多数人都有很多空闲时间时,你能拥有一个安全繁荣的社会吗?
原创文章,作者:适 道,如若转载,请注明出处:https://www.shidaox.com/observation/1566.html