当前位置: 首页 > 产品展示 > 数码模块

火博sports

PRODUCTS
×

火博sports全球AI Agent大盘点大语言模型创业一定要参考

发布时间:2024-03-28 20:23:54 来源:火博体育首页 作者:HB火博APP官网

  百度发布文心一言正式发布不久后的四月,很多人还在感叹文心一言生成的图片多欢乐,更多人在为ChatGPT、Midjourney各种培训而疯狂的时候,Meta创始人兼CEO扎克伯格正在想着如何“以有用且有意义的方式”向全球数十亿人介绍AI Agents的机会。

  OpenAI完成新一轮3亿美元融资的5月,创始人Sam Altman私下对一些开发者说希望将ChatGPT打造成个人工作助手,知情人士透露的消息则是OpenAI一直在关注如何使用聊天机器人来创建自主AI Agents,相关功能很有可能部署在ChatGPT助手中。

  6月的一次全体员工会议上,扎克伯格宣布了一系列处于不同开发阶段的技术,其中一个就是将带来具有不同个性和能力的AI Agents为用户提供帮助或娱乐。

  就在7月,Meta发布了AI Agent项目MetaGPT,这是一个基于GPT-4提供了专注于软件开发的自动智能体框架。

  在国内,虽然AutoGPT早在四月份就与国外同步火了,但限于大部分人对其背后的AI Agent缺少了解,开始的反响并不是太热烈。

  直到7月初OpenAI应用人工智能研究负责人Lilian Weng那篇关于AI Agent的博文刷爆AI圈后,媒体圈、学研界、投资领域才真正开始热烈讨论AI Agent。

  由此国内真正开启了探索与研究AI Agent的热潮,并且也有一些厂商开始以AI Agent模式重构产品架构与商业模式。

  随着AI Agent原理、模式以及构建方式越发明朗,很多受困于技术、模式、生态乃至政策的创业者都是眼前一亮。

  AI Agent不仅让大家看到了大语言模型(LLM,Large language Model)落地的方向,让更多创业者进一步燃起了LLM创业的希望,也让广大企业看到了高效应用LLM的未来趋势。

  对于AI Agent创业,OpenAI的联合创始人Andrej Karpathy认为,普通人、创业者和极客在构建Agents方面比OpenAI更有优势,大家处于平等竞争的状态。

  而大公司一边,面对大型科技公司和创业公司都有可能抓住这次Agent的机会,比尔盖茨也表示如果微软没有介入他会感到失望。

  在科技巨头强劲推动、创业者快速拥抱以及大企业的积极引入下,AI Agent彻底火爆了。并且与之前LLM缺乏落地的境况不同,这次AI Agent再也不是纸上谈兵,目前已经有很多公司推出了Agent项目及相关产品。

  有业内人士透露,至少有100+项目正致力于将AI智能体商业化,近10万名开发人员正在构建自主Agent。在这些AI Agents中,既有国外主要基于GPT与开源Agent框架构建的Agent项目,也有国内基于国产大模型(自研领域大模型)+开源架构的Agent产品。

  说了那么多,都有哪些公司推出了Agent产品?目前的AI Agent产品又是什么形态?本文王吉频道盘点了全球六十个AI Agent,以让大家更好地了解AI智能体。

  虽然LLM具备了足够的智慧,但想要让它给出,还需要输入足够精准的prompt。一个掌握prompt的人和一个普通人使用同一个大模型提问问题,得到的答案会有很大区别:前者可以用多种技巧得到想要的结果,而后者就只能望LLM兴叹了。

  想要用好LLM,就得先学会使用prompt,这个需求已经催生出一个不小的培训市场。prompt提示工程,在增加LLM使用难度的同时,也使得用户体验有所降低。本来应该尽显自然语言优势的LLM,反而因为繁杂的prompt而变得对普通用户不是那么友好。

  AI Agent是一种能够感知环境、进行决策和执行动作的智能实体。不同于传统的AI,AI Agent 具备通过独立思考、调用工具去逐步完成给定目标的能力。

  而在LLM到来之后,AI Agent就被定义为基于LLM驱动的Agent实现对通用问题的自动化处理。

  我们知道,LLM主要擅长处理和生成文本。它们可以回答问题、写文章、生成创意内容、帮助编程等。但LLM还是一个被动的工具,只在你给它输入时才会产生输出。

  AI Agent提供了更广泛的功能,特别是在与环境的交互、主动决策和执行各种任务方面。可以说,AI Agent是真正释放LLM潜能的关键,它能为LLM核心提供强大的行动能力。

  AI Agent和大模型的主要区别在于:大模型与人类之间的交互是基于prompt实现的。用户prompt是否清晰明确会影响大模型回答的效果,没有精确有效的prompt,即便是能力最强的ChatGPT也不行。

  AI Agent 的工作仅需给定一个目标,就能够针对目标独立思考并做出行动,它会根据给定任务详细拆解出每一步的计划步骤,依靠来自外界的反馈和自主思考,为自己创建 prompt以实现目标。

  比如让ChatGPT买一杯咖啡,ChatGPT给出的反馈一般类似“无法购买咖啡,它只是一个文字AI助手”之类的回答。

  但你要告知基于ChatGPT的AI Agent工具让它买一杯咖啡,它会首先拆解如何才能为你购买一杯咖啡并拟定代用某APP下单以及支付等若干步骤,然后按照这些步骤调用APP选择外卖,再调用支付程序下单支付,过程无需人类去指定每一步操作。

  虽然AI工具和Agent都是旨在自动化任务的软件程序,但特定的关键特征将AI智能体区分为更复杂的AI 软件。

  自治(Autonomy):AI 虚拟智能体能够独立执行任务,而无需人工干预或输入。知觉(Perception):智能体功能通过各种传感器(如摄像头或麦克风)感知和解释它们所处的环境。反应(Reactivity):AI 智能体可以评估环境并做出相应的响应以实现其目标。推理和决策(Reasoning and decision-making):AI 智能体是智能工具,可以分析数据并做出决策以实现目标。他们使用推理技术和算法来处理信息并采取适当的行动。学习(Learning):他们可以通过机器、深度和强化学习元素和技术来学习和提高他们的表现。通信(Communication):AI 智能体可以使用不同的方法与其他智能体或人类进行通信,例如理解和响应自然语言、识别语音以及通过文本交换消息。以目标为导向(Goal-oriented):它们旨在实现特定目标,这些目标可以通过与环境的交互来预定义或学习。

  自主智能体如Auto-GPT,能够根据人们通过自然语言提出的需求,自动执行任务并实现预期结果。在这种合作模式下,自主智能体主要是为人类服务,更像是一个高效的工具。

  生成智能体,如斯坦福和谷歌的研究者共同创建的西部世界小镇或者《西部世界》中的人形机器人,它们在同一环境中生活,拥有自己的记忆和目标,不仅与人类交往,还会与其他机器人互动。

  关于AI智能体,最近复旦大学自然语言处理团队(FudanNLP)推出的86页LLM-based Agents 综述论文,全面梳理了基于大型语言模型的智能代理现状,包括:LLM-based Agent 的背景、构成、应用场景、以及备受关注的代理社会。

  (PS:感兴趣的朋友,可以在后台发消息 agent ,获取该论文,照例王吉伟频道为大家准备了机翻版。)

  说了这么多,很多朋友可能仍对AI智能体没有直观的感受。不要着急,下文我们将通过一个对比案例来加深大家的认知。

  AiAgent.app是一个Web 应用,它允许用户创建自定义AI智能体以执行特定任务并实现目标。

  比如想了解过去一个月AI行业的新闻和趋势,在Claude输入:过去一个月人工智能行业最新新闻和趋势的摘要。

  而在AiAgent.app输入这段话,它首先会将你的需求分解成十项任务,然后通过提示与用户交互完成每一项任务,并为每项任务输出结果。显然,在AiAgent.app得到的关于近期AI行业的内容,要比在直接使用其他LLM获得的内容更加全面。

  直接使用大模型能够获取这些内容吗?理论上通过输入更多的Prompt也能完成,但至少需要输入十次,也不能保证所输入Prompt精确性,且有时甚至不知道想要获取什么信息。

  而在AiAgent.app只需要输入一句话,它就分析出了你可能的需求并列出相对全面的内容目标,引导你去完成想要的东西,效率提升数倍。

  两者对比下来,在内容获取的丰富度以及效率上,显然AI Agent更胜一筹。这种资讯内容类Agent对媒体从业者、行业分析师等职业具有非常大的价值,能够大大减少研究资料的获取时间。

  现在已经出现了一些面向更精确用户群体及应用场景的此类Agent,比如哥伦比亚大学推出的GPT Researcher就是一个基于ChatGPT的面向研究人员的Agent,可以为用户创建各种研究报告以促进研究。

  这个案例还只是内容的获取,事实上现在已经出现面向多个应用场景的Agent,足以调动更多软件应用乃至硬件设备完成各项任务。

  比如有些人已经通过AutoGPT实现了订餐、订票、打车以及购物;斯坦福西部世界小镇里的25个AI Agent每天都在散步、约会、聊天、喝咖啡以及分享当天的新闻;谷歌Deepmind推出了利用机械臂自动执行各种工作的robotic agent;亚马逊也推出了Amazon Bedrock Agents用于自动分解企业AI应用开发任务;IBM Watson Health已经在很多医院帮助医生诊断、治疗和监测患者。

  虽然Ai Agent火爆的时间还不算长,但一经出现就得到了众多领域诸多企业的拥戴。大语言模型的多模特能力加上如今更大的算力,让多年前就提出的Agent快速得到价值凸显,并以超强的渗透率在更多领域落地。

  而随着MetaGPT等开源AI Agent的出现,更多技术供用商与创业团队引入Agent,更多组织认知并接受Agent,它必然会快速成为LLM的落地个领域的主要模式,助力千行百业更好的应用LLM。

  上面案例中所提到的AiAgent.app,是近几个月来风头正盛的AI Agent代表性产品之一。包括这款AI智能体在内的国内外多个Agent,均可以在下面的项目盘点名单中看到。

  为了让大家更好地了解目前已推出的AI Agent,王吉伟频道(id:jiwei1122)将这些AI Agent分为媒体报道、国内已推出、行业型、海外其他以及GitHub项目几类,以后还会逐步奖励项目库,将这些Agent分门别类编入不同类别。

  本文所盘点的AI Agents,既包括AI Agents框架及工具,也包括基于一些开源框架打造的AGENT产品,同时大部分项目及产品都为自主智能体。

  因为一些厂商比较低调并未对外宣传,本文盘点的AI Agent并不完全,所以也叫作AI AGENT不完全名单。欢迎更多厂商及创业者看到本文后与王吉伟频道联系,大家一起为AI AGENT生态的繁荣发展做一份贡献。

  与ChatGPT不同的是,用户不需要不断对AI提问以获得对应回答,在AutoGPT中只需为其提供一个AI名称、描述和五个目标,然后AutoGPT就可以自己完成项目。它可以读写文件、浏览网页、审查自己提示的结果,以及将其与所说的提示历史记录相结合。

  AgentGPT允许您配置和部署自主AI智能体。只要为你的自定义AI命名并让它开始任何可以想象的目。


火博sports