全球AI Agent大盘点大语言模型创业一定要参考_火博sports(GUANGDONG)体育首页APP官网

火博sports

PRODUCTS

火博sports全球AI Agent大盘点大语言模型创业一定要参考

发布时间：2024-03-28 20:23:54 来源：火博体育首页作者：HB火博APP官网

　　百度发布文心一言正式发布不久后的四月，很多人还在感叹文心一言生成的图片多欢乐，更多人在为ChatGPT、Midjourney各种培训而疯狂的时候，Meta创始人兼CEO扎克伯格正在想着如何“以有用且有意义的方式”向全球数十亿人介绍AI Agents的机会。

　　OpenAI完成新一轮3亿美元融资的5月，创始人Sam Altman私下对一些开发者说希望将ChatGPT打造成个人工作助手，知情人士透露的消息则是OpenAI一直在关注如何使用聊天机器人来创建自主AI Agents，相关功能很有可能部署在ChatGPT助手中。

　　6月的一次全体员工会议上，扎克伯格宣布了一系列处于不同开发阶段的技术，其中一个就是将带来具有不同个性和能力的AI Agents为用户提供帮助或娱乐。

　　就在7月，Meta发布了AI Agent项目MetaGPT，这是一个基于GPT-4提供了专注于软件开发的自动智能体框架。

　　在国内，虽然AutoGPT早在四月份就与国外同步火了，但限于大部分人对其背后的AI Agent缺少了解，开始的反响并不是太热烈。

　　直到7月初OpenAI应用人工智能研究负责人Lilian Weng那篇关于AI Agent的博文刷爆AI圈后，媒体圈、学研界、投资领域才真正开始热烈讨论AI Agent。

　　由此国内真正开启了探索与研究AI Agent的热潮，并且也有一些厂商开始以AI Agent模式重构产品架构与商业模式。

　　随着AI Agent原理、模式以及构建方式越发明朗，很多受困于技术、模式、生态乃至政策的创业者都是眼前一亮。

　　AI Agent不仅让大家看到了大语言模型（LLM，Large language Model）落地的方向，让更多创业者进一步燃起了LLM创业的希望，也让广大企业看到了高效应用LLM的未来趋势。

　　对于AI Agent创业，OpenAI的联合创始人Andrej Karpathy认为，普通人、创业者和极客在构建Agents方面比OpenAI更有优势，大家处于平等竞争的状态。

　　而大公司一边，面对大型科技公司和创业公司都有可能抓住这次Agent的机会，比尔盖茨也表示如果微软没有介入他会感到失望。

　　在科技巨头强劲推动、创业者快速拥抱以及大企业的积极引入下，AI Agent彻底火爆了。并且与之前LLM缺乏落地的境况不同，这次AI Agent再也不是纸上谈兵，目前已经有很多公司推出了Agent项目及相关产品。

　　有业内人士透露，至少有100+项目正致力于将AI智能体商业化，近10万名开发人员正在构建自主Agent。在这些AI Agents中，既有国外主要基于GPT与开源Agent框架构建的Agent项目，也有国内基于国产大模型（自研领域大模型）+开源架构的Agent产品。

　　说了那么多，都有哪些公司推出了Agent产品？目前的AI Agent产品又是什么形态？本文王吉频道盘点了全球六十个AI Agent，以让大家更好地了解AI智能体。

　　虽然LLM具备了足够的智慧，但想要让它给出，还需要输入足够精准的prompt。一个掌握prompt的人和一个普通人使用同一个大模型提问问题，得到的答案会有很大区别：前者可以用多种技巧得到想要的结果，而后者就只能望LLM兴叹了。

　　想要用好LLM，就得先学会使用prompt，这个需求已经催生出一个不小的培训市场。prompt提示工程，在增加LLM使用难度的同时，也使得用户体验有所降低。本来应该尽显自然语言优势的LLM，反而因为繁杂的prompt而变得对普通用户不是那么友好。

　　AI Agent是一种能够感知环境、进行决策和执行动作的智能实体。不同于传统的AI，AI Agent 具备通过独立思考、调用工具去逐步完成给定目标的能力。

　　而在LLM到来之后，AI Agent就被定义为基于LLM驱动的Agent实现对通用问题的自动化处理。

　　我们知道，LLM主要擅长处理和生成文本。它们可以回答问题、写文章、生成创意内容、帮助编程等。但LLM还是一个被动的工具，只在你给它输入时才会产生输出。

　　AI Agent提供了更广泛的功能，特别是在与环境的交互、主动决策和执行各种任务方面。可以说，AI Agent是真正释放LLM潜能的关键，它能为LLM核心提供强大的行动能力。

　　AI Agent和大模型的主要区别在于：大模型与人类之间的交互是基于prompt实现的。用户prompt是否清晰明确会影响大模型回答的效果，没有精确有效的prompt，即便是能力最强的ChatGPT也不行。

　　AI Agent 的工作仅需给定一个目标，就能够针对目标独立思考并做出行动，它会根据给定任务详细拆解出每一步的计划步骤，依靠来自外界的反馈和自主思考，为自己创建 prompt以实现目标。

　　比如让ChatGPT买一杯咖啡，ChatGPT给出的反馈一般类似“无法购买咖啡，它只是一个文字AI助手”之类的回答。

　　但你要告知基于ChatGPT的AI Agent工具让它买一杯咖啡，它会首先拆解如何才能为你购买一杯咖啡并拟定代用某APP下单以及支付等若干步骤，然后按照这些步骤调用APP选择外卖，再调用支付程序下单支付，过程无需人类去指定每一步操作。

　　虽然AI工具和Agent都是旨在自动化任务的软件程序，但特定的关键特征将AI智能体区分为更复杂的AI 软件。

　　自治（Autonomy）：AI 虚拟智能体能够独立执行任务，而无需人工干预或输入。知觉（Perception）：智能体功能通过各种传感器（如摄像头或麦克风）感知和解释它们所处的环境。反应（Reactivity）：AI 智能体可以评估环境并做出相应的响应以实现其目标。推理和决策（Reasoning and decision-making）：AI 智能体是智能工具，可以分析数据并做出决策以实现目标。他们使用推理技术和算法来处理信息并采取适当的行动。学习（Learning）：他们可以通过机器、深度和强化学习元素和技术来学习和提高他们的表现。通信（Communication）：AI 智能体可以使用不同的方法与其他智能体或人类进行通信，例如理解和响应自然语言、识别语音以及通过文本交换消息。以目标为导向（Goal-oriented）：它们旨在实现特定目标，这些目标可以通过与环境的交互来预定义或学习。

　　自主智能体如Auto-GPT，能够根据人们通过自然语言提出的需求，自动执行任务并实现预期结果。在这种合作模式下，自主智能体主要是为人类服务，更像是一个高效的工具。

　　生成智能体，如斯坦福和谷歌的研究者共同创建的西部世界小镇或者《西部世界》中的人形机器人，它们在同一环境中生活，拥有自己的记忆和目标，不仅与人类交往，还会与其他机器人互动。

　　关于AI智能体，最近复旦大学自然语言处理团队（FudanNLP）推出的86页LLM-based Agents 综述论文，全面梳理了基于大型语言模型的智能代理现状，包括：LLM-based Agent 的背景、构成、应用场景、以及备受关注的代理社会。

　　（PS：感兴趣的朋友，可以在后台发消息 agent ，获取该论文，照例王吉伟频道为大家准备了机翻版。）

　　说了这么多，很多朋友可能仍对AI智能体没有直观的感受。不要着急，下文我们将通过一个对比案例来加深大家的认知。

　　AiAgent.app是一个Web 应用，它允许用户创建自定义AI智能体以执行特定任务并实现目标。

　　比如想了解过去一个月AI行业的新闻和趋势，在Claude输入：过去一个月人工智能行业最新新闻和趋势的摘要。

　　而在AiAgent.app输入这段话，它首先会将你的需求分解成十项任务，然后通过提示与用户交互完成每一项任务，并为每项任务输出结果。显然，在AiAgent.app得到的关于近期AI行业的内容，要比在直接使用其他LLM获得的内容更加全面。

　　直接使用大模型能够获取这些内容吗？理论上通过输入更多的Prompt也能完成，但至少需要输入十次，也不能保证所输入Prompt精确性，且有时甚至不知道想要获取什么信息。

　　而在AiAgent.app只需要输入一句话，它就分析出了你可能的需求并列出相对全面的内容目标，引导你去完成想要的东西，效率提升数倍。

　　两者对比下来，在内容获取的丰富度以及效率上，显然AI Agent更胜一筹。这种资讯内容类Agent对媒体从业者、行业分析师等职业具有非常大的价值，能够大大减少研究资料的获取时间。

　　现在已经出现了一些面向更精确用户群体及应用场景的此类Agent，比如哥伦比亚大学推出的GPT Researcher就是一个基于ChatGPT的面向研究人员的Agent，可以为用户创建各种研究报告以促进研究。

　　这个案例还只是内容的获取，事实上现在已经出现面向多个应用场景的Agent，足以调动更多软件应用乃至硬件设备完成各项任务。

　　比如有些人已经通过AutoGPT实现了订餐、订票、打车以及购物；斯坦福西部世界小镇里的25个AI Agent每天都在散步、约会、聊天、喝咖啡以及分享当天的新闻；谷歌Deepmind推出了利用机械臂自动执行各种工作的robotic agent；亚马逊也推出了Amazon Bedrock Agents用于自动分解企业AI应用开发任务；IBM Watson Health已经在很多医院帮助医生诊断、治疗和监测患者。

　　虽然Ai Agent火爆的时间还不算长，但一经出现就得到了众多领域诸多企业的拥戴。大语言模型的多模特能力加上如今更大的算力，让多年前就提出的Agent快速得到价值凸显，并以超强的渗透率在更多领域落地。

　　而随着MetaGPT等开源AI Agent的出现，更多技术供用商与创业团队引入Agent，更多组织认知并接受Agent，它必然会快速成为LLM的落地个领域的主要模式，助力千行百业更好的应用LLM。

　　上面案例中所提到的AiAgent.app，是近几个月来风头正盛的AI Agent代表性产品之一。包括这款AI智能体在内的国内外多个Agent，均可以在下面的项目盘点名单中看到。

　　为了让大家更好地了解目前已推出的AI Agent，王吉伟频道（id：jiwei1122）将这些AI Agent分为媒体报道、国内已推出、行业型、海外其他以及GitHub项目几类，以后还会逐步奖励项目库，将这些Agent分门别类编入不同类别。

　　本文所盘点的AI Agents，既包括AI Agents框架及工具，也包括基于一些开源框架打造的AGENT产品，同时大部分项目及产品都为自主智能体。

　　因为一些厂商比较低调并未对外宣传，本文盘点的AI Agent并不完全，所以也叫作AI AGENT不完全名单。欢迎更多厂商及创业者看到本文后与王吉伟频道联系，大家一起为AI AGENT生态的繁荣发展做一份贡献。

　　与ChatGPT不同的是，用户不需要不断对AI提问以获得对应回答，在AutoGPT中只需为其提供一个AI名称、描述和五个目标，然后AutoGPT就可以自己完成项目。它可以读写文件、浏览网页、审查自己提示的结果，以及将其与所说的提示历史记录相结合。

　　AgentGPT允许您配置和部署自主AI智能体。只要为你的自定义AI命名并让它开始任何可以想象的目。

火博sports

上一篇：2023前端学习计划下一篇：java中的注释有三类分别是