质量超越o1,成本仅4%,UCSD张怡颖教授团队开源生

日期:2024-12-12 浏览:

AIxiv专栏是呆板之心宣布学术、技巧内容的栏目。从前数年,呆板之心AIxiv专栏接受报道了2000多篇内容,笼罩寰球各年夜高校与企业的顶级试验室,无效增进了学术交换与传布。假如你有优良的任务想要分享,欢送投稿或许接洽报道。投稿邮箱:[email protected][email protected]近多少年在天生式 AI 技巧跟贸易翻新飞速开展的配景下,创立高品质且低本钱的天生式 AI 利用在业界仍有相称难度,重要起因在于缺少体系化的调试跟优化方式。克日,UCSD 张怡颖教学的 GenseeAI 团队推出了首款可主动晋升 AI 任务流天生品质并下降天生本钱的东西 Cognify。Cognify 能够主动优化 AI 任务流,支撑 LangChain、DSPy、Python 等言语框架。Cognify 的中心思绪是一种翻新的分层任务流级优化方式。Cognify 可将天生式 AI 利用的天生品质进步多达 48%,并将履行本钱下降多达 90%。Cognify 现已开源。开源地点:https://github.com/GenseeAI/cognify天生式 AI 任务流以后的天生式 AI 产物平日都是以天生式 AI 任务流的情势构建跟安排。AI 任务流外部能够挪用各种 AI 模子、东西、数据源及其余范例的体系。典范的 AI 任务流包含 Agent 任务流跟 LLM+RAG 等。与单次挪用 AI 模子比拟,AI 任务流供给了更强盛、可定制跟集成化的处理计划。以后业界的 AI 任务流畅常由工程师编写。在安排之前,工程师须要手动调剂 AI 任务流的构造跟提醒词(prompt),并为任务流中的各个步调抉择适合的模子。但是,因为缺少体系化的调优方式,AI 任务流的安排常常十分耗时,已安排的任务流也可能面对品质欠安、不稳固或本钱太高级成绩。固然有很多天生式 AI 任务流的开辟框架,比方 Coze,Dify,LangChain,DSPy 跟 Claude MCP,然而并不能够辅助开辟者体系调试跟优化东西。Cognify 优化器Cognify 是一款片面、多目的的开源 AI 任务流优化器。Cognify 的优化进程基于主动抉择 AI 模子、改良任务流构造跟加强提醒词。Cognify 实现了任务流的多目的优化,包含进步天生品质跟低天生本钱。对差别的利用场景,Cognify 都用雷同或更小的模子到达了更高的天生品质,推进了品质 - 本钱 Pareto 界限,而且容许用户抉择差别的品质 - 本钱组合(成果如下图所示)。在此进程中,Cognify 的优化实现了「一键」全主动化。同时,Cognify 也容许用户自界说优化方式 Cogs(Cognify 把种种优化统称 Cog),备选模子品种,以及最多优化次数。Cognify 现在支撑 LangChain、LangGraph、DSPy 跟基于 Python 开辟的任务流。Cognify 中心技巧全局级其余任务流超参数调优Cognify 的中心理念是对全部任务流停止优化,而不是在每个独自的任务流组件中停止优化。因为上游组件的天生成果对卑鄙组件的机能有严重影响,伶仃的优化各个组件可能招致终极天生品质欠安,并且团体运转本钱增添。Cognify 经由过程试验种种 Cog 组合,并经由过程终极天生的品质评价这些组合的后果,从而优化全部任务流。在团体任务流优化中,一个要害挑衅是优化本钱,包含模子运转本钱跟耗时。一个简略的做法是对每个可能的 cog 组合停止网格搜寻,但这会招致指数级增加的优化本钱。为懂得决这个成绩,Cognify 采取了两种战略。起首,Cognify 将任务流视为一个优化工具,并将全部可能的 Cog 视为其超参数 (hyperparameter)。Cognify 为任务流超参数计划了一套新的贝叶斯优化器(Bayesian Optimizer),用于调优这些任务流超参数。特制的优化器可能无效摸索 cog 组合空间。其次,Cognify 将 cog 分为两层:外轮回包括变动任务流构造的 cog(比方增加或移除组件或从新陈列它们的次序),内轮回包括不影响任务流构造的 cog(比方提醒词调优跟模子抉择)。这种双层方式增加了贝叶斯优化器须要摸索的团体搜寻空间。CogHub:AI 任务流优化器聚集与 Cognify 同时推出的是 CogHub——一个开源 cog 聚集。就像 HuggingFace 聚集了开源的模子,CogHub 聚集了开源的 AI 任务流优化方式。CogHub 在被 Cognify 外部挪用的同时也面向顺序员或将来的天生式 AI 东西。CogHub 现支撑以下五种 cogs:义务剖析 (Task Decomposition)(外轮回):将一个义务(一次 LLM 挪用)剖析为多个细分的子义务(屡次 LLM 挪用)。义务集成 (Task Ensemble)(外轮回):构建并联合多个模块来实现义务。多步推理 (Multi-step Reasoning)(内轮回):请求 LLM 逐渐推理。少样本进修 (Few-shot Learning)(内轮回):从输入样本中增加一些高品质的示例演示。模子抉择 (Model SelectioN)(内轮回):评价差别的模子。优化案例以下是一个数据可视化义务的例子。义务目的是由手机贩卖数据天生针对每个厂商每个季度的销量的箱型图,并盘算每个手机商的贩卖均匀值,终极用均匀值线表现。下图展现了多少个天生图的对照, 1) 人工画的基准图,2) 直接讯问 OpenAI o1,3) 直接运转 MatPlotAgent 任务流,4) DSPy 优化过的任务流,以及 5) 由 Cognify 优化过的任务流。Cognify 优化过的任务流前往的成果多少乎与基准图符合,品质明显优于其余计划。与此同时,Cognify 优化过的任务流的运转本钱仅有 o1-preview 的 4%。GenseeAI 简介GenseeAI(gensee.ai)是由 UCSD 张怡颖教学率领的始创公司。GenseeAI 努力于天生式 AI 任务流优化、安排、推理跟基本平台创立,现在已在多门第界 500 强公司推广初期产物。张怡颖教学师从图领奖得主 David Patterson 学门,是盘算机体系范畴的国际顶尖专家,取得业界跟学术界多项年夜奖跟普遍承认。GenseeAI 的其余中心团队来自于美国谷歌跟 Snap 等高科技公司,存在开辟跟经营日活泼用户上亿级其余 AI 产物的教训。© THE END 转载请接洽本大众号取得受权投稿或追求报道:[email protected]]article_adlist-->   申明:新浪网独家稿件,未经受权制止转载。 -->

0
首页
电话
短信
联系