ICLR'24 大语言模型智能体最新研究进展丨智能体应用篇

今天我们给大家分享的是「智能体应用」主题的论文,共25篇。

内容转载自公众号RUCAIBox:


1.ALanguage-AgentApproachtoFormalTheorem-Proving

本文提出了一种基于语言的智能体COPRA,在形式化的定理证明中表现优异。


2.ToRA:ATool-IntegratedReasoningAgentforMathematicalProblemSolving

本文提出了一系列工具集成的推理智能体,无缝集成自然语言推理与外部工具调用,用于解决复杂数学问题。


3.ModelingComplexMathematicalReasoningviaLargeLanguageModelbasedMathAgent

本文通过对数学推理过程进行细致分解和建模,探索使用agent增强LLM的潜力。


4.Suspicion-Agent:PlayingImperfectInformationGameswithTheoryofMindAwareGPT-4

本文探讨了GPT-4的学习知识在不完全信息博弈中的适用性,并提出了suspicion-agent,它基于GPT-4实现了不完全信息博弈智能体。


5.LargeLanguageModelsCanDesignGame-TheoreticObjectivesforMulti-AgentPlanning

本文提出了一种基于LLM的博弈形式设计,来解决目标表示(objectiverepresentation)和多智能体行为对齐的问题。


6.PlayingrepeatedgameswithLargeLanguageModels

本文提出用行为博弈理论来研究LLM的合作与协调行为。


7.Lemur:HarmonizingNaturalLanguageandCodeforLanguageAgents

提出了Lemur和Lemur-Chat两种开放访问的LLM,对语言和编码能力进行了优化。


8.CompositionalInstructionFollowingwithLanguageModelsandReinforcementLearning

本文提出利用使用组合值函数和LLM提升模型在服从语言指令任务的表现。


9.AReal-WorldWebAgentwithPlanning,LongContextUnderstanding,andProgramSynthesis

本文提出了WebAgent,通过学习自身经验,按照自然语言指令在真实网站上完成任务。


10.3D-GPT:Procedural3DModelingwithLargeLanguageModels

本文提出了一个基于LLM的指令驱动的3D建模框架。


11.LLaVA-Plus:LearningtoUseToolsforCreatingMultimodalAgents

本文提出了Llava-Plus,一个系统性扩展LMM(LargeMultimodelModel)的端到端的训练方法。


12.NExT-GPT:Any-to-AnyMultimodalLLM

本文利用LLM与多模态适配器构建了一个多模态agent,NExT-GPT,并提出了一个轻量化的多模态对齐方法。


13.Towardshuman-likespokialoguegenerationbetweenAIagentsfromwrittialogue

从书面对话中生成类似人类的口语对话仍然具有挑战性,本文提出了CHATS模型,一种基于token的源于书面对话的口语对话生成系统。


14.OptimizingInterpersonalCommunicationbySimulatingAudienceswithLargeLanguageModels

本文探讨了如何利用LLM辅助人类沟通。


15.Theory-of-MindEnhancedDialogueGenerationinSituatedContexts

本文提出了一个新的agent对话框架MindDial,集成了对话生成、计划和思维预测。


16.MaximizingLLMsPotential:EnhancingMongolianChineseMachineTranslationwithRLAgentsandAdversarialMultiKnowledgeDistillation

利用RLagent将LLM中的知识蒸馏到翻译模型中,从而显著提升蒙汉翻译质量。


17.RethinkingtheBuyer’sInspectionParadoxinInformationMarketswithLanguageAgents

本文模拟了数字市场,探索了买方检验悖论(buyer'sinspectionparadox),强调当智能体在购买之前临时访问信息会提高决策和回答质量。


18.WebArena:ARealisticWebEnvironmentforBuildingAutonomousAgents

本文构建了一个高度真实和可复制的,面向LLM-basedagent的环境。


19.LyfeAgents:generativeagentsforlow-costreal-timesocialinteractions

本文提出了LyfeAgents,在LLM-basedagent的社会模拟中,降低资源成本并实现实时响应,同时保持智能和目标导向。


20.SocioDojo:BuildingLifelongAnalyticalAgentswithReal-worldTextandTimeSeries

本文提出了SocioDojo,一个开放式的终身学习环境,用于开发随时可部署的自主智能体,能够在经济、金融、政治和文化等社会主题上执行类似人类的分析和决策。


21.SOTOPIA:InteractiveEvaluationforSocialIntelligenceinLanguageAgents

本文提出了SOTOPIA,一个开放式的环境,用于模拟人工智能体之间复杂的社会互动,并评估其社会智能。


22.ExploringCollaborationMechanismsforLLMAgents:ASocialPsychologyView

本文探索了LLM-basedmulti-agent社会中,这些NLP系统能否反映出人类的协作智能。


23.OceanGPT:ALargeLanguageModelforOceanScienceTasks

本文构造了海洋科学领域大模型OceanGPT;提出了DoInstruct,通过多智能体协作自动生成海洋科学细分领域的数据;此外,本文还贡献了一个海洋科学领域数据集OCEANBENCH。


24.EfficientHuman-AICoordinationviaPreparatoryLanguage-basedConvention

本文提出使用LLM来设计一个动作规划(公约),使其能够在人机协同中有效地指导人类和AI。


25.PLAN-SEQ-LEARN:LANGUAGEMODELGUIDEDRLFORSOLVINGLONGHORIZONROBOTICSTASKS

本文提出PSL(Plan-Seq-Learn),利用LLM-basedagent的规划推理能力,在线高效解决机器人长跨度控制问题。


免责声明:本文章如果文章侵权,请联系我们处理,本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系