ICLR'24 大语言模型智能体最新研究进展丨智能体应用篇

2025-04-28 • 包装材料 • 作者：小编

今天我们给大家分享的是「智能体应用」主题的论文，共25篇。

内容转载自公众号RUCAIBox：

1.ALanguage-AgentApproachtoFormalTheorem-Proving

本文提出了一种基于语言的智能体COPRA，在形式化的定理证明中表现优异。

2.ToRA:ATool-IntegratedReasoningAgentforMathematicalProblemSolving

本文提出了一系列工具集成的推理智能体，无缝集成自然语言推理与外部工具调用，用于解决复杂数学问题。

3.ModelingComplexMathematicalReasoningviaLargeLanguageModelbasedMathAgent

本文通过对数学推理过程进行细致分解和建模，探索使用agent增强LLM的潜力。

4.Suspicion-Agent:PlayingImperfectInformationGameswithTheoryofMindAwareGPT-4

本文探讨了GPT-4的学习知识在不完全信息博弈中的适用性，并提出了suspicion-agent，它基于GPT-4实现了不完全信息博弈智能体。

5.LargeLanguageModelsCanDesignGame-TheoreticObjectivesforMulti-AgentPlanning

本文提出了一种基于LLM的博弈形式设计，来解决目标表示(objectiverepresentation)和多智能体行为对齐的问题。

6.PlayingrepeatedgameswithLargeLanguageModels

本文提出用行为博弈理论来研究LLM的合作与协调行为。

7.Lemur:HarmonizingNaturalLanguageandCodeforLanguageAgents

提出了Lemur和Lemur-Chat两种开放访问的LLM，对语言和编码能力进行了优化。

8.CompositionalInstructionFollowingwithLanguageModelsandReinforcementLearning

本文提出利用使用组合值函数和LLM提升模型在服从语言指令任务的表现。

9.AReal-WorldWebAgentwithPlanning,LongContextUnderstanding,andProgramSynthesis

本文提出了WebAgent，通过学习自身经验，按照自然语言指令在真实网站上完成任务。

10.3D-GPT:Procedural3DModelingwithLargeLanguageModels

本文提出了一个基于LLM的指令驱动的3D建模框架。

11.LLaVA-Plus:LearningtoUseToolsforCreatingMultimodalAgents

本文提出了Llava-Plus，一个系统性扩展LMM(LargeMultimodelModel)的端到端的训练方法。

12.NExT-GPT:Any-to-AnyMultimodalLLM

本文利用LLM与多模态适配器构建了一个多模态agent，NExT-GPT，并提出了一个轻量化的多模态对齐方法。

13.Towardshuman-likespokialoguegenerationbetweenAIagentsfromwrittialogue

从书面对话中生成类似人类的口语对话仍然具有挑战性，本文提出了CHATS模型，一种基于token的源于书面对话的口语对话生成系统。

14.OptimizingInterpersonalCommunicationbySimulatingAudienceswithLargeLanguageModels

本文探讨了如何利用LLM辅助人类沟通。

15.Theory-of-MindEnhancedDialogueGenerationinSituatedContexts

本文提出了一个新的agent对话框架MindDial，集成了对话生成、计划和思维预测。

16.MaximizingLLMsPotential:EnhancingMongolianChineseMachineTranslationwithRLAgentsandAdversarialMultiKnowledgeDistillation

利用RLagent将LLM中的知识蒸馏到翻译模型中，从而显著提升蒙汉翻译质量。

17.RethinkingtheBuyer’sInspectionParadoxinInformationMarketswithLanguageAgents

本文模拟了数字市场，探索了买方检验悖论(buyer'sinspectionparadox)，强调当智能体在购买之前临时访问信息会提高决策和回答质量。

18.WebArena:ARealisticWebEnvironmentforBuildingAutonomousAgents

本文构建了一个高度真实和可复制的，面向LLM-basedagent的环境。

19.LyfeAgents:generativeagentsforlow-costreal-timesocialinteractions

本文提出了LyfeAgents，在LLM-basedagent的社会模拟中，降低资源成本并实现实时响应，同时保持智能和目标导向。

20.SocioDojo:BuildingLifelongAnalyticalAgentswithReal-worldTextandTimeSeries

本文提出了SocioDojo，一个开放式的终身学习环境，用于开发随时可部署的自主智能体，能够在经济、金融、政治和文化等社会主题上执行类似人类的分析和决策。

21.SOTOPIA:InteractiveEvaluationforSocialIntelligenceinLanguageAgents

本文提出了SOTOPIA，一个开放式的环境，用于模拟人工智能体之间复杂的社会互动，并评估其社会智能。

22.ExploringCollaborationMechanismsforLLMAgents:ASocialPsychologyView

本文探索了LLM-basedmulti-agent社会中，这些NLP系统能否反映出人类的协作智能。

23.OceanGPT:ALargeLanguageModelforOceanScienceTasks

本文构造了海洋科学领域大模型OceanGPT；提出了DoInstruct，通过多智能体协作自动生成海洋科学细分领域的数据；此外，本文还贡献了一个海洋科学领域数据集OCEANBENCH。

24.EfficientHuman-AICoordinationviaPreparatoryLanguage-basedConvention

本文提出使用LLM来设计一个动作规划(公约)，使其能够在人机协同中有效地指导人类和AI。

25.PLAN-SEQ-LEARN:LANGUAGEMODELGUIDEDRLFORSOLVINGLONGHORIZONROBOTICSTASKS

本文提出PSL（Plan-Seq-Learn），利用LLM-basedagent的规划推理能力，在线高效解决机器人长跨度控制问题。

免责声明：本文章如果文章侵权，请联系我们处理，本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系

上一篇：2024年市场洞察-SMT网印机行业报告

下一篇：一支体积紧凑、分辨率更高的大光圈镜头索尼FE 85mm F1.4 GM II评测

2026-01-10 点痣后与证件不符，杭州女子办出国游遭遇“证明你是你”！医生教你如何减少美丽的麻烦
2026-02-21 8890丨日晒可能增加暴露部位黑痣
2024-11-16 MySQL数据库升级的一些坑
2025-02-08 让色彩照进百年历史⑦丨印制一本书从几个月到几个小时，是什么撑起的？
2024-11-16 自动缠绕膜缠绕机
2025-01-26 奥美医疗取得无纺布折叠切断装置专利，提高了生产效率，节约了人力成本
2025-01-19 叶潞渊刻自用印33方（附篆刻年表）
2025-02-22 为什么说拜登赢了大选，输了美国制造业？
2025-01-21 挂历印刷和台历印刷哪个便宜又宣传推广好
2024-11-16 美国佐治亚州一食品包装厂液氮泄漏，致6人死亡

友情链接