Skip to main content
Agent Planning with World Knowledge Model

Agent Planning with World Knowledge Model

Basic Information

  • 2024/05/13 發布 (尚未正式於 Conf. 發表)
  • Shuofei Qiao, Runnan Fang, Ningyu Zhang et al. @ Zhejiang University, National University of Singapore, Alibaba Group

問題描述

近年來大型語言模型(LLM)在許多自然語言處理的問題有很快速的成長,而近期開始出現一些使用 LLM 作為 agent model 來處理物理環境中的規劃問題。然而由於當前 SOTA 的 LLM 幾乎都是 autoregressive model,模型實際上會做的事情是去預測下一個 output token 要是什麼,實際上他們對於物理環境是沒有任何理解的。


About 20 minNotePaper ReadReinforcement LearningLLM