PI:Yi Wu
研究方向:强化学习,多智能体学习,大模型强化学习,智能体强化学习
以强化学习技术为核心,探索通用智能体的能力边界,创造更好和人合作的交互AI。
希望AI和人的关系就像奶茶一样,简单,多样,丰富,可以一起干杯。
//github.com/marlbenchmark/on-policy
//github.com/inclusionAI/AReaL