ydjplus

ydjplus

Achievements

multi-agent-dt-demo multi-agent-dt-demo Public

一个聊天优先的工业智能工作台demo，支持普通问答、表格/文档分析，以及通过统一适配器调用数字孪生模型。

Python
Reagent Reagent Public

Forked from kxfan2002/Reagent

Agent-RRM: Exploring Reasoning Reward Model for Agents

Python
ARPO ARPO Public

Forked from RUC-NLPIR/ARPO

[ICLR 2026] Agentic Reinforced Policy Optimization (ARPO)

Python
Search-R1 Search-R1 Public

Forked from PeterGriffinJin/Search-R1

Search-R1: An Efficient, Scalable RL Training Framework for Reasoning & Search Engine Calling interleaved LLM based on veRL

Python
ATPO_tree ATPO_tree Public