13log
  • HOME
  • ARCHIVES
  • TOPICS
    Publications Open Source Notes Share Tech Share Life Share
  • ABOUT
Categories - Notes

16 posts in total


2026

01-13
VideoAuto-R1——按需推理的视频理解框架
01-11
VideoMind——基于 Chain-of-LoRA 的长视频推理框架
01-09
Video-MTR——基于RL的长视频多轮推理框架
01-07
VideoDeepResearch——基于 Agent 工具调用的长视频理解框架
01-05
Spatial-MLLM——提升视觉基础空间智能的MLLM
01-03
GDPO——分组奖励解耦归一化策略优化算法

2025

12-29
SAPO——软自适应策略优化算法
12-28
GSPO——序列级策略优化算法
12-27
DAPO——动态采样策略优化算法
12-25
GRPO——组相对策略优化算法
12
© 2025 13 Lab. All Rights Reserved.
Views: Visitors: