Categories - Notes - choucisan's blog

25 posts in total

2026

VideoMind——基于 Chain-of-LoRA 的长视频推理框架

Video-MTR——基于RL的长视频多轮推理框架

VideoDeepResearch——基于 Agent 工具调用的长视频理解框架

Spatial-MLLM——提升视觉基础空间智能的MLLM

GDPO——分组奖励解耦归一化策略优化算法

2025

SAPO——软自适应策略优化算法

GSPO——序列级策略优化算法

DAPO——动态采样策略优化算法

GRPO——组相对策略优化算法

DPO——直接偏好优化算法