RSS-2026 - a kulbir97 Collection

kulbir97 's Collections

RSS-2026

updated 17 days ago

facebook/locate-3d

Updated Apr 17, 2025 • 60 • 11
facebook/locate-3d-plus

Updated Apr 17, 2025 • 114 • 8
facebook/3d-jepa

Updated Apr 17, 2025 • 32 • 8
Masking Teacher and Reinforcing Student for Distilling Vision-Language Models

Paper • 2512.22238 • Published Dec 23, 2025 • 30
4D-RGPT: Toward Region-level 4D Understanding via Perceptual Distillation

Paper • 2512.17012 • Published Dec 18, 2025 • 49
InfiniDepth: Arbitrary-Resolution and Fine-Grained Depth Estimation with Neural Implicit Fields

Paper • 2601.03252 • Published Jan 6 • 104
Can LLMs Predict Their Own Failures? Self-Awareness via Internal Circuits

Paper • 2512.20578 • Published Dec 23, 2025 • 86
RyeCatcher/speculative-decoding-cross-domain-analysis

Updated Nov 30, 2025
SceneDiff: A Benchmark and Method for Multiview Object Change Detection

Paper • 2512.16908 • Published Dec 18, 2025 • 1
PaperBanana: Automating Academic Illustration for AI Scientists

Paper • 2601.23265 • Published Jan 30 • 228
Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 76
facebook/sam-3d-objects

Updated 4 days ago • 1.6k • 409
SAM 3D: 3Dfy Anything in Images

Paper • 2511.16624 • Published Nov 20, 2025 • 116
Can Large Language Models Understand Context?

Paper • 2402.00858 • Published Feb 1, 2024 • 24
More Agents Is All You Need

Paper • 2402.05120 • Published Feb 3, 2024 • 57
OLMo: Accelerating the Science of Language Models

Paper • 2402.00838 • Published Feb 1, 2024 • 86
Finetuned Multimodal Language Models Are High-Quality Image-Text Data Filters

Paper • 2403.02677 • Published Mar 5, 2024 • 19
facebook/VGGT-Omega

Updated May 14 • 152
nvidia/Cosmos-Predict2.5-14B

Updated Dec 5, 2025 • 13.1k • 28
nvidia/Cosmos-Predict2.5-2B

Updated Mar 3 • 57.2k • 134