Kazuki Fujii

kazukifujii

https://okoge-kaz.github.io/

AI & ML interests

Distributed Training, ML Systems, VLA

Recent Activity

upvoted a paper 3 days ago

GLM-5V-Turbo: Toward a Native Foundation Model for Multimodal Agents

liked a model 4 days ago

zai-org/GLM-5

liked a model 6 days ago

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-Base-BF16

View all activity

Organizations

upvoted a paper 3 days ago

GLM-5V-Turbo: Toward a Native Foundation Model for Multimodal Agents

Paper • 2604.26752 • Published Apr 29 • 112

upvoted an article 6 days ago

Article

Profiling in PyTorch (Part 2): From nn.Linear to a Fused MLP

ariG23498, ror, sergiopaniego, pcuenq, sayakpaul

•

10 days ago

• 43

upvoted 2 articles 20 days ago

Article

Unlocking asynchronicity in continuous batching

ror, pcuenq, ariG23498

•

May 14

• 60

Article

KV Cache from scratch in nanoVLM

ariG23498, kashif, lusxvr, andito, pcuenq

•

Jun 4, 2025

• 120

upvoted an article 21 days ago

Article

Continuous batching from first principles

ror, ArthurZ, mcpotato

•

Nov 25, 2025

• 408

upvoted 2 articles 22 days ago

Article

KV Caching Explained: Optimizing Transformer Inference Efficiency

not-lain

•

Jan 30, 2025

• 351

Article

Profiling in PyTorch (Part 1): A Beginner's Guide to torch.profiler

ariG23498, sayakpaul, sergiopaniego, ror, pcuenq

•

23 days ago

• 121

upvoted 2 papers 28 days ago

Efficient Memory Management for Large Language Model Serving with PagedAttention

Paper • 2309.06180 • Published Sep 12, 2023 • 59

Gated DeltaNet-2: Decoupling Erase and Write in Linear Attention

Paper • 2605.22791 • Published May 21 • 33

upvoted a paper about 1 month ago

MolmoAct2: Action Reasoning Models for Real-world Deployment

Paper • 2605.02881 • Published May 4 • 354

upvoted 2 articles 2 months ago

Article

Building Autonomous Vehicles That Reason with the NVIDIA Alpamayo Open Ecosystem

drmapavone

•

Jan 5

• 26

Article

Introduction to 3D Gaussian Splatting

dylanebert

•

Sep 18, 2023

• 140

upvoted a collection 3 months ago

Nemotron-Post-Training-v3

Collection

Collection of datasets used in the post-training phase of Nemotron Nano, Super, and Ultra v3. • 50 items • Updated 9 days ago • 158

upvoted 2 articles 3 months ago

Article

Code Concepts: A Large-Scale Synthetic Dataset Generated from Programming Concept Seeds

nvidia

•

Mar 11

• 6

Article

LeRobot v0.5.0: Scaling Every Dimension

imstevenpmwork, pepijn223, jadechoghari, CarolinePascal, lilkm, nepyope, Nico-robot, aractingi, VirgileBatto, thomwolf

•

Mar 9

• 44

upvoted a collection 4 months ago

Qwen3.5

Collection

21 items • Updated Mar 9 • 1.68k

upvoted 4 papers 4 months ago

Kazuki Fujii

AI & ML interests

Recent Activity

Organizations

kazukifujii's activity

Profiling in PyTorch (Part 2): From nn.Linear to a Fused MLP

Unlocking asynchronicity in continuous batching

KV Cache from scratch in nanoVLM

Continuous batching from first principles

KV Caching Explained: Optimizing Transformer Inference Efficiency

Profiling in PyTorch (Part 1): A Beginner's Guide to torch.profiler

Building Autonomous Vehicles That Reason with the NVIDIA Alpamayo Open Ecosystem

Introduction to 3D Gaussian Splatting

Code Concepts: A Large-Scale Synthetic Dataset Generated from Programming Concept Seeds

LeRobot v0.5.0: Scaling Every Dimension