MAMVI: 3D Test-Time Adaptation via Masked Multi-View Point Clouds

2026-06-11 · Source: Computer Vision and Pattern Recognition · Field: Technology & Digital — Artificial Intelligence & Machine Learning, Computer Vision · Depth: Expert, quick

Summary

MAMVI, a novel 3D Test-Time Adaptation (TTA) method, addresses significant performance degradation in 3D point cloud models caused by distribution shifts like sensor noise and occlusions. It improves upon existing multi-view TTA approaches by replacing their slow sequential optimization with a unified single-step adaptation. MAMVI employs a hybrid masking strategy, combining fixed ratios for stability with Beta-distributed sampling for diversity. By aggregating losses across multiple views, it performs adaptation via a single backward pass based on multi-view consensus. Additionally, a confidence-based adaptive learning rate dynamically adjusts adaptation intensity. Experiments on ModelNet-40C, ShapeNet-C, and ScanObjectNN-C show MAMVI achieves state-of-the-art accuracy on ShapeNet-C and ScanObjectNN-C, remains competitive on ModelNet-40C, and delivers 4.9-8.9 times faster inference, making it suitable for real-time applications.

Key takeaway

For machine learning engineers deploying 3D point cloud models in dynamic environments, MAMVI offers a significant performance and speed upgrade. Your teams can mitigate distribution shifts 4.9-8.9 times faster than prior methods, ensuring robust real-time inference. Consider integrating MAMVI's single-step, multi-view adaptation to enhance model reliability and efficiency in production systems.

Key insights

MAMVI unifies multi-view 3D test-time adaptation into a single, faster step using hybrid masking and multi-view consensus.

Principles

Sequential optimization limits real-time TTA.
Multi-view consensus improves adaptation stability.
Dynamic learning rates enhance sample-specific adaptation.

Method

MAMVI replaces sequential multi-view optimization with a single backward pass, using a hybrid masking strategy and aggregating losses across views for consensus-based adaptation.

In practice

Apply hybrid masking for diverse and stable data augmentation.
Aggregate multi-view losses for unified adaptation.
Implement confidence-based adaptive learning rates.

Topics

3D Point Clouds
Test-Time Adaptation
Multi-View Learning
Distribution Shift
Real-time Inference
ModelNet-40C

Code references

Inseok-kong/MAMVI

Best for: Research Scientist, AI Scientist, Machine Learning Engineer, Computer Vision Engineer

Related on AIssential

Open in AIssential →

Editorial summary, takeaway, and curation by AIssential. Original article published by Computer Vision and Pattern Recognition.