输出 noisy depth + semantic labels。