Masked autoencoders are scalable vision learners

2021-12-19・machine learning

核心问题

基于掩码的自编码器在自然语言和视觉两个任务上有什么本质区别?

1) 网络结构不同。之前主流的视觉任务主 …


Attention is all you need

2017-06-03・machine learning

背景

在2015年这样的年份,深度学习在自然语言、图像处理分别发展着。在自然语言领域RNN (LSTM,GRU)是最主流的模型结构,用于进行长时序建模 …