对于训练集,这次给了两个数据集,一个是半监督的(5000个),一个是全监督的(5000个)。然后还有一个测试集、一个用于排行的测试数据集。

然后万恶的老师搞了一个排行榜,让我们去提交我们的结果

刚开始我们想的就是使用一个CNN模型,然后利用伪标签进行半监督学习。数据集肯定是增强了的,包括对于结果分类,输入也是进行了增强了的。

刚开始还好,我们提交了CNN的结果,一下子就干到了排行榜第一。

然后我们就摆烂了

然后就是在DDL的前3天,一下子就掉到第三了。😡

这下就坐不安稳,在网AI上到处找资料。然后看到了VAE模型,但之前事情有点多,就没做这个。

直到DDL的前一天下午,才开始写这个模型。

然后我初略地看了一下VAE的原理,以为我懂了,就开始写代码了。后来我才发现我理解错了。

这个是我理解的:

后面发现我理解错了,其实VAE模型还有一个KL散度啥的。但是把这玩意加上去模型反而又根本学不到东西了,由于时间比较紧,就没再去改了。

虽然但是,这个伪VAE的效果还是蛮不错的,又干到榜一了。

项目代码

Project: https://github.com/The-Brotherhood-of-SCU/semi-supervised-learning