第二日一早九点,苏飞背着书包就准时来到了计科306,让他没想到的是,306居然坐满了人,而他一进去,闲聊的学员们就忽然沉默下来,齐刷刷地把视线投到他身上。
这让苏飞多少有点尴尬,他就是个旁听生,怎么还成焦点了,让他有些紧张。
他沿着墙打算找个角落坐下,可屁股还没落座呢,一旁的学员却疑惑地问:“学弟,你坐下干嘛?上去讲课啊。”
苏飞愕然:“我就是个听课的啊?”
姜大小姐也没说他要上去讲啊?难道这是社团习俗?
“我们都是来听你讲课的啊。”那学员吃了一惊,心想这学弟不是被誉为机器学习领域的新星么?怎么感觉呆呆的。
“啊?”苏飞环视一周,发现姜大小姐居然不在。
“快上去呀,大家都等着呢。”旁边的另一个学员催促道。
“哦......哦,那行吧。”
望着齐刷刷看向自己的学长学姐们,他也有些自我怀疑,难道姜大小姐早就想到我会整理TagLM的相关知识并且提出一个新想法,所以让我先大致讲讲我的构想?
他犹豫了片刻,说道:“我对机器学习和深度学习的理解其实比较浅薄,相较在座的各位,经验非常不足,如果有什么错误的地方还请多担待。”
没有他预想里的鼓励加油,众人都一副冷漠的态度。
搞什么,AI研究社的人都和姜倾雪一样是个冰块?
可一想到姜大小姐这座钻石矿,苏飞还是不情不愿地上台。
苏飞打开书包,拿出准备好的U盘,里边有他昨天的构想,将资料投屏到306的屏幕上。
“基于TagLM的深度上下文词向量预训练?不是说要讲讲机器学习的核函数升维方法么?怎么突然改换深度学习了?而且还是自然语言处理?”
下面的一些学员顿时有些迷惑了,这和他们接到的通知不一样啊。
“我想讲一讲我对TagLM的理解,大家可能都比较熟悉TagLM这个模型,但我不想从计算机系的角度去理解,而是从数学系的角度去理解。”
“TagLM的主要贡献其实就是预训练,分三个步骤完成词向量的预训练,前两个步骤的结果拼接起来放到第三个部分进行预测......”
听着苏飞的讲课,众人表情微变。
“这完全就是基础课啊。”
“TagLM,我们社不是研究过好多遍了么?”
“顾行之不是机器学习的么?怎么跳到深度学习了?”
“顾行之名不副实啊。”
苏飞内心暗道果然,这些知识对于普通的本科生来说是超纲知识,但对于AI研究社的学长学姐来说,都只是基础。
于是,他也不准备藏着掖着了,开始进入正题。
“上述所说的都是基于编程知识,对TagLM做的一个简单的概括。那么我接下来就用数学知识来阐述一下我的看法。我想大家也知道,TagLM基于的循环式神经网络在数学上其实就是一个矩阵,用线性代数的角度去想,训练的过程无非就是更新矩阵的参数罢了。”
“但是,为什么TagLM的拼接操作会被人诟病,为什么分成三部来训练就会有不小的误差呢?这个问题不仅困扰着TagLM,而且困扰着与之相关的FastText和ULM模型。我想,深度学习教科书上也不会解释,因为大家都说深度学习是个黑盒,很难解释原理。”
“但,仅针对这个问题,我从数学的角度理解,应当是......”
随着苏飞讲解的深入,众人一改之前的神色,他们发现,这小学弟还真有实力。
众人纷纷打开笔记本,开始记下苏飞的独特见解。
......
此时,姜大小姐才赶回306,来到306门前,正准备推门进来,却发现有人在讲课,顿时停下了动作。
“顾行之刚跟我说有事不来,怎么还有人在讲课?”
姜倾雪越看那人越觉得熟悉,看到PPT上大大的“TagLM”,这才想起,这不是图书馆那日的......苏飞?
姜倾雪出于礼貌,没有立刻开门,而是在门口静静地聆听了几分钟,听着苏飞从数学角度的讲解。
‘叮!目标好感度+1,目前好感度22。’
‘叮!目标好感度+1,目前好感度23。’
...
‘叮!目标好感度+1,目前好感度30。’
系统的声音让正在讲课的苏飞一顿,随即便意识到,姜大小姐回来了?
于是,他又环视了一周,发现在门口站着的那位冰山美人。
“学弟,继续讲啊,刚刚说的两种模态差异的数学表示到底是什么?”
“实在是太精辟了,真的没想到,小学弟研究TagLM到了这种地步,我还从未见过有人能用数学把这个模型讲的这么清晰。”
“虽然涉及到的数学知识只有高等线代和高等数学,但没有把这两本书吃透,根本没法有这样的理解,我们AI研究社专注研究模型结构,忽略了基础的数学理论,学弟你这堂课我们真是受益匪浅!”
“作为数学系的学生,在高等线代的理解上居然不如学弟,学弟牛哇!”
众人发现苏飞久久不语,于是顺着他的视线看去。
“社长?!”
姜倾雪这才一脸冷淡地推门进来。
“社长,这顾行之不愧是社长你推荐的人啊,名副其实!华大研究生实至名归!”一旁的学员感叹道。
苏飞:“啥?”
什么鬼,我成替身了?
姜倾雪淡淡地道:“讲的不错。”
‘叮!目标好感度+5,目前好感度35。’
苏飞暗想:您老就是个傲娇?
姜倾雪撇了他一眼,道:“继续。”
苏飞加快速度继续说下去,很快就到了结尾,在最后他抛出了自己的想法,阐述了他现在的瓶颈,并真诚地看着AI研究社里的各位大佬们。
结果现场一片寂静,连姜倾雪都紧皱着眉头,仿佛在思考。
良久,她才发声:“有可能实现,但非常难。我的思路是,不要做加法,而是做减法,或许大胆点去除CNN和RNN的信息提取层,直接用词向量作为单一信息源,效果会更好。”
其他学员们也都面面相觑,改TagLM的结构,这小学弟胆子是真大,他们这群研二研三的都没有胆子去实践,主要怕浪费时间做无用功。
有人提了个建议:“要不学弟,你就做做TagLM的下游应用,从单纯的命名体识别拓展下,其实也能有不错的成果。”
苏飞摇了摇头,说道:“因为一些原因,我必须改善TagLM的结构。”
下游任务这种简单的应用的确能够快速出成果,一般的水点的二区也能发上去,但顶会就别想了,AAAI就更想p吃。
倒是姜大小姐的建议给了他一点启发,做减法的确是个之前没想到的新思路。
‘叮!目标好感度+5,目前好感度40。’
‘叮!目前目标好感度40,达到朋友关系,获得2000积分,商城随机商品位+1,请宿主再接再厉!’
‘叮!发布攻略任务:请宿主满足姜倾雪的期待,改善好模型并发表论文。奖励:精神力+1,1000积分。’
苏飞眼睛一亮,钻石矿不愧是钻石矿,来这边走一圈,赚的简直盆满钵满。
“咳,学弟,你在江大也没几天了,要不接下来几天给我们社再讲讲深度学习里的数学?”一个男生渴望地看着苏飞。
苏飞瞪大了眼睛,什么叫我在江大没几天了?
姜倾雪咳了一声,说道:“顾行之今天有事来不了,这位同学是江大的。”
苏飞也打了个招呼:“各位学长学姐好,我叫苏飞,目前大四。”
306顿时一静,每个人都眼睛瞪的铃铛一样大。
啥??
才大四,本科生?
社长也是,这个苏飞也是,现在的本科生都这么猛了吗?!
随即他们便有些头皮发麻,瞬间感觉自己这些研究生着实有些废物啊。