2012.07.31,随笔,关于博士

绘图1

出发

不知不觉就到了博士第三年,也就是本该毕业的时候,但自己由于在工作的缘故,很难做到投入太多的精力。而自己总有这样的想法,考上了博士研究生,实在是我工作后难得的补习基础、提高专业的再学习机会,不想纯粹为了博士毕业而匆匆了事,自己希望博士研究生课程的学习只是个引子,利用这条博士学习答辩的主线,将工作上经常用到的基础数学、信号分析和专业知识全部细致的过一遍,以后在应用和研究时,做到知其然更知其所以然,而不是仅仅会用而已。

回顾

基于这个想法,在博士研究生第一学年选课时,自己选了清华精仪系的两门重头课,结果当然让人痛苦不堪,虽然最终侥幸通过,一门甚至得优,但整个过程却如炼狱一般。记得当时还有单位的科研和房子的装修,最终第一学年的时间,让我吃到了太多苦头,却也并无多大收获,因为到了最后备考阶段,自己实际仍是疲于突击考试内容,与自己的研磨基础的初衷相去甚远。

支持向量机

转眼到了要毕业的时间,自己的课题是模式识别中支持向量机技术的应用,因为在自己的行业领域,鲜见支持向量机技术的研究,而支持向量机技术却能克服神经网络的诸多缺陷,简化来说,可以算得上神经网络的升级优化版,因为基于结构风险最小化原则的机器学习方法,克服了神经网络经验风险最小化原则的缺点,当然也克服了神经网络学习中局部极小问题和学习快速性问题。

而支持向量机技术研究的两条主线-分类(Classification)和回归(Regression),恰好是自己最感兴趣的部分,分类用于诊断,回归用于预测,一个是现在正在做的科研,一个是将要开展的科研。自己也没有想到能找到如此合适的课题,来结合自己的博士学习和日常工作。

而网易公开课上斯坦福大学的Andrew Ng的《机器学习》课程,能让自己在今年三月份的时候,轻易的开始课题的学习和研究。但实际上一切比自己想象的复杂,在Andrew Ng讲到第四课第五课时,我会间断着去熟悉概率论和线性代数中以前极少关注的内容(因为大学学习或考研中从未涉及过),这个过程中又会顺带复习之前熟悉现在却已遗忘的部分内容。

等到《机器学习》的公开课学到第七第八课,终于来到我关心的支持向量机技术时,我惊奇的发现,自己只能理解很表面的内容,其原理涉及到太多高等代数、统计学和线性回归基础,而不是我所熟悉的高等数学、概率论和线性代数;

回到小波变换

在硬着头皮看过公开课几乎过半的内容时,自己终于决定先从应用开始,于是研究了支持向量机相关的论文和应用类书籍,发现在分类初期,经常会用来做分类特征的是小波包变换的信号频谱能量。为了尽快开始论文的写作,我想将论文的前半部分用来做特征的提取,因此,选择小波变换作为博士课题的前半个子课题最合适不过。

回到傅里叶变换

所有的小波变换书籍几乎都会在开始介绍傅里叶级数和傅里叶变换,这对自己并不是什么问题,毕竟傅里叶变换自己应用的还算熟练。而网易公开课上斯坦福大学的《傅里叶变换及应用》,又成了这一阶段最好的入门资料。

但在自己听到课程过半时,又惊奇的发现,为了从傅里叶变换引至小波变换,这些课程和书籍都会在讲解傅里叶级数时,引入向量空间和线性相关的概念。

自己在课程学习的间隙,会抽空查看大学教材《线性代数》以及《概率论》,但很难在书中找到这些课程需要的内容,都是些零散的片段。在网上搜索中,发现一位台湾教师的PPT里恰好有内积空间、正交投影部分内容,内容还算系统和完整,于是如饥似渴的自学完这个PPT,才知道自己应该学习的,是基于向量空间线性映射的线性代数,而不是我们之前为了做题和计算的矩阵和行列式的线性代数。

回到线性代数

于是买来两本国外的线性代数教材,一本是《Linear Algebra with Applications》,一本是《Linear Algebra Done Right》,结合麻省理工大的《线性代数》公开课,总算学习过程顺利起来,就算偶尔会卡住,但不至于一目茫然或者又涉及到其他知识。

总结

离毕业的日子越来越近,我想还是努力一把,看能不能在年底完成,虽然觉得希望不大,但尽力了便不后悔,说不定也有奇迹发生。

这几天反思了一下,整个研究课题的知识网拉的太开,这还是基于自己读博的初衷,自己希望今、明两年,借着博士答辩的机会,把重点放在数学和信号分析的基础知识上,争取弄清原理、推理和变换过程,而从2014年起,用一年的时间进行专业的基础学习;这三年过后,就可以把绝大部分的工作精力放在应用和工程实践中了。

但论文答辩时间仍然是无法回避的问题,我想在答辩前,把与课题相关的内容作为重点,毕竟毕业后,明年还有大半年的时间来补漏和整体复习这些基础。因此虽然网拉开了,但哪些是答辩前的重点,哪些可以后面再来,仍然要分清楚。写了个简单的计划,自己看的都有压力,但坚持吧,每天晚上到办公室,总有大学时上晚自习的感觉,那时感觉是能偷懒一次是一次呢,而现在,时间的紧迫感,却让我完全没有心思考虑偷懒的问题,只想早点看到小阶段目标的完成。

计划:

2012年08月:完成“高等代数 向量空间”学习,包括“线性代数”公开课学习、相关书籍学习; 完成信号分析“傅里叶变换及应用”公开课学习;

2012年09月:完成“小波变换”部分学习,包括两本相关书籍的学习; 完成博士论文小波部分的文字初稿;争取9月份能出一篇小波相关论文;

2012年10月:开始“机器学习”部分学习,主要是“机器学习”公开课的学习;开始机器学习部分的开题文字和文献索引工作;

2012年11月:深入“机器学习学习,并根据需要展开“统计学习 线性回归”和“水电机组 故障诊断”部分的学习;              
2012年12月:主要展开论文撰写工作,同时完成机器学习相关书籍的学习;

备注:

如果出差,在外地宾馆夜晚完成博士课题的学习,每天保证1个小时以上;

所有任务均在工作日周一至周五晚19:30-22:00完成,周末保证1个下午和1个晚上时间;

撰写论文期间,插空完成文献检索、撰写相关书籍的阅读;

线性代数内容打扎实,为傅里叶变换和小波变换打基础;

统计学习的在展开支持向量机的学习后,配合开展,不是重点;

水电机组故障诊断相关内容在支持向量机学习时,配合开展;

安排要求前紧后松,在10月初做一个回顾和总结,调整、细化第二阶段的任务;

3 thoughts on “2012.07.31,随笔,关于博士”

回复 panovr 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注