1.6 神经网络的研究方法

研究神经网络的方法大致和其他学科一致,都遵循提出问题、做出假设、开展实验、总结成文的思路。首先是提出问题,最常见的方法是从现实世界的问题出发,提出科学问题。除了从现象中总结提炼的科学问题,研究者也可以构思一些问题,例如如何让神经网络拥有意识等。最终的目标是将科学上的问题转化为如何解决实际问题。例如,研究者可以探讨如何让计算机自动分类正常邮件和垃圾邮件等分类问题,如何在视频中自动识别有意义的帧的识别问题等。

提出问题之后,下一步就要解决问题。首要是数据,神经网络的基础是学习,而学习的原材料就是数据,所以要解决一个科研问题或者实现一个科研项目,首先需要考虑数据是否可以获得。对于数据,也需要思考以下几个问题:数据是否能够反映真实分布?数据中的噪声是否遮盖将要寻找的模式?数据是否完整,有无缺失、需要标注等情况?这些问题,实际上也是神经网络的数据预处理过程。

有了数据以后,需要从数据类型出发思考相关的输入和输出,并对模型所要完成的任务做出假设。研究者可以思考这样几个问题:数据的类型是什么?例如文本、图像、视频、音频等。数据有无标签,需要使用有监督学习,还是无监督学习?希望的输出是什么样的,是类别、数值还是矩阵?输出和输入的关系是什么?数据大约有多少,是否足以训练所需要的模型?

充分了解数据以后,研究者需要设计研究方案,可以选择在现有模型中进行改进,也可以选择另辟蹊径,针对问题开发新的模型架构。这时候,可以思考以下几个问题:所选择的模型是否有部署要求,是否因为实时性需求而不宜过大?所选择的模型应该进行什么层面的优化(架构、神经元、损失函数还是训练流程)?优化后的模型应该在什么方面超越当前常用的模型?

实验结束后,研究者可以通过模型分析数据并得出结论。通过对选定数据集的训练,得到当前模型的性能数据。通过调节超参数等方法,将模型优化到最佳状态。将得到的性能数据与其他模型进行比较,并且分析优势和劣势及其背后的原因。

当进行完对比实验以后,研究者对自己的模型就有了较为完整的评估。此时,应当对自己的工作进行总结,即将以上的几部分总结成论文的形式。在论文的写作过程中,可能还需要再次修改模型、增加实验等。在论文完成后,需要和其他研究者商议,在相关期刊或会议上进行投稿,以便更多的研究者了解自己的工作成果。

但论文并不是研究的终点,好的研究往往是发散性的,甚至是成系统的。能够从上一个问题的解决引出下一个问题的提出;能够从论文中总结出的未来可改进的方向上继续优化当前的研究;也可以跳脱当前论文的限制,思考如何在更高层次上解决遇到的问题。