学霸的模拟器系统: 第102章 物理信息神经网络(求收藏求追读求月票)
有了新的想法,林允宁立刻合上笔记本,抓起桌上的集训队图书卡,走向金陵大学图书馆。
高翔曾经跟他说过,在制备非平衡磁控溅射的多组分金属薄膜时,想找到一种方法,只用少量的XRD数据和几个简单的电学指标,就能快速判断样品是否落在了想要的目标相区。
当时,林允宁给了他一个用贝叶斯框架搭建的,用红、黄、绿三色灯判断样品相区的构思。
只是,他还没来得及实现,就被雅努斯计划吸引了全部注意力,将这个课题搁置了。
如今看来,用神经网络来处理这个问题,可能比贝叶斯模型更高效。
“三色灯”项目,本质上是一个分类问题,与识别猫狗并无二致。
而里希特教授的随机电报噪声 (RTN),则是一个更复杂的时域信号识别问题。
两者有一定的共通之处,也许能用相似的方法论来解决。
林允宁决定先从简单一些的“三色灯”项目开始做起,积累了经验,再推广到RTN问题中。
雅努斯计划的实验验证部分,他目前毫无思路,只能先做其他课题,慢慢寻找灵感。
图书馆,计算机科学阅览区。
林允宁在高大的书架间穿行,最终抽出了两本厚重的英文影印书:
克里斯托弗?毕晓普的《模式识别与机器学习》和Haykin的《神经网络(第二版)》。
回到宿舍,他快速翻阅着那两本书。
感知机、反向传播、梯度下降......这些在十几年后烂大街的概念,在2005年的此刻,对绝大多数人而言还如同天书。
但对林允宁来说,这套逻辑清晰的数学框架并不难理解。
【检测到你已完成对《模式识别与机器学习》的首次通读,该知识模块已成功收录!】
【新知识模块:机器学习 LV.1概念认知】
林允宁没有犹豫,直接调动了系统。
【注入模拟时长:200小时!】
【指定模块:机器学习 LV.1->LV.2范式掌握!】
当模拟结束,林允宁睁开眼时,一个基础的神经网络框架已经在他脑中清晰成型。
他立刻打开电脑,开始用Python搭建一个最简单的三层全连接神经网络,加入到了Aether中,命名为Aether_ML_NN。
在【模拟科研】的帮助下,他很快完成了新模块的编写。
吃过午饭,他带着初步完成的Aether_ML_NN模块,来到了材料学院高翔的实验室。
实验室里还是一如既往,真空泵低沉地嗡鸣。
高翔的办公桌上还摆着两个泡面桶。
他看到林允宁,布满血丝的眼睛里亮起一丝期待。
“林师弟,你那边......”
“模型做好了,可以试试。”
林允宁将自己的笔记本电脑连接到高翔的工作站上,调出了一个简洁的界面,“我已经把你发给我的实验数据和对应的工艺参数,还有你对样品质量的'好'、'中'、'差”的标记,全部导入了Aether进行训练。
“我现在需要更多的数据,进行交叉验证。”
高翔点了点头,立刻行动起来,将最近一个月的数据??十几份样品的XRD图谱和对应的溅射功率、气压、时间等参数,输入这个新模型。
“开始交叉验证。”
林允宁点下鼠标,进度条开始缓慢移动。
十分钟后,屏幕上弹出了一个分类准确率。
53.2%
这个准确率,和闭着眼睛瞎猜也没什么区别。
实验室里一片安静。
高翔脸上的期待迅速褪去,最终化为一声无奈的叹息。
他摘下眼镜,用力揉了揉眉心,声音里带着实验人特有的疲惫:
“唉,我就知道没这么简单。机器学习这东西,在咱们这种小样本、高维度的材料科学里,可能真的不适用。”
他并没有抱怨,失败是科研的常态,他早已习惯。
林允宁却没说话,只是盯着屏幕上的混淆矩阵。
那上面显示,模型能轻易地区分出“好”和“差”的样品,却在“中等”和“良好”这两个最关键的区间,错得一塌糊涂。
为什么总在这两个区间犯错?
林允宁修长的手指轻轻敲击着桌面,很快有了结论。
从XRD图谱上看,这两个区间区别不大,峰型和峰位确实很像。
但神经网络只看到了相似性,却不知道实现两者的工艺参数,比如功率和气压,在物理意义上天差地别。
换句话说,问题不出在神经网络本身,而在于他给的“信息”不够。
“高师兄,”
林允愈抬起头,“我们得教它物理。
“教它物理?”
高翔没听懂。
“对。它现在只会'看',不会“理解”。”
林允宁指着屏幕,“我们得把溅射功率、气压这些工艺参数,不是作为普通数据,而是作为强约束的‘物理规则”,强行写进模型里。让它知道,功率提高1瓦,和气压改变1帕,对最终晶体结构的影响是完全不同的。”
一个全新的混合模型框架??“物理信息神经网络”(PINN) ,在他脑中成型。
【注入模拟时长:50小时!】
【模拟科研启动......】
【第15小时,你正在重构算法。你尝试将描述原子扩散和成核过程的Arrhenius方程,作为一个惩罚项,加入到神经网络的损失函数中。任何不符合该物理规律的参数预测,都会受到巨大惩罚。】
【第45小时你意识到,你正在创造一种全新的模型:不再是让机器去拟合物理,而是用物理去约束机器。】
现实中,林允宁的手指在键盘上翻飞。
一个小时后,Aether_ML_PINN_v1.0诞生了。
他重新导入数据,点击了“开始训练”。
这一次,模型不仅要拟合数据,还要满足物理规律的约束。
训练过程慢了很多,一直快到晚上吃饭的时候,才终于完成。
训练完成,高翔再次导入了那份测试数据。
这一次,屏幕上弹出的最终准确率是??92.3%!
“我......我......”
高翔盯着那个数字,下意识地站了起来,身体因为激动而微微前倾,他反复确认自己没看错,声音都有些发颤,“这......这就成了?”
这个数字虽然不是完美的,但已经相当惊人了。
可想而知,按照这个筛选方案,会极大提高实验的进程。
“还没完。”
林允宁的表情依旧平静,“现在,让它给出一个最优工艺参数的预测。”
他清空了所有数据,只在“目标”一栏里,输入了“最优样品”。
然后,点击了“工艺参数预测”。
模型开始反向推演,在庞大的参数空间中寻找最优解。
十五分钟后,一组工艺参数被输出到了屏幕上。
高翔只看了一眼,眉头就紧紧皱了起来:
“林师弟,这不可能。溅射功率95瓦,气流量2.5sccm......这个参数区间,我们试过不下十次,长出来的全是些非晶的垃圾相,根本成不了膜。这是死区。”
“模型的置信度是99.1%,值得一试。”
林允宁的语气很平淡,却相当自信,“而且,你之前的实验记录显示,在这个参数组合下,基片温度是300度,而模型预测的最佳温度是325度。也许就是这25度的差别。”
高翔看着林允宁,又看了看屏幕上那组违背自己所有经验的参数,脸上满是挣扎。
浪费一片靶材和几个小时的机时倒是小事,但这种希望之后再次失望的感觉,他实在不想再经历一次了。
他犹豫了足足半分钟,最终一咬牙:
“行!反正我也没别的好办法了,这个课题已经失败了无数次,不差这一次。林师弟,我信你一次。如果能成,这篇文章咱们共同一作!”
他转身走向那台巨大的磁控溅射仪,开始按照屏幕上模型预测的参数,设定程序。
真空泵开始轰鸣,腔体内的真空计数字稳定在5.0×10-5 Pa。
当高压电源开启,靶材表面亮起一圈绚丽的紫色等离子体辉光时,高翔的内心,反而平静了下来。
他已经做好了再次失败的准备。
一个小时的薄膜生长过程,显得格外漫长。
当系统提示成膜结束,腔体开始泄压发出嗤'的一声时,高翔甚至没有第一时间去看。
林允宁倒是很平静,他走上前,戴上无尘手套,用样品托取出了那片刚生长完成的硅片。
在实验室顶灯的照射下,那片薄膜的表面呈现出一种均匀的金属镜面光泽,没有任何肉眼可见的瑕疵。
“漂亮......”
高翔喃喃自语。
但他知道,真正的考验,在X射线衍射仪上。
他小心翼翼地将样品固定在衍射仪的样品台上,关上防护铅门,在电脑上设定好扫描程序。
房间里只剩下衍射仪步进电机有节奏的“嗡嗡”声。
屏幕上,衍射图谱的数据点,一个一个地出现,逐渐汇成一条曲线。
高翔的心提到了嗓子眼。
曲线缓慢攀升,在20度附近,突然出现了一个尖锐的衍射峰!
紧接着,第二个、第三个......
所有代表着完美BCC固溶体相的特征峰,一个不少地出现在了它们应该在的位置。
整个图谱干净得像教科书里的示例,没有任何一个杂相峰!
“成功了......真的成功了......”
高翔盯着那张完美的图谱,激动地浑身颤抖。
他猛地一拍桌子,从椅子上弹了起来,在狭小的实验室里来回踱步,嘴里不停地念叨着:
“怎么可能做到......这简直......”
压抑了数个月的挫败感,在这一刻尽数释放,巨大的喜悦让他几乎想要大吼出声。
就在这时,实验室的门被猛地推开。
陈正平因为跑得太急,踉跄了一下,差点摔倒,怀里紧紧抱着他的笔记本电脑。
他脸色煞白,嘴唇都在哆嗦。
“林师弟,你怎么不接电话,我到处都找不到你。”
林允宁这才想起自己一直在忙,手机关了静音。
“怎么了?”
他问道。
“出事了!”
陈正平几步冲到林允宁面前,将自己的笔记本猛地转向他,声音因为愤怒而嘶哑,“快看arxiv!墨尔本那帮......那帮人,根本没等我们回应,直接把Comment挂到预印本网站上了!现在都已经置顶了!”
陈正平咬牙切齿,显然对此十分愤怒。
屏幕上,是物理学预印本网站arXiv的首页。
一篇刚刚提交、被置顶高亮的最新论文,其标题用加粗的字体呈现,措辞十分尖锐一一
<On the Fragility of Theoretically Predicted Quantum Anomalous Hall Effect in Graphene)
(《论石墨烯中理论预言的量子反常霍尔效应之脆弱性》)