第102章物理信息神经网络（求收藏求追读求月票）_学霸的模拟器系统_林允宁

    有了新的想法,林允宁立刻合上笔记本,抓起桌上的集训队图书卡,走向金陵大学图书馆。
    高翔曾经跟他说过,在制备非平衡磁控溅射的多组分金属薄膜时,想找到一种方法,只用少量的XRD数据和几个简单的电学指标,就能快速判断样品是否落在了想要的目标相区。
    当时,林允宁给了他一个用贝叶斯框架搭建的,用红、黄、绿三色灯判断样品相区的构思。
    只是,他还没来得及实现,就被雅努斯计划吸引了全部注意力,将这个课题搁置了。
    如今看来,用神经网络来处理这个问题,可能比贝叶斯模型更高效。
    “三色灯”项目,本质上是一个分类问题,与识别猫狗并无二致。
    而里希特教授的随机电报噪声 (RTN),则是一个更复杂的时域信号识别问题。
    两者有一定的共通之处,也许能用相似的方法论来解决。
    林允宁决定先从简单一些的“三色灯”项目开始做起,积累了经验,再推广到RTN问题中。
    雅努斯计划的实验验证部分,他目前毫无思路,只能先做其他课题,慢慢寻找灵感。
    图书馆,计算机科学阅览区。
    林允宁在高大的书架间穿行,最终抽出了两本厚重的英文影印书:
    克里斯托弗?毕晓普的《模式识别与机器学习》和Haykin的《神经网络(第二版)》。
    回到宿舍,他快速翻阅着那两本书。
    感知机、反向传播、梯度下降......这些在十几年后烂大街的概念,在2005年的此刻,对绝大多数人而言还如同天书。
    但对林允宁来说,这套逻辑清晰的数学框架并不难理解。
    【检测到你已完成对《模式识别与机器学习》的首次通读,该知识模块已成功收录!】
    【新知识模块:机器学习 LV.1概念认知】
    林允宁没有犹豫,直接调动了系统。
    【注入模拟时长:200小时!】
    【指定模块:机器学习 LV.1->LV.2范式掌握!】
    当模拟结束,林允宁睁开眼时,一个基础的神经网络框架已经在他脑中清晰成型。
    他立刻打开电脑,开始用Python搭建一个最简单的三层全连接神经网络,加入到了Aether中,命名为Aether_ML_NN。
    在【模拟科研】的帮助下,他很快完成了新模块的编写。
    吃过午饭,他带着初步完成的Aether_ML_NN模块,来到了材料学院高翔的实验室。
    实验室里还是一如既往,真空泵低沉地嗡鸣。
    高翔的办公桌上还摆着两个泡面桶。
    他看到林允宁,布满血丝的眼睛里亮起一丝期待。
    “林师弟,你那边......”
    “模型做好了,可以试试。”
    林允宁将自己的笔记本电脑连接到高翔的工作站上,调出了一个简洁的界面,“我已经把你发给我的实验数据和对应的工艺参数,还有你对样品质量的'好'、'中'、'差”的标记,全部导入了Aether进行训练。
    “我现在需要更多的数据,进行交叉验证。”
    高翔点了点头,立刻行动起来,将最近一个月的数据??十几份样品的XRD图谱和对应的溅射功率、气压、时间等参数,输入这个新模型。
    “开始交叉验证。”
    林允宁点下鼠标,进度条开始缓慢移动。
    十分钟后,屏幕上弹出了一个分类准确率。
    53.2%
    这个准确率,和闭着眼睛瞎猜也没什么区别。
    实验室里一片安静。
    高翔脸上的期待迅速褪去,最终化为一声无奈的叹息。
    他摘下眼镜,用力揉了揉眉心,声音里带着实验人特有的疲惫:
    “唉,我就知道没这么简单。机器学习这东西,在咱们这种小样本、高维度的材料科学里,可能真的不适用。”
    他并没有抱怨,失败是科研的常态,他早已习惯。
    林允宁却没说话,只是盯着屏幕上的混淆矩阵。
    那上面显示,模型能轻易地区分出“好”和“差”的样品,却在“中等”和“良好”这两个最关键的区间,错得一塌糊涂。
    为什么总在这两个区间犯错?
    林允宁修长的手指轻轻敲击着桌面,很快有了结论。
    从XRD图谱上看,这两个区间区别不大,峰型和峰位确实很像。
    但神经网络只看到了相似性,却不知道实现两者的工艺参数,比如功率和气压,在物理意义上天差地别。
    换句话说,问题不出在神经网络本身,而在于他给的“信息”不够。
    “高师兄,”
    林允愈抬起头,“我们得教它物理。
    “教它物理?”
    高翔没听懂。
    “对。它现在只会'看',不会“理解”。”
    林允宁指着屏幕,“我们得把溅射功率、气压这些工艺参数,不是作为普通数据,而是作为强约束的‘物理规则”,强行写进模型里。让它知道,功率提高1瓦,和气压改变1帕,对最终晶体结构的影响是完全不同的。”
    一个全新的混合模型框架??“物理信息神经网络”(PINN) ,在他脑中成型。
    【注入模拟时长:50小时!】
    【模拟科研启动......】
    【第15小时,你正在重构算法。你尝试将描述原子扩散和成核过程的Arrhenius方程,作为一个惩罚项,加入到神经网络的损失函数中。任何不符合该物理规律的参数预测,都会受到巨大惩罚。】
    【第45小时你意识到,你正在创造一种全新的模型:不再是让机器去拟合物理,而是用物理去约束机器。】
    现实中,林允宁的手指在键盘上翻飞。
    一个小时后,Aether_ML_PINN_v1.0诞生了。
    他重新导入数据,点击了“开始训练”。
    这一次,模型不仅要拟合数据,还要满足物理规律的约束。
    训练过程慢了很多,一直快到晚上吃饭的时候,才终于完成。
    训练完成,高翔再次导入了那份测试数据。
    这一次,屏幕上弹出的最终准确率是??92.3%!
    “我......我......”
    高翔盯着那个数字,下意识地站了起来,身体因为激动而微微前倾,他反复确认自己没看错,声音都有些发颤,“这......这就成了?”
    这个数字虽然不是完美的,但已经相当惊人了。
    可想而知,按照这个筛选方案,会极大提高实验的进程。
    “还没完。”
    林允宁的表情依旧平静,“现在,让它给出一个最优工艺参数的预测。”
    他清空了所有数据,只在“目标”一栏里,输入了“最优样品”。
    然后,点击了“工艺参数预测”。
    模型开始反向推演,在庞大的参数空间中寻找最优解。
    十五分钟后,一组工艺参数被输出到了屏幕上。
    高翔只看了一眼,眉头就紧紧皱了起来:
    “林师弟,这不可能。溅射功率95瓦,气流量2.5sccm......这个参数区间,我们试过不下十次,长出来的全是些非晶的垃圾相,根本成不了膜。这是死区。”
    “模型的置信度是99.1%,值得一试。”
    林允宁的语气很平淡,却相当自信,“而且,你之前的实验记录显示,在这个参数组合下,基片温度是300度,而模型预测的最佳温度是325度。也许就是这25度的差别。”
    高翔看着林允宁,又看了看屏幕上那组违背自己所有经验的参数,脸上满是挣扎。
    浪费一片靶材和几个小时的机时倒是小事,但这种希望之后再次失望的感觉,他实在不想再经历一次了。
    他犹豫了足足半分钟,最终一咬牙:
    “行!反正我也没别的好办法了,这个课题已经失败了无数次,不差这一次。林师弟,我信你一次。如果能成,这篇文章咱们共同一作!”
    他转身走向那台巨大的磁控溅射仪,开始按照屏幕上模型预测的参数,设定程序。
    真空泵开始轰鸣,腔体内的真空计数字稳定在5.0×10-5 Pa。
    当高压电源开启,靶材表面亮起一圈绚丽的紫色等离子体辉光时,高翔的内心,反而平静了下来。
    他已经做好了再次失败的准备。
    一个小时的薄膜生长过程,显得格外漫长。
    当系统提示成膜结束,腔体开始泄压发出嗤'的一声时,高翔甚至没有第一时间去看。
    林允宁倒是很平静,他走上前,戴上无尘手套,用样品托取出了那片刚生长完成的硅片。
    在实验室顶灯的照射下,那片薄膜的表面呈现出一种均匀的金属镜面光泽,没有任何肉眼可见的瑕疵。
    “漂亮......”
    高翔喃喃自语。
    但他知道,真正的考验,在X射线衍射仪上。
    他小心翼翼地将样品固定在衍射仪的样品台上,关上防护铅门,在电脑上设定好扫描程序。
    房间里只剩下衍射仪步进电机有节奏的“嗡嗡”声。
    屏幕上,衍射图谱的数据点,一个一个地出现,逐渐汇成一条曲线。
    高翔的心提到了嗓子眼。
    曲线缓慢攀升,在20度附近,突然出现了一个尖锐的衍射峰!
    紧接着,第二个、第三个......
    所有代表着完美BCC固溶体相的特征峰,一个不少地出现在了它们应该在的位置。
    整个图谱干净得像教科书里的示例,没有任何一个杂相峰!
    “成功了......真的成功了......”
    高翔盯着那张完美的图谱,激动地浑身颤抖。
    他猛地一拍桌子,从椅子上弹了起来,在狭小的实验室里来回踱步,嘴里不停地念叨着:
    “怎么可能做到......这简直......”
    压抑了数个月的挫败感,在这一刻尽数释放,巨大的喜悦让他几乎想要大吼出声。
    就在这时,实验室的门被猛地推开。
    陈正平因为跑得太急,踉跄了一下,差点摔倒,怀里紧紧抱着他的笔记本电脑。
    他脸色煞白,嘴唇都在哆嗦。
    “林师弟,你怎么不接电话,我到处都找不到你。”
    林允宁这才想起自己一直在忙,手机关了静音。
    “怎么了?”
    他问道。
    “出事了!”
    陈正平几步冲到林允宁面前,将自己的笔记本猛地转向他,声音因为愤怒而嘶哑,“快看arxiv!墨尔本那帮......那帮人,根本没等我们回应,直接把Comment挂到预印本网站上了!现在都已经置顶了!”
    陈正平咬牙切齿,显然对此十分愤怒。
    屏幕上,是物理学预印本网站arXiv的首页。
    一篇刚刚提交、被置顶高亮的最新论文,其标题用加粗的字体呈现,措辞十分尖锐一一
    <On the Fragility of Theoretically Predicted Quantum Anomalous Hall Effect in Graphene)
    (《论石墨烯中理论预言的量子反常霍尔效应之脆弱性》)

学霸的模拟器系统： 第102章 物理信息神经网络（求收藏求追读求月票）

学霸的模拟器系统：第102章物理信息神经网络（求收藏求追读求月票）