高通量计算平台主要由三部分组成:1)基于MES系统进行高通量数据的采集,以FAIR原则作指导,确保数据的可查找、可访问、可互操作、可重用及数据系统偏差的一致性;2)利用高保真的高通量实验数据及机器学习技术构建数据驱动模型,指导增材制造实验设计、工艺优化、生产管理;3)数据的可是化,以图形界面展示整个工作流。该平台以”AI+增材制造”为主题,旨在加速高性能合金材料的设计,降低研发成本。
高通量计算平台V1.0数据收集框架主要包含了三个模块:1)MES数据采集、2)机器学习建模、3)集成软件,如图1-1所示。数据采集系统(MES系统)目前MES系统具备从物料信息->3D打印参数->线切割加工参数->CNC加工参数->热处理参数->拉伸机参数,全流程数据采集能力,保证了系统误差的一致性。数据驱动模块包含三个方面:1)增材制造材料设计、2)工艺优化、3)生产管理。
图1-1. 高通量计算平台架构
图1-2. 基于MES的数据采集系统
图1-3. 数据驱动算法模块
本地高性能计算集群
本公司目前具有10台高性能计算机,配置为:
64 CPUs(128 threads)of Intel(R) Xeon(R) Platinum 8375 CPU @ 2.90GHz
128 GB RAM
2T SSD + 8T HDD
高性能云计算平台
商业云计算平台:华为云、腾讯云、曙光智算等
开源工具库及算法:
工具库:sklearn、pytorch、tensorflow、pymatgen、OpenCV、Magpie等
算法:Unet、Vgg16、CNN、RNN、RandomForest、SVM、Bayesian等
自研软件及算法:
晶体错配度-Brafitt、Citrine
热力学筛选软件
AI+微观组织
AI+力学性能
AI+工艺参数
人工智能基础软件开发
人工智能应用软件开发
大数据服务
高性能合金工艺及热处理优化
高性能合金成分设计
高校、研究所等科研单位,材料基因工程项目协同研发;
航空航天,如飞机发动机内叶片、轮盘、轴杆和轴承等结构和结构件;
高通量3D打印实验:通过不同不同原料配比,多通道快速打印拉伸试样件;
数据收集:通过MES系统记录从粉末原料到试样件拉伸全流程数据,包括但不限于物料信息、激光打印参数、线切割加工参数、CNC加工参数、热处理参数、拉伸机参数;
数据驱动模型构建:具备增材制造材料设计、工艺优化、生产管理建模能力;
选区激光熔覆(SLM)是一种广泛应用的金属增材制造(AM)技术,打印工艺参数、加工工艺参数、热处理工艺参数是提高其机械性能的关键因素。传统试错工艺调优的方法费时费力,本公司基于高通量实验数据建立数据驱动模型,构建工艺-结构-性能之间的关系,优化工艺参数以实现高质量的产品。其中打印工艺参数包括但不限于: 1)光斑直径、2)切片层厚、3)扫描图案、4)扫描间距、5)内填充扫描路径、6)内填充旋转角度、7)激光功率、8)扫描速度;9)样品尺寸;10)轮廓数量;11)轮廓激光功率;12)轮廓扫描速度;13)表皮扫描方式;14)表皮扫描间距;15)表皮扫描图案;16)表皮旋转角度;17)表皮扫描 路径;18)表皮激光功率;19)表皮扫描速度;加工参数包括但不限于:1)CNC机床主轴倍率、2)进给倍率、3)主轴电流、4)主轴转矩、5)主轴功率、6)主轴温度;热处理参数包括但不限于:1)固溶温度、2)固溶时间、3)时效温度、4)时效时间。
样品高通量制备,多管道混粉,提升制样效率;
公司目前拥有两台3D打印设备:1)DLM-120HT、2)DLM-280;
不同打印参数,打印多个金相试样块进行打印参数的调优(图3-1(左));
多通道混粉,一块基板上能同时打印不同成分的拉伸试样件(图3-1(右));
图 3-1. 打印金相试样块(左);打印拉伸试样件(右)
数据高通量收集与检索;
多变量同步采集,确保数据的完整性如图3-2,包含:1)物料信息、2)打印参数、3)线切割、4)热处理、5)CNC加工、6)热处理、7)拉伸机
数据检索功能、快速构建输入--输出数据流;
图 3-2. MES系统数据采集
数据驱动建模
工艺参数---孔隙率建模工作流:1)数据集,试样块金相数据集、2)数据预处理,利用Unet网络进行语义分割,划分孔隙与背底,统计孔隙率、3)建立由工艺参数、热处理参数到孔隙率之间的映射关系、4)构建虚拟参数空间并进行预测、5) 实验验证并迭代模型;
图 3-3. 工艺参数/热处理参数--孔隙率模型构建工作流
结果可视化,经过多轮工艺参数调优,试样件的孔隙率逐渐降低;以孔隙率为筛选标准,利用机器学习模型指导工艺参数调优,大大缩短研发周期;孔隙率模型在交叉验证中皮尔森系数(PCC)为0.96,具有较高的预测精度;
图 3-4. 孔隙率随工艺调优的变化
图 3-5. 孔隙率模型评估
针对客户待优化的材料,给出理想的打印参数、热处理参数
针对客户待优化材料,提供所有实验数据(SQL文件)及样品
提供机器学习用户交互界面(包含数据集、优化算法、优化策略)及使用说明书
撰写技术报告
Inconel 718合金(IN718)是一种沉淀硬化型镍基高温合金,具有高强度、耐腐蚀性和机械稳定性,被广泛应用于航空航天、石油化工和核工业等领域。增材制造选区激光熔化(SLM)技术的发展为IN718合金的加工难题提供了新的解决思路。目前的研究大多集中在SLM工艺的参数优化和SLM制备构件的后续热处理,而除此之外,对IN718合金或IN718增材合金粉末进行成分优化和增强不失为一种改善SLM成形件性能的合理途径。通过机器学习辅助高强度-高塑性IN718合金设计,多目标优化算法快速筛选高强度-高塑性IN718合金成分;
机器学习策略,通过选择具有最大期望收益的样本点来更新模型,并逐步收敛于全局最优解,如图3-6所示。
图3-6. 自适应优化设计流程图
通过计算期望提升排序靠前的成分点,作为下一步实验的采样点,进行样品的制备与测试。新的实验数据添加到数据集中,进行实验-机器学习模型的迭代,直到材料性能达到我们的要求。
多种成分样品的高通量制备,DLM-120HT是基于异质粉末3D打印的材料样品高通量制备平台。直接利用元素粉末进行3D打印成型,可同时实现4种以上元素、4个通道、不少于40种材料力学性能样件的一次性制备,并完成均质化处理;
图 3-6. DLM-120HT高通量打印技术原理
根据待优化的成分空间,利用自研软件计算得到四种预合金粉末成分。如图3-7,高强-高塑性IN718合金设计结果图,具体流程为:1)根据文献及热动力学计算,首次筛选出一定量的IN718合金成分作为初始训练集,高通量3D打印制备系统误差一致的数据集;2)利用此数据集进行模型的训练,并对未知的成分空间进行预测;3)基于期望提升筛选出下次实验的采样点;4)根据机器学习预测第二代成分,进行试验验证,性能满足要求则进行工业生产,性能不满足要求则进行高通量试验-机器学习的迭代。由图3-7可知,在保证数据质量的前提下,机器学习成分-断裂强度(UTS,图左),机器学习成分-断裂塑性(Strain,图中)模型在留一交叉验证下均具有较高的预测进度,其相关系数(PCC)分别为0.912,0.848。由图3-7右为IN718强度-塑性示意图, 随着迭代的进行,性能边界逐渐扩大,合金综合性能得到提升。
图3-7. (左)机器学习成分-抗拉强度模型,(中)机器学习成分-塑模型,(右)IN718强度-塑性(随迭代次数的变化)
高强-高塑合金设计方案
合金金相,拉伸数据等实验结果及报告
机器学习优化策略及相应代码
金属粉末原材料会直接影响到最后打印成行件的机械性能,因此粉末物理性能检查至关重要。物理性能主要指的是颗粒形状及结构、粒度分布、比表面积、颗粒密度等。增材制造用金属粉末除需具备良好的可塑性外,还必须满足粉末纯度高,粉末粒径细小、粒度分布窄、球形度高、流动性好和松装密度高等要求。粉末粒度尺寸分布会直接影响打粉末的流动性,进而对3D打印致密化和微观结构的演变具有重要的影响。
传统测量粉末粒度分布的方法有:1)光学显微镜法、2)扫描电镜法、3)动态颗粒图像分析法等。光学显微镜法只能呈现光照条件下的垂直投影,不能反映颗粒的整体形貌和表面状态;扫描电镜虽然具有更大的分辨率,但是其制样相对比较麻烦,设备购置和维护成本较昂贵。基于光学显微法及动态颗粒图像法的不足,本模块借鉴动态颗粒图像分析法采集图像的模式,利用深度学习方法构建卷积神经网络(CNN)对图片进行语义分割处理,并对分割后的二值图进行统计分析,最终给出金属粉末的粒度分布图。
数据的收集:让金属粉末颗粒连续不断地通过相机的拍照区域,颗粒流动时的取向是随机分布的,从而实现多角度对颗粒粒度及粒形的准确检测,数据入MES;本公司MES系统下存放有海量Ni基高温合金、铝基合金的SEM及OM数据,为模型的训练提供的数据基础;
模型的训练:基于Unet网络训练语义分割模型,如图3-8所示,左侧为SEM及OM照片的原始图,中间为基于CNN的U形网络,右测为经过语义分割后的二值图;
后处理:对二值图进行统计分析,得到粉末物理性能(颗粒的形状及结构、粒度分布、比表面积、颗粒密度等)
图3-8. 利用深度学习进行颗粒语义分割示意图
图3-9. 对二值图进行粒度尺寸分析
基于深度学习的粒径分布模型
粒度分布与微观组织关系构建
粒度分布与力学性能关系构建
制粉工艺与金属粉末物理性能关系的构建
目前使用的合金中,绝大多数都不能通过3D技术进行打印,打印过程中的熔化和凝固非平衡动态过程会生产大型柱状晶,从而产生大量的微观裂纹组织。已有实验报道,引入第二相纳米颗粒作为形核剂能有效抑制柱状晶的产生,从而抑制裂纹的生长。
晶格错配是指晶体中的两个相邻晶粒的晶格参数不完全匹配而产生的位向偏差;根据经典形核理论,以晶格错配度及目前最先进的面匹配应变-密度模型,进行形核剂的筛选;
Material project数据库为高通量计算提供了可靠的数据来源,分别计算了大于14万种纳米粉末与Al合金基体粉末的匹配度进行排序;
图3-10. Al及TiO2纳米颗粒晶格匹配示意图
针对客户提出的材料,给出形核剂筛选计算流;
传统材料设计方案,对新材料的开发大多数采用顺序迭代的试错法。首先,研究者根据经验初选一个成分,然后进行材料的制备,合金制备,结构表征,性能测试等一系列实验。遗憾的是,通过一次实验就得到满足要求的合金的情况少之又少。高性能合金的开发往往需要经过反复的成分调整,费时费力。本模块利用Material project开源数据库,利用晶体学及热力学理论对14多万种形核剂进行扫描,预筛选出最优形核剂。
Material project开源材料数据库收录了大量无机材料,能带结构,纳米材料,弹性张量,压电张量等数据,为材料的设计提供数据支撑;
晶格错配高通量筛选,如上述基于晶格错配及面匹配应变-密度模型进行高通量筛选;
热力学筛选的三重准则:1)Gulliver-Scheil凝固;2)合金体系的凝固裂纹敏感性判定;3)成长抑制因子;
高通量实验验证;
根据客户待优化的材料,利用漏斗设计筛选方案;
提供10-100种最优形核剂;
添加形核剂高性能合金的高通量实验制备与验证;
完整实验方案一份;
特征工程是机器学习和数据挖掘中,通过对原始数据进行处理,转换和选择等操作,从中提取出能够反映问题本质,并且便于模型识别和学习的特征。
数据清洗:对数据进行去重、填充缺失值、异常值处理等操作、使数据更加规范;
特征变换:对数据进行数值化、归一化、正则化、标准化等操作、使其适合用于机器学习算法的输入;
特征构建:从原始数据中根据领域知识或专业经验构造新的特征,增加模型的表达能力;
特征选择:从原始数据中选择与目标变量相关性较高的特征、以及剔除冗余和无关的特征;
特征降维:对高维数据进行主成分分析(PCA)、因子分析等方法进行降维,使数据更具可解释性和可视化性;
对客户所剔除的材料内问题进行数据的采集;
对客户提出材料问题进行特征构建、特征筛选、特征重要性排序等;