DOE方法介绍

孤独一笑

收藏于 : 2019-11-03 17:31   被转藏 : 1   

 

DOE, Design of Experiment。就是试验设计。想知道对于某个过程的产生影响的诸多因素中对输出结果影响最关键的因素有哪些,就可以用DOE方法来设计一系列试验,获知关键影响因素。
通常的确定对输出变量最关键影响因子的试验做法有三种。
  1. 经验猜测法。首先组织一个项目小组(可邀请专家参与),陈述清楚要解决的问题,确定响应变量,然后进行头脑风暴,识别出可能的影响因子。然后凭借经验和对过程的认识及知识,猜测其中的关键影响因子或者组合。按照猜测出来的组合方案做试验,来验证是否真正相关。如果真的经验丰富,那这个方法很可能很快就找到关键因子,但是也有可能得花很久,很有运气的成分在里面。毕竟,如果经验丰富能解决这个问题,那问题应该早就解决了。
  2. OFAT. One Factor at one time.就是把各个可能的影响因子列出来后,逐个试验。试验每个因子,因子与因子的组合,以及每个因子的变化水平对输出的影响。这个方法也能得到最后想要的结论,但是缺点很明显,耗时过长,试验成本很高,而且如果提前没有识别出因子间的交互作用而单独将因子交互作为一个变量加入试验计划,那么试验结果是无法发现交互作用的。
  3. DOE试验设计法。DOE方法是一种系统化的,逻辑缜密,有严格操作步骤的试验设计方法。一般只要按照这个方法步骤操作下去就可以得到试验结果,而且花费时间和成本比较经济。
Y=F(x)

DOE试验设计法优势:
  ● 可以研究影响因子之间的交互作用
  ● 试验次数少,精度高
  ● 可以根据目标选择使用不同类型的DOE方法

什么时候使用DOE
  ● 需要知道对响应变量的主要影响因子时
  ● 优化过程的参数组合(如优化某焊接过程的各种参数以提升焊接质量)


下面介绍DOE的详细操作步骤。
1. 陈述要解决的实际问题。陈述问题要明确、具体、量化。如:三月的陶瓷烧结工序合格率只有50%。


2. 陈述试验的目标。目标就是要将实际问题解决到何种程度,将响应变量提高到什么水平目标同样要具体量化。比如:提高陶瓷烧结合格率到95%。

3. 选择过程的响应变量。
1)响应变量1~2个,不要超过两个,而且两个变量之间要相互独立,可以一起设计试验。
2)响应变量要数量化,而非定性。
3)响应变量要简单,独立(描述,测量都比较简单,而且和其他变量无交叠或交叉)。
4)响应变量要准确,能准确代表要解决问题的关键。
5)Y要有明确的目标。


4. 选择过程的影响因子。
1)首先邀请相关人员(一般有设计,技术,质量等职能,如果这些人员都不是专家,那么 要考虑邀请专家)成立项目小组。
2)头脑风暴出所有可能的影响因子。
3)各个影响因子X之间要相互独立,要消除X之间的交叠(如X1=F(X2)时,就要剔除掉X1)。
4)各个影响因子X要可控,可以在试验中变化因子水平。如果某因子在制程中无法控制,那么不能将其作为X, 并且要在试验中将其影响降低到最低。
5)筛选出小组认为比较关键的影响因子。这里可以用BP法来进行一次筛选,从11(最多11种)因子中筛选出关键的几个影响因子。BP 法就是对这11中因子做一次正交试验,每个因子选择高和低两种水平,来一次试验。试验结果反映出来的关键影响因子可以继续运用DOE法进一步试验再次筛选识别最关键因子。


5. 选择影响因子水平。
1)第一次做试验时,一般给每个因子选择高低两个因子水平(上限和下限)。
2)如果经验认为需要做多水平,建议高中低三个水平。
3)如果经验已经知道某因子的不同因子水平产生的Y的结果是一致的,那么就不要设计不同的因子水平。


6. 选择试验设计方案。
1)一般使用正交试验方法,MiniTab会给出试验方案。
这里阐述一下正交试验方法。对于一个4因子3水平的试验来说,要想试验因子和因子水平的所有组合,必须得做3^4=81次试验。这个还未考虑每个组合的重复次数。为了减少试验次数,但是还能让试验结果能反映出全组合试验的结果,日本质量专家田口玄一设计出了正交表。采用了正交表制定的试验方案,就叫做正交试验设计。所谓正交,其实就是让每个因子的每个水平和其他因子的每个水平都能均等的做一次组合。Minitab可以为使用者按选项自动配置正交方案。


下面引用一个例子来说明正交试验方法的概念。(以下例子引用百度百科词条内容,这个已经很好了没必要再编写一个)
[例1]为提高某化工产品的转化率,选择了三个有关因素进行条件试验,反应温度(A),反应时间(B),用碱量(C),并确定了它们的试验范围:
A:80-90℃
B:90-150分钟
C:5-7%
试验目的是搞清楚因子A、B、C对转化率有什么影响,哪些是主要的,哪些是次要的,从而确定最适生产条件,即温度、时间及用碱量各为多少才能使转化率高。试制定试验方案。
这里,对因子A,在试验范围内选了三个水平;因子B和C也都取三个水平:
A:A1=80℃,A2=85℃,A3=90℃
B:B1=90分,B2=120分,B3=150分
C:C1=5%,C2=6%,C3=7%
当然,在正交试验设计中,因子可以是定量的,也可以是定性的。而定量因子各水平间的距离可以相等,也可以不相等。
这个三因子三水平的条件试验,通常有两种试验进行方法:
       (Ⅰ)取三因子所有水平之间的组合,即A1B1C1,A1B1C2,A1B2C1, ……,A3B3C3,共3^3=27次试验。用图表示就是图1 立方体的27个节点。这种试验法叫做全面试验法。

图1 全面试验法取点。

全面试验对各因子与指标间的关系剖析得比较清楚。但试验次数太多。特别是当因子数目多,每个因子的水平数目也多时。试验量大得惊人。如选六个因子,每个因子取五个水平时,如欲做全面试验,则需5^6=15625次试验,这实际上是不可能实现的。如果应用正交实验法,只做25次试验就行了。而且在某种意义上讲,这25次试验代表了15625次试验。

(Ⅱ)简单对比法,即变化一个因素而固定其他因素,如首先固定B、C于B1、C1,使A变化之:

↗A1
B1C1 →A2
↘A3 (好结果)
如得出结果A3最好,则固定A于A3,C还是C1,使B变化之:
↗B1
A3C1 →B2 (好结果)
↘B3
得出结果以B2为最好,则固定B于B2,A于A3,使C变化之:
↗C1
A3B2→C2 (好结果)
↘C3


试验结果以C2最好。于是就认为最好的工艺条件是A3B2C2。
这种方法一般也有一定的效果,但缺点很多。首先这种方法的选点代表性很差,如按上述方法进行试验,试验点完全分布在一个角上,而在一个很大的范围内没有选点。因此这种试验方法不全面,所选的工艺条件A3B2C2不一定是27个组合中最好的。其次,用这种方法比较条件好坏时,是把单个的试验数据拿来,进行数值上的简单比较,而试验数据中必然要包含着误差成分,所以单个数据的简单比较不能剔除误差的干扰,必然造成结论的不稳定。
简单对比法的最大优点就是试验次数少,例如六因子五水平试验,在不重复时,只用5+(6-1)×(5-1)=5+5×4=25次试验就可以了。
考虑兼顾这两种试验方法的优点,从全面试验的点中选择具有典型性、代表性的点,使试验点在试验范围内分布得很均匀,能反映全面情况。但我们又希望试验点尽量地少,为此还要具体考虑一些问题。
如上例,对应于A有A1、A2、A3三个平面,对应于B、C也各有三个平面,共九个平面。则这九个平面上的试验点都应当一样多,即对每个因子的每个水平都要同等看待。具体来说,每个平面上都有三行、三列,要求在每行、每列上的点一样多。这样,作出如图2所示的设计,试验点用⊙表示。我们看到,在9个平面中每个平面上都恰好有三个点而每个平面的每行每列都有一个点,而且只有一个点,总共九个点。这样的试验方案,试验点的分布很均匀,试验次数也不多。


图2 正交试验法设计
当因子数和水平数都不太大时,尚可通过作图的办法来选择分布很均匀的试验点。但是因子数和水平数多了,作图的方法就不行了。
试验工作者在长期的工作中总结出一套办法,创造出所谓的正交表。按照正交表来安排试验,既能使试验点分布得很均匀,又能减少试验次数,图2正交试验设计图例而且计算分析简单,能够清晰地阐明试验条件与指标之间的关系。用正交表来安排试验及分析试验结果,这种方法叫正交试验设计法。

2)minitab都会给出不同的试验方案选择和响应的置信度水平(绿,黄,红)


7. 运行试验并收集数据
1)对于同一个试验要重复一次,观察分析结果再决定要将这同一个试验做几次(一般3~5次)。有可能是同一种样品做好几次,也有可能是同样的试验条件重复做几次?也有可能是在不同时间段测量的结果不同?
2)收集试验结果数据

     对于同一组试验重复做几次的结果(如做5次重复试验),可以取五次试验的平均结果。


8. 分析结果
分析结果一般看两点。
1)因子影响帕累托分析图。如果有因子超出虚红线右侧,那么这个因子就是关键因子。如果帕累托结构不错,但没有因子超出右侧,那么需要剔除掉噪音因子,一般是帕累托图中排名最后的几个因子。剔除后如果还没有因子超出右侧,那么可能在实验设计中遗漏了重要因子,需要返回筛选影响因子的阶段重新来过。
2)看MiniTab运行结果的Rsq值。如果这个值比较高,比如90%以上,那说明模型的符合度很好。意思是按照几个因子影响度拟合成出的模型计算出的响应变量结果和试验实际结果符合性很高。这个值是要和第一点的线一起来看。如果帕累托结构明显,也有因子超出线右侧,即使这个值到70%那也是认可这个模型结果的。


9. 给出试验结论
minitab会根据因子分析模型给出建议的最佳因子配比。但还是需要根据推荐方案进行验证实验。

10. 给出实际应用结论
结合验证试验结果,给出实际应用建议。跟踪观察一段时间,达到目标即可关闭项目。如果验证失败,需要重新看是否有其他干扰因子,或某个根本性影响因子未考虑。


需要注意,有可能两个现象之间一致性很强,但是它们直接可能没有相互影响的关系,不是x和y的关系。比如小鸟的出生率和小孩的出生率之间的关系。都是春季出生率高,但有必然的互相联系吗?它们可能都只是季节变化的结果。


 阅读文章全部内容  
点击查看
文章点评
相关文章
孤独一笑 关注

文章收藏:4628

TA的最新收藏