Page 46 - 国外钢铁技术信息内参( 2022年5月)
P. 46
ᇏݓࣁඋ࿐߶
四分位数和异常值。小提琴图是一种有用的对称图,它显示了变量的分布,因此
图形越宽,变量值在该范围内重复的次数就越多。相反,它越窄,变量值在该范
围内的重复次数就越少。一个好的单变量分布显示一个紧凑的框,很少或没有异 ᇏݓࣁඋ࿐߶
ᇏݓࣁඋ࿐߶
常值,是对称的,平均值和中间值接近。小提琴图的优点是可以显示变量的分布,
同时考虑变量变为多模态还是正态。
附录中的图 9,具有用于 EDA 的数据集的每个变量的箱线图和小提琴图的
插图连接。为了理解表 1 中所有图形的描述符所代表的符号,将对一个图形进行
解释。 ᇏݓࣁඋ࿐߶
ᇏݓࣁඋ࿐߶
ᇏݓࣁඋ࿐߶
ᇏݓࣁඋ࿐߶
图 2 LF 炉温度的箱线图和小提琴图
初始温度变量在箱线图中用实线绘制,在小提琴图中用虚线绘制。箱线图显
ᇏݓࣁඋ࿐߶
示为一个紧凑的框,对应于 50%的数据,一条与框相交的线表示中间值。此外,
我们观察到在中间有一个十字架的圆圈,表示平均值。垂直于水平框边缘的垂直
线是表示数据的第一个四分位数和最后一个四分位数的须线。虚线下方和上方的
黑点是异常值。小提琴图是一个对称的图形,说明密度变化,因此可以观察到初
始温度有一个正态分布。
最后,箱线图居中,平均值和中间值接近,对称而紧凑,与小提琴图等正态
ᇏݓࣁඋ࿐߶
分布有关。ANN 输入包括铸件的液重、炉渣质量、初始温度、LF 炉中氧气以及
43

