Page 45 - 国外钢铁技术信息内参( 2022年5月)
P. 45
ᇏݓࣁඋ࿐߶
2) 探索性数据分析 ᇏݓࣁඋ࿐߶
探索性数据分析(EDA)是一个关键步骤,因为它的主要目标是检查数据的
分布和行为,是否存在非典型或缺失的数据,并在某些情况下创建统计假设等。
ᇏݓࣁඋ࿐߶
这可以在描述性和图形工具中显示,例如直方图、箱线图、散点图、小提琴图等
统计工具。因此,变量说明如表 1 所示:
表 1 输入数据的描述性统计
描述性统计
第一四 第三四
变量 最小值 中间值 平均值 最大值 ᇏݓࣁඋ࿐߶
分位值 分位值
初始温度 1483 1560 1582 1582 1603 1701
钢水重量 43340 53051 55344 55039 57545 62537
LF 炉氧气,ppm 0.51 2.62 4,38 38.84 9.87 866.64
出钢加脱氧白云石石灰 0 201 218 202.8 222 444
296
石灰石 1 ᇏݓࣁඋ࿐߶ 555.8 861
408.8
549
0
石灰石 2 0 0 0 82.34 0 836
ᇏݓࣁඋ࿐߶
出钢加脱氧铝块 0 0 56 41.87 57 133
铝粒 0 0 25 20.32 30 80
出钢加脱氧 FeSi 0 0 0 12.34 0 357
出钢加脱氧 SiMn 0 190 325.5 359.3 602 1274
LF 炉加 CaO 31.11 53.95 56.70 ᇏݓࣁඋ࿐߶
55.96
66.35
58.96
LF 炉加 Al2O3 7.14 17.036 18.71 18.80 20.53 30.49
ᇏݓࣁඋ࿐߶
LF 炉加 MgO 0 7.46 8.27 8.37 9.31 15.66
LF 炉加 SiO2 0 8.21 9.26 9.44 10.59 25.67
同样,它是一个结合每个变量的箱线图和小提琴图的说明。因此,变量的描
述和分布在一张图中显示,更容易理解和研究。
众所周知,箱线图表示变量的分布,显示最小值、最大值、平均值、中间值、
ᇏݓࣁඋ࿐߶
42

