-
黄铁矿作为成矿过程的产物,是金矿床中普遍且重要的金属硫化物(Boyle,1979),据统计载金矿物中出现黄铁矿的金矿床占总数的98%,以黄铁矿作为主要载金矿物的金矿约占85%(高振敏等,2000)。通过研究黄铁矿的各种标型特征来获取金矿成因和找矿信息也已被广泛应用到找矿勘查和深部成矿预测的实际工作中,并取得良好的效果(陈光远等,1989;李胜荣等,1996;杨兴科等,2011;Wang Guowen et al.,2016)。黄铁矿包含信息量最大的标型特征是成分标型(徐国风等,1980;陈光远等,1988),包含了相当多的成因与找矿信息,所以占据重要的地位(Groves et al.,2016,2018;Hossein et al.,2017;Ehsan et al.,2018)。截至目前国内外对金矿黄铁矿成分标型特征的研究积累了大量的文献资料,且在金矿类型研究领域也扮演着重要的角色(栾世伟等,1983;郑明华等,1983;栾世伟,1987;Bache,1988;邵洁涟,1988;周学武和邵洁涟,1994;严育通等,2012a)。
-
矿床分类研究一直是矿床学的基本任务之一,它对于建立找矿模型和指导找矿勘查具有重要研究意义(Malmqvist et al.,1972;胡伦积等,1983;Mcenroe et al.,2001)。随着激光剥蚀-电感耦合等离子体质谱测试方法(LA-ICP-MS)和电子探针测试方法(EMPA)的成熟应用,黄铁矿矿物微量元素含量被精准测量。因为不同的矿床类型具有不同的流体源、物质源和演化机制,所以这些因素都会影响金属硫化物矿物的微量元素含量(Arehart et al.,1993;Gregory et al.,2014;Daniele et al.,2017),硫化物矿物微量元素含量数据包含的地质信息十分丰富。目前对不同类型金矿的黄铁矿微量元素的研究有很多,如Arehart et al.(1993)对美国内华达州卡林型金矿的研究发现金赋存于含砷黄铁矿内,并认为黄铁矿内还有其他微量元素。Henkelman(2004)通过对美国内华达州Betze-Post卡林型金矿的黄铁矿进行研究,按照微量元素含量将黄铁矿成分样品进行了分组。Cook et al.(2009)研究了中国三座金矿的黄铁矿微量元素变化后认为富As的黄铁矿含有较多的金。在国内,徐国风和邵洁涟(1980)对比了斑岩型和沉积热液型矿床的Co/Ni,发现前者Co/Ni比值4.45,后者0.74。在总结了部分国外黄铁矿微量元素后发现,沉积型黄铁矿含Se为0.5×10-6~2×10-6,S/Se比值为25×104~50×104,热液矿床中Se为20×10-6~50×10-6,S/Se比值为1×104~2.67×104,提出低温热液型矿床富含Tl。谢文安(1982)研究了湘东南矿床中黄铁矿的Co/Ni比值特征和地质意义。宋学信和张景凯(1986)总结中国各种成因黄铁矿微量元素及其比值特征,利用Co-Ni-As原子百分比三角图对沉积与层控、矽卡岩-热液型和斑岩型矿床进行了划分。陈光远等(1988)对胶东地区金矿进行了研究,总结出胶东地区黄铁矿成分特征和地质意义。As与金具有相关性,内生岩浆热液型高中温热液矿床比外生沉积型层状黄铁矿矿床及层控矿床的Se、Te含量高。黄邵峰(1987)总结了内生金矿床中黄铁矿特征和成因意义,采用Co-Ni-As三角图对地下热卤水型、岩浆热液型、变质热液型、火山—次火山热液型金矿床进行划分。王奎仁(1989)总结不同矿床Co/Ni比值特征,指出沉积型小于1,岩浆热液型在1~5之间,火山热液型在5以上。严育通等(2012b,2013,2016)对胶东地区石英脉型和蚀变岩型金矿床的黄铁矿成分进行了研究,发现黄铁矿Fe-S参数可以很好地区分两种金矿。之后又总结出了不同成因类型金矿成矿期黄铁矿的成分特征,提出采用黄铁矿主微量元素蛛网图、δFe-δS和Co-Ni-As方法研究不同类型的金矿类型。李洪梁等(2019)总结了不同类型热液金矿床的标型特征。这些前人的工作具有重要的借鉴意义,但是这些矿床类型判别图或方法仅仅使用了少量的黄铁矿成分数据的特征值,所采用数据的来源也仅仅来源于小片区域的几座矿床,显然不能代表多数金矿,缺乏金矿类型多样性和分布区域广域型,在大数据时代,传统判别图理论和方法都需要进一步进化和反思(葛粲等,2019;洪双等,2021)。近些年来,一些学者尝试了机器学习算法对黄铁矿微量元数据进行分析,从而判断矿床的成因类型。如Gregory et al.(2019)收集了来自世界各地的五种类型金矿(IOCG型、造山型、斑岩型、SEDEX型和VHMS型)的黄铁矿微量元素成分数据建立数据集,采用机器学习方法中的随机森林算法,进行了金矿类型建模训练,取得了很好的分类效果。但是收集到的每种成因类型黄铁矿数据量不平衡,导致每种类型的预测正确率存在差异性,这是因为对数据量少的矿床类型学习程度不够,预测准确率偏低,导致模型缺乏泛用性和实用性。目前鲜有人将数据增强方法应用于黄铁矿微量元素的成分分析中,并采用卷积神经网络进行金矿类型分类研究。
-
基于此,本次研究通过收集整理发表于国内外期刊上的黄铁矿地球化学数据,主要是黄铁矿微量元素成分数据,借鉴Goldfarb et al.(2014,2015)金矿分类方案,按照造山型、斑岩型、热液型、卡林型、VMS型和矽卡岩型金矿类型建立基于电子探针测试方法(EMPA)和激光剥蚀-电感耦合等离子体质谱测试方法(LA-ICP-MS)的黄铁矿微量元素数据集。然后将数据处理后转化为图像,通过数据增强方法将每个金矿类型的数据量趋于一致后,在前人研究的基础上,使用机器学习理论中的卷积神经网络算法对六种类型金矿进行分类训练。本文共为此设计了四次实验,分别使用Mobilenet V2、Resnet 50、VGG 16和VIT卷积神经网络模型对基于EMPA和LA-ICP-MS黄铁矿微量元素数据集进行分类建模,评价不同网络模型的分类效果和训练好的模型的预测分类效果。此方法可推广至其他地质相关分类任务中,为地质研究提供全新思路与方法。
-
1 黄铁矿数据集
-
1.1 数据获取
-
黄铁矿地球化学数据的测试方法目前主要是电子探针(EPMA)和激光剥蚀-电感耦合等离子体质谱仪(LA-ICP-MS)两种。本次研究收集前人发表的相关金矿类型的黄铁矿地球化学数据,包括EMPA和LA-ICP-MS两种测试方法作为分析数据。其中电子探针数据5060条,收集到的元素包括Co、Ni、Cu、Zn等31种化学元素。激光剥蚀-电感耦合等离子体质谱仪数据4817条,元素种类除了包括41种微量元素,收集黄铁矿微量元素数据来源的金矿点或金矿床分布如图1所示。
-
1.2 数据清洗
-
考虑到这些数据在原论文有不同的研究目的,并非所有样品都测试了全部微量元素的含量,所以收集到的每组数据,都有不同的缺失值。例如在电子探针黄铁矿地球化学数据集中的Hg、Cd、Mn、Mo等元素的缺失率高达80%以上,明显会影响网络的学习和模型正确性。所以针对这类问题,本次研究对收集到的研究数据进行了清洗和缺失值估计填充。对于缺失率(数据缺失数与总数据量比值)超过45%的黄铁矿微量元素种类进行剔除,电子探针数据集共剔除相关微量元素种类17种,留下As、Sb、Fe、Ag、Co、Pb、Ni、S、Cu、Zn、Au、Se、Te共13种元素。激光剥蚀-电感耦合等离子体质谱仪数据剔除相关微量元素种类31种,剩余As、Ag、Au、Co、Ni、Cu、Zn、Pb、Bi、Sb这10种元素。数据原作者所采用的检测设备精度规格也不尽相同,所以各金矿点或金矿床数据组合的检测限是不一样的。因此,就需要对那些低于检测限的数据按照文献中检测限的一半进行填充或者按照原论文中该微量元素的众数进行插值。对剩余指定的元素缺失值,采用K最邻近法、众数替换法、随机样本估计来进行数据补全。经过数据清洗填充后EMPA数据集数据量有4891条,LA-ICP-MS数据集有4779条数据。参考前人经验在EMPA数据集中引入Co/Ni、Se/Te、Se/S、S/Fe、Au/Ag比值和Co-Ni-As元素组合,在LA-ICP-MS数据集中引入Co/Ni和Au/Ag元素组合,这些组合的引入是为了增加黄铁矿数据的维度,提升图片承载的地质信息,方便网络进行学习和训练。
-
图1 收集黄铁矿微量元素数据集相关矿床矿点分布图
-
Fig.1 Distribution map of ore deposits related to the collection of pyrite trace element datasets
-
1.3 数据图像化
-
收集到的黄铁矿地球化学数据测量元素种类十几种,信息量相对庞大,数据使用表格来进行了存储记录。但是如此臃长的复杂列表,已经远远超出了人们能够直接分析处理的程度,无法直观认识到不同样本数据间的地质意义。经典解决办法是使用元素种类作为坐标轴对黄铁矿进行投图,各种图解法的排列组合复杂多样,可以间接了解数据背后的有用信息,但是人们往往只能够筛选某几种便于理解的组合进行图解分析,例如Co/Ni、Se/Te、Co-Ni-As等组合,这些组合产生了出人意料的极佳效果,但还是令研究人员困惑不已。这是因为各种传统图解法筛选出影响深刻的元素组合的同时,也无视了其他元素的影响信息,在大数据时代,传统判别图的理论和方法都需要进一步进化和反思。
-
本次研究所采用的数据离散度大,各个种类数据数量差异大,而且卷积神经网络无法直接处理一维列数据。我们采用灰度图生成方法将离散数据图像化,方便我们进行分类建模。也就是将每种样本的黄铁矿地球化学数据转化为灰度图,不同数值代表不同深度的黑灰白色,然后按照一定的排列顺序生成独特的数据身份码,每一张图将单独代表某个样本的数据含义。为了方便计算机识别运算和后续的数据增强工作,我们将LA-ICP-MS数据集按照As、Ag、Au、Co、Ni、Cu、Zn、Pb、Bi、Sb、Co/Ni和Au/Ag的顺序依次排列,EMPA数据集按照As、Sb、Fe、Ag、Co、Pb、Ni、S、Cu、Zn、Au、Se、Te、Co/Ni、Se/Te、Se/S、Te/S、S/Fe、Co-Ni-As和Au/Ag的顺序排列。
-
首先进行数值转换,先统计单一元素的数据总个数,然后将总个数除以255后取整数n,这样处理是为了得出将所有数据分为255个区间时,每个区间分n个数据。将每种元素按照含量从小到大依次排序。按照刚刚计算的分级标准每整数n个数分为一个区间,如果遇到相同的数值就按照最低标准进行分类。如此处理过后再将每一级映射成0~255之间的整数。最后将整数值按照排列规则生成灰度图,EMPA数据集的像素块按照四行五列排列,每个像素块高45像素,宽56像素生成灰度图。LA-ICP-MS数据集像素块按照四行三列进行排列,每个像素块高75个像素,宽56个像素。最终全部生成224×224像素的灰度图,这个过程使用python语言进行实现,具体的实现过程以LA-ICP-MS数据集示例如图2所示。
-
1.4 数据增强
-
将所生成的灰度图按照不同的金矿类型划分不同的标签,最后得到可供卷积神经网络算法识别的图像数据集。面对不同类型金矿数据集内的数据量不平衡问题,如EMPA电子探针数据集中热液型有1825个,VMS型的数据仅仅有62个,如此严重的数量偏差可能会影响网络训练时对数据量少金矿类型的学习程度。因此本次研究采用机器学习思想中的数据增强算法进行数据扩充。原理就是通过对原始图片进行特殊处理,例如添加随机像素、高斯噪声、随机像素置零、椒盐噪声、渐变蒙版、等比例缩放、不等比例缩放、强化图像边缘、随机亮度、最大池化、平均池化等方法处理图片,这样不会改变灰度图所蕴含的地质信息,可以增加训练集的数据量。数据增强后的各金矿类型的数据分布见表1,部分操作效果如图3所示。
-
2 实验和方法
-
2.1 卷积神经网络
-
卷积神经网络是1989年由纽约大学的Yann提出的(Le Cun et al.,1989),该算法采用局部连接和权值共享的方式大大减少了算法的权值数量,使得神经网络更加容易优化。同时也降低了模型的复杂度和算法的过拟合风险。这些优点在网络输入数据是图像时更加明显,直接将图像入网络,避免了传统识别算法繁杂的特征提取与数据重建过程。卷积神经网络可以自动地提取图像数据上的信息特征,图像信息特征的移位、缩放、扭曲和其他形式的特殊处理也不影响卷积神经网络的学习,这使得卷积神经网络可以通过数据增强来提高神经网络的准确度(Le Cun et al.,1989,1998)。
-
图2 灰度图生成过程
-
Fig.2 Grayscale image generation process
-
图3 部分灰度图数据增强后效果展示
-
Fig.3 Effect display of part of grayscale image data enhancement
-
训练卷积神经网络在某种意义上其实就是训练每个卷积层的滤波器,使得这些滤波器可被特定的激活函数激活,从而达到分类目的。卷积神经网络本身是层状分布,根据功能可以分为输入层(进行数据输入)、卷积层(按照特定规则提取不同金矿类型的黄铁矿微量元素含量数据特征)、激活函数(对不同类型金矿提取来的特征进行非线性分类,提升网络非线性建模能力,从而提升模型泛化能力)、池化层(进行参数压缩,减少数据空间大小,从而达到减少权值参数数量和计算量,减少过拟合可能)、全连接层(将神经网络先前学习到的黄铁矿微量元素含量特征映射到不同金矿类型上)、损失函数层(通过信息论的Softmax交叉熵损失函数得出不同类型黄铁矿微量元素数据属于不同金矿类型的概率)、分类层(根据概率对不同类型金矿进行分类)。
-
2.1.1 Mobilenet V2
-
Mobilenet模型是Google提出的一种轻量级深层卷积神经网络(Sandler et al.,2018),其核心思想是深度可分离卷积块(depthwise separable convolution),而Mobilenet V2在此基础上使用了倒残差结构(inverted resblock)组成整个网络,使得模型准确率变高,体积变小。倒残差结构首先经过1×1升维,再经过3×3DW卷积,最后再1×1降维,使得高维度信息经过ReLU激活函数时丢失较少的信息。具体网络结构如图4所示。
-
2.1.2 Resnet 50
-
He Kaiming et al. (2015)提出了残差网络模型(residual net),在2015年ImageNet图像分类大赛时获得分类任务第一名,具有简单实用的特点,是一个经典的卷积神经网络模型。Resnet的主要思想是使用了直连通道(highway network)的思想,将靠近前段若干层的某一层数据输出直接跳过中间多层引入到后面数据层的输入部分,意味着后面的特征层的内容会有一部分由其前面的某一层线性贡献,其结构如图5所示。Resnet 50模型拥有Conv Block和Identity Block两个基本模块。Conv Block模块的输入输出维度不同,所以仅用来连接串联,改变网络维度。Identity Block模块的输入输出维度一样,可以直接串联用来加深网络层数。具体结构如图5所示。
-
图4 Mobilenet V2网络结构示意图
-
Fig.4 Schematic diagram of Mobilenet V2 network structure
-
图5 Resnet 50网络结构示意图
-
Fig.5 Schematic diagram of Resnet 50 network structure
-
2.1.3 VGG 16
-
VGG是由Simonyan和Zisserman 2014年提出的一种卷积神经网络模型(Simonyan et al.,2014,2015),该模型参加2014年ImageNet图像分类大赛时获得分类任务第二名,已经证明了该模型的卓越性能。VGG 16由三种不同的层组成,包括卷积层、最大池化层、全连接层。具体执行方式如图6所示。
-
2.1.4 VIT
-
VIT(Vision Transformer)是Transformer的视觉处理版本(Dosovitskiy,2021)。VIT可以将输入的图片,每隔一定的区域划分出一个小图片块,然后将划分的图片进行排列组合,得出结果后传入Transformer特有的Multi-head Self-attention中进行特征提取,对提取的特征利用Cls Token进行分类任务,如此实现了视觉领域的Transformer。具体VIT的网络架构如图7所示。
-
图6 VGG 16网络结构示意图
-
Fig.6 Schematic diagram of VGG 16 network structure
-
2.2 实验设计
-
本次研究采用python 3.9和pytorch 1.2深度学习框架进行代码实现,运行试验平台采用的是谷歌Colab(https://drive.google.com/drive)平台,GPU是NVIDIA-SMI 460.32.03,CPU使用的是Intel(R)Xeon(R)CPU @ 2.20 GHz。Colaboratory是谷歌提供的一款基于Jupyter Notebook开发的深度学习云平台,具有简单易用免费等特点。
-
按照Mobilenet V2、Resnet 50、VGG 16和VIT四种网络模型依次基于EMPA和LA-ICP-MS黄铁矿地球化学数据集进行金矿分类建模。将总数据的80%作为训练集进行训练学习,20%作为验证集进行评价验证。每次训练迭代100次并且分成两个阶段,前50次为冻结阶段,后50次为解冻阶段。冻结阶段时会冻结模型的主干参数,在特征提取时不会发生改变,防止训练初期权值被破坏,且能够提升训练速度,这个阶段只对网络进行微调所以显存占比很小。解冻阶段时模型的主干将不再被冻结,特征提取网络发生改变,此时显存占用将会变大,网络所有参数都会被改变。对于EMPA数据集,冻结阶段将Batch size(每次抓取的样本数)设置为32,学习率设置为0.001。解冻阶段将Batch size设置为16,学习率设置为0.0001。另外使用VIT进行训练时为了防止模型不收敛需要将冻结阶段的学习率设置为0.0001,解冻阶段的学习率设置为0.00001;对于LA-ICP-MS数据集将冻结阶段的Batch size设置为64,学习率设置为0.0001。解冻阶段的Batch size设置为32,学习率设置为0.00001,每次迭代过程中10%的数据作为验证集,剩余的作为训练集,实验过程采用16线程加快训练速度。
-
图7 VIT网络结构示意图
-
Fig.7 Schematic diagram of VIT network structure
-
3 实验结果及讨论
-
3.1 实验结果
-
按照实验设计进行训练后得到的loss曲线如图8所示,总体观察不同类数据集的不同网络模型loss曲线特征发现训练过程中损失值整体趋于收敛,说明针对现有数据集本次实验设计具备可行性。具体分析发现在0~50次迭代过程中,虽然模型train loss和val loss基本呈现下降趋势,但是很快便趋于稳定,这说明在冻结主干网络权值时,所有模型的训练效果有限,但是这样可以加快模型训练速度,且避免网络权值在训练初期被破坏。第50次迭代之后的训练中train loss和val loss开始大幅下降,这样良好的特征再次验证我们的实验数据具有可分类性,说明卷积神经网络算法可以对不同类型金矿进行准确度划分。对比不同测试方法的数据发现EMPA数据集的模型训练效果整体要比LA-ICP-MS数据集要好,前者的val loss 值在0.1~0.2左右分布,后者的却都在0.5以上。推测此现象的原因可能是因为LA-ICP-MS数据集的黄铁矿微量元素种类和比值特征我们用了12种,而EMPA数据集我们用了20种,EMPA数据集数据维度更多包含的信息更全面,所以划分效果偏好。然而通常情况下LA-ICP-MS数据集包含的元素种类高于EMPA的,LA-ICP-MS理论上也具备更加丰富的地质信息,所以对于本实验来说LA-ICP-MS数据集当具备深厚的潜力。基于此,在使用卷积神经网络进行金矿类型分类任务的进一步研究中,采用更加庞大数据集的同时,每条数据的种类维度需要尽可能多,包含更详细的信息,这样会有更好的分类效果。
-
3.2 模型评价
-
模型训练时的损失值越小并不代表采用卷积神经网络模型进行金矿类型分类时候效果更好,我们使用测试集数据对训练好的模型依次进行评价,评价方法采用top 1方式(预测的金矿类型取最后概率向量里面最大的那一个作为预测结果,如果预测结果中概率最大的那个分类正确,则预测正确,否则预测错误),然后将评价结果做成混淆矩阵如图9所示。计算出准确率、精确率、召回率和特异性如表2所示。混淆矩阵是用来评价分类模型精度的可视化工具,混淆矩阵的对角线数据越大证明网络验证精度越高。准确率是测试集中金矿类型预测准确的样本占总样本的比例,精确率是预测某一类型金矿中正确样本的概率,召回率是指某一类型金矿的样本中预测正确的概率,特异性则是关注于负样本,等价于正样本中的召回率。
-
对比混淆矩阵发现,在验证阶段基于EMPA数据集训练的模型分类效果要好于LA-ICP-MS数据集的分类模型,EMPA训练出的分类模型除少数情况下都能精确划分金矿类型,但是LA-ICP-MS数据集得出的分类模型在划分热液型和造山型金矿的时候会发生互相分错的现象。分析原因之一可能是因为造山型和热液型金矿的成因复杂多变,他们之间的黄铁矿微量元素成分信息差异性并不明显。但是EMPA数据集能够很好的划分证明通过增加元素种类是可以放大这不同类型金矿的黄铁矿地球化学信息差异性的,从而更加准确地进行分类预测。对比表格中每次实验的模型准确率和验证准确率,我们发现Mobilenet V2、Resnet 50、VGG 16和VIT都可以对黄铁矿微量元素数据进行很好的分类学习训练,这再次印证不同类型金矿的黄铁矿微量元素存在可分性,模型划分准确率一度高达99.8%。而在验证阶段EMPA的精确度基本都在88%以上,最高的VIT模型甚至达到93%,这说明基于卷积神经网络和黄铁矿微量元素大数据训练出来的金矿类型分类模型具有很好的泛化能力,至少对于本数据集能够有效地划分不同的金矿类型。尽管LA-ICP-MS数据集的模型效果不如EMPA的分类模型,但是验证精确度也大都在70%以上,说明采用LA-ICP-MS数据集的黄铁矿微量元素进行金矿类型预测也具有相当大的潜力,后期增加黄铁矿的元素种类、数据处理方法的进一步改进和使用新的卷积神经网络模型,仍然可能获得意想不到的效果。对比每次实验中不同类型金矿的精确率、召回率和特异性,发现卡林型、斑岩型、矽卡岩型和VMS金矿能够得到有效的划分,热液型和造山型金矿的分类预测效果并不是很好。推测使用更加科学的金矿分类方案,也可能提高本方法的使用效果。
-
图8 分类模型训练学习loss曲线(a~h)
-
Fig.8 Classification model training learning loss curve (a~h)
-
EMPA数据集普遍具有高精确率、高召回率和高特异性,说明EMPA是一个比较符合预期的分类器,对于本数据集具有优秀的适配性。而LA-ICP-MS数据集中的热液型金矿和造山型金矿,存在低精确率、低召回率和高特异性的情况,也就是说针对本本次实验的数据集和数据处理方案,分类模型将一部分造山型和热液型金矿的黄铁矿数据进行了错分,这并不能说明此方法不适于划分两种金矿或者LA-ICP-MS数据集的分类效果不如EMPA数据集,这可能是因为本次实验收集的LA-ICP-MS数据中两种类型金矿存在部分混淆,由于EMPA数据集和LA-ICP-MS数据集的数据收集是分开进行的,所以EMPA数据集并不存在此类现象。后续可以收集更加典型的相关金矿黄铁矿微量元素数据进行训练。也可能是当前造山型金矿和热液型金矿存在许多争议,金矿分类方案还有改进空间造成的。进一步的研究中借鉴更科学的金矿分类方案或许会有更佳的分类效果。
-
图9 分类模型混淆矩阵(a~h)
-
Fig.9 Classification model confusion matrix (a~h)
-
4 结论
-
(1)数值数据图像化的方法很好地解决了卷积神经网络的数据读取问题,且可以采用数据增强手段对数据量过少的数据进行扩充,从而提升卷积神经网络分类模型的分类效果。提出了一种采用卷积神经网络模型基于两种测试方法的黄铁矿微量元素数据集建立造山型、斑岩型、热液型、卡林型、VMS型和矽卡岩型金矿的分类模型的研究方法,发现深度学习算法可以很好地完成分类任务,相比传统图解法具有更好的分类效果和更强的泛化能力。
-
(2)在对比了不同数据集四种不同网络结构的卷积神经网路分类效果后,发现当前实验基于电子探针测试方法的黄铁矿数据集和VIT分类模型训练学习得到的分类模型的效果最好,另外基于LA-ICP-MS测试方法的数据集也有极大的潜力,后续可以扩充元素种类、扩充典型金矿的黄铁矿数据或借鉴更加科学的金矿分类方案进行再次实验。
-
(3)本次试验数据的造山型和热液型的黄铁矿成分特征差异性相对较小,推测这是因为此次收集的元素种类不足以区分两种类型金矿,通过增加黄铁矿微量元素种类可以放大差异性,从而提升分类模型的预测效果。使用黄铁矿微量元素来区分卡林型、矽卡岩型、斑岩型和VMS型金矿具有较高的准确性,说明卷积神经网路可以很好地学习相关特征。
-
(4)本次研究建立的分类模型的分类精确度高达99.8%预测精确度,模型的验证精确度最高也达到了93%,已经具备了实际运用的价值,帮助预测金矿类型,后期可以深入研究并开发相关软件辅助地质学家的工作。
-
致谢:感谢匿名审稿人在审稿过程中提出的诸多宝贵意见和建议,长安大学地球科学与资源学院杨俊杰博士在论文撰写过程中提供的各种帮助,在此表示衷心感谢!
-
参考文献
-
Arehart G B, Chryssoulis S L, Kesler S E. 1993. Gold and arsenic in iron sulfides from sediment-hosted disseminated gold deposits: Implications for depositional processes. Economic Geology, 88(1): 171~185.
-
Bache J J. 1988. World Gold Deposits-Geological Classification and Quantitative Classification. Chengdu: Sichuan Bureau of Geology(in Chinese with English abstract).
-
Boyle R W. 1979. The geochemistry of gold and its deposits (Bulletin 280). Geological Survey of Canada, Ottawa, 579~584.
-
Chen Guangyuan, Sun Daisheng, Yin Huian. 1988. Genetic Mineralogy and Prospecting Mineralogy. Chongqing: Chongqing Press(in Chinese with English abstract).
-
Chen Guangyuan, Shao Wei, Shun Daisheng. 1989. Genetic Mineralogy and Prospecting of the Jiaodong Gold Deposit. Chongqing: Chongqing Press (in Chinese with English abstract).
-
Cook N J, Ciobanu C L, Mao Jingwen. 2009. Textural control on gold distribution in As-free pyrite from the Dongping, Huangtuliang and Hougou gold deposits, North China Craton (Hebei Province, China). Chemical Geology, 264(1-4): 101~121.
-
Daniele T, Martin R, Artur P D, Stephen C, Pablo S A, Jackie W, Malcolm P R. 2017. Copper-arsenic decoupling in an active geothermal system: A link between pyrite and fluid composition. Geochimica et Cosmochimica Acta, 204: 179~204.
-
Dosovitskiy A, Beyer L, Kolesnikov A, Weissenborn D, Houlsby N, Zhai Xiaohua, Unterthiner T, Dehghani M, Minderer M, Heigold G, Gelly S, Uszkoreit J, Houlsby N. 2021. An image is worth 16×16 words: Transformers for image recognition at scale. Proceeding of International Conference on Learning Representations(ICLR), 1~22.
-
Ehsan B, Valeh A. 2018. Pyritefrom zarshuran carlin-type gold deposit: Characterization, alkaline oxidation pretreatment, and cyanidation. Hydrometallurgy, 179: 222~231.
-
Gao Zhenmin, Yang Zhusen, Li Hongyang, Luo Taiyi, Yao Linbo. 2000. Genesis and characteristics of gold gosted by pyrite. Geological Journal of China Universities, 6(2): 156~162 (in Chinese with English abstract).
-
Ge Can, Wang Fangyue, Gu Haiou, Guan Huaifeng, Li Xiuyu, Yuan Feng. 2019. Tectonic discrimination based on convolution neural network and big data of volcanic rocks. Earth Science Frontiers, 26(4): 22~32 (in Chinese with English abstract).
-
Goldfarb R J, Santosh M. 2014. The dilemma of the Jiaodong gold deposits: Are they unique?Geoscience Frontiers, 5(2): 139~153.
-
Goldfarb R J, Groves D I. 2015. Orogenic gold: Common or evolving fluid and metal sources through time. Lithos, 233: 2~26.
-
Gregory D D, Meffre S, Large R R. 2014. Comparison of metal enrichment in pyrite framboids from a metal-enriched and metal-poor estuary. American Mineralogist, 99(4): 633~644.
-
Gregory D D, Cracknell M J, Large R R, McGoldrick P, Kuhn S D, Maslennikov V V, Baker M J, Fox N, Belousov I, Figueroa M C, Steadman J A, Fabris A J, Lyons T W. 2019. Distinguishing ore deposit type and barren sedimentary pyrite using laser ablation-inductively coupled plasma-mass spectrometry trace element data and statistical analysis of large data sets. Economic Geology, 114(4): 771~786.
-
Groves D I, Goldfarb R J, Santosh M. 2016. The conjunction of factors that lead to formation of giant gold provinces and deposits in non-arc settings. Geoscience Frontiers, 7(3): 303~314.
-
Groves D I, Santosh M, Goldfarb R J, Zhang Liang. 2018. Structural geometry of orogenic gold deposits: Implications for exploration of world-class and giant deposits. Geoscience Frontiers, 9(4): 1163~1177.
-
He Kaiming, Zhang Xiangyu, Ren Shaoqing, Sun Jian. 2015. Deep residual learning for image recognition. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 770~778.
-
Henkelman C A. 2004. Pyrite geochemistry across the Betze-post deposit, northern Carlin Trend, Nevada. Doctoral dissertation of University of Nevada, Las Vegas.
-
Hong Shuang, Zuo Renguang, Hu Hao, Xiong Yihui, Wang Ziye. 2021. Tectonic discrimination based on convolution neural network and big data of volcanic rocks. Earth Science Frontiers, 28(3): 87~96 (in Chinese with English abstract).
-
Hossein K, Majid G, Ross R L, Khin Z. 2017. Texture and chemistry of pyrite at ChahZard epithermal gold-silver deposit, Iran. Ore Geology Reviews, 84: 80~101.
-
Hu Lunji, Yao Fengliang. 1983. Genetic classification of gold deposits. Geology in China, 11(1): 13~15(in Chinese with English abstract).
-
Huang Shaofeng. 1987. Typomorphic characteristics and genetic significance of pyrite in endogenetic gold deposits. Selected Papers on Genetic Mineralogy and Prospecting Mineralogy of Gold Deposits in China. Langfang: Institute of Gold Geology of the Chinese People's Armed Police Force(in Chinese with English abstract).
-
Le Cun Y, Jackel L D, Boser B, Denker J S, Graf H P, Guyon I, Henderson D, Howard R E, Hubbard W. 1989. Handwritten digit recognition: Applications of neural net chips and automatic learning. IEEE Communication, 41~46.
-
Le Cun Y, Bottou L. 1998. Gradient-based learning applied to document recognition. Proceedings of the IEEE, 86(11): 2278~2324.
-
Li Hongliang, Li Guangming. 2019. Compositional characteristics of pyrite ore formed in the main metallogenic period of various types of hydrothermal gold deposits. Earth Science Frontiers, 26(3): 202~210(in Chinese with English abstract).
-
Li Shengrong, Chen Guangyuan, Shao Wei. 1996. Genetic Mineralogy of the Rushan Gold Orefield, Jiaodong. Beijing: Geological Press(in Chinese with English abstract).
-
Luan Shiwei. 1987. Gold Deposit Geology and Prospecting Methods. Chengdu: Sichuan Science and Technology Press (in Chinese with English abstract).
-
Luan Shiwei, Chen Shangdi. 1983. Geochemical types of gold deposits. Journal of Chengdu Institute of Geology, 11(3): 20~29(in Chinese with English abstract).
-
Malmqvist D, Parasnis D S. 1972. Aitik: Geophysical documentation of a third-generation copper deposit in North Sweden. Geoexploration, 10(3): 149~160+171~200.
-
Mcenroe S A, Robinson P, Panish P T. 2001. Aeromagnetic anomalies, magnetic petrology, and rock magnetism of hemo-ilmenite- and magnetite-rich cumulate rocks from the Sokndal Region, South Rogaland, Norway. American Mineralogist, 86(11-12): 1447~1468.
-
Sandler M, Howard A, Zhu Menglong, Zhmoginov A, Chen L C. 2018. MobileNetV2: Inverted residuals and linear bottlenecks. Proceedings of 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 4510~4520.
-
Shao Jielian. 1988. Gold Prospecting Mineralogy. Wuhan: China University of Geosciences Press (in Chinese with English abstract).
-
Simonyan K, Zisserman A. 2014. Two-stream convolutional networks for action recognition in videos. Proceedings of NIPS, 1~11.
-
Simonyan K, Zisserman A. 2015. Very deep convolutional networks for large-scale image recognition. International Conference on Learning Representations (ICLR) 2015, 1~14.
-
Song Xuexin, Zhang Jingkai. 1986. Trace element characteristics of various genetic pyrites in China. Anthology of Institute of Mineral Deposit Geology, Chinese Academy of Geological Sciences (18), 175~184(in Chinese with English abstract).
-
Wang Guowen, Feng Yuan, Carranza E J M, Li Ruixi, Li Zonglie, Feng Zankui, Zhao Xiandong, Wang Daojun, Kong Liang, Jia Wenjuan, Wen Botao. 2016. Typomorphic characteristics of pyrite: Criteria for 3D exploration targeting in the Xishan gold deposit, China. Journal of Geochemical Exploration, 164: 136~163.
-
Wang Kuiren. 1989. Earth and Cosmogenic Mineralogy. Hefei: Anhui Education Press(in Chinese with English abstract).
-
Xie Wen'an. 1982. Geochemical typomorphic characteristics of pyrite in sulfide deposits in southeastern Hunan and its geological significance. Geology and Exploration, 10(6): 38~41(in Chinese with English abstract).
-
Xu Guofeng, Shao Jielian. 1980. On the type peculiarities of pyrite and their practical significance. Geological Review, 26(6): 541~546(in Chinese with English abstract).
-
Yan Yutong, Li Shengrong, Jia Baojian, Zhang Na, Yan Lina. 2012a. Composition typomorphic characteristics and statistic analysis of pyrite in gold deposits of different genetic types. Earth Science Frontiers, 19(4): 214~226(in Chinese with English abstract).
-
Yan Yutong, Li Shengrong, Zhang Na, Jiang Liang, Jia Baojian, Li Binkai, Yan Lina. 2012b. Composition typomorphic characteristics and statistics analysis of metallogenic pyrite in gold deposits of different genetic types. Gold, 33(3): 11~16(in Chinese with English abstract).
-
Yan Yutong, Zhang Na, Li Shengrong, Li Yongsheng. 2013. Compositional typomorphic characteristics of pyrite in each type of gold deposit of Jiaodong. Earth Science Frontiers, 20(3): 88~93 (in Chinese with English abstract).
-
Yan Yutong, Li Shengrong, Zhou Hongsheng, Shi Xingjun, Zhao Guoyong, Yan Junhui. 2016. A new composition typomorphism method of pyrite element spider diagram and its application in various gold deposits. Gold, 37(6): 13~16(in Chinese with English abstract).
-
Yang Xingke, Chao Huixia, Lu Guxian, Qu Cuixia, Zhang Kang, He Hujun, Zhang Guishan. 2011. Classification of structural types of metal ore fields and analysis of prospecting prediction ideas. Acta Mineralogica Sinica, 31(S1): 897~898(in Chinese with English abstract).
-
Zheng Minghua, Zhang Bin, Zhang Zhan'ao, Zhou Yuyi, Lin Wendi, Shuai Dequan. 1983. Preliminary classification of gold deposit types in China. Journal of Chengdu Institute of Geology, 11(1): 27~42 (in Chinese with English abstract).
-
Zhou Xuewu, Shao Jielian, Bian Qiujuan. 1994. Study on typomorphic characteristics of pyrite from Dongbeizhai gold deposit, Sichuan Province. Earth Science—Journal of China University of Geosiciences, 19(1): 52~59 (in Chinese with English abstract).
-
Bache J J. 1988. 世界金矿床-地质分类和定量分类. 成都: 四川省地矿局.
-
陈光远, 孙岱生, 殷辉安. 1988. 成因矿物学与找矿矿物学. 重庆: 重庆出版社.
-
陈光远, 邵伟, 孙岱生. 1989. 胶东金矿成因矿物学与找矿. 重庆: 重庆出版社.
-
高振敏, 杨竹森, 李红阳, 罗泰义, 姚林波, 饶文波. 2000. 黄铁矿载金的原因和特征. 高校地质学报, 6(2): 156~162.
-
葛粲, 汪方跃, 顾海欧, 管怀峰, 李修钰, 袁峰. 2019. 基于卷积神经网络和火山岩大数据的构造源区判别. 地学前缘, 26(4): 22~32.
-
洪双, 左仁广, 胡浩, 熊义辉, 王子烨. 2021. 磁铁矿元素地球化学大数据构建及其在矿床成因分类中的应用. 地学前缘, 28(3): 87~96.
-
胡伦积, 姚风良. 1983. 金矿床的成因分类. 中国地质, 11(1): 13~15.
-
黄绍峰. 1987. 内生金矿床中黄铁矿的标型特征及其成因意义. 中国金矿床成因矿物学和找矿矿物学论文选集. 廊坊: 中国人民武装警察部队黄金地质研究所.
-
李洪梁, 李光明. 2019. 不同类型热液金矿床主成矿期黄铁矿成分标型特征. 地学前缘, 26(3): 202~210.
-
李胜荣, 陈光远, 邵伟. 1996. 胶东乳山金矿田成因矿物学. 北京: 地质出版社.
-
栾世伟. 1987. 金矿床地质及找矿方法. 成都: 四川科学技术出版社.
-
栾世伟, 陈尚迪. 1983. 金矿床地球化学类型. 成都地质学院学报, 11(3): 20~29.
-
邵洁涟. 1988. 金矿找矿矿物学. 武汉: 中国地质大学出版社.
-
宋学信, 张景凯. 1986. 中国各种成因黄铁矿的微量元素特征. 中国地质科学院矿床地质研究所文集(18), 175~184.
-
王奎仁. 1989. 地球与宇宙成因矿物学. 合肥: 安徽教育出版社.
-
谢文安. 1982. 湘东南硫化物矿床中黄铁矿的地球化学标型特征及其地质意义. 地质与勘探, 10(6): 38~41.
-
徐国风, 邵洁涟. 1980. 黄铁矿的标型特征及其实际意义. 地质论评, 26(6): 541~546.
-
严育通, 李胜荣, 贾宝剑, 张娜, 闫丽娜. 2012a. 中国不同成因类型金矿床的黄铁矿成分标型特征及统计分析. 地学前缘, 19(4): 214~226.
-
严育通, 李胜荣, 张娜, 蒋亮, 贾宝剑, 李斌凯, 闫丽娜. 2012b. 不同成因类型金矿床成矿期黄铁矿成分成因标型特征. 黄金, 33(3): 11~16.
-
严育通, 张娜, 李胜荣, 李永生. 2013. 胶东各类型金矿床黄铁矿化学成分标型特征. 地学前缘, 20(3): 88~93.
-
严育通, 李胜荣, 周红升, 史兴俊, 赵国永, 闫军辉. 2016. 黄铁矿元素蛛网图成分标型方法及其在金矿床中的应用. 黄金, 37(6): 13~16.
-
杨兴科, 晁会霞, 吕古贤, 屈翠侠, 张康, 何虎军, 张贵山. 2011. 金属矿田构造类型划分与找矿预测思路分析. 矿物学报, 31(S1): 897~898.
-
郑明华, 张斌, 张占鳌, 周渝峯, 林文弟, 帅德权. 1983. 我国金矿床类型的初步划分. 成都地质学院学报, 11(1): 27~42.
-
周学武, 邵洁涟. 1994. 四川松潘东北寨金矿黄铁矿标型特征研究. 地球科学——中国地质大学学报, 19(1): 52~59.
-
摘要
黄铁矿是金矿中普遍存在的金属硫化物,其微量元素含量信息可以揭示出矿物形成时的相关矿物和流体组成与结晶特征,因此不同期次与金矿有关的黄铁矿及微量元素信息可以被用来预测矿床的类型。且相关研究历史已久,积累了大量的研究资料,然而由于研究思想和手段的局限性,传统方法往往存在无解性或多解性问题。随着大数据思想的发展和推广,研究人员试图采用机器学习算法来解决此类问题,已取得不错的效果。本次研究根据深度学习思想建立黄铁矿微量元素数据集并进行深入研究,采用“成分数据图像化”和“数据增强”等手段,解决了前人采用深度学习方法进行此类分类任务时遇到的数据不平衡问题和卷积神经网络无法直接读取数据的问题。本文对比分析了基于四种卷积神经网络模型(Mobilenet V2、Resnet 50、VGG 16和VIT)采用黄铁矿微量元素成分数据进行金矿类型分类任务的精度与效果,发现采用卷积神经网络算法可以基于黄铁矿成分数据对不同类型金矿进行较为精准的分类任务。此方法比传统图解法具备更高的精准度与泛化能力,通过对金矿类型的预测可以为找矿勘查和深部预测工作节省成本,也为深度学习在地质矿产研究方面的应用和推广提供全新思路,具有一定的推广价值。
Abstract
Pyrite is a ubiquitous metal sulfide in gold mines, and its trace element content information can reveal the composition and crystallization characteristics of related minerals and fluids when the minerals are formed. Therefore, different stages of pyrite trace element information can be used to predict the type of deposit. In addition, the related research has a long history, and a large amount of data have been accumulated. However, due to the limitations of research ideas and methods, traditional methods often have problems of no solution or multiple solutions. With the development and promotion of big data ideas, researchers have tried to use machine learning algorithms to solve such problems, and have achieved good results. In this study, based on the idea of deep learning, a data set of trace elements of pyrite was established and subjected to in-depth research. By means of “component data visualization” and “data enhancement”, it solved the problems encountered by predecessors when using deep learning methods for such classification tasks. Previous attempts have pointed to the data imbalance problem and the inability of the convolutional neural network to directly read the data. This paper compares and analyzes the accuracy and effect of gold ore type classification task using pyrite trace element composition data based on four convolutional neural network models (Mobilenet V2, Resnet 50, VGG 16 and VIT). It is found that the convolutional neural network algorithm based on the pyrite composition data can perform more accurate classification tasks for different types of gold deposits. This method has higher accuracy and generalization ability than the traditional graphical method. By predicting the type of gold deposits, it can save costs for prospecting exploration and deep prediction work, and also provide deep learning for the application and promotion of geological and mineral resources research. The new idea has certain promotion value.
Keywords
pyrite ; gold ore types ; big data ; deep learning ; convolutional neural networks ; grayscale map