卷积 FCN UNet,转置卷积

有哪些优秀的Kaggle竞赛解决方案 , 可以分享吗?

卷积 FCN UNet,转置卷积


地球上一些储藏了大量石油和天然气的区域 , 其地表下还有大量的沉积盐 。但要准确找出哪些地方有大量沉积盐并非易事 。专业的地震成像仍然需要对盐矿体进行专业的人工判断 。这导致了非常主观、高度可变的渲染过程 。此外 , 这对石油和天然气开采也造成了潜在的隐患 。为了创建最准确的地震成像(seismic image)和 3D 渲染 , TGS(世界领先的地理数据公司)希望 Kaggle 的机器学习社区能构建一种可以自动、准确识别一块次表层是不是盐体的算法 。
这正是我们今天要介绍的 Kaggle 竞赛:TGS 盐体识别挑战赛 , 挑战者需要开发出能准确分割地表以下沉积盐分布的算法 。简言之 , 这就是一个图像语义分割任务 。本文介绍了获得该竞赛第一名的方案 。本项竞赛奖金丰厚 , 前四名总共可获得 10 万美元的奖励 , 而第一名将获得 5 万美元 。目前该竞赛的提交日期已经截止 , 该赛事共有 3291 个队伍参赛 。
【卷积 FCN UNet,转置卷积】以下是前十名的成绩排行:赛题背景地震数据是通过地震反射(reflection seismology)收集的 , 这种方法要求能量的受控震源(如压缩气体或地震振动器) , 以及记录来自地下岩石界面反射的传感器 。之后处理记录的数据 , 创建地球内部的 3D 视图 。地震反射类似于 X 光、声波定位仪和回波定位 。地震成像是通过将来自岩石边界的反射成像来生成的 。
地震成像展示了不同岩石类型之间的边界 。理论上 , 反射的力量与岩石界面两侧的物理特性的差别成正比 。地震成像展示了岩石边界 , 但它们并不能显示岩石的属性 , 一些岩石容易辨认 , 一些则很难 。世界上一些地区地下存在大量的盐 。地震成像的一大挑战就是识别哪些地表下面有盐 。盐很容易识别 , 也很难识别 。盐的密度通常是 2.14 g/cc , 比周围的岩石密度低 。
盐的地震波速是 4.5 km/sec , 通常比周围的岩石速度快 。这种区别就使得在盐岩-沉积层界面处反射的变化比较大 。通常盐是非晶质岩石 , 没有太多内部结构 。这意味着盐内部通常不会有太多反射 , 除非其中有沉积物 。这种情况下盐的地震波速较高 , 使得地震成像出现问题 。数据使用的数据是在次表层底部多个地点选取的一系列图片 。
图像的分辨率为 101 x 101 , 每个像素被分类为盐或沉积物 。除了地震成像之外 , 还为每个图像提供成像位置的深度 。比赛的目标是分割含盐区域 。训练数据集示例评估比赛根据 IoU 阈值上不同交叉点的平均精度来计算比分 。提交的目标像素预测值和真实目标像素之间的 IoU 分数计算方式如下:将一系列 IoU 阈值代入该公式 , 在每个点计算一个平均精度值 。
阈值的范围在 0.5 到 0.95 之间 , 步长为 0.05:(0.5, 0.55, 0.6, 0.65, 0.7, 0.75, 0.8, 0.85, 0.9, 0.95) 。换句话说 , 在阈值为 0.5 时 , 如果预测目标与真实目标的交集大于 0.5 , 则该预测对象被视为「命中」 。在每个阈值 t 处 , 基于预测目标与所有真实目标对比所产生的真正类(TP)、假负类(FN)和假正类(FP)的数量来计算精度值:当单个预测目标与真实目标匹配并且 IoU 高于阈值时 , 记为真正类 。

推荐阅读