比赛链接:https://www.kaggle.com/c/seti-breakthrough-listen
比赛名称:SETI Breakthrough Listen - E.T. Signal Search
比赛内容:利用算法来识别异常的信号,CV类型赛题
比赛背景:
“我们一个人在宇宙里吗?”这是最深刻且长期存在的人类问题之一。随着技术的进步,我们正在寻找新的和更强大的方法来寻求答案。加州大学伯克利大学使用世界上最强大的望远镜对数百万颗恒星进行技术扫描。现在希望Kaggle社区能够帮助解释他们收到的信号。
加州大学伯克利分校的Breakthrough Listen 团队使用世界上最强大的望远镜扫描数百万颗恒星以寻找技术迹象。
现在它希望Kaggle社区帮助解释他们接收到的信号。Listen团队是外星智慧搜索(SETI) 的一部分,使用地球上最大的可操纵天线,即直径100 米的绿岸望远镜。与任何SETI搜索一样,交流的动机也是主要挑战。
人类已经建造了大量的无线电设备。很难在现代技术的巨大检测结果中寻找微弱的外星传播针。当前的方法使用两个过滤器来搜索大海捞针。
首先,Listen团队将目标恒星的扫描与天空其他区域的扫描穿插在一起。两组扫描中出现的任何信号都可能不是来自目标恒星的方向。其次,管道会丢弃不会改变其频率的信号,因为这意味着它们可能在望远镜附近。
运动中的源应该有一个暗示运动的信号,类似于路过的消防车警报器的音调变化。这两个过滤器非常有效,但我们知道它们可以改进。
管道无疑会错过有趣的信号,尤其是那些具有复杂时间或频率结构的信号,以及那些在有大量干扰的频谱区域中的信号。在本次比赛中,利用您的数据科学技能帮助识别Breakthrough Listen 目标扫描中的异常信号。
由于没有确认的用于训练机器学习算法的外星信号示例,该团队在来自望远镜的海量数据中加入了一些模拟信号(他们称之为“针”)。他们已经确定了一些隐藏的针,以便您可以训练您的模型以找到更多。
数据由二维数组组成,因此可能存在有前景的计算机视觉方法,以及数字信号处理、异常检测等。成功识别最多针的算法将赢得现金奖励,但也有可能帮助回答科学中最大的问题之一。
赛题目标
比赛的任务就是通过给定的频谱图预测对应的标签:0或者1在这场比赛中,利用算法来识别异常的信号。数据由二维数组组成,因此计算机视觉中可能会有一些方法,可能涉及的知识包括数字信号处理,异常检测等。
评价指标
Submissions are evaluated on area under the ROC curve between the predicted probability and the observed target.
赛题赛程
- July 21, 2021 - Entry Deadline.
- July 21, 2021 - Team Merger Deadline.
- July 28, 2021 - Final Submission Deadline.
赛题数据
赛题数据与频谱图类似,但通常跨越几个GHz的无线电频谱。数据存储为滤波器组格式或HDF5格式文件。
通过交替观测来做到这一点:在恒星“A”上观察 5 分钟,然后在恒星“B”上观察 5 分钟,然后回到恒星“A”上 5 分钟,然后是“C” ”,然后回到“A”,然后在“D”星上用 5 分钟结束。一组六个观察值 (ABACAD) 被称为“节奏”。