ARC-AGI-2和ARC奖2025

ARC-AGI-2和ARC奖2025

Hacker News 摘要


原标题:Arc-AGI-2 and ARC Prize 2025

该网页宣布了ARC-AGI-2和ARC Prize 2025的正式启动。内容指出,尽管人工智能(AI)领域取得了一定的进展,但实现通用人工智能(AGI)仍未解决,仍然需要新的思路和创新来进一步推进。

ARC-AGI-2是继ARC-AGI-1之后推出的更高难度的基准,旨在挑战新的前沿。该基准规定AI在完成任务时的难度更大,但对人类保持相对简单。ARC-AGI-2的任务是基于前期研究发现设计的,且每个任务都在一次受控研究中有至少两名人类在两次尝试内解决,而公共AI推理系统的得分则极低,纯语言模型(LM)的得分更是低至0%。

ARC Prize 2025的比赛也将在Kaggle上举行,旨在推动开放源代码的进展,以开发能超越ARC-AGI-2的高效通用系统。比赛将提供100万美元奖金,其中包含12.5万美元的保证进展奖金以及70万美元的大奖,获胜团队需要在比赛结束后将其解决方案开源并共享至公共领域。比赛预计将在3月和11月之间进行。

网页还强调,ARC-AGI基准并非仅用于测量AGI进展,更是希望激励研究人员提出新的创意。特别注意的是,智能不仅限于问题解决能力,还与获取和运用这些能力的效率密切相关。为了实现AGI,必须识别出AI与人类能力之间的差距,并通过创新来缩小这个差距。

此外,ARC-AGI-2的任务主要集中于象征性解读、组合推理和上下文规则应用等领域。每个任务都需要在特定条件下应用规则,AI推理系统在这些任务上表现不佳。网页提供了任务示例,以帮助理解AI面临的挑战。

总体而言,网页展示了ARC Prize Foundation的目标,即通过内生的高效基准推动AGI的发展,并鼓励参与者在追求一般智能的过程中贡献新的想法。


原文:https://arcprize.org/blog/announcing-arc-agi-2-and-arc-prize-2025

评论:https://news.ycombinator.com/item?id=43465147

Report Page