» 发表于 2024 年 2 月 15 日 08:00
创新技术:
本专栏的作者是网络媒体“Seamless”的运营者山下由纪,该媒体自 2014 年以来一直在发表有关尖端技术研究的文章。山下先生会挑选一些非常新颖的科学论文并进行解释。
推特:@shiropen2
谷歌 DeepMind 旗下研究人员发表的论文《没有搜索的大师级国际象棋》表明,在不使用传统搜索算法的情况下,人工智能可以达到与人类国际象棋大师相当的水平。这项研究展示了可以做什么。
论文首页1997年,IBM的国际象棋超级计算机“深蓝”击败了世界象棋冠军加里·卡斯帕罗夫。这次胜利首次向世界表明,机器可以在国际象棋这种需要复杂思维和策略的游戏中超越人类。
Deep Blue 是一个将丰富的国际象棋知识与先进的搜索算法相结合的系统,现在也出现了像 Stockfish 16 这样强大的国际象棋引擎。像美国 DeepMind 开发的 AlphaZero 这样的系统,通过自学习而不依赖于广泛的国际象棋知识来展示高性能。
近年来,扩展人工智能系统的巨大进步是由监督训练推动的,特别是在大规模架构和数据集方面。然而,目前还不清楚这些技术如何在国际象棋这样需要复杂策略的领域发挥作用。这项研究探讨了是否可以在不使用人类国际象棋知识或探索算法的情况下在大型数据集上实现强大的国际象棋比赛。
研究人员使用具有 2.7 亿个参数的 Transformer 模型,并在 1000 万盘国际象棋比赛的数据集上训练该模型。该数据集使用 Stockfish 16 提供的动作值进行注释,包含大约 150 亿个数据点。通过这种广泛的训练,该模型展示了其解决高级国际象棋游戏的能力。
创建国际象棋数据集并对其进行分析的过程为了评估模型的性能,它在在线国际象棋平台 Lichess 上与一名人类棋手进行了一场快速的比赛,并获得了 2895 的 Elo。这相当于特级大师级别,无需使用任何特定领域的调整或探索算法即可实现,并且可以使用现有的高级模型(例如 AlphaZero 和 AI 模型“GPT-3.5-turbo-instruct”)来实现这一目标结果超过了。
所提出的人工智能系统的游戏风格示例所提出模型(3 种不同大小)与 Stockfish 16、AlphaZero(有和没有探索)和 GPT-3.5-turbo-instruct 的预测和游戏强度的比较这项研究特别值得注意的是,它表明只有通过大量的训练才能获得出色的国际象棋表现。通过系统地研究模型和数据集大小,我们发现较大的模型在较大的数据集上训练时表现出显着的改进,并且这种“规模法则”解释了为什么国际象棋显示这种方法在以下领域也有效
来源和图片来源:Anian Ruoss、Gregoire Deletang、Sourabh Medapati、Jordi Grau-Moya、Li Kevin Wenliang、Elliot Catt、John Reid、Tim Genewein 大师级国际象棋无需搜索。
相关文章
相关链接
版权所有 © ITmedia, Inc. 保留所有权利。
]]> '; e_dlv.innerHTML = html; adRequest({position:dlv_pos,dom:true}); }else if(ad_type === 'gam'){ var e_dlv.innerHTML = html; ('InArtSpecialLink'); }else if(ad_type === 'logly'){ var html = ''; e_dlv.innerHTML = html; loglySet(g_id); }else if(ad_type === 'google'){ html = ''; e_dlv.innerHTML = html; googletag.cmd.push(function(){ var slot8 = googletag.defineSlot('/43042345/nlab_artinsert_RT',[[336,280],[300,250],'流体'],' div-gpt-ad-1551176482959-0').addService(googletag.pubads()); googletag.pubads().enableSingleRequest(); googletag.enableServices(); googletag.display('div-gpt-ad-1551176482959- 0'); googletag.pubads().refresh([slot8]); var insert_ok = function(_target,_str){ var clearfix = d.createElement('div'); colBoxClear'; if(ad_float_fix){ e_body.insertBefore(e_dlv,_target); e_body.insertBefore(clearfix,_target.nextElementSibling); } else{ e_body.insertBefore(e_dlv,_target); function(_str){ e_dlv.style.display = 'none' }; var main = function(){ var e_nodes = e_body.childNodes; // BODY 直接子元素 var e_tags = []; p_num = []; // BODY 正下方的 P 标签位置 var p_target_num; // 帧插入参考位置 var o_float = {}; // 环绕元素 var o_this = {}; // 活动标签// 活动标签 下一个标签 var flag_insert = 0; // 插入标志 // 环绕元素检查 var check_float = function(_e){ var e = 0; if(_e.id.match(/^col\d{3} (l| r)$/)){ e = _e; } return e }; // 元素的 Y 坐标和高度之和 var get_element_y = function(_e){ var ey = 0; while (_e){ ey += _e.offsetTop; _e = _e.offsetParent; } return ey + eh; }; var check_ptag = function(_e){ if(_e.tagName && _e.tagName == = 'P'){ e = _e; }; var try_insert = function(){ p_target_num = Math.floor(p_num.length / 2) - 1; if(p_target_num >= _maxrange) p_target_num = _maxrange; ( var i = p_num[p_target_num]; i = _threshold){ try_insert(); }else{ insert_ng('P 标记 ' + _threshold + ' 下面'); if(e_body){ main(); insert_ng('没有文章正文') } })(文档,4,5);
留言