在最近的第六屆阿里巴巴全球數(shù)學(xué)競(jìng)賽中,一項(xiàng)新的挑戰(zhàn)吸引了全球的注意:AI大模型挑戰(zhàn)賽。這次比賽不僅有來(lái)自全球的數(shù)學(xué)愛(ài)好者參與,還特別開(kāi)放給了AI隊(duì)伍,讓人工智能與人類(lèi)直接在同一賽場(chǎng)上競(jìng)技。
第六屆阿里數(shù)學(xué)賽競(jìng)賽中,17歲學(xué)生姜萍位列12名成全球矚目,同時(shí)AI隊(duì)伍的表現(xiàn)也引人注目,平均分達(dá)到了18分,顯示出它們?cè)诮鉀Q標(biāo)準(zhǔn)化問(wèn)題上的能力已經(jīng)與人類(lèi)選手相當(dāng)。然而,盡管AI的表現(xiàn)在某些方面已經(jīng)接近人類(lèi),但在高分段的表現(xiàn)仍有很大差距。AI的最高分為34分,遠(yuǎn)低于人類(lèi)選手的最高分113分。
這次比賽中,AI隊(duì)伍的最高分是由上海建平中學(xué)的涂津豪設(shè)計(jì)的AI方案獲得。他的方法是讓多個(gè)大模型通過(guò)“自問(wèn)自答自驗(yàn)證”的方式,進(jìn)行深度思考和問(wèn)題解決,最終從多個(gè)可能的答案中選擇最優(yōu)解。
此外,來(lái)自西南交通大學(xué)的特工宇宙團(tuán)隊(duì)和中國(guó)人民大學(xué)的SuperCarryMan團(tuán)隊(duì)也表現(xiàn)出色,分別以27分的成績(jī)獲得亞軍和季軍。這兩支隊(duì)伍都采用了多智能體系統(tǒng),通過(guò)不同智能體的協(xié)作和多階段推理來(lái)解決問(wèn)題。
盡管AI在這次競(jìng)賽中展現(xiàn)了一定的能力,但賽事的結(jié)果也揭示了AI在進(jìn)行復(fù)雜推理和創(chuàng)新思考方面的局限。浙江大學(xué)計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)實(shí)驗(yàn)室的陳天楚指出,目前的大語(yǔ)言模型主要是通過(guò)固定速率預(yù)測(cè)下一個(gè)詞,而這種一次性輸出的方式并不適合需要深層次邏輯推理和多次試錯(cuò)的任務(wù)。
AI挑戰(zhàn)賽的結(jié)果不僅展示了人工智能在數(shù)學(xué)領(lǐng)域的進(jìn)步和挑戰(zhàn),也引發(fā)了對(duì)AI本質(zhì)的更深入探討。技術(shù)總監(jiān)認(rèn)為,雖然AI在處理規(guī)則明確的計(jì)算問(wèn)題上可能超越人類(lèi),但在需要高度創(chuàng)新和深度邏輯推理的領(lǐng)域,人類(lèi)的優(yōu)勢(shì)仍然明顯。
通過(guò)這次競(jìng)賽,AI的發(fā)展和人類(lèi)的理解可能會(huì)進(jìn)一步推動(dòng),不僅在數(shù)學(xué)理論上,也可能在AI技術(shù)的應(yīng)用和發(fā)展上帶來(lái)新的突破。而阿里數(shù)賽作為全球規(guī)模最大的在線(xiàn)數(shù)學(xué)競(jìng)賽之一,將繼續(xù)為全球的數(shù)學(xué)愛(ài)好者和AI研究者提供一個(gè)展示和競(jìng)技的平臺(tái)。