黑龍江網(wǎng) > 教育

清華學(xué)霸與AI比做高考壓軸題，誰會(huì)贏？發(fā)布時(shí)間： 2025-05-29 14:27 來源：第一財(cái)經(jīng)

　　作者：陸涵之

　　去年，“9.11和9.9誰大？”這一簡單的數(shù)學(xué)題曾難倒了多家大模型。到了今年，大模型的理科能力提升如何？

　　今日網(wǎng)易有道發(fā)布了一則視頻，6位清華姚班學(xué)生與AI比賽做高考壓軸題。清華姚班為圖靈獎(jiǎng)得主姚期智院士創(chuàng)辦，匯聚了數(shù)學(xué)、物理、信息學(xué)競賽金牌得主。

　　姚班學(xué)生和AI競速的兩道題分別為2023年高考數(shù)學(xué)全國一卷壓軸題和2021年高考物理江蘇卷壓軸題。姚班學(xué)生在10分鐘內(nèi)完成了作答，僅有1位同學(xué)做錯(cuò)了題目，AI答疑筆則在輸入確認(rèn)后幾秒就開始輸出步驟，并答對了題目。

　　對于AI的回答，一位姚班學(xué)生認(rèn)為AI做題思路與其一致，步驟更加清晰，相較于傳統(tǒng)的答案更有利于學(xué)生理解解題思路。

　　可以對比的是，去年高考結(jié)束后，有機(jī)構(gòu)讓包括GPT-4o、豆包、文心4.0在內(nèi)的9家大模型嘗試河南的高考卷，并以河南的分?jǐn)?shù)線評判，最終有4家大模型在文科高考中達(dá)到河南的一本線，但沒有大模型的理科分?jǐn)?shù)達(dá)到河南省一本線。

　　有道相關(guān)負(fù)責(zé)人對記者表示，今年以來AI進(jìn)展迅速，尤其是DeepSeek-R1帶來了推理模型大爆發(fā)，而大模型推理能力和交互能力在教育場景的適配性非常高，能夠逐步解決個(gè)性化教學(xué)和答疑的需求，而且提供的指導(dǎo)和答疑質(zhì)量越來越高，所以選擇與高考頂尖學(xué)霸進(jìn)行同題測試，用一種直接明了的方式向大眾展示AI大模型能力的提升。

　　在題型選擇上，主要基于難度和認(rèn)知度的考量，上述負(fù)責(zé)人表示，“因?yàn)榇蠹覍Ω呖嫉碾y度都是有概念的，尤其是這種高難度的理科壓軸題，容易引起關(guān)注，也能直觀展示效果?！?/p>

　　上述人士透露，前段時(shí)間還做了北京最新高考二模(題庫數(shù)據(jù)里沒有的新題)的挑戰(zhàn)。AI答題后由老師進(jìn)行批改，分?jǐn)?shù)為697分(總分750分)，達(dá)到“清北”水平?！爱吘谷ツ闍I集體做24年高考題的時(shí)候理科幾乎全軍覆滅?！?/p>

　　過去一年時(shí)間，不少大模型公司將數(shù)學(xué)能力作為大模型的能力體現(xiàn)。OpenAI在介紹OpenAI o3-mini時(shí)表示，OpenAI o3?mini 的高推理能力在 FrontierMath 上的表現(xiàn)優(yōu)于其前輩。在 FrontierMath 上，當(dāng)被要求使用 Python 工具時(shí)，具有高推理能力的 o3?mini 首次嘗試即可解決超過 32% 的問題，其中包括超過 28% 的挑戰(zhàn)性 (T3) 問題。FrontierMath是由Epoch AI聯(lián)合60余位全世界的數(shù)學(xué)家共同推出了全新的數(shù)學(xué)基準(zhǔn)，其原創(chuàng)的數(shù)學(xué)問題對于專業(yè)數(shù)學(xué)家而言仍需數(shù)小時(shí)甚至數(shù)日解決。不過，OpenAI公布的成績后續(xù)曾遭到質(zhì)疑。

　　此前谷歌宣布推出了基于強(qiáng)化學(xué)習(xí)的數(shù)學(xué)推理系統(tǒng) AlphaProof，以及幾何求解系統(tǒng)的改進(jìn)版 AlphaGeometry 2。谷歌表示這兩款系統(tǒng)共同解決了2024年國際數(shù)學(xué)奧林匹克(IMO) 六道題目中的四道，首次達(dá)到了與銀牌得主相當(dāng)?shù)乃健?/p>

　　今年4月29日，阿里巴巴發(fā)布新一代通義千問模型Qwen3。據(jù)了解，在奧數(shù)水平的AIME25測評中，千問3斬獲81.5分，刷新開源紀(jì)錄。

　　艾媒咨詢發(fā)布的《2024年人工智能+教育行業(yè)發(fā)展研究報(bào)告》指出，2023至2027年在線教育市場的AI貢獻(xiàn)率預(yù)計(jì)從7%提升至16%左右。

責(zé)任編輯：姚楠

審核：劉海龍

圖片版權(quán)歸原作者所有，如有侵權(quán)請聯(lián)系我們，我們立刻刪除。

舉報(bào)郵箱：chinahljcn@126.com

亚洲二区一区动漫|伊人久久久久伊人|88久久无码毛片|日韩综合久久91|久久精品久久久久久|av免费在线网站|久久婷婷国产综合|欧美国产另类久热|无码久久久久久久久|中文字幕在线观看1

清華學(xué)霸與AI比做高考壓軸題，誰會(huì)贏？ 發(fā)布時(shí)間： 2025-05-29 14:27 來源：第一財(cái)經(jīng)

推薦新聞

清華學(xué)霸與AI比做高考壓軸題，誰會(huì)贏？發(fā)布時(shí)間： 2025-05-29 14:27 來源：第一財(cái)經(jīng)