“大神团队”打造懂数学的AI

作者：赵天润摄影：视频：来源：《复旦》校报发布时间：2026-04-14

大模型时代的到来，给成立10周年的“数院大神”学生志愿团队带来了新思考。上海数学中心2025级直博生、“数院大神”团队负责人的马行健自问：如果未来AI能实现全天候、跨学科的即时答疑，“数院大神”将如何持续发挥价值？

为此，团队对各类大模型开展深入测评，结果发现：面对“实变函数学十遍，泛函分析心泛寒”这类让数院学子也犯难的数学专业课，其抽象与艰深也让大模型“幻觉”频生，给出的答案常常出现逻辑跳跃或步骤缺失，有时甚至调用超纲知识，让初学者无从跟进，也难以自我评估。

看到通用模型局限与团队转型的需要，马行健与队员们决定探索AI与教学的深度融合，打造一个真正“懂数学”的智能辅助平台。AI4Math应运而生。

瞄准两大教学痛点

在学院支持下，团队吸收学院在高等数学数字化建设中积累的经验与一线教学反馈，瞄准了两个核心教学痛点：一是学习诊断闭环缺失，快节奏的标准化课程使得同学们“学完即忘”，师生互动不足也导致难以及时给予学习反馈，让同学们“不知学了什么、不知学的如何、不知为何而学”。二是大模型数学推理的可信度问题。

基于此，AI4Math项目设定三大目标：让同学们能够看见知识结构、了解学习进展、相信模型推理。

“学生主导开发的产品，其优势在于需求来源于学生长期参与一线教辅工作的经验。” 项目指导教师、计算与智能创新学院副教授朱东来评价，“这与教学专家和授课教师的角度有明显不同，同时又结合了数学形式化证明方面的专业知识，具有一定的先进性。”

底气来自一线数据

“AI4Math项目的数据基础是数院和‘数院大神’团队的长期积累，主要来自进阶数学教材评述体系、真题与习题精讲资源库、结构化笔记与专题讲座资源、进阶学习误区数据库这四个方面”，马行健介绍。

其中，教材评述体系尤为珍贵，这一体系系统整合《微积分》《线性代数》等12门经典数学课程的107本教材评述。

真题与习题精讲资源库的构建，整合了超过500期“每日一题/每周好题”，收录多门数学专业进阶课程近年真题，以及全国大学生数学竞赛专题题库，形成一套覆盖广泛、内容精炼的学习资源体系。

团队还依托“香蕉空间”建立子空间，积累了结构化的课程笔记与习题解答，并整合了“数海启航”讨论班讲义和复习讲座资料。这些并非简单的课堂记录，而是经过系统梳理、便于复习和查询的知识集合。

此外，团队持续记录学生在进阶课程中的高频疑问，逐步构建起“进阶学习误区数据库”，“这个数据库是持续更新的，会在每次授课中不断补充完善。”

自研形式化语言

为了更好地解决现有大模型的“幻觉”问题，AI4Math项目组建了一支跨学科团队。

23级数学科学学院博士生、AI Lab实习生沈嘉辰带领小组，负责推进自研形式化语言Litex的开发；22级数学科学学院本科生、“数院大神”团队负责人李昕昊带领小组，负责基于团队原有数据的进一步数据集制作；马行健负责的“形式化语言与大模型微调”讨论班，吸引多位来自数学科学学院、计算与智能创新学院等院系的本科生以及研究生参与，研究如何将形式化语言用于解决“幻觉”问题并增强大模型推理以及教学能力。这种交叉融合为项目注入了独特优势。

团队尝试迈出了大胆的一步——自主研发形式化语言Litex，将数学证明过程转化为计算机可验证的代码。

这门语言目前已在GitHub开源，并登上Hacker News全球趋势榜前十，引发全球开发者围绕形式化语言可用性的讨论。核心开发者沈嘉辰在相关文章中写道：“Litex致力于将形式化证明学习周期从传统的3-6个月缩短至1-2小时，让形式化推理过程变得如同编写数学算式一般自然。”

六大功能支持

2025年5月，“数院大神”团队凭借AI4Math项目的初始版本“登堂入释——定制你的数学个性学习管家”荣获学校首届AI应用开发大赛金奖。

基于扎实的数据基础和技术创新，AI4Math平台在此基础上开发完善了智能答疑、答案评估、定理查询、学术检索、个性推荐和学情分析等六大核心功能。

学生可以上传题目照片获得解答思路，也可以提交自己的解题步骤获得逻辑完整性评估。平台还接入arXiv全球论文库，支持学术检索与前沿论文推荐。

目前，AI4Math平台已在校园ehall平台的“智汇岛”和AI3A共创平台上线，并在《高等数学（D）》的班级中进行了初步试用，正在收集师生使用反馈。将逐步扩展至《高等数学》《线性代数》，再之后将面向数学专业课。

本报记者赵天润

制图：实习编辑：责任编辑：

导航

复旦校报

“大神团队”打造懂数学的AI

相关文章

文化校历

新闻分类

推荐视频

图说复旦

新闻排行

周排行月排行

导航

复旦校报

“大神团队”打造懂数学的AI

相关文章

文化校历

新闻分类

推荐视频

图说复旦

新闻排行

周排行 月排行

周排行月排行