本工作核心作者為湯子瑞(上海交通大學)、牛博宇(上海交通大學)。合作者為李帛修、周煒、王健楠、李國良、張心怡、吳帆。通訊作者為上海交通大學計算機學院博士生導師周煊赫。團隊長期從事人工智能與數據交叉研究。
半結構化表格是我們日常工作中常見的 “攔路虎”—— 布局五花八門、結構復雜多變,讓自動化數據處理變得異常困難。

面對這樣的挑戰,傳統的表格處理工具往往力不從心。研究發現,現有的大模型以及表格理解領域模型在NL2SQL/ 結構化表格已經有了較好的效果(準確率超 80%),但是在那些諸如金融報表、庫存表、企業管理表等具有合并單元格、嵌套表格、層次結構等特征的復雜半結構化表格上表現明顯退化。

為了解決這一痛點,來自上海交通大學計算機學院、西蒙菲莎大學、清華大學、中國人民大學的合作團隊,帶來基于樹形框架的智能表格問答系統(ST-Raptor),其不僅能精準捕捉表格中的復雜布局,還能自動生成表格操作指令,并一步步執行這些操作流程,最終準確回答用戶提出的問題 —— 就像給 Excel 裝上了一個會思考的 “AI 大腦”。
目前,該論文已被數據庫領域國際頂尖學術會議ACM SIGMOD2026 接收。