我目前在东北大学攻读计算机科学硕士学位,研究方向为信息检索和大语言模型。

我的研究兴趣涵盖自然语言处理(NLP)、信息检索、大语言模型(LLM)、检索增强生成(RAG)、推荐系统(Recsys)以及多模态领域。目前,我的工作包括推荐系统的数据去噪、合成数据生成以及大语言模型的指令微调。

我拥有哈尔滨工程大学计算机科学与技术学士学位,本科期间由助理研究员李超指导。我还在东北大学信息检索实验室进行研究实习,导师是刘正皓副教授(来自清华大学),同时也在启元实验室清华大学自然语言处理与社会人文计算实验室实习,分别由闫宇坤(来自清华大学)和熊辰炎副教授(来自卡内基梅隆大学)指导。


总页面浏览量: | 上次编辑时间: 2025-04-14 | 联系方式: [email protected]


🔥 新闻

  • 2024.10: 🕯 深切哀悼我的朋友徐子涵于2024年10月10日在上海离世。
  • 2024.04: 🎉 我们发布了一个GitHub代码库 heu-icicles ,欢迎提出问题和提交拉取请求!
  • 2024.02: 🎉 我们的论文被2024年语言资源与评价会议-国际计算语言学大会(LREC-COLING 2024,CCF-B类会议)录用!
  • 2023.10: 🎉 我们发布了MMAD,这是一个能为电影生成全面音频描述以帮助视障人士的模型!
  • 2023.05: 🎉 我们在2023年数学建模竞赛(MCM/ICM)上提出了一个用于预测Wordle游戏结果的模型!

📝 发表成果

* 表示同等贡献,† 表示通讯作者。

LREC-COLING 2024
sym

MMAD: Multi-modal Movie Audio Description

Xiaojun Ye, Junhao Chen, Xiang Li, Haidong Xin, Chao Li, Sheng Zhou$^†$, Jiajun Bu

📃论文 | 📄PDF | 🗂️项目网站 |

  • 这项工作为视障人士开启了全新的观影体验。
arXiv 2023
sym

Puzzle game: Prediction and Classification of Wordle Solution Words

Haidong Xin$^{*†}$, Fang Wu$^{*}$, Zhitong Zhou$^{*}$

📃论文 | 📄PDF | arXiv

  • 这项工作对 Wordle 游戏进行了详细的数值分析,揭示了其中的统计规律。

🏆 获奖情况

  • 2024.11 🥇校优秀学生一等奖学金。
  • 2023.07 🥈中国大学生计算机设计大赛国家二等奖。
  • 2023.05 🥈美国大学生数学建模竞赛荣誉提名奖。
  • 2023.05 🥈中国大学生创新创业大赛二等奖。
  • 2022.11 🥇中国大学生数学建模竞赛一等奖。
  • 2022.10 🥈东北三省数学建模联赛二等奖。
  • 2022.05 🥇校优秀学生一等奖学金。
  • 2021.05 🥇校优秀学生一等奖学金。

🔨 项目经历

语料库智能检索系统
sym

Corpus Intelligent Retrieval System

辛海东, 吴方, 叶笑君, 张先煜, 孙靖博

🔨项目 | | http://corpus.hrbeu.edu.cn

  • 本项目是一个采用前后端方式实现的语料库智能检索系统。我们实现了语料库的数据管理和权限管理。
Bird Sound Classification
sym

鸟类声音分类系统

李响, 吴方, 辛海东

🔨项目 |

  • 本项目是中国大学生计算机设计大赛的获奖作品。我们构建了一个前后端系统,用于展示鸟类音频分类结果和百科信息。
Ray Tracing With OpenGL
sym

使用 OpenGL 进行光线追踪

辛海东, 张先煜, 岳观澜

🔨项目 |

  • 本项目是中国大学生计算机设计大赛的获奖作品。我们使用 OpenGL 库和 NVIDIA 驱动实现了光线追踪。

📖 教育背景

💬 受邀活动

💻 实习经历

🤝 曾经帮助过我的人

按姓氏的字母顺序排列,无特殊优先级。