AI 算法研究员 & 开发者

你好,我是 刘小允.

数学与应用数学专业 · 中国海洋大学 (2023级)

致力于数学理论指导模型算法优化。基于严格的数学推演深入实践与优化 LLM 训练全流程(含预训练、后训练、科研用 Agent 架构设计),并拥有丰富的深度学习跨学科交叉应用落地经验。我坚信计算科学与数学基础的结合将不断拓宽智能系统的边界,致力于用技术解码复杂世界并实现前沿理论的工程化落地。

科研与项目经历

AI 与地球动力学算法研究

科研项目在投专利

研发地球动力学模拟异常检测与归档整理相关的智能体(Agent)。参与撰写两篇将地质学与人工智能结合的在投专利。

智能体 (Agents)地球动力学异常检测AI 交叉研究
AI 与地球动力学算法研究

文献自动化排版智能体开发

磬东厦门商务咨询有限公司企业项目

为企业开发自动化文献排版与格式化处理智能体。引入该系统后,自动化排版流水线为排版流程节省了单篇论文约1人天的工作量,并显著降低了约 35% 由人工操作引起的格式错误率,大幅提升了交付效率。

大模型智能体自动化企业级解决方案
文献自动化排版智能体开发

进行中的研究

PDF 到 LaTeX 视觉模型预训练

科研项目进行中

独立设计并优化多模态模型数据管线,从零预训练专用于应对 PDF 到 LaTeX 转化任务的视觉模型。重点解决复杂数学公式提取过程中的失真问题,有效克服了传统工具解析速度慢、结构还原度差的工程痛点。

视觉模型从头预训练LaTeX文档 AI

后训练算法改进

科研项目进行中

专注于提升小尺寸语言模型的数学逻辑推导表现。探索基于 PPO/DPO 的强化学习对齐 (RLHF) 技术及高质量推理轨迹构建,定向增强模型在复杂数学问题上的多步推理能力,实现特定垂直场景下的表现越级。

大语言模型后训练数学推理

个人其他科研和项目

全球学术竞赛

在世界舞台上应用先进的 AI 与数学建模解决复杂问题。

ASC 世界大学生超级计算机竞赛

赛事主页 - 全国二等奖
2026

负责具身智能 (Embodied AI) 算法优化部分,在超算集群严格的功耗限制下,着重对 Diffusion Model 和其中的 Attention 机制进行了极致优化。

具身智能扩散模型注意力机制优化高性能计算 (HPC)

国际基因工程机器大赛 (iGEM)

查看我的成果 (See my work) - 全球银奖
2025

参与并领导 Model 部分。负责抗菌肽筛选与重排智能体搭建,提出利用大语言模型 (LLM) 驱动的抗菌肽序列重排机制,并进行了抗菌肽药物作用的分子动力学模拟和药物扩散模型的偏微分方程建模。

大语言模型偏微分方程建模分子动力学生物信息学

学术论文

参与以下同行评审研究中的数据处理、生物信息学流程开发与计算建模工作。

已发表2025

Metagenomic analysis reveals Northwest Pacific Ocean as a reservoir and evolutionary hub of antibiotic resistance genes

Ziyi Guo, Hongyue Ma, Yaxin Liu, Jiangtao Xie, Xiaoyun Liu, Yidan Chang, Ziwei Wang, Pengfei Cui

负责宏基因组数据处理、抗生素耐药基因注释流程开发以及共现网络建模。

Environmental PollutionDOI ↗
数据处理生信流程开发网络建模宏基因组学
预印本2025

Beach sand beneath our feet: an overlooked reservoir of antibiotic resistance genes and pathogens, revealed by metagenomic evidence from Qingdao's recreational beaches

Chenglu Li, Hongyue Ma, Yidan Chang, Hezi Ge, Xiaoyun Liu, Jiangtao Xie, He Zhang, Pengfei Cui

参与宏基因组测序数据分析、耐药基因识别以及病原体分布的统计建模。

bioRxiv PreprintDOI ↗
数据分析统计建模基因识别宏基因组学

系统演示展示

Geo-RAG-LLM:基于高质量数据清洗与 LoRA 微调的地质学垂类问答系统。

Coming Soon: Geo-RAG-LLM Demo Video

我与 AI 的愿景

我感觉我对人工智能有很大的情节,我认为我这辈子就是要做这件事情的。这不是一条简单的职业路径,而是我内心的真正使命。

我积极探索和学习相关领域的前沿知识,不断寻求理论基础(如数学推导与算法建模)和实践部署(大语言模型、智能体架构和生物信息学应用)上的突破。

我的目标是拓展智能系统的边界,创造出能够深度推理、理解复杂科学领域的模型和智能体,最终为人类知识体系贡献自己的力量。

"在智能时代中,不断寻求理论与实践的双重突破。"