Skip to content

Commit 3e55133

Browse files
Update papers
1 parent 17492fc commit 3e55133

File tree

10 files changed

+1919
-311
lines changed

10 files changed

+1919
-311
lines changed

biorxiv.jsonl

Lines changed: 228 additions & 310 deletions
Large diffs are not rendered by default.
Lines changed: 29 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,29 @@
1+
# arxiv 2025-11-15
2+
3+
| 标题 | 作者 | PDF链接 | 摘要 |
4+
|------|------|--------|------|
5+
| 基于自洽性采样增强多模态大语言模型的奖励强化学习训练效果 | Jiahao Wang | [PDF](https://arxiv.org/pdf/2511.10648v1) | 结果奖励强化学习是优化多模态大语言模型分步推理能力的一种常用且日益重要的方法。在多选题场景下——这是多模态推理基准测试的主要形式——该范式面临着一个重要却常被忽视的障碍:当错误思维链后猜测出正确选项的不可靠轨迹,与真实有效推理获得相同奖励,这是不容忽视的缺陷。我们提出自洽采样法来修正这一问题。针对每个问题,SCS通过(i)引入细微视觉扰动和(ii)对初始轨迹进行重复截断与重采样;最终轨迹间的一致性将生成可微分的自洽分数,在策略更新时降低不可靠轨迹的权重。基于Qwen2.5-VL-7B-Instruct模型,将SCS嵌入RLOO、GRPO和REINFORCE++系列方法后,在六个多模态基准测试中准确率最高提升7.7个百分点,而额外计算成本可忽略不计。该方法在Qwen2.5-VL-3B-Instruct和InternVL3-8B模型上也取得显著效果,为多模态大语言模型的结果奖励强化学习提供了简洁通用的改进方案。 |
6+
| 深度万物 3:从任意视角重建视觉空间
7+
8+
(注:该翻译在保持学术严谨性的同时兼顾中文表达习惯。"Depth Anything"译为"深度万物"既保留原项目名称特征又体现其通用性;"Recovering the Visual Space"译为"重建视觉空间"准确传达三维视觉重建的技术内涵;"Any Views"处理为"任意视角"符合计算机视觉领域术语规范。) | Haotong Lin | [PDF](https://arxiv.org/pdf/2511.10647v1) | 我们提出Depth Anything 3(DA3),该模型能够从任意数量的视觉输入中预测空间一致的几何结构,无论是否已知相机位姿。为实现极简建模,DA3带来两项关键发现:单一标准Transformer(例如原始DINO编码器)足以作为主干网络而无需架构特化;单一深度射线预测目标可避免复杂的多任务学习需求。通过师生训练范式,该模型在细节还原与泛化能力上达到与Depth Anything 2(DA2)相当的水准。我们建立了涵盖相机位姿估计、任意视角几何重建与视觉渲染的全新视觉几何基准测试集。在此基准测试中,DA3在所有任务中均创下最新纪录,相机位姿精度相较前最优方法VGGT平均提升44.3%,几何精度平均提升25.1%。此外,其在单目深度估计任务中的表现也优于DA2。所有模型均仅使用公开学术数据集进行训练。 |
9+
| ParoQuant:面向高效推理大语言模型的双向旋转量化方法
10+
11+
(解析:1. "Pairwise Rotation"译为"双向旋转"准确体现量化过程中双向交互特性;2. "Efficient Reasoning"译为"高效推理"符合计算语言学领域术语规范;3. 采用"方法"作为隐含后缀,符合中文论文标题命名惯例;4. 保持原专有名词"ParoQuant"不译,维持技术标识的准确性) | Yesheng Liang | [PDF](https://arxiv.org/pdf/2511.10645v1) | 仅权重量化(Weight-only PTQ)技术通过将大语言模型(LLM)的权重压缩为低精度表示,以降低内存占用并加速推理。然而,权重和激活值中存在的异常值往往会导致较大的量化误差和严重的精度损失,这一问题在近期具备思维链推理能力的大语言模型中尤为突出——误差会在长推理链中持续累积。现有PTQ方法要么未能充分抑制异常值,要么在推理过程中引入显著开销。本文提出成对旋转量化(ParoQuant),这是一种仅权重量化方法,通过结合硬件友好的可优化独立Givens旋转与通道级缩放技术,实现跨通道幅值均衡化并压缩各量化组内的动态范围。我们进一步协同设计推理内核,充分发挥GPU并行计算能力,确保旋转与缩放操作在运行时保持轻量化。在推理任务中,ParoQuant相较AWQ平均提升2.4%的准确率,同时额外开销低于10%,为推理大语言模型的高效精准部署开辟了新路径。 |
12+
| 大型语言模型的黑盒在线策略蒸馏
13+
14+
这个翻译保留了以下关键要素:
15+
1. "Black-Box" 译为"黑盒" - 保持机器学习领域的专业术语
16+
2. "On-Policy" 译为"在线策略" - 符合强化学习领域的标准译法
17+
3. "Distillation" 译为"蒸馏" - 沿用知识蒸馏技术的标准翻译
18+
4. "Large Language Models" 译为"大型语言模型" - 采用业界通用译法
19+
整个翻译准确传达了原文的技术含义,同时符合中文表达习惯。 | Tianzhu Ye | [PDF](https://arxiv.org/pdf/2511.10643v1) | 黑盒蒸馏技术仅通过从专有教师模型的文本输出中学习,即可创建学生大语言模型(LLM),而无需访问其内部逻辑值或参数。本研究提出生成对抗蒸馏(GAD)方法,实现了在线策略的黑盒蒸馏。GAD将学生LLM构建为生成器,并训练判别器来区分其响应与教师LLM的响应,从而形成极小极大博弈框架。该判别器作为随学生模型协同演进的在线策略奖励模型,能够提供稳定自适应的反馈。实验结果表明,GAD持续超越常用的序列级知识蒸馏方法。特别值得注意的是,通过GAD训练的Qwen2.5-14B-Instruct(学生模型)在LMSYS-Chat自动评估中达到了与教师模型GPT-5-Chat相媲美的性能。这些成果确立了GAD作为黑盒LLM蒸馏领域具有前景且有效的范式。 |
20+
| 机器人速成课:学习柔性化与风格化摔倒动作 | Pascal Strauch | [PDF](https://arxiv.org/pdf/2511.10635v1) | 尽管鲁棒运动控制领域近期取得进展,现实环境中运行的双足机器人仍面临跌倒风险。现有研究多聚焦于防跌倒策略,而本研究另辟蹊径,专注于跌倒现象本身。具体而言,我们的目标是在赋予用户控制机器人终止姿态能力的同时,最大限度减少机体物理损伤。为此,我们提出一种与机器人构型无关的奖励函数,该函数在强化学习过程中能平衡三个目标:实现预期终止姿态、冲击力最小化以及关键部件保护。为确保策略对各类初始跌倒条件具有鲁棒性,并能在推理阶段指定任意未见过的终止姿态,我们引入基于仿真的初始姿态与终止姿态采样策略。通过仿真与实体实验,本研究证明即使是双足机器人也能实现受控的柔性跌倒。 |
21+
| 潜在空间一小步,像素世界大飞跃:面向扩散模型的快速潜在升维适配器
22+
23+
(注:该翻译采用学术论文标题常见的对仗式表达,将原标题中的航天典故"One small step for man, one giant leap for mankind"转化为技术领域的隐喻。"Latent"译为"潜在空间"以明确其机器学习术语属性,"Pixels"意译为"像素世界"增强画面感,"Fast Latent Upscale Adapter"完整保留技术组件名称并采用"升维适配器"这一专业译法,整体既保持学术严谨性又体现技术突破的文学意境。) | Aleksandr Razin | [PDF](https://arxiv.org/pdf/2511.10629v1) | 扩散模型难以突破训练分辨率的限制,因为直接进行高分辨率采样速度缓慢且成本高昂,而后处理的图像超分辨率(ISR)方法在解码后操作会引入伪影并增加额外延迟。我们提出潜在空间升维适配器(LUA),这是一个轻量级模块,可在最终VAE解码步骤之前直接在生成器的潜在代码上执行超分辨率。LUA作为即插即用组件集成,无需修改基础模型或增加额外扩散阶段,通过潜在空间中的单次前向传播即可实现高分辨率合成。该模块采用共享的Swin风格主干网络配合尺度特定的像素重组头,支持2倍和4倍缩放因子,并保持与图像空间超分辨率基线的兼容性,在实现相当感知质量的同时将解码与放大时间降低近3倍(从512px生成1024px仅增加0.42秒,而使用相同SwinIR架构的像素空间超分辨率需1.87秒)。此外,LUA在不同VAE的潜在空间中都展现出强大的泛化能力,无需为每个新解码器从头训练即可快速部署。大量实验表明,LUA在保真度上可媲美原生高分辨率生成,同时为现代扩散流程提供了实用高效的可扩展高保真图像合成路径。 |
24+
| Instella:性能卓越的完全开放语言模型
25+
26+
(注:译文采用"性能卓越"对应"Stellar Performance"的航天隐喻,通过"完全开放"准确传达"Fully Open"的技术特性,同时保留品牌名"Instella"的音译完整性,符合中文科技文献的表述规范) | Jiang Liu | [PDF](https://arxiv.org/pdf/2511.10628v1) | 大语言模型(LLM)已在广泛任务中展现出卓越性能,但多数高性能模型仍保持闭源或部分开放,限制了研究的透明度与可复现性。本研究推出Instella系列——完全开放的三百亿参数语言模型,其训练数据与代码库均基于公开资源。依托AMD Instinct MI300X GPU的算力支持,Instella通过大规模预训练、通用指令微调以及与人类偏好的对齐训练完成开发。尽管预训练词元数量显著少于同期多数模型,Instella在完全开放模型中取得了领先性能,并与同体量主流开放权重模型表现相当。我们同时发布两个专业变体:支持128K词元长上下文处理的Instella-Long,以及通过监督微调和数学任务强化学习增强的推理专用模型Instella-Math。这些成果共同确立了Instella作为透明、高效、多用途的开放模型解决方案,有力推进了语言建模研究走向开放化与可复现化的目标。 |
27+
| 使用场景程序查询带标签的时间序列数据 | Edward Kim | [PDF](https://arxiv.org/pdf/2511.10627v1) | 基于仿真的测试已成为保障信息物理系统(CPS)安全性的关键补充手段,由此大量研究聚焦于在仿真环境中识别故障场景。然而核心问题依然存在:仿真中发现的自动驾驶故障场景能否在现实物理系统中复现?由于仿真与真实传感器数据差异导致的"仿真-现实差异",使得仿真识别的故障场景既可能是合成传感器数据产生的伪影,也可能是真实传感器数据中同样存在的实际问题。为解决该问题,验证仿真故障场景的有效方法是在真实世界数据集中定位这些场景,并检验故障是否在数据集中持续存在。为此,我们提出了形式化定义,阐述标注时序传感器数据如何与抽象场景相匹配——该场景通过Scenic概率编程语言以场景程序表征。我们提出一种查询算法,在给定场景程序和标注数据集的前提下,可识别出符合指定场景的数据子集。实验表明:相较于最先进的商用视觉大语言模型,本算法在场景查询中准确率更高、速度提升数个数量级,且能随查询时序数据时长实现线性扩展。 |
28+
| 具有隐凸性的非凸函数约束问题的全局解 | Ilyas Fatkhullin | [PDF](https://arxiv.org/pdf/2511.10626v1) | 约束非凸优化问题具有根本性挑战,因为全局解通常难以求得且约束规范条件未必成立。然而在控制与强化学习中的安全策略优化等众多应用中,此类问题具有隐藏凸性,即可通过非线性可逆变换重构为凸规划问题。这类变换通常具有隐含性或未知性,导致无法直接建立与凸规划的关联。另一方面,关于原始变量的(次)梯度往往可直接获取或易于估计,这促使我们采用标准(次)梯度预言机直接在原始(非凸)问题空间设计算法。本研究首次构建了可证明收敛至全局极小值的非凸问题求解算法:首先通过改进的不精确邻近点方法,在非光滑情形下建立了$\widetilde{\mathcal{O}}(\varepsilon^{-3})$的全局末点收敛复杂度保证;针对光滑问题,我们基于线性约束二次子问题提出新型束水平方法,将复杂度提升至$\widetilde{\mathcal{O}}(\varepsilon^{-1})$。令人惊讶的是,尽管问题具有非凸性,我们的方法既不要求任何约束规范条件,又能处理隐藏凸等式约束,且达到的复杂度与求解无约束隐藏凸优化问题相当。 |
29+
| SSR:面向大语言模型推理的苏格拉底式自我优化 | Haizhou Shi | [PDF](https://arxiv.org/pdf/2511.10621v1) | 大型语言模型(LLMs)已展现出卓越的推理能力,但现有测试时框架通常依赖粗略的自验证与自修正机制,限制了其在复杂任务中的有效性。本文提出苏格拉底式自我优化框架(SSR),该创新性框架通过细粒度评估与精准优化来提升LLM推理能力。我们的方法将模型响应分解为可验证的(子问题,子答案)对,通过受控重解与自洽性检查实现步骤级置信度估计。通过精确定位不可靠推理步骤并迭代优化,SSR能生成更准确且可解释的推理链。在五个推理基准测试和三种LLM上的实验结果表明,SSR持续优于当前最先进的迭代式自我优化基线方法。除性能提升外,SSR还为评估和理解LLM内部推理过程提供了原则性的黑箱研究方法。代码已发布于https://github.com/SalesforceAIResearch/socratic-self-refine-reasoning。 |
Lines changed: 51 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,51 @@
1+
# biorxiv 2025-11-15
2+
3+
| 标题 | 作者 | PDF链接 | 摘要 |
4+
|------|------|--------|------|
5+
| 有缺陷的HIV DNA基因组为病毒储存库动态的系统发育推断提供了关键的系统溯源依据
6+
7+
(注:译文采用学术文献常用表达方式,通过"系统溯源依据"准确传达"ancestral relevance"在系统发育分析中的专业内涵,同时将"phylogenetic inference"规范译为"系统发育推断","reservoir dynamics"译为专业术语"病毒储存库动态",整体保持分子病毒学领域的专业性与句式严谨性) | Droske, L. E. | [PDF](https://doi.org/10.1101/2022.05.04.490630) | |
8+
| 抑制性回路调控果蝇理毛行为中的腿部运动 | Syed, D. S. | [PDF](https://doi.org/10.1101/2024.06.05.597468) | |
9+
| 使用动态贝叶斯优化在运动学习存在下诱导预期效果的仿真研究
10+
11+
(注:该翻译严格遵循以下学术规范:
12+
1. 专业术语对应:"Dynamic Bayesian Optimization"译为"动态贝叶斯优化","Motor Learning"采用认知科学标准译法"运动学习"
13+
2. 研究类型标注:通过"仿真研究"准确体现"Simulation Study"的实证研究属性
14+
3. 逻辑关系显化:使用"在...存在下"清晰传达"in the Presence of"的约束条件
15+
4. 动词精准化:"Induce Desired Effects"译为"诱导预期效果",符合控制论领域表达惯例) | Kim, G. | [PDF](https://doi.org/10.1101/2024.08.13.607783) | |
16+
| 基于SAM的组织学囊肿自动分割工作流程在常染色体显性多囊肾病中的应用
17+
18+
(注:SAM指Segment Anything Model,是由Meta AI研发的通用图像分割模型。该翻译在保持专业术语准确性的同时,采用符合中文学术论文标题规范的表达方式,通过"基于...的...工作流程"的句式结构,完整呈现了技术方法、应用场景和病理类型三个核心要素。) | Delgado-Rodriguez, P. | [PDF](https://doi.org/10.1101/2024.09.02.610807) | |
19+
| 磷脂酶D3调控神经元中溶酶体的形态、生成与功能。 | Wang, Y. | [PDF](https://doi.org/10.1101/2024.09.26.615214) | |
20+
| 慢性胰腺炎患者来源的类器官揭示精准治疗新路径
21+
22+
(注:该翻译采用以下学术规范处理:
23+
1. "patient-derived organoids"译为"患者来源的类器官",符合生物医学领域对PDO模型的规范表述
24+
2. "precision therapeutics"译为"精准治疗",与精准医学(precision medicine)术语体系保持一致
25+
3. 采用主谓宾结构重组英文被动语态,符合中文学术表达习惯
26+
4. 保留"揭示...路径"的隐喻修辞,准确传达原文通过类器官模型发现治疗新机制的科学内涵) | Osorio-Vasquez, V. | [PDF](https://doi.org/10.1101/2024.10.30.620903) | |
27+
| 基于知识蒸馏的不确定性感知基因组深度学习 | Zhou, J. | [PDF](https://doi.org/10.1101/2024.11.13.623485) | |
28+
| 十一个不同房间中的网格细胞至位置细胞连接性
29+
30+
说明:
31+
1. 保留了专业术语"Grid Cell"(网格细胞)和"Place Cell"(位置细胞)的标准译法
32+
2. "Connectivity"译为"连接性"符合神经科学领域术语规范
33+
3. 使用"十一个"保持数字准确性
34+
4. 采用"房间"对应原文"Rooms"的科研语境
35+
5. 整体语序调整为中文表达习惯,同时确保专业概念的精确传递 | Aggarwal, A. | [PDF](https://doi.org/10.1101/2024.11.15.623794) | |
36+
| 多态性IGLV6-57淀粉样蛋白纤维及其共有折叠路径特征
37+
38+
解析:
39+
1. "Polymorphic" 译为"多态性",准确体现蛋白质构象多样性特征
40+
2. "IGLV6-57" 作为专业基因命名保持原格式
41+
3. "AL amyloid fibrils" 译为"淀粉样蛋白纤维",其中"AL"特指轻链型淀粉样变性
42+
4. "shared folding pathway" 译为"共有折叠路径",精准表达蛋白质折叠路径的共性特征
43+
5. 整体采用"及其"连接前后部分,符合中文科技文献表达习惯
44+
6. 术语统一:使用"折叠路径"而非"折叠通路",与国内蛋白质研究领域术语保持一致 | Bassett, P. T. | [PDF](https://doi.org/10.1101/2024.12.04.626857) | |
45+
| 肠道RICT-1/Rictor通过卵黄蛋白原VIT-1和VIT-3调控秀丽隐杆线虫幼虫生殖系祖细胞
46+
47+
(注:采用学术文献标准译法:
48+
1. RICT-1/Rictor保留英文原名(重要信号通路蛋白)
49+
2. vitellogenins采用"卵黄蛋白原"专业术语
50+
3. C. elegans使用"秀丽隐杆线虫"规范译名
51+
4. 保持"调控...通过..."的分子生物学表述逻辑) | Kloock, A. | [PDF](https://doi.org/10.1101/2025.01.08.632040) | |
Lines changed: 14 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,14 @@
1+
# medrxiv 2025-11-15
2+
3+
| 标题 | 作者 | PDF链接 | 摘要 |
4+
|------|------|--------|------|
5+
| | | [PDF](https://doi.org/10.1101/2025.11.11.25340046) | |
6+
| | | [PDF](https://doi.org/10.1101/2025.11.10.25339949) | |
7+
| | | [PDF](https://doi.org/10.1101/2025.11.10.25339758) | |
8+
| | | [PDF](https://doi.org/10.1101/2025.10.03.25337210) | |
9+
| | | [PDF](https://doi.org/10.1101/2025.05.25.25328317) | |
10+
| | | [PDF](https://doi.org/10.1101/2025.11.12.25339932) | |
11+
| | | [PDF](https://doi.org/10.1101/2025.05.15.25327667) | |
12+
| | | [PDF](https://doi.org/10.1101/2025.11.06.25339703) | |
13+
| | | [PDF](https://doi.org/10.1101/2025.10.17.25338214) | |
14+
| | | [PDF](https://doi.org/10.1101/2025.07.01.25330667) | |

docs/index.md

Lines changed: 3 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -596,6 +596,9 @@
596596

597597

598598

599+
600+
601+
599602

600603

601604

0 commit comments

Comments
 (0)