法舟记

法舟记

AI 大模型与前沿技术笔记

196 篇文章17 个分类
了解更多 →

最新动态

tech

Antares Achieves Criticality of Mark-0 Reactor

Article URL: https://antaresindustries.com/updates/antares-achieves-criticality Comments URL: https://news.ycombinator.com/item?id=48730246 Points: 17 # Comments: 4

6月30日阅读 →
ai-tools

全球秘密研发中心:苏黎世如何成为AI技术新高地

您需要启用JavaScript才能查看此网站。跳过内容。由Greater Zurich Area提供赞助。苹果(Apple)、Anthropic、迪士尼研究(Disney Research)、谷歌(Google)、Meta、微软(Microsoft)、英伟达(NVIDIA)、OpenAI。硅谷之外,很少有地方能同时拥有所有这些公司的研发中心。更少的地方能集中在一个人口仅40万出头的城市——大约是旧

6月30日阅读 →
ai-tools

数据与评估闭环:模型能力增强的系统化方法

模型能力是大语言模型(LLM)预训练中的核心变量,却从未被直接观测:数据前瞻性地塑造它,而评估仅能回顾性地揭示它,将样本、提示(prompt)、解码(decoding)和评分规则压缩成一个充满噪声的分数。实际优化是反向进行的:首先观察到失败,工程师必须推断出语料库的修复方案。双方使用不相容的词汇——基准名称和逐样本正确性 vs. 数据来源、领域和质量标签——因此这种推断通常依赖直觉,而非方法。

6月30日阅读 →
ai-tools

GPTNT:多模态智能体在《保持通话,无人爆炸》中的实时协作基准测试

计算机科学 > 人工智能 arXiv:2606.28514 (cs) [提交于2026年6月26日] 标题:GPTNT:多模态智能体在《保持通话,无人爆炸》中的实时协作基准测试 作者:Amit Parekh, Sabrina McCallum, Kareem Al-Hasan, Malvina Nikandrou, Alessandro Suglia, Ioannis Konstas 查看论文PD

6月30日阅读 →
programming

Tyaff:六天打造替代React的轻量级VDOM库,解决memo痛点

Tyaff Tyaff — 一个用于JavaScript的VDOM库(VDOM library for JavaScript)。它是纯JavaScript(ES6+)编写的轻量级React替代方案,拥有自己的虚拟DOM(virtual DOM)和极简主义哲学。与React的关键区别在于:memo()仅阻塞当前组件——子组件独立继续自己的更新链,使优化变得可预测;支持任何来源的可变数据(Mutabl

6月30日阅读 →
ai-tools

IMCBench:面向多模态大语言模型的图像驱动医疗对话基准

计算机科学 > 人工智能 arXiv:2606.28556 (cs) [提交于2026年6月26日] 标题:IMCBench:面向多模态大语言模型的图像驱动医疗对话基准 作者:Maria Xenochristou, Ashutosh Joshi, Korosh Vatanparvar, Mohammad Abuzar Hashemi, Prasad Kasu, Deepak Bansal, Anc

6月30日阅读 →
ai-tools

戳破GPU泡沫:Photon推理引擎的流水线解码技术揭秘

如何让AI模型运行得尽可能快?这是Moondream总部一直痴迷的问题。GPU负责模型推理中的所有数学运算,因此乍一看似乎没什么大不了的:只需告诉它做什么,然后等待答案即可。但如果你开始研究它在底层实际是如何工作的,你会发现GPU经常处于空闲状态,不是因为没活干,而是因为CPU还没有告诉它下一步该做什么。这种现象被称为GPU泡沫(GPU bubble)。 当典型的AI模型生成文本时,它一次生成一

6月30日阅读 →
ai-tools

通过留出选择实现递归自进化智能体

大型语言模型(LLM)智能体越来越多地通过进化自然语言工件(如反思、工作流、操作手册、速查表或优化提示)来改进,而无需权重更新,这些工件用于调节冻结策略。此类方法通常被报道为在它们所帮助的单一基准测试上取得了胜利。我们对它们进行了公平比较,并揭示了一幅更清晰的图景。

6月30日阅读 →
ai-tools

AI模型网络:概念、现状与未来展望

虽然计算机的主要功能在于计算和处理,但互联网的核心价值却植根于共享与协作。计算机创造了互联网,而互联网则赋予了计算机更大的价值。互联网、云计算和大数据的快速发展,正推动人工智能进入大模型(Large Models, LMs)时代。然而,当前大模型的实际应用受到高训练成本和部署复杂性的阻碍,这促使业界转向轻量化、私有化和领域特定模型。随着异构模型的快速普及和广泛分布,如何实现它们之间的有效交互与协作

6月29日阅读 →