法舟记

AI 大模型与前沿技术笔记

196 篇文章17 个分类

法舟记

AI 大模型与前沿技术笔记

196 篇文章17 个分类

了解更多 →

Antares Achieves Criticality of Mark-0 Reactor

Article URL: https://antaresindustries.com/updates/antares-achieves-criticality Comments URL: https://news.ycombinator.com/item?id=48730246 Points: 17 # Comments: 4

阅读全文

ai-tools6月30日

全球秘密研发中心：苏黎世如何成为AI技术新高地

您需要启用JavaScript才能查看此网站。跳过内容。由Greater Zurich Area提供赞助。苹果（Apple）、Anthropic、迪士尼研究（Disney Research）、谷歌（Google）、Meta、微软（Microsoft）、英伟达（NVIDIA）、OpenAI。硅谷之外，很少有地方能同时拥有所有这些公司的研发中心。更少的地方能集中在一个人口仅40万出头的城市——大约是旧

阅读全文

ai-tools6月30日

数据与评估闭环：模型能力增强的系统化方法

模型能力是大语言模型（LLM）预训练中的核心变量，却从未被直接观测：数据前瞻性地塑造它，而评估仅能回顾性地揭示它，将样本、提示（prompt）、解码（decoding）和评分规则压缩成一个充满噪声的分数。实际优化是反向进行的：首先观察到失败，工程师必须推断出语料库的修复方案。双方使用不相容的词汇——基准名称和逐样本正确性 vs. 数据来源、领域和质量标签——因此这种推断通常依赖直觉，而非方法。

阅读全文

ai-tools6月30日

GPTNT：多模态智能体在《保持通话，无人爆炸》中的实时协作基准测试

计算机科学 > 人工智能 arXiv:2606.28514 (cs) [提交于2026年6月26日] 标题：GPTNT：多模态智能体在《保持通话，无人爆炸》中的实时协作基准测试作者：Amit Parekh, Sabrina McCallum, Kareem Al-Hasan, Malvina Nikandrou, Alessandro Suglia, Ioannis Konstas 查看论文PD

阅读全文

programming6月30日

Tyaff：六天打造替代React的轻量级VDOM库，解决memo痛点

Tyaff Tyaff — 一个用于JavaScript的VDOM库（VDOM library for JavaScript）。它是纯JavaScript（ES6+）编写的轻量级React替代方案，拥有自己的虚拟DOM（virtual DOM）和极简主义哲学。与React的关键区别在于：memo()仅阻塞当前组件——子组件独立继续自己的更新链，使优化变得可预测；支持任何来源的可变数据（Mutabl

阅读全文

ai-tools6月30日

IMCBench：面向多模态大语言模型的图像驱动医疗对话基准

计算机科学 > 人工智能 arXiv:2606.28556 (cs) [提交于2026年6月26日] 标题：IMCBench：面向多模态大语言模型的图像驱动医疗对话基准作者：Maria Xenochristou, Ashutosh Joshi, Korosh Vatanparvar, Mohammad Abuzar Hashemi, Prasad Kasu, Deepak Bansal, Anc

阅读全文

ai-tools6月30日

戳破GPU泡沫：Photon推理引擎的流水线解码技术揭秘

如何让AI模型运行得尽可能快？这是Moondream总部一直痴迷的问题。GPU负责模型推理中的所有数学运算，因此乍一看似乎没什么大不了的：只需告诉它做什么，然后等待答案即可。但如果你开始研究它在底层实际是如何工作的，你会发现GPU经常处于空闲状态，不是因为没活干，而是因为CPU还没有告诉它下一步该做什么。这种现象被称为GPU泡沫（GPU bubble）。当典型的AI模型生成文本时，它一次生成一

阅读全文

ai-tools6月30日

通过留出选择实现递归自进化智能体

大型语言模型（LLM）智能体越来越多地通过进化自然语言工件（如反思、工作流、操作手册、速查表或优化提示）来改进，而无需权重更新，这些工件用于调节冻结策略。此类方法通常被报道为在它们所帮助的单一基准测试上取得了胜利。我们对它们进行了公平比较，并揭示了一幅更清晰的图景。

阅读全文

ai-tools6月29日

AI模型网络：概念、现状与未来展望

虽然计算机的主要功能在于计算和处理，但互联网的核心价值却植根于共享与协作。计算机创造了互联网，而互联网则赋予了计算机更大的价值。互联网、云计算和大数据的快速发展，正推动人工智能进入大模型（Large Models, LMs）时代。然而，当前大模型的实际应用受到高训练成本和部署复杂性的阻碍，这促使业界转向轻量化、私有化和领域特定模型。随着异构模型的快速普及和广泛分布，如何实现它们之间的有效交互与协作

阅读全文

1 / 22

tech

Antares Achieves Criticality of Mark-0 Reactor

Article URL: https://antaresindustries.com/updates/antares-achieves-criticality Comments URL: https://news.ycombinator.com/item?id=48730246 Points: 17 # Comments: 4

6月30日阅读 →

ai-tools

全球秘密研发中心：苏黎世如何成为AI技术新高地

6月30日阅读 →

ai-tools

数据与评估闭环：模型能力增强的系统化方法

6月30日阅读 →

ai-tools

GPTNT：多模态智能体在《保持通话，无人爆炸》中的实时协作基准测试

6月30日阅读 →

programming

Tyaff：六天打造替代React的轻量级VDOM库，解决memo痛点

6月30日阅读 →

ai-tools

IMCBench：面向多模态大语言模型的图像驱动医疗对话基准

6月30日阅读 →

ai-tools

戳破GPU泡沫：Photon推理引擎的流水线解码技术揭秘

6月30日阅读 →

ai-tools

通过留出选择实现递归自进化智能体

6月30日阅读 →

ai-tools

AI模型网络：概念、现状与未来展望

6月29日阅读 →

分类

技术 AI 工具编程创业硬件科学游戏政策加密/web3 engineering engineering-management security technology biotechnology fiction 设计 privacy

Antares Achieves Criticality of Mark-0 Reactor

Article URL: https://antaresindustries.com/updates/antares-achieves-criticality Comments URL: https://news.ycombinator.com/item?id=48730246 Points: 17 # Comments: 4

阅读全文

ai-tools6月30日

全球秘密研发中心：苏黎世如何成为AI技术新高地

阅读全文

ai-tools6月30日

数据与评估闭环：模型能力增强的系统化方法

阅读全文

ai-tools6月30日

GPTNT：多模态智能体在《保持通话，无人爆炸》中的实时协作基准测试

阅读全文

programming6月30日

Tyaff：六天打造替代React的轻量级VDOM库，解决memo痛点

阅读全文

ai-tools6月30日

IMCBench：面向多模态大语言模型的图像驱动医疗对话基准

阅读全文

ai-tools6月30日

戳破GPU泡沫：Photon推理引擎的流水线解码技术揭秘

阅读全文

ai-tools6月30日

通过留出选择实现递归自进化智能体

阅读全文

ai-tools6月29日

AI模型网络：概念、现状与未来展望

阅读全文

1 / 22

tech

Antares Achieves Criticality of Mark-0 Reactor

Article URL: https://antaresindustries.com/updates/antares-achieves-criticality Comments URL: https://news.ycombinator.com/item?id=48730246 Points: 17 # Comments: 4

6月30日阅读 →

ai-tools

全球秘密研发中心：苏黎世如何成为AI技术新高地

6月30日阅读 →

ai-tools

数据与评估闭环：模型能力增强的系统化方法

6月30日阅读 →

ai-tools

GPTNT：多模态智能体在《保持通话，无人爆炸》中的实时协作基准测试

6月30日阅读 →

programming

Tyaff：六天打造替代React的轻量级VDOM库，解决memo痛点

6月30日阅读 →

ai-tools

IMCBench：面向多模态大语言模型的图像驱动医疗对话基准

6月30日阅读 →

ai-tools

戳破GPU泡沫：Photon推理引擎的流水线解码技术揭秘

6月30日阅读 →

ai-tools

通过留出选择实现递归自进化智能体

6月30日阅读 →

ai-tools

AI模型网络：概念、现状与未来展望

6月29日阅读 →

法舟记

法舟记

最新动态

Antares Achieves Criticality of Mark-0 Reactor

全球秘密研发中心：苏黎世如何成为AI技术新高地

数据与评估闭环：模型能力增强的系统化方法

GPTNT：多模态智能体在《保持通话，无人爆炸》中的实时协作基准测试

Tyaff：六天打造替代React的轻量级VDOM库，解决memo痛点

IMCBench：面向多模态大语言模型的图像驱动医疗对话基准

戳破GPU泡沫：Photon推理引擎的流水线解码技术揭秘

通过留出选择实现递归自进化智能体

AI模型网络：概念、现状与未来展望

Antares Achieves Criticality of Mark-0 Reactor

全球秘密研发中心：苏黎世如何成为AI技术新高地

数据与评估闭环：模型能力增强的系统化方法

GPTNT：多模态智能体在《保持通话，无人爆炸》中的实时协作基准测试

Tyaff：六天打造替代React的轻量级VDOM库，解决memo痛点

IMCBench：面向多模态大语言模型的图像驱动医疗对话基准

戳破GPU泡沫：Photon推理引擎的流水线解码技术揭秘

通过留出选择实现递归自进化智能体

AI模型网络：概念、现状与未来展望

分类

最新动态

Antares Achieves Criticality of Mark-0 Reactor

全球秘密研发中心：苏黎世如何成为AI技术新高地

数据与评估闭环：模型能力增强的系统化方法

GPTNT：多模态智能体在《保持通话，无人爆炸》中的实时协作基准测试

Tyaff：六天打造替代React的轻量级VDOM库，解决memo痛点

IMCBench：面向多模态大语言模型的图像驱动医疗对话基准

戳破GPU泡沫：Photon推理引擎的流水线解码技术揭秘

通过留出选择实现递归自进化智能体

AI模型网络：概念、现状与未来展望

Antares Achieves Criticality of Mark-0 Reactor

全球秘密研发中心：苏黎世如何成为AI技术新高地

数据与评估闭环：模型能力增强的系统化方法

GPTNT：多模态智能体在《保持通话，无人爆炸》中的实时协作基准测试

Tyaff：六天打造替代React的轻量级VDOM库，解决memo痛点

IMCBench：面向多模态大语言模型的图像驱动医疗对话基准

戳破GPU泡沫：Photon推理引擎的流水线解码技术揭秘

通过留出选择实现递归自进化智能体

AI模型网络：概念、现状与未来展望