MiniMax M2.5 发布:在 SWE-bench 验证中达到 80.2%
Feb 12, 2026启动 HN:Omnara(YC S25)- 在任何地方运行 Claude 代码和 Codex
Feb 12, 2026盈利型初创企业
文章主要讨论了初创公司在发展过程中应优先考虑盈利性而非单纯的快速增长。作者认为,盈利性是控制公司命运的体现,意味着公司不需要过度依赖投资者,可以专注于自己的愿景和使命,并自主决定增长速度。文章以Linear公司的案例说明了通过保持团队小而精、控制成本等方式实现...
Read MoreAll Stories
MiniMax M2.5 发布:在 SWE-bench 验证中达到 80.2%
MiniMax M2.5是一款基于强化学习训练的模型,适用于真实世界的高效生产力。它在编码、工具使用和搜索、办公工作等多个经济价值任务中表现出色,达到行业领先水平。M2.5在SWE-Bench Verified、Multi-SWE-Bench和BrowseComp等基准测试中取得了优异成绩,并且速度和成本效益极高。M2.5支持多种编程语言,能够高效完成从系统...
Feb 12, 2026启动 HN:Omnara(YC S25)- 在任何地方运行 Claude 代码和 Codex
Omnara 是一款支持 Claude Code 和 Codex 的 Web 和移动 IDE,允许用户在任何地方运行和交互代码代理。Omnara 允许用户在本地机器上运行代理会话,并通过 Web 和移动界面进行访问。它解决了代理在没有输入时暂停的问题,并提供了云同步功能,以便在本地机器离线时继续会话。此外,Omnara 还引入了语音代理功能,方便用户在行走或...
Feb 12, 2026Gemini 3 深度思考
今日,我们发布了Gemini 3 Deep Think的重大升级,这是我们的专业推理模式,旨在推动智能前沿并解决科学、研究和工程领域的现代挑战。与科学家和研究人员紧密合作,Deep Think致力于解决复杂的科研难题,这些问题往往没有明确的界限或单一的正确解决方案,数据通常是杂乱无章或不完整的。通过结合深厚的科学知识和日常工程实用性,Deep Think超越...
Feb 12, 2026Gemini 3 深度思考:推进科学、研究和工程
今日,我们发布了Gemini 3 Deep Think的重大升级,这是一种专门的设计推理模式,旨在推动智能前沿并解决科学、研究和工程领域的现代挑战。该升级与科学家和研究人员紧密合作,以应对复杂的研究挑战,这些问题通常缺乏明确的指导方针或单一的正确解决方案,数据也常常杂乱或 incomplete。通过结合深入的科学知识和日常工程实用性,Deep Think超越...
Feb 12, 2026开始使用第六代Waymo驾驶员完全自主操作
Waymo宣布将开始使用第六代驾驶员进行完全自动驾驶操作,这是将技术推广到更多城市和更多乘客的重要一步。该系统旨在长期增长,其扩展功能允许Waymo在更多样化的环境中安全地扩大其足迹,包括极端冬季天气地区。第六代Waymo驾驶员是七年来安全服务的成果,基于在10多个主要城市密集核心区域和不断扩大的高速公路网络上行驶近2亿英里完全自动驾驶里程的经验。Waymo...
Feb 12, 2026LLMs 在 SQL 方面很擅长。我们给它提供了数以TB计的 CI 日志。
本文介绍了Mendral系统如何通过高效的数据存储和查询机制,实现快速定位和调试CI(持续集成)过程中的问题。系统利用ClickHouse数据库存储和压缩海量日志数据,并通过SQL接口供代理程序进行查询。代理程序能够通过分析日志和元数据,快速定位问题的根源。文章详细描述了代理程序的查询模式、数据存储结构、查询性能以及如何处理GitHub API的请求限制等问题。
Feb 11, 2026Fluorite – 一款与 Flutter 完全集成的控制台级游戏引擎
Fluorite 是首个与 Flutter 完全集成的控制台级游戏引擎。它允许开发者使用 Dart 语言直接编写游戏代码,并利用 Flutter 的强大开发工具。Fluorite 采用数据导向的 ECS 架构,并使用 C++ 编写以实现高性能和优化。该引擎支持在 Blender 中定义可点击区域,并通过 Google 的 Filament 渲染器提供高质量的...
Feb 11, 2026AI-First Company Memos
本文探讨了不同公司在AI转型中采取的不同哲学和策略。文章指出,尽管这些公司都采用CEO向全体员工发送关于AI转型的备忘录这一格式,但它们在“AI优先”的含义上存在三种根本不同的哲学:将AI视为门槛、将AI视为阶梯和将AI视为既成事实。文章强调,这些备忘录不仅是沟通策略的工具,更是战略本身,能够创造问责制、设定外部叙事并创造同侪压力。然而,这些备忘录并未明确定...
Feb 11, 2026Oxide完成2亿美元C轮融资
本文段主要讲述了Oxide公司在产品市场匹配、资本筹集和公司愿景方面的考虑。公司已经实现了产品与市场的完美匹配,因此不需要通过资本筹集来支持业务。尽管如此,由于投资者的支持,公司还是进行了C轮融资。这一轮融资不仅确保了公司的独立性,还消除了未来的资本风险。Oxide公司致力于成为一家代际企业,而非被收购的目标。通过C轮融资,公司获得了足够的资本保障其长期生存...
Feb 10, 2026我减半了对谷歌搜索的依赖
本文介绍了作者如何通过构建一个名为Hister的自托管网络历史搜索工具,将自身对谷歌搜索的依赖减少了50%。作者分析了当前网络搜索存在的问题,如广告过多、SEO操纵、AI摘要不准确、隐私问题等。他发现大部分日常搜索属于“回忆搜索”,即寻找已访问过的信息。因此,他开发了Hister,一个专门针对“回忆搜索”的工具,可以本地索引和搜索浏览历史。使用Hister后...
Feb 10, 2026竞争并不等于市场验证
文章讨论了创业公司在面对激烈竞争的市场时可能遇到的误区。作者指出,高竞争并不一定意味着市场大,而是可能是因为市场供应过剩,如资金、创始人、基础设施等方面的过度供应。文章还分析了需求侧可能导致市场拥挤但规模较小的因素,例如用户痛点标准化不足、成熟市场中的过度竞争等。作者建议创业者应将竞争视为多个信号之一,并专注于用户需求和痛点。文章最后提出了几个测试,帮助创业...
Feb 10, 2026美国的1000亿美元AI赌注
美国正在经历历史上前所未有的投资热潮,用于构建训练和部署人工智能所需的计算机、数据中心等物理基础设施。自2022年底ChatGPT发布以来,数据中心建设支出已创下新高,年化超过420亿美元,比ChatGPT发布前增长了300%以上。投资规模之大,已使相关支出接近美国GDP的3.5%。这一投资热潮主要集中在美国,加拿大、英国、欧盟和日本的投资增长并不显著。美国...
Feb 10, 20262026版最受欢迎的代理开源工具
本文探讨了在过去18个月中,基于代理的AI生态系统从聊天机器人转向代理工程的发展。这一转变得益于开源基础设施的推动。文章以You.com为例,说明了团队如何从以提示为中心的实验转向系统设计,包括代理循环、工具编排、验证层和评估。文章重点介绍了2026年构建代理的最佳团队不是编写提示,而是构建系统,这些系统能够规划、执行、验证、重试和学习以完成目标。文章详细介...
Feb 09, 2026- «
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
- 109
- 110
- 111
- 112
- 113
- 114
- 115
- 116
- 117
- 118
- 119
- 120
- 121
- 122
- 123
- 124
- 125
- 126
- 127
- 128
- 129
- 130
- 131
- 132
- 133
- 134
- 135
- 136
- 137
- 138
- Next »
Featured
-
Gemini 3 深度思考
Feb 12, 2026 -
开始使用第六代Waymo驾驶员完全自主操作
Feb 12, 2026 -
Fluorite – 一款与 Flutter 完全集成的控制台级游戏引擎
Feb 12, 2026 -
Oxide完成2亿美元C轮融资
Feb 12, 2026 -
GitHub 停机了
Feb 12, 2026 -
Deno Sandbox
Feb 12, 2026 -
Agent Skills
Feb 12, 2026 -
破解 Moltbook
Feb 12, 2026 -
威斯康星州的社区签署了保密协议,用于建设价值数十亿美元的数据中心。
Feb 12, 2026 -
Project Genie:探索无限、交互式世界的实验
Feb 12, 2026