不要信任人工智能代理

摘要： 本文介绍了在构建基于AI代理的应用时，应采取的安全策略。主要观点包括：

将AI代理视为不可信和潜在的恶意行为者，并以此为基础构建安全架构。
不信任应用程序层面的安全措施，如允许列表和确认提示，而是采用容器隔离、文件系统隔离等底层安全机制。
避免不同代理之间共享容器和文件系统，以防止数据泄露。
确保代码库简洁、易于审计，并限制新功能的添加。
设计安全模型时，应考虑即使AI代理出现幻觉或异常行为，也不会导致安全问题。

讨论： 这段内容主要讨论了关于开源软件安全、人工智能在编程中的应用、数字代理的潜在风险以及如何确保其安全性等问题。讨论了OpenClaw项目代码量庞大，缺乏足够的审查，以及对于代码行数作为衡量软件质量指标的批评。同时，也提到了数字代理在日常生活中的应用和潜在问题，如权限管理、数据安全和自动化过程中的摩擦等。此外，还讨论了如何为数字代理设置安全边界和审计机制，以及如何应对AI在理解和执行代码方面的局限性。

原文标题：Don’t trust AI agents
原文链接：https://nanoclaw.dev/blog/nanoclaw-security-model
讨论链接：https://news.ycombinator.com/item?id=47194611