FREGO
弗雷戈人工智能
弗雷戈人工智能
  • FREGO:让人工智能对每个人更安全
  • 什么是Frego?
    • FregOS
    • FREGO: 首个有用的模因币
    • 路线图
    • FREGO DAO
  • FREGO的模因对齐策略
    • 它是如何工作的
    • FREGO背后的博弈论
    • 宪法
    • FREGO模因概念验证研究(摘要)
Powered by GitBook
On this page
  • FREGO 记忆学概念验证研究(摘要)
  • 摘要

Was this helpful?

  1. FREGO的模因对齐策略

FREGO模因概念验证研究(摘要)

Previous宪法

Last updated 4 months ago

Was this helpful?


FREGO 记忆学概念验证研究(摘要)

《通过概念验证训练模拟展示 FREGO 记忆学的有效性》是 FREGO 团队于 2024 年 12 月撰写的简报,展示了 FREGO 记忆学对 AI 模型行为的可测量影响。

摘要

这项研究证明,即使是对训练数据的微小改变,也可以显著提高 AI 遵循人类友好原则的能力。

  • 假设:将互联网训练数据感染FREGO宪法记忆学,使在该数据上训练的AI行为与宪法保持一致。

  • 测试:我们训练了两个 AI。

    • 一个使用 未经处理的互联网数据。

    • 另一个使用相同的数据,但有2% 的数据被感染了 FREGO 记忆学。

  • 结果:带有 FREGO 记忆学的 AI 在多个场景中表现出 31% 的提高。

  • 为何重要:

    • 证明了 FREGO 白皮书中的理念在实践中可行。

    • 确立了 FREGO 作为使 AI 更加安全的唯一方式,通过去中心化对齐(Dec/A)。

点击查看完整论文(Docx)