Minimind

iomgaa/Minimind

Fork 0

Commit Graph

Author	SHA1	Message	Date
iomgaa	afd4fd1f0f	Experiment 1.4.9: Memory Bank优化 - 顺序冻结 + 相似度Loss + 维度修复 🔬 实验基础: 基于实验1.4.7的重要改进 🎯 研究目标: 提升Memory Bank的知识保护和检索准确性 🚀 三大核心创新: 1️⃣ 智能冻结策略改进 • 从随机冻结 → 顺序冻结前20%记忆条目 • 保护重要知识: 假设前面的记忆条目更重要，需要优先保护 • freeze_ratio=0.2: 冻结前20%的memory_bank条目 2️⃣ 查询-知识相似度Loss • 新增相似度监督信号: 衡量查询向量与选中知识的匹配度 • 余弦相似度计算: F.cosine_similarity(query, selected_memory) • 相似度统计: 平均值、最大值、最小值、标准差全方位监控 3️⃣ 维度截断问题修复 • 统一维度处理: knowledge_dim → dim，避免信息截断 • concat_dim修正: dim + num_selected * dim (之前是knowledge_dim) • 记忆向量完整保留: 解决查询结果维度被不当压缩的问题 🏗️ 架构优化细节: • GatedMemoryFusion维度一致性: 统一使用dim维度 • 记忆池化策略: 使用平均池化压缩knowledge_length维度 • 残差连接增强: 改进memory_output与主路径的融合 📊 实验配置: • experiment_1_4_9-02: 8层网络完整测试 • experiment_1_4_9-04: 1层网络最小验证 • EMA更新机制: decay=0.9, update_freq=5 • 数据库初始化: sentence_trex_data.json文本数据 💡 技术假设: 顺序冻结策略能更好地保护重要知识，相似度Loss能提升检索精度，维度统一能减少信息丢失，三者结合将显著改善Memory Bank性能。 🛠️ 基础设施改进: • UUID映射系统: 跟踪记忆条目的原始数据源 • 增强缓存机制: 支持映射文件自动生成 • 监控系统升级: 相似度统计信息实时追踪 🤖 Generated with [Claude Code](https://claude.ai/code) Co-Authored-By: Claude <noreply@anthropic.com>	2025-09-05 14:24:48 +08:00
Yu Chengzhang	44fe6259ec	Experiment 1.4.7: Memory Bank文本初始化 + 部分冻结机制 ## 主要改进 - 🔥 Memory Bank文本初始化：使用sentence_trex_data.json真实文本数据 - 🔥 部分冻结机制：新增freeze_ratio=0.2，保护20%重要记忆条目 - 📊 性能提升：推理Loss改善5.5% (2.4699 vs 2.6142) ## 核心变更 ### model/LMConfig.py - 新增freeze_ratio参数，支持Memory Bank条目冻结控制 ### model/model_memory.py - 实现freeze_mask机制，随机冻结20%记忆条目 - EMA更新过滤：只更新未冻结条目，保护重要知识 - 统计信息增强：新增冻结条目数量和比例监控 ### train_pretrain_accelerate.py - model_memory完整初始化支持：文本数据处理、缓存机制 - sentence_trex_data.json文本tokenization和长度处理 - memory_bank_init缓存优化，提升重复实验效率 ### 实验文档 - experiment/EXPERIMENT_1_4_7.md：完整实验记录和结果分析 - run_file/experiment_1_4_7.sh：实验执行脚本 - CLAUDE.md：架构设计防护规则和模型版本管理规范 ## 实验结果 ✅ 文本初始化效果验证：Loss性能改善5.5% ✅ 冻结机制技术实现：209,715/1,048,576条目成功冻结 ❌ 生成连贯性仍需改进：架构级问题待解决 ## 下一步优化 - EOS token控制修复 - Cross-attention权重优化 - 生成参数调优(temperature/top_p) 🤖 Generated with [Claude Code](https://claude.ai/code) Co-Authored-By: Claude <noreply@anthropic.com>	2025-08-19 19:32:52 +08:00

Author

SHA1

Message

Date

iomgaa

afd4fd1f0f

Experiment 1.4.9: Memory Bank优化 - 顺序冻结 + 相似度Loss + 维度修复

🔬 实验基础: 基于实验1.4.7的重要改进
🎯 研究目标: 提升Memory Bank的知识保护和检索准确性

🚀 三大核心创新:

1️⃣ 智能冻结策略改进
• 从随机冻结 → 顺序冻结前20%记忆条目
• 保护重要知识: 假设前面的记忆条目更重要，需要优先保护
• freeze_ratio=0.2: 冻结前20%的memory_bank条目

2️⃣ 查询-知识相似度Loss
• 新增相似度监督信号: 衡量查询向量与选中知识的匹配度
• 余弦相似度计算: F.cosine_similarity(query, selected_memory)
• 相似度统计: 平均值、最大值、最小值、标准差全方位监控

3️⃣ 维度截断问题修复
• 统一维度处理: knowledge_dim → dim，避免信息截断
• concat_dim修正: dim + num_selected * dim (之前是knowledge_dim)
• 记忆向量完整保留: 解决查询结果维度被不当压缩的问题

🏗️ 架构优化细节:
• GatedMemoryFusion维度一致性: 统一使用dim维度
• 记忆池化策略: 使用平均池化压缩knowledge_length维度
• 残差连接增强: 改进memory_output与主路径的融合

📊 实验配置:
• experiment_1_4_9-02: 8层网络完整测试
• experiment_1_4_9-04: 1层网络最小验证
• EMA更新机制: decay=0.9, update_freq=5
• 数据库初始化: sentence_trex_data.json文本数据

💡 技术假设:
顺序冻结策略能更好地保护重要知识，相似度Loss能提升检索精度，
维度统一能减少信息丢失，三者结合将显著改善Memory Bank性能。

🛠️ 基础设施改进:
• UUID映射系统: 跟踪记忆条目的原始数据源
• 增强缓存机制: 支持映射文件自动生成
• 监控系统升级: 相似度统计信息实时追踪

🤖 Generated with [Claude Code](https://claude.ai/code)

Co-Authored-By: Claude <noreply@anthropic.com>

2025-09-05 14:24:48 +08:00

Yu Chengzhang

44fe6259ec

Experiment 1.4.7: Memory Bank文本初始化 + 部分冻结机制

## 主要改进
- 🔥 Memory Bank文本初始化：使用sentence_trex_data.json真实文本数据
- 🔥 部分冻结机制：新增freeze_ratio=0.2，保护20%重要记忆条目
- 📊 性能提升：推理Loss改善5.5% (2.4699 vs 2.6142)

## 核心变更
### model/LMConfig.py
- 新增freeze_ratio参数，支持Memory Bank条目冻结控制

### model/model_memory.py
- 实现freeze_mask机制，随机冻结20%记忆条目
- EMA更新过滤：只更新未冻结条目，保护重要知识
- 统计信息增强：新增冻结条目数量和比例监控

### train_pretrain_accelerate.py
- model_memory完整初始化支持：文本数据处理、缓存机制
- sentence_trex_data.json文本tokenization和长度处理
- memory_bank_init缓存优化，提升重复实验效率

### 实验文档
- experiment/EXPERIMENT_1_4_7.md：完整实验记录和结果分析
- run_file/experiment_1_4_7.sh：实验执行脚本
- CLAUDE.md：架构设计防护规则和模型版本管理规范

## 实验结果
✅ 文本初始化效果验证：Loss性能改善5.5%
✅ 冻结机制技术实现：209,715/1,048,576条目成功冻结
❌ 生成连贯性仍需改进：架构级问题待解决

## 下一步优化
- EOS token控制修复
- Cross-attention权重优化
- 生成参数调优(temperature/top_p)

🤖 Generated with [Claude Code](https://claude.ai/code)

Co-Authored-By: Claude <noreply@anthropic.com>

2025-08-19 19:32:52 +08:00

2 Commits