Skip to content

Architecture Diagrams

Visual Reference for Implementation
Created: December 8, 2025


πŸ“ System Architecture Overview

β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚                         HRM-ACTV1 Enhanced Model                        β”‚
β”œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€
β”‚                                                                         β”‚
β”‚  Input Tokens                                                           β”‚
β”‚      β”‚                                                                  β”‚
β”‚      β–Ό                                                                  β”‚
β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”                                                       β”‚
β”‚  β”‚ Embeddings  β”‚                                                       β”‚
β”‚  β””β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”˜                                                       β”‚
β”‚         β”‚                                                               β”‚
β”‚         β–Ό                                                               β”‚
β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”          β”‚
β”‚  β”‚                    Layer 1                              β”‚          β”‚
β”‚  β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”              β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”    β”‚          β”‚
β”‚  β”‚  β”‚   Attention  │◄────────────── TraceManager    β”‚    β”‚          β”‚
β”‚  β”‚  β”‚   + RoPE     β”‚  bias inject β”‚ - Sparse Memory β”‚    β”‚          β”‚
β”‚  β”‚  β””β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”˜              β”‚ - Salience      β”‚    β”‚          β”‚
β”‚  β”‚         β”‚                       β”‚ - Decay/Update  β”‚    β”‚          β”‚
β”‚  β”‚         β”‚                       β””β”€β”€β”€β”€β”€β”€β”€β”€β–²β”€β”€β”€β”€β”€β”€β”€β”€β”˜    β”‚          β”‚
β”‚  β”‚         β”‚                                β”‚             β”‚          β”‚
β”‚  β”‚         β–Ό                                β”‚ capture     β”‚          β”‚
β”‚  β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”                       β”‚             β”‚          β”‚
β”‚  β”‚  β”‚  MoE Router  │──────────────────────►│             β”‚          β”‚
β”‚  β”‚  β””β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”˜      log paths        β”‚             β”‚          β”‚
β”‚  β”‚         β”‚                                β”‚             β”‚          β”‚
β”‚  β”‚         β–Ό                                β”‚             β”‚          β”‚
β”‚  β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”              β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”΄β”€β”€β”€β”€β”€β”€β”€β”€β”    β”‚          β”‚
β”‚  β”‚  β”‚   Experts    β”‚              β”‚ RoutingPathTree β”‚    β”‚          β”‚
β”‚  β”‚  β”‚  [E1..E8]    β”‚              β”‚ - Suffix Tree   β”‚    β”‚          β”‚
β”‚  β”‚  β””β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”˜              β”‚ - Motif Detect  β”‚    β”‚          β”‚
β”‚  β”‚         β”‚                       β”‚ - Crystallize   β”‚    β”‚          β”‚
β”‚  β”‚         β”‚                       β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜    β”‚          β”‚
β”‚  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜          β”‚
β”‚            β”‚                                                           β”‚
β”‚           ... (Layers 2-31)                                           β”‚
β”‚            β”‚                                                           β”‚
β”‚            β–Ό                                                           β”‚
β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”                                                      β”‚
β”‚  β”‚ Output Head β”‚                                                      β”‚
β”‚  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜                                                      β”‚
β”‚                                                                         β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜

πŸ”„ Data Flow: Attention Trace Lifecycle

β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚                    Forward Pass (with tracing)                      β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                              β”‚
                              β–Ό
                    β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                    β”‚  Compute QKV    β”‚
                    β””β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                             β”‚
                             β–Ό
                    β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                    β”‚ Load trace bias │◄──── M^(l,h) (sparse)
                    β”‚ from memory     β”‚
                    β””β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                             β”‚
                             β–Ό
                    β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                    β”‚  QK^T / √d_k    β”‚
                    β”‚  + Ξ±Β·M          β”‚  ← Biased attention
                    β””β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                             β”‚
                             β–Ό
                    β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                    β”‚   Softmax       β”‚
                    β””β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                             β”‚
                             β–Ό
                    β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                    β”‚  AttentionΒ·V    β”‚
                    β””β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                             β”‚
                             β–Ό
                    β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                    β”‚  [DETACH]       β”‚
                    β”‚  Store attn     β”‚  β†’ Temporary buffer
                    β”‚  weights        β”‚
                    β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜

β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚                    Backward Pass (gradient capture)                 β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                              β”‚
                              β–Ό
                    β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                    β”‚ loss.backward() β”‚
                    β””β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                             β”‚
                             β–Ό
                    β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                    β”‚  Extract βˆ‚L/βˆ‚A  β”‚  ← Attention gradients
                    β””β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                             β”‚
                             β–Ό
                    β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                    β”‚ Compute salienceβ”‚
                    β”‚ S = AΒ·|βˆ‚L/βˆ‚A|   β”‚
                    β””β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                             β”‚
                             β–Ό
                    β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                    β”‚ Top-k selection β”‚  ← Only high salience
                    β”‚ (k β‰ˆ 0.1% edges)β”‚
                    β””β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                             β”‚
                             β–Ό
                    β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                    β”‚ Update M^(l,h)  β”‚
                    β”‚ with EMA/decay  β”‚
                    β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜

🌳 Routing Path Tree Structure

                              Root
                               β”‚
                β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                β”‚              β”‚              β”‚
               E₁             Eβ‚‚             E₃  ← Layer 1
          count: 523      count: 892     count: 341
         reward: 412     reward: 705    reward: 268
                β”‚              β”‚              β”‚
        β”Œβ”€β”€β”€β”€β”€β”€β”€β”Όβ”€β”€β”€β”€β”€β”   β”Œβ”€β”€β”€β”€β”Όβ”€β”€β”€β”€β”    β”Œβ”€β”€β”€β”΄β”€β”€β”€β”
        β”‚       β”‚     β”‚   β”‚    β”‚    β”‚    β”‚       β”‚
       E₁      Eβ‚‚    E₃  E₁   Eβ‚‚   E₃   E₁      Eβ‚‚  ← Layer 2
    cnt:201 cnt:198     ...
                β”‚
            β”Œβ”€β”€β”€β”Όβ”€β”€β”€β”
            β”‚   β”‚   β”‚
           E₁  Eβ‚‚  E₃  ← Layer 3
              ...

─────────────────────────────────────────────────────────

High-Utility Path Example:

Ο€ = [Eβ‚‚ β†’ E₁ β†’ E₃ β†’ Eβ‚‚]
    ─────────────────────
    Frequency: 198 (> threshold)
    Utility: +0.07 (> threshold)
    Entropy: 0.8 (< threshold)
    β†’ CRYSTALLIZE βœ“

Creates new expert: E_motif42

Future routing can select E_motif42 directly,
bypassing individual expert routing.

πŸ’Ύ Memory Layout: Trace Storage

β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚               TraceMemory (Per Layer/Head)              β”‚
β”œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€
β”‚                                                         β”‚
β”‚  Sparse COO Format:                                     β”‚
β”‚                                                         β”‚
β”‚  traces: List[AttentionTrace]                          β”‚
β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β” β”‚
β”‚  β”‚ AttentionTrace #1:                                β”‚ β”‚
β”‚  β”‚   layer_id:     5    (1 byte)                     β”‚ β”‚
β”‚  β”‚   head_id:      12   (1 byte)                     β”‚ β”‚
β”‚  β”‚   query_idx:    1024 (2 bytes)                    β”‚ β”‚
β”‚  β”‚   key_idx:      512  (2 bytes)                    β”‚ β”‚
β”‚  β”‚   salience:     0.85 (4 bytes float32)            β”‚ β”‚
β”‚  β”‚   age:          3    (2 bytes)                    β”‚ β”‚
β”‚  β”‚                              Total: 12 bytes       β”‚ β”‚
β”‚  β”œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€ β”‚
β”‚  β”‚ AttentionTrace #2:                                β”‚ β”‚
β”‚  β”‚   ...                                             β”‚ β”‚
β”‚  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜ β”‚
β”‚                                                         β”‚
β”‚  max_traces: 2048 per head                             β”‚
β”‚  Total: 2048 Γ— 12 bytes = 24 KB per head              β”‚
β”‚                                                         β”‚
β”‚  For 32 layers Γ— 32 heads:                             β”‚
β”‚  Total: 32 Γ— 32 Γ— 24 KB = 24.6 MB                     β”‚
β”‚                                                         β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜

β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚            Fast Lookup via Hash Map                     β”‚
β”œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€
β”‚                                                         β”‚
β”‚  trace_index: HashMap[(layer, head, i, j) β†’ salience] β”‚
β”‚                                                         β”‚
β”‚  Example:                                               β”‚
β”‚  (5, 12, 1024, 512) β†’ 0.85                             β”‚
β”‚  (5, 12, 2048, 256) β†’ 0.72                             β”‚
β”‚  ...                                                    β”‚
β”‚                                                         β”‚
β”‚  O(1) lookup for bias injection                        β”‚
β”‚  O(log n) insert for updates (maintain sorted)         β”‚
β”‚                                                         β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜

πŸ”€ Training Loop Integration

β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚                    Standard Training Loop                     β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
    β”‚
    β–Ό
β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚  for batch in dataloader:                                     β”‚
β”‚      β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”         β”‚
β”‚      β”‚  1. Forward Pass                            β”‚         β”‚
β”‚      β”‚     - Attention with trace bias             β”‚         β”‚
β”‚      β”‚     - MoE routing logged                    β”‚         β”‚
β”‚      β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜         β”‚
β”‚                β”‚                                               β”‚
β”‚      β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β–Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”         β”‚
β”‚      β”‚  2. Compute Loss                            β”‚         β”‚
β”‚      β”‚     L_total = L_task + β₁·L_balance         β”‚         β”‚
β”‚      β”‚             + Ξ²β‚‚Β·L_trace + β₃·L_crystal     β”‚         β”‚
β”‚      β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜         β”‚
β”‚                β”‚                                               β”‚
β”‚      β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β–Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”         β”‚
β”‚      β”‚  3. Backward Pass                           β”‚         β”‚
β”‚      β”‚     - Compute gradients                     β”‚         β”‚
β”‚      β”‚     - Extract βˆ‚L/βˆ‚A for salience            β”‚         β”‚
β”‚      β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜         β”‚
β”‚                β”‚                                               β”‚
β”‚      β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β–Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”         β”‚
β”‚      β”‚  4. Optimizer Step                          β”‚         β”‚
β”‚      β”‚     - Update model weights                  β”‚         β”‚
β”‚      β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜         β”‚
β”‚                β”‚                                               β”‚
β”‚      β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β–Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”         β”‚
β”‚      β”‚  5. Periodic Trace Update                   β”‚         β”‚
β”‚      β”‚     if step % UPDATE_INTERVAL == 0:         β”‚         β”‚
β”‚      β”‚       - Compute salience scores             β”‚         β”‚
β”‚      β”‚       - Update trace memory (EMA)           β”‚         β”‚
β”‚      β”‚       - Apply decay to unused traces        β”‚         β”‚
β”‚      β”‚       - Evict lowest salience if quota full β”‚         β”‚
β”‚      β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜         β”‚
β”‚                β”‚                                               β”‚
β”‚      β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β–Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”         β”‚
β”‚      β”‚  6. Periodic Motif Update                   β”‚         β”‚
β”‚      β”‚     if step % CRYSTALLIZE_INTERVAL == 0:    β”‚         β”‚
β”‚      β”‚       - Traverse routing tree               β”‚         β”‚
β”‚      β”‚       - Compute utilities                   β”‚         β”‚
β”‚      β”‚       - Detect crystallization candidates   β”‚         β”‚
β”‚      β”‚       - Freeze high-utility motifs          β”‚         β”‚
β”‚      β”‚       - Prune low-utility motifs            β”‚         β”‚
β”‚      β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜         β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜

πŸ“Š Salience Computation Pipeline

  Attention Weights (A)         Gradients (βˆ‚L/βˆ‚A)      Recurrence (p)
        β”‚                              β”‚                      β”‚
        β”‚ [B, H, T, T]                β”‚ [B, H, T, T]        β”‚ [T, T]
        β”‚                              β”‚                      β”‚
        β–Ό                              β–Ό                      β–Ό
β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”            β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”     β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚   A_{i,j}     β”‚            β”‚   |βˆ‚L/βˆ‚A|      β”‚     β”‚ log(1 + p)  β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”˜            β””β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”˜     β””β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”˜
        β”‚                             β”‚                     β”‚
        β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜                     β”‚
                      β”‚                                     β”‚
                      β–Ό                                     β”‚
              β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”                             β”‚
              β”‚   A Β· |βˆ‚L/βˆ‚A|β”‚                             β”‚
              β””β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”˜                             β”‚
                      β”‚                                     β”‚
                      β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                                   β”‚
                                   β–Ό
                          β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                          β”‚  Salience Score β”‚
                          β”‚  S = AΒ·|βˆ‚|Β·log p β”‚
                          β””β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                                   β”‚
                                   β–Ό
                          β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                          β”‚  Threshold      β”‚
                          β”‚  S > ΞΈ?         β”‚
                          β””β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                                   β”‚
                    β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”΄β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                    β”‚                             β”‚
                   YES                           NO
                    β”‚                             β”‚
                    β–Ό                             β–Ό
          β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”         β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
          β”‚  Add to traces   β”‚         β”‚  Apply decay     β”‚
          β”‚  (EMA update)    β”‚         β”‚  M ← Ξ³Β·M         β”‚
          β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜         β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜

🎯 Crystallization Decision Tree

                    Routing Path Ο€
                         β”‚
                         β–Ό
                β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                β”‚ Frequency f(Ο€)   β”‚
                β”‚ > f_min?         β”‚
                β””β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”˜
                    YES      NO
                     β”‚        β”‚
                     β”‚        └──► Reject (insufficient data)
                     β”‚
                     β–Ό
                β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                β”‚ Utility U(Ο€)     β”‚
                β”‚ > U_min?         β”‚
                β””β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”˜
                    YES      NO
                     β”‚        β”‚
                     β”‚        └──► Reject (not beneficial)
                     β”‚
                     β–Ό
                β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                β”‚ Entropy H(Ο€)     β”‚
                β”‚ < H_max?         β”‚
                β””β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”˜
                    YES      NO
                     β”‚        β”‚
                     β”‚        └──► Reject (unstable routing)
                     β”‚
                     β–Ό
                β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                β”‚ Age age(Ο€)       β”‚
                β”‚ > Ο„?             β”‚
                β””β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”˜
                    YES      NO
                     β”‚        β”‚
                     β”‚        └──► Reject (temporal instability)
                     β”‚
                     β–Ό
                β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                β”‚ Motif quota      β”‚
                β”‚ available?       β”‚
                β””β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”˜
                    YES      NO
                     β”‚        β”‚
                     β”‚        └──► Evict lowest-utility motif
                     β”‚             (if U(Ο€) > U_min(existing))
                     β”‚
                     β–Ό
            β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
            β”‚  CRYSTALLIZE MOTIF  β”‚
            β”‚  - Create new expertβ”‚
            β”‚  - Freeze pathway   β”‚
            β”‚  - Register in MoE  β”‚
            β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜

πŸ”¬ Experimental Monitoring Dashboard

β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚                     Training Metrics                           β”‚
β”œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€
β”‚                                                                β”‚
β”‚  Loss Components:                                              β”‚
β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β” β”‚
β”‚  β”‚ L_task:        2.34 ↓ (main task loss)                   β”‚ β”‚
β”‚  β”‚ L_balance:     0.05 ~ (MoE load balance)                 β”‚ β”‚
β”‚  β”‚ L_trace:       0.12 ↓ (trace utilization)                β”‚ β”‚
β”‚  β”‚ L_crystal:     0.08 ↓ (crystallization entropy)          β”‚ β”‚
β”‚  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜ β”‚
β”‚                                                                β”‚
β”‚  Trace Statistics:                                             β”‚
β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β” β”‚
β”‚  β”‚ Total traces:      1.2M / 2.1M (57% capacity)            β”‚ β”‚
β”‚  β”‚ Avg salience:      0.42 (healthy)                        β”‚ β”‚
β”‚  β”‚ Coverage:          34% (attention ops using traces)      β”‚ β”‚
β”‚  β”‚ Decay rate:        0.98 (auto-tuned)                     β”‚ β”‚
β”‚  β”‚ Memory usage:      18.3 MB / 24.6 MB                     β”‚ β”‚
β”‚  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜ β”‚
β”‚                                                                β”‚
β”‚  Crystallization Statistics:                                   β”‚
β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β” β”‚
β”‚  β”‚ Active motifs:     87 / 512 (17% capacity)               β”‚ β”‚
β”‚  β”‚ Avg utility:       +0.09 (9% improvement)                β”‚ β”‚
β”‚  β”‚ Avg entropy:       0.7 (stable)                          β”‚ β”‚
β”‚  β”‚ FLOP reduction:    23% (via motif reuse)                 β”‚ β”‚
β”‚  β”‚ Tree nodes:        12.4K (manageable)                    β”‚ β”‚
β”‚  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜ β”‚
β”‚                                                                β”‚
β”‚  Emergent Language Properties:                                β”‚
β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β” β”‚
β”‚  β”‚ Max hierarchy:     3 levels deep                         β”‚ β”‚
β”‚  β”‚ Composition rate:  42% (motifs calling motifs)           β”‚ β”‚
β”‚  β”‚ Task clustering:   Silhouette = 0.61 (good)              β”‚ β”‚
β”‚  β”‚ Symbol efficiency: 8.2Γ— compression vs tokens            β”‚ β”‚
β”‚  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜ β”‚
β”‚                                                                β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜

πŸ› οΈ File Structure

src/aios/core/hrm_models/cognitive/
β”‚
β”œβ”€β”€ __init__.py                    # Module exports
β”‚
β”œβ”€β”€ trace_manager.py               # Persistent attention traces
β”‚   β”œβ”€β”€ class TraceManager
β”‚   β”‚   β”œβ”€β”€ __init__(config)
β”‚   β”‚   β”œβ”€β”€ capture_attention(layer, head, attn_weights)
β”‚   β”‚   β”œβ”€β”€ compute_salience(attn, grads, recurrence)
β”‚   β”‚   β”œβ”€β”€ update_traces(salience_scores)
β”‚   β”‚   β”œβ”€β”€ apply_decay()
β”‚   β”‚   β”œβ”€β”€ get_bias_for_layer_head(layer, head)
β”‚   β”‚   └── to_sparse_tensor()
β”‚   β”‚
β”‚   └── class AttentionTrace (dataclass)
β”‚       β”œβ”€β”€ layer_id: uint8
β”‚       β”œβ”€β”€ head_id: uint8
β”‚       β”œβ”€β”€ query_idx: uint16
β”‚       β”œβ”€β”€ key_idx: uint16
β”‚       β”œβ”€β”€ salience: float32
β”‚       └── age: uint16
β”‚
β”œβ”€β”€ routing_tree.py                # MoE path tracking
β”‚   β”œβ”€β”€ class RoutingNode
β”‚   β”‚   β”œβ”€β”€ expert_id: int
β”‚   β”‚   β”œβ”€β”€ layer: int
β”‚   β”‚   β”œβ”€β”€ count: int
β”‚   β”‚   β”œβ”€β”€ total_reward: float
β”‚   β”‚   β”œβ”€β”€ children: Dict[int, RoutingNode]
β”‚   β”‚   β”œβ”€β”€ utility() β†’ float
β”‚   β”‚   └── entropy() β†’ float
β”‚   β”‚
β”‚   └── class RoutingPathTree
β”‚       β”œβ”€β”€ root: RoutingNode
β”‚       β”œβ”€β”€ motif_registry: Dict[str, CrystallizedMotif]
β”‚       β”œβ”€β”€ record_path(path, reward)
β”‚       β”œβ”€β”€ find_candidates()
β”‚       └── prune_low_utility()
β”‚
β”œβ”€β”€ crystallization.py             # Motif freezing logic
β”‚   β”œβ”€β”€ class CrystallizedMotif
β”‚   β”‚   β”œβ”€β”€ path: List[int]
β”‚   β”‚   β”œβ”€β”€ frozen_experts: nn.Module
β”‚   β”‚   β”œβ”€β”€ utility: float
β”‚   β”‚   β”œβ”€β”€ frequency: int
β”‚   β”‚   └── forward(x)
β”‚   β”‚
β”‚   └── class CrystallizationManager
β”‚       β”œβ”€β”€ detect_motifs(tree)
β”‚       β”œβ”€β”€ freeze_motif(path)
β”‚       β”œβ”€β”€ unfreeze_motif(motif_id)
β”‚       └── evaluate_utility(motif)
β”‚
β”œβ”€β”€ losses.py                      # Auxiliary loss functions
β”‚   β”œβ”€β”€ trace_utilization_loss(trace_manager)
β”‚   β”œβ”€β”€ crystallization_entropy_loss(routing_tree)
β”‚   └── elastic_weight_consolidation(model, fisher_info)
β”‚
β”œβ”€β”€ config.py                      # Configuration schemas
β”‚   β”œβ”€β”€ class TraceConfig (TypedDict)
β”‚   └── class CrystallizationConfig (TypedDict)
β”‚
└── visualization.py               # Analysis tools
    β”œβ”€β”€ plot_trace_heatmap()
    β”œβ”€β”€ plot_routing_sankey()
    β”œβ”€β”€ plot_motif_hierarchy()
    └── export_motif_graph()

🎨 Color Coding for Visualizations

Trace Salience: - 🟦 Low salience (0.0-0.3): Recently captured, not yet consolidated - 🟩 Medium salience (0.3-0.7): Moderately reinforced - 🟨 High salience (0.7-0.9): Strongly reinforced - πŸŸ₯ Critical salience (0.9-1.0): Core reasoning pathways

Motif Utility: - ⬜ Neutral (U β‰ˆ 0): No benefit - 🟦 Low benefit (U = 0.01-0.05): Minor improvement - 🟩 Moderate benefit (U = 0.05-0.10): Worth crystallizing - 🟨 High benefit (U = 0.10-0.20): Very valuable - πŸŸ₯ Critical (U > 0.20): Essential pattern

Routing Entropy: - 🟩 Low entropy (H < 0.5): Deterministic, stable - 🟨 Medium entropy (H = 0.5-1.0): Somewhat stable - πŸŸ₯ High entropy (H > 1.0): Unstable, don't crystallize


Status: Visual reference complete
Usage: Print this for implementation reference
Next: Begin coding Phase 0 infrastructure