linuxmatters
diff --git a/‎internal/logging/report.go‎
Lines changed: 72 additions & 20 deletions b/‎internal/logging/report.go‎
Lines changed: 72 additions & 20 deletions
diff --git a/‎internal/processor/adaptive.go‎
Lines changed: 87 additions & 35 deletions b/‎internal/processor/adaptive.go‎
Lines changed: 87 additions & 35 deletions
@@ -494,7 +494,7 @@ func formatFilter(f *os.File, filterID processor.FilterID, cfg *processor.Filter
 	case processor.FilterNoiseRemove:
 		formatNoiseRemoveFilter(f, cfg, m, prefix)
 	case processor.FilterDC1Declick:
-		formatDC1DeclickFilter(f, cfg, prefix)
+		formatDC1DeclickFilter(f, cfg, m, prefix)
 	case processor.FilterDS201Gate:
 		formatDS201GateFilter(f, cfg, m, prefix)
 	case processor.FilterLA2ACompressor:
@@ -655,25 +655,26 @@ func formatNoiseRemoveFilter(f *os.File, cfg *processor.FilterChainConfig, m *pr
 		cfg.NoiseRemoveResearchSec,
 		cfg.NoiseRemoveSmooth)
 
-	// compand parameters (adaptive)
-	fmt.Fprintf(f, "        compand: threshold %.0f dB, expansion %.0f dB\n",
-		cfg.NoiseRemoveCompandThreshold,
-		cfg.NoiseRemoveCompandExpansion)
+	// compand parameters and rationale - show noise floor source
+	if m != nil && m.NoiseProfile != nil && m.NoiseProfile.MeasuredNoiseFloor < 0 {
+		fmt.Fprintf(f, "        noise floor: %.1f dBFS (from silence regions)\n",
+			m.NoiseProfile.MeasuredNoiseFloor)
+		fmt.Fprintf(f, "        compand: threshold %.0f dB (floor + 5dB), expansion %.0f dB\n",
+			cfg.NoiseRemoveCompandThreshold,
+			cfg.NoiseRemoveCompandExpansion)
+	} else {
+		fmt.Fprintf(f, "        compand: threshold %.0f dB, expansion %.0f dB (defaults - no noise profile)\n",
+			cfg.NoiseRemoveCompandThreshold,
+			cfg.NoiseRemoveCompandExpansion)
+	}
 	fmt.Fprintf(f, "        timing: attack %.0fms, decay %.0fms, knee %.0f dB\n",
 		cfg.NoiseRemoveCompandAttack*1000,
 		cfg.NoiseRemoveCompandDecay*1000,
 		cfg.NoiseRemoveCompandKnee)
-
-	// Show adaptive rationale if noise profile available
-	if m != nil && m.NoiseProfile != nil && m.NoiseProfile.Duration > 0 {
-		fmt.Fprintf(f, "        Rationale: noise floor %.1f dB → target -90 dB (%.0f dB expansion)\n",
-			m.NoiseProfile.MeasuredNoiseFloor,
-			cfg.NoiseRemoveCompandExpansion)
-	}
 }
 
 // formatDC1DeclickFilter outputs CEDAR DC-1-inspired declicker filter details
-func formatDC1DeclickFilter(f *os.File, cfg *processor.FilterChainConfig, prefix string) {
+func formatDC1DeclickFilter(f *os.File, cfg *processor.FilterChainConfig, m *processor.AudioMeasurements, prefix string) {
 	if !cfg.DC1DeclickEnabled {
 		if cfg.DC1DeclickReason != "" {
 			fmt.Fprintf(f, "%sDC1 Declick: DISABLED (%s)\n", prefix, cfg.DC1DeclickReason)
@@ -694,6 +695,17 @@ func formatDC1DeclickFilter(f *os.File, cfg *processor.FilterChainConfig, prefix
 	if cfg.DC1DeclickReason != "" {
 		fmt.Fprintf(f, "        Reason: %s\n", cfg.DC1DeclickReason)
 	}
+
+	// Show centroid with measurement source (used for window sizing)
+	if m != nil && m.SpectralCentroid > 0 {
+		centroid := m.SpectralCentroid
+		centroidSource := "full-file"
+		if m.SpeechProfile != nil && m.SpeechProfile.SpectralCentroid > 0 {
+			centroid = m.SpeechProfile.SpectralCentroid
+			centroidSource = "speech region"
+		}
+		fmt.Fprintf(f, "        spectral centroid: %.0f Hz (%s)\n", centroid, centroidSource)
+	}
 }
 
 // joinWithComma joins string slice with comma separator
@@ -804,7 +816,7 @@ func formatLA2ACompressorFilter(f *os.File, cfg *processor.FilterChainConfig, m
 	fmt.Fprintf(f, "        Timing: attack %.0fms, release %.0fms\n", cfg.LA2AAttack, cfg.LA2ARelease)
 	fmt.Fprintf(f, "        Mix: %.0f%%, knee %.1f\n", cfg.LA2AMix*100, cfg.LA2AKnee)
 
-	// Show rationale
+	// Show rationale with measurement sources
 	if m != nil && m.DynamicRange > 0 {
 		dynamicsType := "moderate"
 		if m.DynamicRange > 30 {
@@ -813,29 +825,69 @@ func formatLA2ACompressorFilter(f *os.File, cfg *processor.FilterChainConfig, m
 			dynamicsType = "already compressed"
 		}
 		fmt.Fprintf(f, "        Rationale: DR %.1f dB (%s), LRA %.1f LU\n", m.DynamicRange, dynamicsType, m.InputLRA)
+
+		// Show kurtosis and flux with sources (used for ratio and release tuning)
+		kurtosis := m.SpectralKurtosis
+		flux := m.SpectralFlux
+		kurtosisSource := "full-file"
+		fluxSource := "full-file"
+		if m.SpeechProfile != nil {
+			if m.SpeechProfile.SpectralKurtosis > 0 {
+				kurtosis = m.SpeechProfile.SpectralKurtosis
+				kurtosisSource = "speech region"
+			}
+			if m.SpeechProfile.SpectralFlux > 0 {
+				flux = m.SpeechProfile.SpectralFlux
+				fluxSource = "speech region"
+			}
+		}
+		fmt.Fprintf(f, "        spectral kurtosis: %.1f (%s)\n", kurtosis, kurtosisSource)
+		fmt.Fprintf(f, "        spectral flux: %.4f (%s)\n", flux, fluxSource)
 	}
 }
 
 // formatDeesserFilter outputs deesser filter details
 func formatDeesserFilter(f *os.File, cfg *processor.FilterChainConfig, m *processor.AudioMeasurements, prefix string) {
-	if !cfg.DeessEnabled || cfg.DeessIntensity == 0 {
+	if !cfg.DeessEnabled {
 		fmt.Fprintf(f, "%sdeesser: DISABLED\n", prefix)
 		return
 	}
+	if cfg.DeessIntensity == 0 {
+		// Enabled but intensity is 0 - adaptive tuning determined no de-essing needed
+		fmt.Fprintf(f, "%sdeesser: inactive: no sibilance detected\n", prefix)
+		return
+	}
 
 	fmt.Fprintf(f, "%sdeesser: intensity %.0f%%, amount %.0f%%, freq %.0f%%\n",
 		prefix, cfg.DeessIntensity*100, cfg.DeessAmount*100, cfg.DeessFreq*100)
 
-	// Show rationale
+	// Show rationale with measurement source
 	if m != nil && m.SpectralCentroid > 0 {
+		// Determine which values were used and their sources
+		centroid := m.SpectralCentroid
+		rolloff := m.SpectralRolloff
+		centroidSource := "full-file"
+		rolloffSource := "full-file"
+		if m.SpeechProfile != nil {
+			if m.SpeechProfile.SpectralCentroid > 0 {
+				centroid = m.SpeechProfile.SpectralCentroid
+				centroidSource = "speech region"
+			}
+			if m.SpeechProfile.SpectralRolloff > 0 {
+				rolloff = m.SpeechProfile.SpectralRolloff
+				rolloffSource = "speech region"
+			}
+		}
+
 		voiceType := "normal"
-		if m.SpectralCentroid > 7000 {
+		if centroid > 7000 {
 			voiceType = "very bright"
-		} else if m.SpectralCentroid > 6000 {
+		} else if centroid > 6000 {
 			voiceType = "bright"
 		}
-		fmt.Fprintf(f, "        Rationale: %s voice (centroid %.0f Hz, rolloff %.0f Hz)\n",
-			voiceType, m.SpectralCentroid, m.SpectralRolloff)
+		fmt.Fprintf(f, "        Rationale: %s voice\n", voiceType)
+		fmt.Fprintf(f, "        spectral centroid: %.0f Hz (%s)\n", centroid, centroidSource)
+		fmt.Fprintf(f, "        spectral rolloff: %.0f Hz (%s)\n", rolloff, rolloffSource)
 	}
 }
 
 
@@ -716,57 +716,89 @@ func tuneDC1Declick(config *FilterChainConfig, measurements *AudioMeasurements)
 		config.DC1DeclickReason += "; +threshold (compressed)"
 	}
 
+	// Prefer speech-specific centroid for window sizing
+	centroid := measurements.SpectralCentroid
+	if measurements.SpeechProfile != nil {
+		centroid = preferSpeechMetric(centroid, measurements.SpeechProfile.SpectralCentroid)
+	}
+
 	// Window adaptation based on content type
 	switch {
-	case measurements.SpectralCentroid > dc1CentroidFast:
+	case centroid > dc1CentroidFast:
 		// Fast speech/plosives - shorter window preserves transients
 		config.DC1DeclickWindow = dc1WindowShort
-	case measurements.SpectralCentroid < dc1CentroidSlow:
+	case centroid < dc1CentroidSlow:
 		// Bass-heavy content - longer window for better LF reconstruction
 		config.DC1DeclickWindow = dc1WindowLong
 	default:
 		config.DC1DeclickWindow = dc1WindowDefault
 	}
 }
 
-// tuneNoiseRemove configures NoiseRemove compand parameters for residual suppression.
-// The anlmdn parameters (strength, patch, research, smooth) are kept constant from spike validation.
-//
-// POST-ANLMDN COMPAND STRATEGY (2024-12-24):
-// Since anlmdn now handles the heavy noise reduction (achieving "digital black" for clean
-// sources and 37+ dB reduction for noisy sources), compand's role is now:
-// - Residual noise suppression in silence regions
-// - Breath noise attenuation between speech
-// - NOT primary noise reduction
+// tuneNoiseRemove adjusts compand parameters based on measured noise floor.
+// Uses silence region measurements for accurate noise characterisation.
 //
-// Spike testing (mcompand-spike.sh at 1500s) validated these settings:
-// - Fixed 6 dB expansion: provides ~5-6 dB breath/residual attenuation
-// - Fixed -55 dB threshold: catches breaths without affecting speech
-// - Single-band compand: more transparent than mcompand (0% spectral change)
+// The anlmdn parameters (strength, patch, research, smooth) are kept constant from spike validation.
+// Compand parameters adapt to the measured noise floor:
+// - Threshold: 5dB above noise floor (catches breaths but not speech)
+// - Expansion: scales with noise severity (gentle for clean, aggressive for noisy)
 //
 // anlmdn remains constant because spike testing validated these parameters:
 // - strength: 0.00001 (minimum)
 // - patch: 6ms (context window)
 // - research: 5.8ms (search window)
 // - smooth: 11 (weight smoothing)
-func tuneNoiseRemove(config *FilterChainConfig, measurements *AudioMeasurements) {
+func tuneNoiseRemove(config *FilterChainConfig, m *AudioMeasurements) {
 	if !config.NoiseRemoveEnabled {
 		return
 	}
 
-	// Fixed compand parameters validated in spike testing (mcompand-spike.sh)
-	// These are intentionally NOT adaptive — anlmdn handles the adaptive part
-	const (
-		compandThreshold = -55.0 // dB - catches breaths without affecting speech
-		compandExpansion = 6.0   // dB - gentle push for residual/breath attenuation
-	)
+	// Default values (fallback if no noise profile)
+	threshold := -55.0
+	expansion := 6.0
+
+	if m.NoiseProfile != nil && m.NoiseProfile.MeasuredNoiseFloor < 0 {
+		noiseFloor := m.NoiseProfile.MeasuredNoiseFloor
 
-	config.NoiseRemoveCompandThreshold = compandThreshold
-	config.NoiseRemoveCompandExpansion = compandExpansion
+		// Threshold: 5dB above noise floor (catches breaths but not speech)
+		threshold = noiseFloor + 5.0
+		// Clamp to reasonable range
+		threshold = clamp(threshold, -70.0, -40.0)
+
+		// Expansion: scale with noise severity
+		expansion = scaleExpansion(noiseFloor)
+	}
+
+	config.NoiseRemoveCompandThreshold = threshold
+	config.NoiseRemoveCompandExpansion = expansion
 
 	// attack, decay, knee stay constant (validated in spike testing)
 }
 
+// preferSpeechMetric returns speech-specific measurement if available,
+// otherwise falls back to full-file measurement.
+func preferSpeechMetric(fullFile, speechProfile float64) float64 {
+	if speechProfile > 0 {
+		return speechProfile
+	}
+	return fullFile
+}
+
+// scaleExpansion returns expansion depth based on noise severity.
+// Noisier recordings need more aggressive expansion to suppress residuals.
+func scaleExpansion(noiseFloor float64) float64 {
+	switch {
+	case noiseFloor > -45.0:
+		return 12.0 // Very noisy - aggressive
+	case noiseFloor > -55.0:
+		return 8.0 // Moderate noise
+	case noiseFloor > -65.0:
+		return 6.0 // Typical
+	default:
+		return 4.0 // Very clean - gentle
+	}
+}
+
 // tuneDeesser adapts de-esser intensity based on spectral analysis.
 // Uses both spectral centroid (energy concentration) and rolloff (HF extension)
 // to detect likelihood of harsh sibilance.
@@ -793,31 +825,39 @@ func tuneDeesser(config *FilterChainConfig, measurements *AudioMeasurements) {
 
 // tuneDeesserFull uses both centroid and rolloff for precise de-esser tuning
 func tuneDeesserFull(config *FilterChainConfig, measurements *AudioMeasurements) {
+	// Prefer speech-specific measurements for sibilance detection
+	centroid := measurements.SpectralCentroid
+	rolloff := measurements.SpectralRolloff
+	if measurements.SpeechProfile != nil {
+		centroid = preferSpeechMetric(centroid, measurements.SpeechProfile.SpectralCentroid)
+		rolloff = preferSpeechMetric(rolloff, measurements.SpeechProfile.SpectralRolloff)
+	}
+
 	// Determine baseline intensity from centroid
 	var baseIntensity float64
 	switch {
-	case measurements.SpectralCentroid > centroidVeryBright:
+	case centroid > centroidVeryBright:
 		baseIntensity = deessIntensityBright // Bright voice
-	case measurements.SpectralCentroid > centroidBright:
+	case centroid > centroidBright:
 		baseIntensity = deessIntensityNormal // Normal voice
 	default:
 		baseIntensity = deessIntensityDark // Dark voice
 	}
 
 	// Refine based on spectral rolloff (HF extension)
 	switch {
-	case measurements.SpectralRolloff < rolloffNoSibilance:
+	case rolloff < rolloffNoSibilance:
 		// Very limited HF content - no sibilance expected
 		config.DeessIntensity = 0.0
 
-	case measurements.SpectralRolloff < rolloffLimited:
+	case rolloff < rolloffLimited:
 		// Limited HF extension - reduce intensity
 		config.DeessIntensity = baseIntensity * 0.7
 		if config.DeessIntensity < deessIntensityMin {
 			config.DeessIntensity = 0.0 // Skip if too low
 		}
 
-	case measurements.SpectralRolloff > rolloffExtensive:
+	case rolloff > rolloffExtensive:
 		// Extensive HF content - likely sibilance
 		config.DeessIntensity = math.Min(baseIntensity*1.2, deessIntensityMax)
 
@@ -1216,6 +1256,12 @@ func tuneLA2AAttack(config *FilterChainConfig, measurements *AudioMeasurements)
 // - Narrow LRA + low flux = compressed/monotone, faster release OK
 // - Warm voices (high skewness) get extra release to preserve body
 func tuneLA2ARelease(config *FilterChainConfig, measurements *AudioMeasurements) {
+	// Prefer speech-specific flux for timing decisions
+	flux := measurements.SpectralFlux
+	if measurements.SpeechProfile != nil {
+		flux = preferSpeechMetric(flux, measurements.SpeechProfile.SpectralFlux)
+	}
+
 	// Start with standard LA-2A-style release
 	release := la2aReleaseStandard
 
@@ -1230,12 +1276,12 @@ func tuneLA2ARelease(config *FilterChainConfig, measurements *AudioMeasurements)
 	}
 
 	// Adjust based on spectral flux (frame-to-frame variation)
-	if measurements.SpectralFlux > 0 {
+	if flux > 0 {
 		switch {
-		case measurements.SpectralFlux > la2aFluxDynamic:
+		case flux > la2aFluxDynamic:
 			// Dynamic/expressive content - add release time
 			release = math.Max(release, la2aReleaseExpressive)
-		case measurements.SpectralFlux < la2aFluxStatic:
+		case flux < la2aFluxStatic:
 			// Static/monotone content - can use shorter release
 			release = math.Min(release, la2aReleaseCompact)
 		}
@@ -1265,16 +1311,22 @@ func tuneLA2ARelease(config *FilterChainConfig, measurements *AudioMeasurements)
 // - Peaked/tonal content (high kurtosis) = gentler ratio, preserve character
 // - Flat/noise-like content (low kurtosis) = firmer ratio, more levelling
 func tuneLA2ARatio(config *FilterChainConfig, measurements *AudioMeasurements) {
+	// Prefer speech-specific kurtosis for harmonic structure
+	kurtosis := measurements.SpectralKurtosis
+	if measurements.SpeechProfile != nil {
+		kurtosis = preferSpeechMetric(kurtosis, measurements.SpeechProfile.SpectralKurtosis)
+	}
+
 	// Start with LA-2A baseline ratio
 	ratio := la2aRatioBase
 
 	// Adjust based on spectral kurtosis (peakedness)
-	if measurements.SpectralKurtosis > 0 {
+	if kurtosis > 0 {
 		switch {
-		case measurements.SpectralKurtosis > la2aKurtosisHighPeak:
+		case kurtosis > la2aKurtosisHighPeak:
 			// Highly peaked harmonics - gentler ratio preserves character
 			ratio = la2aRatioPeaked
-		case measurements.SpectralKurtosis < la2aKurtosisLowPeak:
+		case kurtosis < la2aKurtosisLowPeak:
 			// Flat spectrum - firmer ratio for consistent levelling
 			ratio = la2aRatioFlat
 		}