← 실험

에너지 필라멘트 이론(Energy Filament Theory, EFT)의 평균 중력 프레임워크와 차가운 암흑물질(DM)의 최소 NFW 기준선 비교

저자: Guanglin Tu
이메일: riniky@energyfilament.org | ORCID: 0009-0003-7659-6138
소속: EFT 작업그룹, Shenzhen Energy Filament Science Research Co., Ltd. (중국)
버전: v1.1 | 날짜: 2026-02-14

프리프린트(동료평가 전)|이 버전은 공개 배포와 재검증 가능한 확인을 위한 것이며, 학술지 최종 게재본을 대표하지 않습니다.

라이선스: 보고서(CC BY-NC-ND 4.0); 전체 재현 패키지(CC BY 4.0).

출판급 보고서(Concept DOI): https://doi.org/10.5281/zenodo.18526334
전체 재현 패키지(Concept DOI): https://doi.org/10.5281/zenodo.18526286

0 실행 요약(Executive Summary)

이 보고서는 Zenodo에 보관된 출판급 완전 보고서(아카이브판)로, 데이터, 모델 장부, 공정 비교, 폐쇄 검정, 재현 자료까지 이어지는 하나의 감사 가능한 체인을 제공합니다. 부록 B(P1A)는 견고성 보완 자료로서 “더 표준적인 DM 기준선 + 핵심 렌즈계통오차” 스트레스 테스트를 제시하며, 본문 핵심 결론이 더 현실적인 DM 모델링과 렌즈계통오차 처리에 얼마나 민감한지 점검합니다.

핵심 결론(네 문장, 직접 인용 가능; 자세한 내용은 2.4절 참조):

(1) 회전 곡선(RC) 피팅에서 EFT 계열은 모든 커널 함수/사전분포 조합에서 DM_RAZOR보다 유의하게 우수합니다. 대표적인 개선폭은 Δlog𝓛_RC ≈ 10^3입니다(표 S1a 참조).
(2) RC→GGL 폐쇄 검정에서 EFT는 더 강한 교차 탐침 이전 가능성을 보입니다. 폐쇄 강도 Δlog𝓛_closure(True−Perm)는 DM_RAZOR보다 뚜렷하게 높으며, 그 차이는 공분산 shrinkage, R_min, σ_int 스캔에 대해 견고합니다(그림 S3, 표 S1b 참조).
(3) 결합 피팅(RC+GGL)에서도 EFT는 안정적인 우위를 유지합니다. 공유 매핑을 깨뜨린 음성 대조군에서는 이 우위가 붕괴하므로, “평균 중력 효과”가 우연한 피팅이 아니라 공유 매핑에서 나온다는 점을 뒷받침합니다(그림 S4 참조).
(4) 부록 B(P1A)는 차원을 크게 늘리지 않으면서 더 표준적인 DM 기준선 모듈과 렌즈 쪽 핵심 nuisance 계통오차 하나로 DM 측을 스트레스 테스트합니다. 이러한 강화는 EFT의 폐쇄 우위를 제거하지 못했습니다(표 B1, 그림 B1 참조).

데이터와 코드 이용 가능성: 보고서 Concept DOI 10.5281/zenodo.18526334; 전체 재현 패키지 Concept DOI 10.5281/zenodo.18526286. 부록 B(P1A)에 해당하는 태그는 run_tag=20260213_151233, closure_tag=20260213_161731, joint_tag=20260213_195428입니다.

1 초록

우리는 동일한 데이터와 동일한 통계 프로토콜 아래 두 이론적 틀을 재현 가능한 방식으로 정량 비교합니다. 하나는 에너지 필라멘트 이론(Energy Filament Theory, EFT; 흔한 약어 Effective Field Theory와는 다른 의미)이 제안하는 “평균 중력 수정” 모델이고, 다른 하나는 차가운 암흑물질(DM) NFW 헤일로의 기준 모델(DM_RAZOR)입니다. 여기서 DM_RAZOR는 의도적으로 “최소 DM 기준선”으로 선택했습니다. 즉 NFW 헤일로 + 고정 c–M 관계(halo-to-halo scatter 없음)로, 감사 가능하고 재검증 가능한 대조 기준을 제공하기 위한 것입니다. 동시에 분명히 해야 할 점은, 이 논문에서 EFT는 하나의 현상론적이고 MOND 유사적인 유효장/유효응답 매개변수화로 다루어지며, 통일된 통계 프로토콜 아래 검정된다는 것입니다. 이 글에서 EFT의 미시적 제일원리 유도를 제시하는 것은 아닙니다.

데이터는 다음을 포함합니다. 통일된 전처리와 분할을 거친 SPARC 회전 곡선(RC)의 속도 데이터 2295개(104개 은하, 20개 RC-bin), 그리고 KiDS-1000의 은하-은하 약한 중력렌즈(GGL) 등가 표면밀도 ΔΣ(R)(4개 항성질량 bin × bin마다 R 점 15개, 총 60개 점, 완전 공분산 사용).

우리는 순서대로 RC-only 추론, RC→GGL 폐쇄 검정(closure), GGL-only 추론, RC+GGL 결합 추론을 수행하고, 일관성 감사를 통해 인용된 모든 수치가 추적 가능하도록 보장했습니다. 엄격한 매개변수 장부와 공유 매핑 제약 아래(DM: 20개의 log M200_bin; EFT: 20개의 log V0_bin + 1개의 전역 log ℓ), EFT 계열은 결합 피팅에서 DM_RAZOR보다 현저히 우수합니다. ΔlogL_total = 1155–1337(DM_RAZOR 대비)입니다. 더 중요한 점은 폐쇄 검정이 RC 사후분포가 GGL에 대해 비자명한 예측력을 갖는다는 것을 보여준다는 점입니다. EFT의 폐쇄 강도 ΔlogL_closure = 172–281은 DM_RAZOR의 127보다 높습니다. 반면 RC-bin→GGL-bin 묶음을 무작위로 섞으면 폐쇄 신호는 6–23으로 붕괴합니다. 이는 해당 신호가 통계적 우연이나 구현 편향이 아님을 확인합니다. σ_int, R_min, 공분산 shrinkage에 대한 체계적 스캔에서도 EFT의 상대 우위는 양의 값을 유지하고 크기 차원도 안정적이었습니다. “DM 기준선이 너무 약하다/계통오차를 물리로 해석했다”는 흔한 비판에 대응하기 위해, 부록 B(P1A)에서는 더 표준적이면서도 저차원이고 감사 가능한 DM 기준선 스트레스 테스트를 제공합니다. 여기에는 계층적 c–M scatter + prior, 단일 매개변수 core proxy, lensing m, 그리고 조합 모델 DM_STD가 포함됩니다. 동일한 폐쇄 프로토콜에서 이러한 강화는 EFT의 폐쇄 우위를 제거하지 못했습니다(표 B1/그림 B1 참조).

키워드: 회전 곡선; 은하-은하 약한 중력렌즈; 폐쇄 검정; EFT; 차가운 암흑물질; 베이지안 추론

2 서론과 결과 개요

회전 곡선(RC)과 은하-은하 약한 중력렌즈(GGL)는 서로 보완적인 두 종류의 중력 탐침입니다. RC는 원반면 안의 동역학적 퍼텐셜과 방사형 가속도 관계(RAR)를 제약하고, GGL은 투영 질량분포와 헤일로 규모의 중력 응답을 측정합니다. 어떤 후보 이론에서든 핵심은 두 데이터셋을 각각 잘 맞출 수 있느냐가 아니라, 동일한 교차 데이터 매핑과 공유 제약 아래에서 일관된 설명을 구현할 수 있느냐입니다.

따라서 이 논문은 “폐쇄 검정(closure test)”을 핵심 통계 프로토콜로 삼습니다. 먼저 RC-only 사후분포로 GGL을 전방 예측하고, 이를 RC-bin→GGL-bin 매핑을 치환한 음성 대조군(permutation / shuffle)과 비교합니다. 이를 통해 교차 데이터 이전 예측력(predictive transferability)을 평가하고, 구현 편향이나 우연한 피팅에서 생기는 가짜 신호를 배제합니다.

이론적 위치와 범위: 이 논문은 EFT(에너지 필라멘트 이론)의 미시적 제일원리 유도나 상대론적으로 완비된 형식을 이 원고에서 제시하려 하지 않습니다. 반대로 우리는 EFT를 커널 함수 f(x)와 전역 척도 ℓ로 기술되는 저차원 MOND 유사 유효장/유효응답 매개변수화로 두고, 엄격한 매개변수 장부 제약 아래 RC→GGL 폐쇄 검정을 통해 그 교차 데이터 일관성과 이전 예측 능력을 시험합니다.

연구 계획과 범위 선언: 이 논문은 진행 중인 P 시리즈 관측 검색 계획의 일부입니다. 우리는 현재의 은하 규모 데이터에서 두 가지 가능한 유효 배경 기여를 찾습니다. (i) 조립질화(coarse-graining) 이후의 평균 중력 응답으로 기술할 수 있는 “평균 중력 바닥”(mean gravity floor), 그리고 (ii) 미시 과정의 요동과 관련된 “확률적/잡음 바닥”(stochastic/noise floor)입니다. 이 논문(P1)에서는 전자에만 초점을 맞춥니다. 즉 특정 미시적 생성 메커니즘을 가정하지 않고, RC→GGL 폐쇄 검정을 통해 평균 중력 바닥의 관측 징후를 검색하며, 통일된 대조 프로토콜 아래 감사 가능한 DM 기준선과 비교합니다. 휴리스틱한 물리 그림으로 보자면, 짧은 수명의 자유도가 존재할 경우 그 붕괴/소멸은 정지질량을 다른 자유도가 운반하는 에너지-운동량으로 바꿀 수 있고, 유효 수준에서는 자연스럽게 “평균 기여 + 요동 기여”의 분해에 대응합니다. 그러나 이 논문은 그 미시 그림을 정량 모델링하지 않습니다.

과도한 해석을 피하기 위해 이 논문의 범위 경계는 다음과 같습니다.
• 이 논문이 하는 일: 엄격한 매개변수 장부와 공유 매핑 제약 아래, 폐쇄 검정으로 교차 데이터 이전 예측력을 측정하고, EFT 평균 중력 응답과 DM 기준선을 재현 가능하게 비교합니다.
• 이 논문이 하지 않는 일: 미시적 생성 메커니즘, 풍부도/수명, 우주론적 제약을 논하지 않습니다. “잡음 바닥”에 해당하는 확률항도 모델링하지 않습니다.
• 이 논문이 주장하지 않는 일: 암흑물질을 반박하는 것을 목표로 하지 않습니다. P1은 “바닥이 존재하는가”에 대한 최종 판정을 내리지 않고, 단계적 증거를 보고합니다. 이 글에서 선택한 견고한 측정 영역에서는 데이터가 평균 중력 응답을 포함한 모델을 더 선호한다는 것입니다.

또한 우리는 DM_RAZOR가 최소화되고 감사 가능한 NFW 기준선만을 대표한다는 점을 명확히 합니다. 여기에는 고정 c–M 관계가 쓰이며 scatter는 없고, Adiabatic Contraction, feedback core, 비구형성, 환경항은 포함되지 않습니다. 따라서 본문 핵심 결론은 엄격히 다음으로 한정됩니다. 이 최소 기준선과 엄격한 매개변수 장부/매핑 제약 아래에서는 EFT의 교차 데이터 일관성이 더 강합니다. 더 표준적인 ΛCDM 기준선과 핵심 렌즈계통오차 모델링이 결론을 크게 바꿀 수 있느냐는 흔한 질문에 답하기 위해, 우리는 더 표준적이면서도 저차원이고 감사 가능한 DM 강화와 렌즈 쪽 nuisance를 부록 B(P1A: DM 기준선 표준화 스트레스 테스트)로 정리했으며, 본문과 완전히 동일한 공유 매핑 및 폐쇄 검정 기준을 유지했습니다(표 B1/그림 B1 참조).

2.1 Tab S1a–S1b: 핵심 지표 요약(Strict)

표 S1a는 결합 피팅(RC+GGL)의 주요 비교 지표(logL, ΔlogL, AICc, BIC)를 제시합니다. 표 S1b는 폐쇄 검정과 견고성 스캔 지표(closure, shuffle 음성 대조군, σ_int / R_min / cov-shrink 스캔 범위)를 제시합니다. 모든 수치는 엄격 요약 주표인 Tab_Z1_master_summary에서 나온 것이며, 공개 아카이브 패키지에서 항목별로 추적할 수 있습니다.

표 S1a|결합 피팅 주요 비교 지표(RC+GGL, Strict).

모델(workspace)

W 커널

k

결합 logL_total(best)

ΔlogL_total vs DM

AICc

BIC

DM_RAZOR

none

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

none

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

표 S1b|폐쇄 및 견고성 지표(Strict).

모델(workspace)

폐쇄 ΔlogL(true-perm)

음성 대조군 shuffle 후 ΔlogL

σ_int 스캔 ΔlogL 범위

R_min 스캔 ΔlogL 범위

cov-shrink 스캔 ΔlogL 범위

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308


2.2 Fig S3: 폐쇄 강도(RC-only → GGL 예측)

폐쇄 강도는 ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩로 정의합니다. RC-only 사후분포 샘플에서 GGL을 전방 예측하고, “RC-bin→GGL-bin 매핑을 치환한” 음성 대조군과 비교합니다.

그림 S3|폐쇄 강도(클수록 좋음): RC-only → GGL 예측의 평균 로그우도 우위.


2.3 Fig S4: 결합 피팅 주요 비교(RC+GGL)

결합 피팅 우위는 ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR)로 정의합니다. 동일한 데이터, 동일한 매핑, 거의 동일한 매개변수 규모에서 EFT 계열은 훨씬 더 높은 결합 로그우도를 얻습니다.

그림 S4|결합 피팅 우위(클수록 좋음): RC+GGL의 best logL_total을 DM_RAZOR 대비로 표시.


2.4 네 문장 결론(직접 인용 가능)

(1) SPARC 회전 곡선 + KiDS-1000 약한 중력렌즈의 통일 결합 분석에서, EFT 평균 중력 프레임워크 모델은 엄격한 대조 프로토콜 아래 DM_RAZOR보다 체계적으로 우수합니다. ΔlogL_total = 1155–1337(DM_RAZOR 대비)입니다.

(2) RC→GGL 폐쇄 검정은 EFT의 예측 일관성이 더 강함을 보여줍니다. ΔlogL_closure = 172–281인 반면 DM_RAZOR는 127입니다. 또한 RC-bin→GGL-bin 묶음을 무작위로 섞으면 폐쇄 신호가 6–23으로 붕괴하므로, 이 신호가 우연한 피팅이 아니라 올바른 교차 데이터 매핑에 의존한다는 점을 보여줍니다.

(3) σ_int, R_min, 공분산 shrinkage에 대한 체계적 스캔은 모두 “EFT가 DM_RAZOR보다 우수하다”는 부호와 크기 차원을 바꾸지 않았습니다. 이는 결론이 흔한 계통 교란에 대해 견고함을 뜻합니다.

(4) 부록 B(P1A)는 동일한 폐쇄 프로토콜 아래 DM 기준선을 “표준화되고 감사 가능한” 방식으로 강화합니다. 세 개의 1-매개변수 강화(SCAT/AC/FB)를 유지하고, 계층적 c–M scatter + prior, 단일 매개변수 core proxy, 렌즈 쪽 전단 보정 m 및 그 조합 DM_STD를 추가합니다. 결과는 다음과 같습니다. feedback/core 분기만 폐쇄 강도에 작은 순개선(122.21→129.45, ΔΔlogL_closure≈+7.25)을 가져왔고, 나머지 강화는 폐쇄 강도에 유의미한 기여를 하지 않거나 음의 기여를 보였습니다. 따라서 본문 핵심 결론은 DM_RAZOR가 지나치게 약하다는 가정에 의존하지 않습니다.

3 데이터와 전처리

이 연구는 두 종류의 공개 데이터를 사용하며, 엔지니어링 과정 안에서 추적 가능한 스크립트로 다운로드, 검증(sha256), 전처리를 완료했습니다. 교차 모델의 공정 비교를 보장하기 위해 모든 작업공간(EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR)은 완전히 동일한 데이터 산출물과 bin 매핑을 공유합니다.


3.1 회전 곡선(RC, SPARC)

RC 데이터는 SPARC 데이터베이스의 Rotmod_LTG(175개 rotmod 파일)에서 왔습니다. 전처리 후 본 프로젝트 모델링에 포함된 표본은 104개 은하, 총 2295개의 (r, V_obs) 데이터 포인트이며, 항성질량 등의 규칙에 따라 20개의 RC-bin으로 나뉩니다. 각 데이터 포인트에는 반지름 r(kpc), 관측 속도 V_obs(km/s), 오차 σ_obs, 그리고 가스/원반/핵구 성분 속도(V_gas, V_disk, V_bul)가 포함됩니다.


3.2 약한 중력렌즈(GGL, KiDS-1000 / Brouwer+2021)

GGL 데이터는 Brouwer 등(2021)이 KiDS-1000에서 제시한 Fig.3 등가 표면밀도 ΔΣ(R)(4개 항성질량 bin, bin마다 15개 R 점)를 사용하며, 그들이 제공한 완전 공분산을 함께 사용합니다. 엔지니어링 과정에서는 원시 long-form 공분산을 각 bin의 15×15 정방행렬로 재구성하고, Stage-B 감사에서 차원과 수치의 합리성을 검증했습니다.


3.3 RC-bin → GGL-bin 매핑과 총 표본 수

GGL의 4개 질량 bin과 RC의 20개 bin은 고정 매핑으로 연결됩니다. 각 GGL-bin은 5개의 RC-bin에 대응하며, 은하 수 가중치로 RC-bin의 기여를 가중 평균합니다. 이 매핑은 모든 모델에서 변하지 않으며, 폐쇄 검정과 결합 피팅의 공정 비교를 지탱하는 핵심 제약입니다. 최종 결합 데이터 포인트 총수는 n_total = 2355(RC=2295, GGL=60)입니다.

4 모델과 통계 방법


4.1 EFT와 DM의 최소 수학 규격(감사 가능/검정 가능)

이 절에서는 구현과 직접 대응되는 최소 수학 규격을 제시합니다.

(a) 회전 곡선(RC) 모델

각 RC 데이터 포인트 (r, V_obs, σ_obs)에 대해 우리는 성분 중첩을 사용합니다. V_mod²(r) = V_bar²(r) + V_extra²(r). 여기서 V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r)입니다. 이 원고의 주결과에서는 Υ_d = Υ_b = 0.5를 사용했습니다(SPARC의 경험적 권고와 일치하며, 불필요한 자유도를 줄이기에도 유리합니다).

(b) EFT 평균 중력 수정(EFT)

EFT의 추가항은 “평균 속도 제곱” 형태로 매개변수화합니다. V_extra²(r) = V0_bin² · f(r/ℓ). 여기서 V0_bin은 각 RC-bin의 진폭 매개변수(20개), ℓ은 전역 척도(1개), f(x)는 무차원 커널 형태 함수입니다. 이 논문에서 비교하는 커널 형태(모두 추가 연속 자유도 없음)는 다음과 같습니다.

물리적 동기(확장): EFT는 은하 규모의 추가 중력 응답을, 더 미시적인 작용이 유한한 척도에서 조립질화/척도 평균된 뒤 나타나는 유효 응답으로 이해합니다. 이 논문에서는 특정 미시 메커니즘을 미리 가정하지 않고, 최소·감사 가능한 매개변수화를 사용하여 통일된 통계 프로토콜 아래 통제된 비교와 검정을 수행합니다.

직관적 이해를 돕기 위해 추가항을 가속도 형태로 쓸 수 있습니다. a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). r≫ℓ일 때 f→1, V_extra→V0_bin이 되어 외곽 영역에서 거의 평탄한 추가 속도 기여를 줍니다. r≪ℓ이고 f(x)≈x일 때는 특성 가속도 척도 a0,bin≈V0_bin²/ℓ를 도입할 수 있습니다(커널 함수의 O(1) 계수 차이는 존재). 이는 MOND 유사의 내부-외부 영역 전이 척도에 대한 직관을 제공합니다.

이 논문에서 채택한 이산 커널 계열(none/exponential/yukawa/powerlaw_tail)은 서로 다른 “초기 기울기/전이 속도/장거리 꼬리”에 대한 저차원 proxy로 볼 수 있습니다. 예컨대 Yukawa-like 차폐와 더 긴 꼬리 응답을 견고성 스트레스 테스트에 사용한 것이며, 모델 공간을 모두 열거하려는 것은 아닙니다. 약한 렌즈 부분에서는 V_avg(r)로부터 등가 포락 질량과 밀도를 구성한 뒤 투영하여 ΔΣ(R)를 얻습니다. 이 등가 밀도는 구대칭·약장 매핑 가정 아래 렌즈 퍼텐셜을 유효하게 기술한 것으로 이해해야 합니다(전체 세부사항은 부록 A로 옮겼습니다).

위 커널 형태들은 x→∞에서 모두 f(x)→1을 만족합니다(즉 V_extra²→V0²로 포화). x≪1에서는 선형 또는 아선형 증가를 보입니다. 예를 들어 exponential은 f≈x, yukawa는 f≈0.5x, powerlaw_tail은 f≈0.5x입니다. 따라서 서로 다른 커널 형태는 작은 반지름의 “초기 기울기”, 전이 속도, 외곽 꼬리에서 관측 가능한 차이를 만들며, RC+GGL의 결합 및 폐쇄 검정으로 구분할 수 있습니다.

약한 렌즈 ΔΣ(R)의 EFT 예측은 V_avg(r)에서 포락 질량과 밀도를 역추정하고, 다시 투영 적분을 통해 얻습니다. M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr, ΔΣ(R)=Σ̄(<R)−Σ(R). 수치 구현은 로그 격자를 사용하며, 이상 상황에서는 적응적으로 세분화하여 안정성과 반복 가능성을 보장합니다.

(c) DM_RAZOR: NFW 차가운 암흑물질 헤일로 기준선

동시에 우리는 DM_RAZOR가 최소화되고 감사 가능한 NFW 기준선만을 대표한다는 점을 명확히 합니다. 여기에는 고정 c–M 관계가 쓰이며 scatter는 없고, Adiabatic Contraction, feedback core, 비구형성, 환경항은 포함되지 않습니다. “strawman baseline” 위험을 낮추기 위해, 이 논문은 이러한 효과가 없다고 주장하지 않습니다. 오히려 이를 저차원·감사 가능한 방식으로 부록 B(P1A)에 스트레스 테스트로 포함했습니다. 여기에는 c–M scatter의 계층화 처리, core proxy, 렌즈 쪽 전단 보정 nuisance 등이 포함됩니다.


4.2 모델 장부와 공정 비교(공유 매개변수 = 폐쇄의 정의)

주요 비교 집합의 매개변수 수는 다음과 같습니다. DM_RAZOR k=20, EFT 계열 k=21(추가 1개는 전역 log ℓ). 모든 모델은 동일한 RC 데이터, 동일한 GGL 데이터와 공분산, 동일한 RC-bin→GGL-bin 매핑, 동일한 중입자항과 단위 변환을 공유합니다. 또한 커널 형태(none / exponential / yukawa / powerlaw_tail)는 이산 선택지이며 추가 연속 매개변수를 도입하지 않습니다. 따라서 “자유도가 하나 더 많아서” 얻는 우위를 피합니다.


4.3 Likelihood, 사전분포와 샘플러

RC 우도는 대각 가우시안으로 둡니다. σ_eff² = σ_obs² + σ_int²이며, 주결과에서는 σ_int=5 km/s로 고정하고 Run-5에서 σ_int를 스캔합니다. GGL 우도는 bin별 완전 공분산 가우시안입니다. logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). 결합 목표는 logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ)입니다. 사전분포는 주로 물리적으로 가능한 경계(log ℓ, log V0, log M200의 구간 제약)를 반영합니다. 자유 Υ와 σ_int를 켤 때는 약정보 사전분포를 사용합니다(자세한 내용은 구현과 release 패키지 설정 참조).

샘플러는 적응형 block Metropolis 무작위 보행을 사용합니다. 각 단계에서 매개변수 공간의 무작위 부분 블록만 갱신하여 고차원 수용률을 높이고, 윈도 수용률에 따라 보폭을 가볍게 적응시킵니다(목표 수용률은 약 0.25). 주결과는 quick 모드(n_steps=800 등 설정)를 사용하며, 각 작업공간에 대해 trace, 잔차, PPC 그림을 출력하여 수동 및 스크립트 감사를 가능하게 합니다.


4.4 폐쇄 검정과 음성 대조군(정의)

폐쇄 검정(Run-2)은 GGL을 다시 피팅하지 않고 “RC-only 사후분포가 GGL을 예측할 수 있는가”를 검정합니다. 구체적으로는 RC-only 사후분포 샘플에서 4개 GGL-bin의 ΔΣ(R)를 전방 생성하고, 완전 공분산으로 logL_true를 계산합니다. 그런 다음 RC-bin→GGL-bin의 그룹 매핑을 무작위 치환(permutation)하여 logL_perm을 얻습니다. 폐쇄 강도는 ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩로 정의합니다. 또한 Run-10은 20개의 RC-bin을 4×5로 무작위 재분할(shuffle)하고 폐쇄를 다시 계산하여, 폐쇄 신호가 올바른 매핑에 의존하는지 검정합니다.

5 주요 결과와 해석


5.1 결합 피팅 주결과(RC+GGL)

결합 피팅의 best logL_total과 상대 우위 ΔlogL_total(DM_RAZOR 대비)은 표 S1a와 그림 S4에 제시되어 있습니다. 주요 비교 집합에서 EFT_BIN의 결합 우위가 가장 큽니다(ΔlogL_total=1337.210). 다른 EFT 커널 형태도 모두 유의한 우위(1154.827–1294.442)를 유지합니다. 정보 기준(AICc/BIC)에서도 EFT 계열은 DM_RAZOR보다 현저히 우수하며, 이 우위가 매개변수 수의 편향에서 온 것이 아님을 보여줍니다.

주: ΔlogL_total≈1337의 주요 기여는 RC 항에서 나옵니다(joint 분해에서 ΔlogL_RC≈1065, 약 80%). 이는 N=2295개의 RC 데이터 포인트에서 점당 Δχ²≈0.90 정도의 온건한 개선이 대각 가우시안 우도 아래 자연스럽게 누적되어 10^3 규모의 우위가 된 것으로 이해할 수 있습니다. 동시에 GGL과 폐쇄 검정은 독립적인 교차 데이터셋 제약을 제공하며, σ_int, R_min, cov‑shrink 스트레스 테스트에서도 순위가 안정적으로 유지됩니다(6절 및 표 S1b 참조).


5.2 폐쇄 검정 결과(RC-only → GGL)

폐쇄 검정의 핵심량 ΔlogL_closure는 표 S1b와 그림 S3에 제시되어 있습니다. EFT 계열의 폐쇄 강도는 171.977–280.513으로, DM_RAZOR의 126.678보다 높습니다. 이는 추가적인 교차 데이터 자유도를 전혀 허용하지 않는 조건에서도, EFT가 RC 데이터에서 얻은 사후분포 샘플이 GGL 데이터에 대해 더 강한 이전 예측 능력을 갖는다는 뜻입니다.

음성 대조군은 폐쇄 신호의 물리적 관련성을 더 뒷받침합니다. RC-bin→GGL-bin 그룹을 무작위로 섞으면 EFT의 폐쇄 강도는 6–15로 낮아집니다(커널마다 약간 다름). 원래 기준 폐쇄 강도는 172–281에 이릅니다. 이러한 “신호 붕괴”는 수치 구현, 단위 오류, 공분산 처리 부적절성에서 생긴 가짜 우위를 배제합니다.

그림 R1|음성 대조군: shuffle 그룹화 뒤 폐쇄 신호가 현저히 낮아짐(Tab_Z1 지표 기반).


5.3 결과의 의미와 제한

이 연구의 결론은 “이 데이터셋과 이 프로토콜 아래에서 EFT 평균 중력 수정은 검정된 DM_RAZOR 기준선보다 우수하다”는 것입니다. 강조해야 할 점은, DM 측에서는 최소 NFW 기준선과 고정 c(M) 관계만 사용했고, core 형성, 비구형성, 환경항, 더 복잡한 은하-헤일로 연결 모델 등은 넣지 않았다는 점입니다. 따라서 이 원고는 모든 DM 모델 계열을 배제한다고 주장하지 않습니다. 대신 RC와 GGL이 동일한 교차 데이터 매개변수와 매핑으로 일관되게 설명될 수 있는지를 평가하기 위한, 재현 가능하고 폐쇄 검정을 중심에 둔 대조 기준선을 제공합니다.

이 흔한 의문에 답하기 위해 우리는 독립 확장 프로젝트 P1A(부록 B 참조)를 완료했습니다. RC-bin→GGL-bin 공유 매핑과 감사 프레임워크를 바꾸지 않은 상태에서, DM 기준선을 “표준화되고 감사 가능한” 방식으로 강화했습니다. 세 개의 1-매개변수 강화(SCAT/AC/FB)에 더해, (i) 계층적 c–M scatter + mass–concentration prior(DM_HIER_CMSCAT), (ii) 단일 매개변수 baryonic-feedback core proxy(DM_CORE1P), (iii) 약한 렌즈 쪽 전단 보정 nuisance m(DM_RAZOR_M)을 추가하고, 조합 모델 DM_STD도 제시했습니다. 동시에 EFT_BIN은 대조 기준으로 유지했습니다.

• DM_RAZOR_SCAT(c–M scatter) — halo-to-halo 농도 산포 매개변수 σ_logc를 도입하여, “고정 c(M)”이 DM의 설명력을 체계적으로 과소평가하는지 검정합니다.
• DM_RAZOR_AC(Adiabatic Contraction) — 단일 매개변수 α_AC로 “수축 없음 ↔ 표준 수축” 사이를 연속 보간하여, 중입자 유입이 야기할 수 있는 내부 영역 수축 경향을 최소 비용으로 포착합니다.
• DM_RAZOR_FB(Feedback / core) — log r_core 같은 core 척도로 내부 영역 core 형성이 회전 곡선에 주는 억제 효과를 기술하고, 약한 렌즈 척도에서는 NFW 근사를 유지합니다.

P1A의 정량 scoreboard는 부록 B의 표 B1 / 그림 B1에 제시되어 있습니다(Tab_S1_P1A_scoreboard에서 자동 생성). 폐쇄 지표에서 DM_RAZOR_FB는 작은 순개선(122.21→129.45, +7.25)을 보였지만, 나머지 강화는 폐쇄 강도에 유의미한 기여를 하지 않거나 음의 기여를 보였습니다. 결합 피팅 쪽에서는 계층적 c–M scatter prior(DM_HIER_CMSCAT)나 조합 모델(DM_STD)을 넣으면 joint logL이 크게 개선될 수 있지만, 폐쇄 강도 향상은 동반되지 않았습니다. 이는 주된 증가가 교차 탐침 이전 가능성이 아니라 결합 피팅의 유연성에서 나온다는 점을 시사합니다. 따라서 본문의 핵심 결론은 다음과 같이 이해해야 합니다. 엄격한 공유 매핑과 폐쇄 검정 제약 아래에서 EFT의 교차 데이터 일관성 우위는 DM 측의 “지나치게 약한 기준선” 선택에서 비롯된 것이 아닙니다. 부록 B에 해당하는 P1A 공개 패키지(보충 표·그림 및 full_fit_runpack)는 이 논문의 full_fit_runpack과 동일한 Zenodo Concept DOI에 추가 파일로 포함될 예정입니다: https://doi.org/10.5281/zenodo.18526286.

6 견고성 및 대조 실험


6.1 σ_int 스캔(Run-5)

우리는 RC의 내재 산포 σ_int를 체계적으로 스캔하고, 각 σ_int에서 결합 추론을 반복하여 DM_RAZOR 대비 ΔlogL_total을 계산했습니다. 각 모델이 스캔 범위 안에서 보인 ΔlogL_total의 최소/최대값은 표 S1b에 제시되어 있습니다.

그림 R2|σ_int 스캔에서 ΔlogL_total의 범위(클수록 좋음).


6.2 R_min 스캔(Run-6)

중심부 데이터의 계통오차(예: 비원형 운동, 해상도, 충분하지 않은 중입자 모델링)의 영향을 검정하기 위해, 우리는 RC에 R_min 임계값 절단을 적용하고 결합 추론을 반복했습니다. EFT 계열의 우위는 R_min 스캔에서도 양의 값을 유지했고, 크기 차원도 안정적이었습니다.

그림 R3|R_min 스캔에서 ΔlogL_total의 범위(클수록 좋음).


6.3 cov-shrink 스캔(Run-7)

GGL 공분산 불확실성을 검정하기 위해, 우리는 각 질량 bin의 공분산 행렬에 shrinkage를 적용했습니다. C_α=(1−α)C+α·diag(C)로 두고 α를 스캔했습니다. 결과는 EFT 계열의 우위가 이 처리에 민감하지 않음을 보여줍니다.

그림 R4|cov-shrink 스캔에서 ΔlogL_total의 범위(클수록 좋음).


6.4 소거 계단(Run-8)

EFT_BIN 내부에서 중첩 소거를 수행했습니다. 극단적으로 단순한 모델(자유 매개변수 없음)에서 시작하여, 소수의 자유도만 남긴 모델을 거쳐, 완전한 20-bin 진폭 + 전역 척도 모델까지 비교했습니다. AICc/BIC는 완전한 EFT_BIN이 데이터 설명에 유의미하게 필요함을 보여줍니다.

그림 R5|EFT_BIN의 소거 계단(AICc, 작을수록 좋음).


6.5 유보 예측(Run-9)

우리는 추가로 leave-one-bin-out(LOO) 검정을 수행했습니다. GGL의 4개 질량 bin 중 매번 1개 bin을 유보하고, 나머지 bin과 전체 RC로 다시 추론한 뒤, 유보된 bin에서 테스트 로그우도를 평가했습니다. 요약 지표는 보충표 Tab_R3_leave_one_bin_out에 제시되어 있습니다(Run-9 산출물; 8.2절의 핵심 산출물 목록에 파일 경로 패턴이 제시됨). 최악의 유보 상황에서도 EFT 계열은 DM_RAZOR보다 여전히 뚜렷하게 우수했습니다.

그림 R6|LOO: 유보 bin의 로그우도 분포(Run-9 산출물).


6.6 음성 대조군: RC-bin shuffle(Run-10)

Run-10은 20개의 RC-bin을 4×5로 무작위 재분할하고, RC-only 사후분포를 유지한 상태에서 폐쇄를 다시 계산합니다. 결과는 원래 매핑과 비교할 때 shuffle이 폐쇄의 mean logL_true와 ΔlogL_closure를 현저히 낮춘다는 것을 보여줍니다(표 S1b 및 그림 R1 참조). 이는 폐쇄 신호의 해석 가능성을 추가로 뒷받침합니다.

그림 R7|음성 대조군: shuffle 매핑은 폐쇄 mean logL_true를 현저히 낮춤(Run-10 산출물).

7 추적 가능성과 일관성 감사(Provenance)

이 논문에서 인용된 모든 수치는 공개 아카이브의 엄격 요약표와 감사 기록에서 항목별로 추적할 수 있습니다. 본문 읽기의 흐름을 더 매끄럽게 하기 위해, 전체 추적 체인(tag 목록, 감사표, checksum 목록, 확인 방식)은 부록 A로 옮겼습니다.

8 재현 가능성과 Zenodo 아카이브(Reproducibility & Archive)

데이터와 코드 이용 가능성 선언: 이 논문에서 사용한 SPARC 회전 곡선과 KiDS-1000 약한 중력렌즈 데이터는 모두 공개 데이터입니다. 출판급 보고서는 Zenodo에 보관되었습니다(Concept DOI: https://doi.org/10.5281/zenodo.18526334). 전체 재현 패키지도 Zenodo에 보관되었습니다(Concept DOI: https://doi.org/10.5281/zenodo.18526286). 상세한 실행 단계, 의존 환경, 아카이브 목록과 해시 검증 정보는 부록 A를 참조하십시오. DM 기준선 표준화 스트레스 테스트(P1A)의 설계, 실행 태그와 산출물은 부록 B를 참조하십시오.

동일한 전체 재현 패키지 Concept DOI(https://doi.org/10.5281/zenodo.18526286) 아래에서, 우리는 용도별로 두 가지 재현 입구를 제공합니다.
• P1(본문) full_fit_runpack: EFT vs DM_RAZOR의 RC-only / closure / joint 및 견고성 스캔을 재현하고, 본문 표 S1a/S1b와 그림 S3/S4 등의 자산을 생성합니다.
• P1A(부록 B) full_fit_runpack: DM 기준선 표준화 스트레스 테스트(SCAT/AC/FB + 계층적 c–M scatter prior + core1p + lensing m + DM_STD; EFT_BIN 대조 포함)를 재현하고, 부록 표 B1과 그림 B1을 생성합니다.
P1A의 보충 표·그림과 full_fit_runpack은 추가 파일로 동일한 Concept DOI에 포함되어, 단일 아카이브 입구를 유지합니다.

9 감사의 말과 선언


9.1 감사의 말

공개 데이터와 문서를 제공한 SPARC 및 KiDS-1000 팀에 감사드립니다. 또한 본 프로젝트의 재구성 및 감사 절차에 참여한 분들께 감사드립니다.


9.2 저자 기여

Guanglin Tu은 본 연구의 개념 제안, 연구 설계, 엔지니어링 구현, 데이터 정리, 형식 분석, 재현 절차 구현과 감사, 그리고 논문 작성을 담당했습니다.


9.3 재원

저자 Guanglin Tu의 개인 자비(외부 지원 없음/과제 번호 없음).


9.4 경쟁적 이해관계

저자 Guanglin Tu은 “EFT 작업그룹, Shenzhen Energy Filament Science Research Co., Ltd. (중국)”와 관련이 있습니다. 그 밖의 경쟁적 이해관계는 없습니다.


9.5 AI 보조

OpenAI GPT-5.2 Pro와 Gemini 3 Pro를 언어 다듬기, 구조화 편집, 재현 절차 정리에 사용했습니다. 데이터, 결과, 그림, 표, 코드의 생성 또는 수정에는 사용하지 않았고, 참고문헌 생성에도 사용하지 않았습니다. 저자는 전문 내용과 인용 정확성에 대해 전적인 책임을 집니다.

10 참고문헌

부록 A: 추적 가능성과 재현 가능성 세부사항

이 부록은 장기 아카이브를 위한 추적 가능성과 재현 가능성 정보(실행 태그, 감사 결과, 아카이브 목록, 대조 핵심점 등)를 모아, 독자가 필요할 때 확인하고 재현할 수 있게 합니다.


A.1 추적 가능성과 감사 세부사항

장기 추적 가능성을 보장하기 위해, 이 프로젝트는 각 실행과 산출물에 타임스탬프 tag를 사용하고, 과거 산출물을 덮어쓰지 않고 보존합니다. 이 원고가 인용한 핵심 수치는 엄격 요약(compile_tag=20260205_035929)에서 왔으며, 다음 일관성 감사를 통과했습니다.

• 모든 단계별 표에는 run_tag와 단계 tag가 붙어 있습니다. 엄격 요약 스크립트는 report/tables에서 “완전하고 일관된” canonical 표 출처를 선택합니다.

• Tab_Z1_master_summary와 Tab_Z2_conclusion_highlights의 수치를 선택된 canonical 표와 항목별로 대조했습니다.

• PDF를 생성할 때 “인용된 표/그림의 tag”에 대한 태그 감사를 수행하여 오래된 산출물이 섞이지 않았음을 보장했습니다.

핵심 태그(모든 중간 산출물 위치 지정용): run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442.

일관성 감사 결과: Tab_AUDIT_checks_strict는 pass=9, fail=0, skip=0을 보여줍니다(자세한 내용은 release 패키지 참조).


A.2 재현 가능성 실행 단계와 아카이브 목록

이 연구는 “출판급 보고서 + 표·그림 보충 자료 + 전체 재실행 가능 runpack”의 재현 체계를 사용합니다. 독자는 Tables & Figures Supplement를 직접 열어 이 논문이 인용한 모든 표/그림 자산을 대조할 수 있습니다. 수치와 감사 체인을 처음부터 재현하려면 full_fit_runpack으로 데이터를 다운로드하고 전체 절차를 다시 실행할 수 있으며, 실행이 끝난 뒤에는 패키지 안의 reference 표 대조 스크립트로 표 수치의 일치성을 검증할 수 있습니다.


A.2.1 재현 Quickstart(RUN_FULL, Windows PowerShell)

이 절은 더 짧은 재현 경로(Windows PowerShell)를 제시합니다. 빠른 확인에는 Tables & Figures Supplement를 직접 살펴보며 이 논문이 인용한 표와 그림을 항목별로 대조하는 것을 권합니다. 엔드투엔드 재현으로 모든 표/그림 및 감사 산출물을 생성하려면 full_fit_runpack을 사용하십시오. 패키지 안의 README/ONE_PAGE_REPRO_CHECKLIST에 따라 verify_checksums.ps1과 RUN_FULL.ps1을 실행합니다(Mode=full 권장).

Zenodo 아카이브 입구(Concept DOI): https://doi.org/10.5281/zenodo.18526286.
본문 주체인 태그: run_tag=20260204_122515, strict compile_tag=20260205_035929, release_tag=20260205_112442.


A.2.2 아카이브 자료와 핵심 대조점(Packages & checks)

Zenodo 아카이브는 다음 3가지 상호 보완 자료를 제공합니다. (1) 출판급 보고서(본문, v1.1; 부록 B: P1A DM 기준선 표준화 스트레스 테스트 포함), (2) Tables & Figures Supplement(표와 그림 보충 자료: 이 논문이 인용한 모든 표/그림 자산을 포괄하며, P1과 P1A에 각각 대응), (3) full_fit_runpack(전체 재현 패키지: 데이터를 처음부터 다운로드하고 전체 절차를 재실행하며, P1과 P1A에 각각 대응). 이 가운데 (1)–(2)는 빠른 읽기와 독립 확인을 지원하고, (3)은 엔드투엔드 전체 재현 기능을 제공합니다.

자료 범주

파일명(예시)

용도와 위치(독자는 이 순서로 사용할 것을 권장)

출판급 보고서(중문 및 영문)

P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf
P1_RC_GGL_report_CN_PUBLICATION_V1_1.pdf

Zenodo에 보관된 완전 보고서. 본문은 주결론과 견고성 감사를 제시하고, 부록 B는 P1A(DM 기준선 표준화 스트레스 테스트)를 제시합니다.

Tables & Figures Supplement(P1)

P1_RC_GGL_supplement_figs_tables_V1_1.zip

본문에서 인용한 모든 표(CSV)와 그림(PNG). 생성 스크립트와 태그 파일을 포함합니다.

Tables & Figures Supplement(P1A)

P1A_supplement_figs_tables_v1.zip

부록 B(P1A)에서 인용한 모든 표와 그림. Tab_S1_P1A_scoreboard와 Fig_S1_P1A_scoreboard를 포함합니다.

full_fit_runpack(P1)

P1_RC_GGL_full_fit_runpack_v1_1.zip

엔드투엔드 전체 재현: 데이터를 처음부터 다운로드하고 RC-only/closure/joint 및 견고성 스캔을 다시 실행합니다.

full_fit_runpack(P1A)

P1A_RC_GGL_full_fit_runpack_v1.zip

엔드투엔드 전체 재현(부록 B): DM 7+1 + DM_STD(EFT_BIN 대조 포함)를 다시 실행하고 부록 자산을 생성합니다. 패키지에는 표 수치 일치성을 검증하기 위한 reference 표 대조 스크립트가 포함됩니다.

인용 권장 방식: 이 논문이나 첨부 재현 자료를 인용할 때는 Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334)를 명시해 주십시오.

재현 후 나타나고 대조할 수 있어야 하는 핵심 산출물은 다음과 같습니다.

부록 B: P1A—DM 기준선 표준화 스트레스 테스트(DM 7+1 + DM_STD; EFT 대조 포함)

이 부록은 본문 폐쇄 프로토콜과 일치하는 “DM 기준선 표준화 스트레스 테스트” 확장 프로젝트(P1A)를 기록합니다. 그 위치는 다음과 같습니다. 많은 자유도를 도입하지 않고 RC-bin→GGL-bin 공유 매핑과 감사 프레임워크를 바꾸지 않은 상태에서, 본문에서 사용한 최소 DM_RAZOR(NFW + 고정 c–M, scatter 없음/수축 없음/core 없음)를 천체물리 실무에 더 가깝고 흔한 비판에 더 잘 견디는 DM 기준선 집합으로 끌어올립니다. P1A는 이전 세 분기 스트레스 테스트를 포괄하고 확장합니다. SCAT/AC/FB를 유지하면서, 계층적 c–M scatter + prior, 단일 매개변수 core proxy, 렌즈 쪽 전단 보정 nuisance m을 추가하고, 조합 모델 DM_STD를 제공합니다. 동시에 EFT_BIN을 대조 참조로 유지합니다.

보충 설명: 부록 B(P1A)의 폐쇄 강도 등 수치는 더 높은 Monte Carlo 예산(예: ndraw=400, nperm=24)을 사용했습니다. 본문에서 완전한 EFT 커널 계열을 포괄하기 위해 사용한 quick 예산(예: ndraw=60, nperm=12)과 다르므로, 절대 수치에는 O(10) 수준의 샘플링 이동이 있을 수 있습니다. 그러나 동일 예산/동일 표 안에서 모델 간 비교는 공정하며, 우위의 부호와 크기 차원은 서로 다른 예산에서도 안정적으로 유지됩니다.


B.1 목적과 위치(Why P1A, and why as an Appendix)

P1A는 가능한 모든 ΛCDM 헤일로 모델링(예: 비구형성, 환경 의존성, 복잡한 은하-헤일로 연결, 고차원 baryon physics)을 소진하려 하지 않습니다. 반대로 P1A는 “저차원, 감사 가능, 재현 가능” 원칙을 따릅니다. 각 강화 모듈은 ≤1개의 핵심 유효 매개변수만 도입하고, 이 논문의 세 가지 강한 제약을 계속 따릅니다.
(i) 매개변수 장부: 신규 매개변수는 명확히 기록되고 정보 기준(AICc/BIC)과 함께 보고되어야 합니다.
(ii) 공유 매핑: 동일한 RC-bin→GGL-bin 그룹 매핑을 계속 사용하며, 단일 데이터셋을 위해 따로 ‘매핑을 조정’하는 것은 허용하지 않습니다.
(iii) 폐쇄 검정: 어떤 강화든 RC-only 피팅이 좋아지는 데 그치지 않고, RC→GGL 이전 예측에서 실제 이득을 보여야 합니다.


B.2 DM 7+1 + DM_STD: 모듈 정의, 매개변수, 결합 사후분포에 들어가는 방식

P1A는 독립 runpack으로서 8개의 DM 작업공간(DM 7+1)과 1개의 EFT 대조를 제공합니다. DM_RAZOR를 기준선으로 삼아 세 개의 legacy 1-매개변수 강화(DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB)를 만들고, 세 개의 더 표준적인 방어 모듈(DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M)을 추가한 뒤, 조합 모델 DM_STD를 제시합니다. 이 모듈들의 공동 목표는 차원을 가능한 한 늘리지 않으면서 가장 흔한 세 종류의 비판을 포괄하는 것입니다. (a) c–M 관계의 산포와 사전분포가 계층 모델에 어떻게 들어가는가, (b) baryonic feedback의 주효과를 1-매개변수 core proxy로 나타낼 수 있는가, (c) 렌즈 쪽 핵심 계통오차가 물리 신호로 오인될 가능성이 있는가입니다.

Workspace

dm_model

신규 매개변수(≤1)

물리적 동기(핵심)

구현 원칙(감사 친화적)

DM_RAZOR

NFW (fixed c–M, no scatter)

최소화되고 감사 가능한 ΛCDM 헤일로 기준선. EFT와 엄격 비교에 사용

공유 매핑 고정; 매개변수 장부 엄격; baseline으로 상대 비교에만 사용

DM_RAZOR_SCAT

NFW + c–M scatter(legacy)

σ_logc

c–M 관계에 산포가 존재함. 1-매개변수 log-normal scatter로 근사

≤1개 신규 매개변수; 공유 매핑 유지; 폐쇄 이득을 검수 기준으로 사용

DM_RAZOR_AC

NFW + Adiabatic Contraction(legacy)

α_AC

중입자 유입이 헤일로의 단열 수축을 유발할 수 있음. 1-매개변수 강도로 근사

≤1개 신규 매개변수; 매핑 변경 없음; AICc/BIC 변화와 폐쇄 이득 보고

DM_RAZOR_FB

NFW + feedback core(legacy)

log r_core

피드백이 내부 영역에 core를 형성할 수 있음. 1-매개변수 core 척도로 근사

≤1개 신규 매개변수; 폐쇄/음성 대조군 동일 기준; RC-only 개선만을 유일 목표로 삼지 않음

DM_HIER_CMSCAT

Hierarchical c–M scatter + prior

σ_logc(hier)

더 표준적인 계층화 c_i∼logN(c(M_i),σ_logc). RC와 GGL 결합 사후분포에 동시에 영향

명시적 사전분포; latent c_i 주변화; 저차원·감사 가능성 유지

DM_CORE1P

1‑parameter core proxy (coreNFW/DC14‑inspired)

log r_core

1-매개변수 core proxy로 baryonic feedback 주효과를 나타내어 고차원 별형성 세부항을 피함

표준 문헌 인용; ≤1개 신규 매개변수; 폐쇄 검정과 결합

DM_RAZOR_M

NFW + lensing shear‑calibration nuisance

m_shear(GGL)

약한 렌즈 쪽 핵심 계통오차를 유효 매개변수로 흡수하여 ‘계통오차를 물리로 오인’할 위험을 낮춤

nuisance 명확히 기록; RC에 역방향 영향 불허; 결과는 폐쇄 견고성을 중심으로 평가

DM_STD

Standardized DM baseline (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

가장 흔한 세 가지 비판을 저차원 표준 기준선 하나에 동시에 포함

매개변수 장부와 정보 기준 함께 보고; 폐쇄를 주지표로 사용; 가장 강한 DM 방어 대조군으로 사용

설명: 위 매개변수 이름은 엔지니어링 구현을 기준으로 합니다(예: σ_logc, α_AC, log r_core, m_shear). P1A의 설계 초점은 “DM 기준선을 조금 더 강하게 만들되 여전히 감사 가능하게 유지하는 것”이지, DM 측을 통제 불가능한 고차원 피팅기로 만드는 것이 아닙니다. 특히 DM_HIER_CMSCAT은 c–M scatter를 계층 방식으로 도입합니다. 각 halo의 농도 c_i에 대해 c(M_i) 주위의 log-normal 산포를 설정하고, 전역 σ_logc와 c(M) 사전분포로 이를 제약합니다. 이 계층 구조는 RC와 GGL의 결합 사후분포에 동시에 영향을 줍니다.


B.3 본문과 일치하는 통계 프로토콜과 산출물 기준

P1A는 본문의 모든 데이터 산출물, 공유 매핑과 감사 프레임워크를 재사용하며, 실행 순서와 산출물 기준을 동일하게 유지합니다.
(1) Run‑1: RC-only 추론(출력 posterior_samples.npz 및 metrics.json)
(2) Run‑2: RC→GGL 폐쇄 검정(출력 closure_summary.json 및 permuted baseline)
(3) Run‑3: RC+GGL 결합 피팅(출력 joint_summary.json)
인용된 모든 수치는 자동 요약표(Tab_S1_P1A_scoreboard)에서 왔으며, P1A full_fit_runpack으로 전체 절차를 다시 실행한 뒤 내장 reference 표 대조 스크립트로 복검할 수 있습니다.


B.4 주요 결과, 표·그림 입구와 아카이브 계획(동일 DOI)

이 절은 P1A의 핵심 정량 결론을 제시합니다. 표 B1은 RC-only, RC→GGL 폐쇄, RC+GGL 결합 피팅의 핵심 지표를 요약합니다(괄호 안은 DM_RAZOR baseline 대비 차이). 폐쇄 강도는 ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩로 정의합니다(클수록 좋음). 그림 B1은 같은 scoreboard를 시각화합니다. 주요 결론은 다음과 같습니다.
• legacy 세 분기 중 DM_RAZOR_FB(feedback/core)만 폐쇄 강도에 작은 순개선을 줍니다: 122.21→129.45(+7.25). SCAT와 AC는 순개선을 주지 않습니다.
• 새로 추가한 DM_HIER_CMSCAT와 DM_RAZOR_M은 폐쇄 강도에 거의 영향을 주지 않으며(~0), DM_CORE1P도 유의미한 순개선을 보이지 않습니다.
• 조합 모델 DM_STD는 joint logL을 크게 개선할 수 있지만(결합 피팅 최적에 더 가까워짐), 폐쇄 강도는 오히려 낮아집니다. 이는 주된 개선이 교차 탐침 이전 가능성이 아니라 결합 피팅의 유연성에서 온다는 점을 시사합니다.
• EFT_BIN은 대조로서 폐쇄 강도와 결합 피팅에서 여전히 뚜렷한 우위를 유지합니다. 따라서 본문 주결론은 “더 강한 DM 기준선 + 렌즈 nuisance”를 도입해도 견고합니다.

본문 주비교와 직접 대조하기 쉽도록, 본문 Tab S1a–S1b는 EFT 계열과 DM_RAZOR의 엄격 대조 결과를 요약합니다. EFT 모델은 결합 피팅에서 DM_RAZOR 대비 ΔlogL_total≈1155–1337의 개선을 보이고, 폐쇄 검정에서 ΔlogL_closure=172–281에 도달합니다. P1A는 DM 측에 “더 어려운 대조군”을 제공할 뿐입니다. 그 기능은 “strawman baseline / systematics-as-physics”류의 의문점을 낮추는 것이며, 본문 주비교를 대체하는 것이 아닙니다.

표 B1|P1A scoreboard(클수록 좋음; 괄호 안은 DM_RAZOR baseline 대비 차이).

모델 분기(workspace)

Δk

RC-only best logL_RC (Δ)

폐쇄 강도 ΔlogL_closure (Δ)

Joint best logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

그림 B1|P1A scoreboard: 폐쇄 및 결합의 ΔlogL을 baseline 대비로 표시(클수록 좋음).

이 부록에 해당하는 이미 완료된 실행 태그 예시는 다음과 같습니다(P1A의 중간 산출물과 표·그림 위치 지정용).
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.


B.5 권장 인용 방식(Appendix citation note)

독자가 본문 주결론과 별도로 “DM 기준선 표준화 스트레스 테스트”를 인용해야 할 때는, 본문 주결론과 함께 다음 문구를 덧붙이는 것을 권합니다. ‘See Appendix B (P1A) for standardized DM baseline stress tests (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.’