P1_RC_GGL: 은하 동역학과 약한 중력렌즈의 엄격한 클로저 검정(회전곡선 + GGL)
EFT 평균 중력 프레임워크와 차가운 암흑물질(DM)의 최소 NFW 기준선 비교
원본 평가 보고서를 확인해 보세요:
1. ChatGPT: https://chatgpt.com/share/6a00cd62-6e34-83eb-b165-6ec09e3519cc
2. Gemini: https://gemini.google.com/share/773ec96d75a0
3. Grok: https://grok.com/share/bGVnYWN5LWNvcHk_c0b4fa65-0e86-4adb-9b58-5617d616dc04
4. Qwen: https://chat.qwen.ai/s/22ab9336-671f-420a-a7fa-43e24774bb2a?fev=0.2.46
5. DeepSeek: https://chat.deepseek.com/share/tj6k7hb5owtoldg2bm
0 실행 요약
이 보고서는 Zenodo에 기탁된 출판급 아카이브판이다. 데이터, 모델 장부, 공정 비교, 클로저 검정, 재현 가능성 자료를 포괄하는 통합적이고 감사 가능한 체인을 제공한다. 부록 B(P1A)는 견고성 보충 자료로서, “더 표준적인 DM 기준선 + 하나의 핵심 렌즈계 계통오차”를 사용한 스트레스 테스트에 초점을 맞추며, 더 현실적인 DM 모델링과 렌즈계 계통오차 처리에 대해 본문의 주요 결론이 얼마나 민감한지 평가한다.
핵심 결론(그대로 인용 가능한 네 문장; 2.4절 참조):
(1) 회전곡선(RC) 피팅에서 EFT 계열은 모든 커널/사전분포 조합 아래에서 DM_RAZOR를 유의하게 능가한다. 전형적인 개선폭은 Δlog𝓛_RC ≈ 10^3이다(표 S1a 참조).
(2) RC→GGL 클로저 검정에서 EFT는 더 강한 교차 탐침 이전 가능성을 보인다. 클로저 강도 Δlog𝓛_closure(True−Perm)는 DM_RAZOR보다 유의하게 높으며, 그 차이는 공분산 shrinkage, R_min, σ_int 스캔에 대해 견고하다(그림 S3 및 표 S1b 참조).
(3) 결합 피팅(RC+GGL)에서도 EFT는 안정적인 우위를 유지한다. 공유 매핑을 깨뜨리는 음성 대조에서는 이 우위가 붕괴하므로, “평균 중력 효과”가 우연한 피팅이 아니라 공유 매핑에서 나온다는 해석을 뒷받침한다(그림 S4 참조).
(4) 차원 수를 크게 늘리지 않고, 부록 B(P1A)는 더 표준적인 DM 기준선 모듈과 하나의 핵심 렌즈계 계통오차 nuisance로 DM 측을 스트레스 테스트한다. 이러한 보강은 EFT의 클로저 우위를 제거하지 못한다(표 B1 및 그림 B1 참조).
데이터 및 코드 제공: 보고서 Concept DOI 10.5281/zenodo.18526334; 전체 재현 패키지 Concept DOI 10.5281/zenodo.18526286. 부록 B(P1A)에 대응하는 태그는 run_tag=20260213_151233, closure_tag=20260213_161731, joint_tag=20260213_195428이다.
1 초록
본 연구는 동일한 데이터와 동일한 통계 프로토콜 아래에서 두 이론적 프레임워크를 재현 가능한 방식으로 정량 비교한다. 하나는 에너지 필라멘트 이론(Energy Filament Theory, EFT; 흔히 쓰이는 effective field theory의 약어와 구별됨)이 제안하는 “평균 중력 보정” 모델이고, 다른 하나는 차가운 암흑물질(DM)의 NFW 헤일로 기준선 모델(DM_RAZOR)이다. DM_RAZOR는 의도적으로 “최소 DM 기준선”으로 선택되었다. 즉, 고정된 c–M 관계를 갖고 헤일로 간 산란은 포함하지 않는 NFW 헤일로로서, 감사 가능하고 재현 가능한 대조군 역할을 한다. 또한 본 논문에서 EFT는 미시적 제1원리로부터 도출되는 것이 아니라, 통일된 통계 프로토콜 아래에서 검정하기 위한 현상론적·MOND 유사 유효장/유효응답 매개변수화로 취급된다는 점을 강조한다.
데이터는 균일하게 전처리되고 binning된 SPARC 회전곡선(RC)의 속도 데이터 2,295개(104개 은하, 20개 RC bin)와, KiDS-1000 은하–은하 약한 렌즈(GGL)의 초과 표면밀도 ΔΣ(R)(4개 항성질량 bin × 각 bin 15개 R 점, 총 60개 점, 전체 공분산 사용)로 구성된다.
우리는 순차적으로 RC-only 추론, RC→GGL 클로저 검정, GGL-only 추론, 결합 RC+GGL 추론을 수행하고, 일관성 감사를 통해 인용되는 모든 수치가 추적 가능함을 보장한다. 엄격한 매개변수 장부와 공유 매핑 제약(DM: 20개의 log M200_bin 매개변수; EFT: 20개의 log V0_bin 매개변수 + 1개의 전역 log ℓ) 아래에서, EFT 계열은 결합 피팅에서 DM_RAZOR를 크게 능가한다. 즉, DM_RAZOR 대비 ΔlogL_total = 1155–1337이다. 더 중요한 점은 클로저 검정이 RC posterior가 GGL에 대해 비자명한 예측력을 갖는다는 사실을 보여준다는 것이다. EFT의 클로저 강도는 ΔlogL_closure = 172–281로, DM_RAZOR의 127보다 높다. RC-bin→GGL-bin 그룹화를 무작위로 셔플하면 클로저 신호는 6–23으로 붕괴하며, 이는 해당 신호가 통계적 우연이나 구현상의 산물이 아님을 확인한다. σ_int, R_min, 공분산 shrinkage의 계통 스캔 전반에서 EFT의 상대적 우위는 양수로 유지되고 규모도 안정적이다. “DM 기준선이 너무 약하다”거나 “계통오차를 물리로 오인하고 있다”는 일반적 우려에 대응하기 위해, 부록 B(P1A)는 계층적 c–M 산란 + 사전분포, 1-매개변수 core proxy, 렌즈 m, 결합 DM_STD 모델을 포함하는, 더 표준적이면서도 여전히 저차원이고 감사 가능한 DM 기준선 스트레스 테스트를 제공한다. 같은 클로저 프로토콜 아래에서 이러한 보강은 EFT의 클로저 우위를 제거하지 못한다(표 B1/그림 B1 참조).
키워드: 회전곡선; 은하–은하 약한 렌즈; 클로저 검정; EFT; 차가운 암흑물질; 베이즈 추론
2 서론 및 결과 개관
회전곡선(RC)과 은하–은하 약한 렌즈(GGL)는 상보적인 두 종류의 중력 탐침이다. RC는 원반면에서의 동역학 퍼텐셜과 반지름 방향 가속도 관계(RAR)를 제약하고, GGL은 투영 질량분포와 헤일로 규모 중력응답을 측정한다. 어떤 후보 이론에서든 핵심 질문은 두 데이터셋을 따로따로 피팅할 수 있느냐가 아니라, 동일한 교차 데이터 매핑과 공유 제약 아래에서 둘을 일관되게 설명할 수 있느냐다.
따라서 본 논문은 “클로저 검정”을 핵심 통계 프로토콜로 삼는다. 먼저 RC-only posterior를 사용해 GGL을 전방 예측하고, 그 다음 RC-bin→GGL-bin 매핑을 치환/셔플한 음성 대조와 비교한다. 이를 통해 교차 데이터 예측 이전 가능성을 평가하고, 구현 편향이나 우연한 피팅이 만든 거짓 신호를 배제한다.
이론적 위치와 범위: 본 논문은 EFT(에너지 필라멘트 이론, Energy Filament Theory)의 미시적 제1원리 유도나 상대론적으로 완전한 정식화를 제시하려는 것이 아니다. 대신 EFT를 커널 f(x)와 전역 척도 ℓ로 기술되는 저차원·MOND 유사 유효장/유효응답 매개변수화로 다루며, 엄격한 매개변수 장부 아래에서 RC→GGL 클로저 검정을 통해 그 교차 데이터 일관성과 이전 예측력을 검정한다.
연구 프로그램과 범위 선언: 본 논문은 진행 중인 P-시리즈 관측 검색 프로그램의 일부다. 기존 은하 규모 데이터에서 우리는 두 종류의 가능한 유효 배경 기여를 찾는다. (i) 거칠게 평균화된 평균 중력 응답으로 기술될 수 있는 “평균 중력 플로어”, 그리고 (ii) 미시적 과정의 요동과 관련된 “확률적/노이즈 플로어”다. 본 논문(P1)에서는 전자에만 초점을 맞춘다. 미시적 생성 메커니즘에 대한 어떤 가설도 도입하지 않고, RC→GGL 클로저 검정으로 평균 중력 플로어의 관측적 징후를 검색하며, 통일된 대조 프로토콜 아래에서 감사 가능한 DM 기준선과 비교한다. 휴리스틱한 물리상으로 보자면, 단수명 자유도가 존재한다면 그 붕괴/쌍소멸은 정지질량을 다른 자유도가 운반하는 에너지-운동량으로 바꿀 수 있고, 유효 수준에서는 자연스럽게 “평균 기여 + 요동 기여”라는 분해에 대응할 수 있다. 그러나 본 논문은 그 미시적 그림을 정량적으로 모델링하지 않는다.
과잉 해석을 피하기 위해, 본 논문의 범위 경계는 다음과 같다.
• 본 논문이 하는 일: 엄격한 매개변수 장부와 공유 매핑 제약 아래에서 클로저 검정으로 교차 데이터 예측 이전 가능성을 측정하고, EFT 평균 중력 응답과 DM 기준선 사이의 재현 가능한 비교를 수행한다.
• 본 논문이 하지 않는 일: 미시적 생성 메커니즘, 존재량/수명, 우주론적 제약을 논의하지 않는다. “노이즈 플로어”에 대응하는 확률항도 모델링하지 않는다.
• 본 논문이 주장하지 않는 일: 암흑물질을 전복하는 것을 목표로 하지 않는다. P1은 “플로어”가 존재하는지에 대한 최종 판결을 내리지 않으며, 여기서 선택한 견고한 측정 영역 안에서는 평균 중력 응답을 포함하는 모델을 데이터가 선호한다는 단계적 증거를 보고한다.
동시에 우리는 DM_RAZOR가 최소적이고 감사 가능한 NFW 기준선(고정 c–M, 산란 없음; 단열 수축, feedback core, 비구면성, 환경항 없음)만을 대표한다는 점을 분명히 한다. 따라서 본문 주요 결론은 엄밀히 다음 명제로 제한된다. 최소 기준선과 엄격한 매개변수 장부/매핑 제약 아래에서 EFT는 더 강한 교차 데이터 일관성을 보인다. 더 표준적인 ΛCDM 기준선과 핵심 렌즈계 계통오차 모델링이 결론을 크게 바꾸는지라는 일반적 질문에 답하기 위해, 우리는 더 표준적이면서도 여전히 저차원이고 감사 가능한 DM 보강과 렌즈 측 nuisance를 부록 B(P1A: DM 기준선 표준화 스트레스 테스트)에 모았으며, 본문과 정확히 같은 공유 매핑 및 클로저 검정 프로토콜을 유지한다(표 B1/그림 B1 참조).
2.1 Tab S1a–S1b: 핵심 지표 요약(Strict)
표 S1a는 결합 피팅(RC+GGL)의 주요 비교 지표, 즉 logL, ΔlogL, AICc, BIC를 보고한다. 표 S1b는 클로저 검정과 견고성 스캔 지표, 즉 closure, 셔플 음성 대조, σ_int / R_min / cov-shrink 스캔 범위를 보고한다. 모든 값은 엄격한 마스터 요약표 Tab_Z1_master_summary에서 나온 것이며, 릴리스 아카이브 패키지 안에서 항목별로 추적할 수 있다.
표 S1a | 결합 피팅 주요 비교 지표(RC+GGL, Strict).
모델(workspace) | W 커널 | k | 결합 logL_total(best) | DM 대비 ΔlogL_total | AICc | BIC |
DM_RAZOR | none | 20 | -16927.763 | 0.0 | 33895.885 | 34010.811 |
EFT_BIN | none | 21 | -15590.552 | 1337.21 | 31223.501 | 31344.155 |
EFT_WEXP | exponential | 21 | -15668.83 | 1258.932 | 31380.057 | 31500.711 |
EFT_WYUK | yukawa | 21 | -15772.936 | 1154.827 | 31588.268 | 31708.922 |
EFT_WPOW | powerlaw_tail | 21 | -15633.321 | 1294.442 | 31309.038 | 31429.692 |
표 S1b | 클로저 및 견고성 지표(Strict).
모델(workspace) | 클로저 ΔlogL(true-perm) | 셔플 후 음성 대조 ΔlogL | σ_int 스캔 ΔlogL 범위 | R_min 스캔 ΔlogL 범위 | cov-shrink 스캔 ΔlogL 범위 |
DM_RAZOR | 126.678 | 22.725 | — | — | — |
EFT_BIN | 231.611 | 14.984 | 459–1548 | 1243–1289 | 1337–1351 |
EFT_WEXP | 171.977 | 6.04 | 408–1471 | 1169–1207 | 1259–1277 |
EFT_WYUK | 179.808 | 14.688 | 380–1341 | 1065–1099 | 1155–1166 |
EFT_WPOW | 280.513 | 6.672 | 457–1500 | 1203–1247 | 1294–1308 |
2.2 그림 S3: 클로저 강도(RC-only → 예측 GGL)
클로저 강도는 ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩로 정의된다. RC-only posterior 샘플에서 GGL을 전방 예측하고, RC-bin→GGL-bin 매핑을 치환한 음성 대조와 비교한다.

그림 S3 | 클로저 강도(클수록 좋음): RC-only → GGL 예측의 평균 로그우도 우위.
2.3 그림 S4: 주요 결합 피팅 비교(RC+GGL)
결합 피팅 우위는 ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR)로 정의된다. 동일한 데이터, 동일한 매핑, 거의 같은 매개변수 규모 아래에서 EFT 계열은 유의하게 더 높은 결합 로그우도를 달성한다.

그림 S4 | 결합 피팅 우위(클수록 좋음): DM_RAZOR 대비 RC+GGL의 best logL_total.
2.4 네 가지 결론(직접 인용 가능)
(1) SPARC 회전곡선과 KiDS-1000 약한 렌즈의 통일 결합 분석에서, EFT 평균 중력 프레임워크 모델은 엄격한 대조 프로토콜 아래 DM_RAZOR를 체계적으로 능가한다. 즉, DM_RAZOR 대비 ΔlogL_total = 1155–1337이다.
(2) RC→GGL 클로저 검정은 EFT의 예측 일관성이 더 강함을 보여준다. ΔlogL_closure = 172–281이며, DM_RAZOR는 127이다. RC-bin→GGL-bin 그룹화를 무작위로 셔플하면 클로저 신호가 6–23으로 붕괴하므로, 이 신호는 우연한 피팅이 아니라 올바른 교차 데이터 매핑에 의존함을 알 수 있다.
(3) σ_int, R_min, 공분산 shrinkage의 계통 스캔은 “EFT가 DM_RAZOR를 능가한다”는 부호와 규모를 바꾸지 않는다. 따라서 이 결론은 일반적인 계통적 교란에 대해 견고하다.
(4) 동일한 클로저 프로토콜 아래에서, 부록 B(P1A)는 DM 기준선을 “표준화되고 감사 가능한” 방식으로 강화한다. 세 개의 1-매개변수 보강(SCAT/AC/FB)을 유지하고, 계층적 c–M 산란 + 사전분포, 1-매개변수 core proxy, 렌즈 측 shear-calibration m(및 결합 DM_STD 모델)을 추가한다. 결과는 feedback/core 분기만이 클로저 강도에 작은 순개선(122.21→129.45, ΔΔlogL_closure≈+7.25)을 가져오고, 다른 보강은 클로저 강도에 무시할 만하거나 음의 기여를 함을 보여준다. 따라서 주요 결론은 DM_RAZOR가 지나치게 약한 기준선이라는 사실에 의존하지 않는다.
3 데이터와 전처리
본 연구는 두 개의 공개 데이터셋을 사용한다. 엔지니어링 워크플로 안에서 다운로드, 체크섬 검증(sha256), 전처리는 추적 가능한 스크립트로 완료된다. 모델 간 공정 비교를 보장하기 위해, 모든 workspace(EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR)는 정확히 동일한 데이터 산물과 bin 매핑을 공유한다.
3.1 회전곡선(RC, SPARC)
RC 데이터는 SPARC 데이터베이스의 Rotmod_LTG 파일(175개 rotmod 파일)에서 온다. 전처리 후 모델링 표본은 104개 은하와 2,295개의 (r, V_obs) 데이터점으로 이루어지며, 항성질량 및 관련 기준에 따라 20개의 RC bin으로 나뉜다. 각 데이터점은 반지름 r(kpc), 관측 속도 V_obs(km/s), 관측오차 σ_obs, 그리고 가스/원반/팽대부 성분 속도(V_gas, V_disk, V_bul)를 포함한다.
3.2 약한 렌즈(GGL, KiDS-1000 / Brouwer+2021)
GGL 데이터는 KiDS-1000에 기반한 Brouwer 등(2021) 그림 3의 초과 표면밀도 ΔΣ(R)(4개 항성질량 bin, 각 bin 15개 R 점)와 제공된 전체 공분산을 사용한다. 엔지니어링 워크플로에서는 원래의 long-form 공분산을 각 bin의 15×15 행렬로 재구성하고, Stage-B 감사에서 차원 및 수치의 타당성을 확인한다.
3.3 RC-bin → GGL-bin 매핑과 전체 표본 크기
4개의 GGL 질량 bin과 20개의 RC bin은 고정 매핑으로 연결된다. 각 GGL bin은 5개의 RC bin에 대응하며, RC-bin 기여는 은하 수로 가중평균된다. 이 매핑은 모든 모델에서 고정되며, 클로저 검정과 결합 피팅에서 공정 비교의 핵심 제약이다. 최종 결합 데이터셋은 n_total = 2355개 점(RC=2295, GGL=60)을 포함한다.
4 모델과 통계 방법
4.1 EFT와 DM의 최소 수학 사양(감사 가능/검정 가능)
이 절은 구현에 직접 대응하는 최소 수학 사양을 제시한다.
(a) 회전곡선(RC) 모델
각 RC 데이터점 (r, V_obs, σ_obs)에 대해 성분 중첩을 사용한다. V_mod²(r) = V_bar²(r) + V_extra²(r). 여기서 V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r)이다. 본 논문의 주요 결과는 Υ_d = Υ_b = 0.5를 채택한다. 이는 SPARC의 경험적 권고와 일치하며 불필요한 자유도를 줄이는 데에도 유용하다.
(b) EFT 평균 중력 보정(EFT)
EFT의 추가항은 “평균 속도 제곱” 형태로 매개변수화된다. V_extra²(r) = V0_bin² · f(r/ℓ). 여기서 V0_bin은 각 RC bin의 진폭 매개변수(20개), ℓ은 전역 척도(1개), f(x)는 무차원 커널 형상 함수다. 본 논문에서 비교하는 커널 형상(어느 것도 추가적인 연속 자유도를 도입하지 않음)은 다음과 같다.
- none: f(x)=x/(1+x)
- exponential: f(x)=1−exp(−x)
- yukawa: f(x)=1−exp(−x)·(1+0.5x)
- powerlaw_tail: f(x)=1−(1+x)^(−1/2)
- (선택 대조) gaussian: f(x)=erf(x/√2) (주요 결론 세트에는 포함하지 않음)
물리적 동기(확장): EFT는 은하 규모의 추가 중력 응답을, 더 미시적인 작용을 유한한 척도에서 거칠게 평균화/척도 평균화하여 얻은 유효응답으로 해석한다. 본 논문에서는 특정한 미시적 메커니즘을 가정하지 않는다. 대신 통일된 통계 프로토콜 아래에서 통제된 비교와 검정을 수행하기 위해 최소적이고 감사 가능한 매개변수화를 사용한다.
직관을 위해, 추가항은 가속도 형태로 쓸 수 있다. a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). r≫ℓ이면 f→1이고 V_extra→V0_bin이 되어, 바깥 영역에서 거의 평평한 추가 속도 기여를 만든다. r≪ℓ이고 f(x)≈x일 때는 특징적 가속도 척도 a0,bin≈V0_bin²/ℓ을 도입할 수 있으며(커널 함수의 O(1) 계수 차이를 제외), 안쪽에서 바깥쪽으로 넘어가는 전이 척도에 대해 MOND 유사 직관을 제공한다.
여기서 사용하는 이산 커널 계열(none/exponential/yukawa/powerlaw_tail)은 서로 다른 “초기 기울기 / 전이 속도 / 장거리 꼬리”에 대한 저차원 proxy로 볼 수 있다(예: Yukawa형 차폐 대 더 긴 꼬리를 가진 응답). 이는 모델 공간을 모두 소진하기 위한 것이 아니라 견고성 스트레스 테스트를 위한 것이다. 약한 렌즈 성분에서는 V_avg(r)에서 유효 외피 질량과 밀도를 구성한 뒤, 이를 투영하여 ΔΣ(R)을 얻는다. 이 유효 밀도는 구대칭성과 약한 장 매핑의 가정 아래에서 렌즈 퍼텐셜을 유효하게 기술한 것으로 이해해야 한다(전체 세부사항은 부록 A로 옮겼다).
위의 모든 커널 형상은 x→∞에서 f(x)→1(즉 V_extra²→V0² 포화)을 만족하며, x≪1에서는 선형 또는 준선형 성장을 준다. 예를 들어 exponential: f≈x; yukawa: f≈0.5x; powerlaw_tail: f≈0.5x이다. 따라서 서로 다른 커널 형상은 작은 반지름의 “초기 기울기”, 전이 속도, 바깥 꼬리에서 관측 가능한 차이를 가지며, 결합 RC+GGL 및 클로저 검정으로 구별될 수 있다.
약한 렌즈 ΔΣ(R)에 대한 EFT 예측은 V_avg(r)에서 외피 질량과 밀도를 추론한 뒤 다음 투영 적분을 적용하여 얻는다. M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr, ΔΣ(R)=Σ̄(<R)−Σ(R). 수치 구현은 로그 격자를 사용하며, 예외적인 경우 적응적으로 격자를 세분화하여 안정성과 재현성을 보장한다.
(c) DM_RAZOR: NFW 차가운 암흑물질 헤일로 기준선
동시에 우리는 DM_RAZOR가 최소적이고 감사 가능한 NFW 기준선(고정 c–M, 산란 없음; 단열 수축, feedback core, 비구면성, 환경항 없음)만을 대표한다는 점을 분명히 한다. “허수아비 기준선” 위험을 줄이기 위해, 본 논문은 그러한 효과가 존재하지 않는다고 주장하지 않는다. 대신 부록 B(P1A)에서 계층적 c–M 산란 처리, core proxy, 렌즈 측 shear-calibration nuisance를 포함하는 저차원·감사 가능 스트레스 테스트로 그것들을 반영한다.
4.2 모델 장부와 공정 비교(공유 매개변수 = 클로저의 정의)
주요 비교 세트의 매개변수 수는 DM_RAZOR k=20, EFT 계열 k=21(추가 매개변수는 전역 log ℓ)이다. 모든 모델은 같은 RC 데이터, 같은 GGL 데이터와 공분산, 같은 RC-bin→GGL-bin 매핑, 같은 바리온 항, 같은 단위 변환을 공유한다. 또한 커널 형상(none / exponential / yukawa / powerlaw_tail)은 이산 선택이며 추가 연속 매개변수를 도입하지 않으므로, “자유도 하나 추가”로 인한 우위를 방지한다.
4.3 우도, 사전분포, 샘플러
RC 우도는 대각 가우시안이다. σ_eff² = σ_obs² + σ_int². 주요 결과는 σ_int=5 km/s로 고정하고, Run-5에서 σ_int를 스캔한다. GGL 우도는 각 bin에 대해 전체 공분산 가우시안을 사용한다. logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). 결합 목적함수는 logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ)이다. 사전분포는 주로 물리적으로 가능한 경계(log ℓ, log V0, log M200의 구간 제약)를 부호화한다. 자유 Υ와 σ_int를 활성화할 때는 약정보 사전분포를 사용한다(자세한 내용은 구현 및 릴리스 패키지 설정 참조).
샘플러는 적응형 블록 Metropolis 랜덤 워크를 사용한다. 각 단계에서는 고차원에서의 수용률을 개선하기 위해 매개변수 공간의 무작위 하위 블록만 업데이트하며, 단계 크기는 창별 수용률에 따라 가볍게 적응된다(목표 수용률 약 0.25). 주요 결과는 quick mode(n_steps=800 등의 설정)를 사용하며, 각 workspace는 수동 및 스크립트 감사용 trace, residual, PPC plot을 출력한다.
4.4 클로저 검정과 음성 대조(정의)
클로저 검정(Run-2)은 RC-only posterior가 GGL을 재피팅하지 않고 예측할 수 있는지를 시험한다. 구체적으로 RC-only posterior 샘플에서 4개의 GGL bin에 대해 ΔΣ(R)을 전방 생성하고 전체 공분산으로 logL_true를 계산한다. 그런 다음 RC-bin→GGL-bin 그룹 매핑을 무작위 치환해 logL_perm을 얻는다. 클로저 강도는 ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩로 정의된다. 추가로 Run-10은 20개 RC bin을 4×5로 무작위 재그룹화(shuffle)한 뒤 클로저를 다시 계산하여, 클로저 신호가 올바른 매핑에 얼마나 강하게 의존하는지 시험한다.
5 주요 결과와 해석
5.1 주요 결합 피팅 결과(RC+GGL)
결합 피팅에서 얻은 best logL_total과 상대 우위 ΔlogL_total(DM_RAZOR 대비)은 표 S1a와 그림 S4에 제시되어 있다. 주요 비교 세트에서 EFT_BIN은 가장 큰 결합 우위(ΔlogL_total=1337.210)를 보이며, 다른 EFT 커널 형상들도 유의한 우위(1154.827–1294.442)를 유지한다. 정보 기준(AICc/BIC)에서도 EFT 계열은 DM_RAZOR를 크게 능가하므로, 이 우위가 매개변수 수 편향 때문이 아님을 보여준다.
주: ΔlogL_total≈1337에 대한 주된 기여는 RC 항에서 온다(결합 분해에서 ΔlogL_RC≈1065, 약 80%). 이는 N=2295개의 RC 데이터점 전체에 걸쳐 점당 약 Δχ²≈0.90의 완만한 개선으로 이해할 수 있으며, 대각 가우시안 우도 아래에서 자연스럽게 10^3 규모의 우위로 누적된다. 동시에 GGL과 클로저 검정은 독립적인 교차 데이터셋 제약을 제공하고, 순위는 σ_int, R_min, cov-shrink 스트레스 테스트 아래에서도 안정적으로 유지된다(6절 및 표 S1b 참조).
5.2 클로저 검정 결과(RC-only → GGL)
핵심 클로저 검정량 ΔlogL_closure는 표 S1b와 그림 S3에 보고되어 있다. EFT 계열의 클로저 강도는 171.977–280.513으로, DM_RAZOR의 126.678보다 높다. 이는 추가적인 교차 데이터 자유도를 허용하지 않아도, EFT가 RC 데이터에서 얻은 posterior 샘플이 GGL 데이터에 대해 더 강한 이전 가능한 예측력을 갖는다는 뜻이다.
음성 대조는 클로저 신호의 물리적 관련성을 더 뒷받침한다. RC-bin→GGL-bin 그룹화가 무작위로 셔플되면 EFT의 클로저 강도는 6–15로 떨어진다(커널 간 작은 차이만 있음). 반면 기준 클로저 강도는 172–281에 이른다. 이 “신호 붕괴”는 수치 구현, 단위 오류, 부적절한 공분산 처리에서 비롯된 거짓 우위를 배제한다.

그림 R1 | 음성 대조: 셔플 그룹화 후 클로저 신호가 크게 하락한다(Tab_Z1 지표에서 그림).
5.3 결과의 의미와 한계
본 연구의 결론은 “이 데이터셋과 이 프로토콜 아래에서 EFT 평균 중력 보정이 검정된 DM_RAZOR 기준선을 능가한다”는 것이다. DM 측은 core 형성, 비구면성, 환경항 또는 더 복잡한 은하–헤일로 연결 모델 없이, 고정 c(M) 관계를 갖는 최소 NFW 기준선만을 사용한다는 점을 강조해야 한다. 따라서 본 원고는 모든 DM 모델 계열을 배제한다고 주장하지 않는다. 대신 RC와 GGL이 동일한 교차 데이터 매개변수와 매핑으로 일관되게 설명될 수 있는지 평가하기 위한, 재현 가능하고 클로저 검정 중심의 대조 기준선을 제공한다.
이 일반적 우려에 대응하기 위해, 우리는 독립 확장 프로젝트 P1A(부록 B 참조)를 완료했다. RC-bin→GGL-bin 공유 매핑이나 감사 프레임워크를 바꾸지 않고, P1A는 DM 기준선을 “표준화되고 감사 가능한” 방식으로 강화한다. 세 가지 1-매개변수 보강(SCAT/AC/FB)을 넘어, (i) 계층적 c–M 산란 + 질량–농도 사전분포(DM_HIER_CMSCAT), (ii) 1-매개변수 바리온 feedback core proxy(DM_CORE1P), (iii) 약한 렌즈 측 shear-calibration nuisance m(DM_RAZOR_M)을 추가하고, 결합 모델 DM_STD를 보고한다. EFT_BIN은 대조 참조로 유지된다.
• DM_RAZOR_SCAT(c–M 산란) — 헤일로 간 농도 산란 매개변수 σ_logc를 도입하여, 고정 c(M)가 DM의 설명력을 체계적으로 과소평가하는지 시험한다.
• DM_RAZOR_AC(단열 수축) — 단일 매개변수 α_AC를 사용하여 “수축 없음”과 “표준 수축” 사이를 연속적으로 보간하고, 바리온이 내부 헤일로를 수축시키려는 경향을 최소 비용으로 포착한다.
• DM_RAZOR_FB(Feedback/core) — core 척도(예: log r_core)를 사용하여 내부 core 형성이 회전곡선을 어떻게 억제하는지 기술하면서, 약한 렌즈 규모에서는 NFW 근사를 유지한다.
정량적 P1A scoreboard는 부록 B의 표 B1 / 그림 B1에 제공되어 있다(Tab_S1_P1A_scoreboard에서 자동 생성). 클로저 지표에서 DM_RAZOR_FB는 작은 순개선(122.21→129.45, +7.25)을 보이는 반면, 다른 보강은 클로저 강도에 무시할 만하거나 음의 기여를 한다. 결합 피팅 측에서는 계층적 c–M 산란 사전분포(DM_HIER_CMSCAT)나 결합 모델(DM_STD)을 추가하면 joint logL을 크게 개선할 수 있지만, 클로저 강도는 개선하지 못한다. 이는 그 개선이 주로 교차 탐침 이전 가능성보다 결합 피팅 유연성에서 나온다는 점을 시사한다. 따라서 본문의 핵심 결론은 다음과 같이 읽어야 한다. 엄격한 공유 매핑과 클로저 검정 제약 아래에서, EFT의 교차 데이터 일관성 우위는 DM 측에 “지나치게 약한 기준선”을 선택했기 때문에 생긴 것이 아니다. 부록 B에 대응하는 P1A 릴리스 패키지(보충 표/그림 및 full_fit_runpack)는 본 논문의 full_fit_runpack과 동일한 Zenodo Concept DOI 아래 추가 파일로 포함될 예정이다: https://doi.org/10.5281/zenodo.18526286.
6 견고성 및 대조 실험
6.1 σ_int 스캔(Run-5)
우리는 RC의 내재 산란 σ_int를 체계적으로 스캔하고 각 σ_int에서 결합 추론을 반복하여, DM_RAZOR 대비 ΔlogL_total을 계산한다. 스캔 범위 전체에서 각 모델의 최소/최대 ΔlogL_total 값은 표 S1b에 보고되어 있다.

그림 R2 | σ_int 스캔 아래 ΔlogL_total의 범위(클수록 좋음).
6.2 R_min 스캔(Run-6)
중심부 데이터의 계통오차(비원형 운동, 분해능, 불충분한 바리온 모델링 등)가 미치는 영향을 시험하기 위해, RC에 R_min 임계값 절단을 적용하고 결합 추론을 반복한다. EFT 계열의 우위는 R_min 스캔 아래에서도 양수이며 규모도 안정적이다.

그림 R3 | R_min 스캔 아래 ΔlogL_total의 범위(클수록 좋음).
6.3 cov-shrink 스캔(Run-7)
GGL 공분산의 불확실성을 시험하기 위해, 각 질량 bin의 공분산 행렬에 shrinkage를 적용한다. C_α=(1−α)C+α·diag(C), 그리고 α를 스캔한다. 결과는 EFT 계열의 우위가 이 처리에 민감하지 않음을 보여준다.

그림 R4 | cov-shrink 스캔 아래 ΔlogL_total의 범위(클수록 좋음).
6.4 Ablation ladder(Run-8)
EFT_BIN 안에서 우리는 중첩 ablation을 수행한다. 자유 매개변수가 없는 최소 모델에서 시작하여, 소수의 자유도만 유지하는 버전을 거쳐, 최종적으로 완전한 20-bin 진폭 + 전역 척도 모델에 이른다. AICc/BIC는 완전한 EFT_BIN 모델이 데이터에 의해 강하게 요구됨을 보여준다.

그림 R5 | EFT_BIN ablation ladder(AICc; 낮을수록 좋음).
6.5 Holdout 예측(Run-9)
우리는 추가로 leave-one-bin-out(LOO) 검정을 수행한다. 4개의 GGL 질량 bin 중 매번 하나의 bin을 holdout하고, 나머지 bin(및 모든 RC)을 사용해 추론을 다시 수행한 뒤, holdout된 bin에서 test log-likelihood를 평가한다. 요약 지표는 보충 표 Tab_R3_leave_one_bin_out(Run-9 산물; 파일 경로 패턴은 8.2절의 핵심 산물 목록에 제시됨)에 제공된다. EFT 계열은 가장 불리한 holdout 사례에서도 DM_RAZOR보다 명확히 우월하다.

그림 R6 | LOO: holdout된 bin의 log-likelihood 분포(Run-9 산물에서).
6.6 음성 대조: RC-bin 셔플(Run-10)
Run-10은 RC-only posterior를 그대로 유지한 채 20개 RC bin을 4×5로 무작위 재그룹화하고 클로저를 다시 계산한다. 결과는 원래 매핑과 비교했을 때 셔플이 클로저 평균 logL_true와 ΔlogL_closure를 모두 크게 낮춘다는 것을 보여주며(표 S1b 및 그림 R1 참조), 클로저 신호의 해석 가능성을 추가로 지지한다.

그림 R7 | 음성 대조: 셔플 매핑은 클로저 평균 logL_true를 뚜렷하게 낮춘다(Run-10 산물에서).
7 추적 가능성 및 일관성 감사(Provenance)
본 논문에서 인용되는 모든 수치값은 릴리스 아카이브의 엄격한 요약표와 감사 기록에서 항목별로 추적할 수 있다. 본문을 더 읽기 쉽게 유지하기 위해, 전체 provenance 체인(태그 목록, 감사표, 체크섬 목록, 검증 방법)은 부록 A로 옮겼다.
8 재현 가능성 및 Zenodo 아카이브
데이터 및 코드 제공 선언: 본 논문에서 사용한 SPARC 회전곡선 데이터와 KiDS-1000 약한 렌즈 데이터는 공개 데이터셋이다. 출판급 보고서는 Zenodo에 보관되었고(Concept DOI: https://doi.org/10.5281/zenodo.18526334), 전체 재현 패키지도 Zenodo에 보관되었다(Concept DOI: https://doi.org/10.5281/zenodo.18526286). 상세한 실행 절차, 의존성 환경, 아카이브 목록, 해시 검증 정보는 부록 A에 제공되며, DM 기준선 표준화 스트레스 테스트(P1A)의 설계, run tag, 출력은 부록 B에 제공된다.
동일한 전체 재현 패키지 Concept DOI(https://doi.org/10.5281/zenodo.18526286) 아래, 사용 사례별로 두 개의 재현 가능한 진입점을 제공한다. • P1(본문) full_fit_runpack: EFT vs DM_RAZOR에 대한 RC-only / closure / joint 분석과 견고성 스캔을 재현하고, 표 S1a/S1b 및 그림 S3/S4를 포함한 본문 산물을 생성한다. • P1A(부록 B) full_fit_runpack: DM 기준선 표준화 스트레스 테스트(SCAT/AC/FB + 계층적 c–M 산란 사전분포 + core1p + lensing m + DM_STD, EFT_BIN 대조 포함)를 재현하고, 부록 표 B1 및 그림 B1을 생성한다. P1A의 보충 표/그림과 full_fit_runpack은 단일 아카이브 진입점을 유지하기 위해 동일한 Concept DOI 아래 추가 파일로 포함될 예정이다.
9 감사의 말 및 선언
9.1 감사의 말
공개 데이터와 문서를 제공한 SPARC 및 KiDS-1000 팀, 그리고 본 프로젝트의 재구성 및 감사 워크플로 참여자들에게 감사드린다.
9.2 저자 기여
Guanglin Tu는 개념 제안, 연구 설계, 엔지니어링 구현, 데이터 큐레이션, 형식 분석, 재현 가능성 워크플로 구현 및 감사, 원고 작성을 담당했다.
9.3 연구비
저자 Guanglin Tu의 자체 연구비로 수행됨(외부 연구비 없음 / 과제 번호 없음).
9.4 이해상충
저자 Guanglin Tu는 “EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd. (China)”에 소속되어 있으며, 그 밖의 이해상충은 선언하지 않는다.
9.5 AI 지원
OpenAI GPT-5.2 Pro와 Gemini 3 Pro는 언어 다듬기, 구조 편집, 재현 가능성 워크플로 정리에 사용되었다. 이 도구들은 데이터, 결과, 그림, 표, 코드의 생성 또는 수정, 그리고 인용 생성에는 사용되지 않았다. 저자는 원고 전체의 내용과 인용 정확성에 대해 전적인 책임을 진다.
10 참고문헌
- Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.
- Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.
- Wright, C. O., & Brainerd, T. G. (2000). Gravitational Lensing by Navarro–Frenk–White Halos. The Astrophysical Journal, 534, 34–40.
- Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493. DOI: https://doi.org/10.1086/304888
- Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374. DOI: https://doi.org/10.1093/mnras/stu742
- Blumenthal, G. R., Faber, S. M., Flores, R., & Primack, J. R. (1986). Contraction of dark matter galactic halos due to baryonic infall. Astrophysical Journal, 301, 27. DOI: https://doi.org/10.1086/163867
- Di Cintio, A., Brook, C. B., Dutton, A. A., et al. (2014). A mass-dependent density profile for dark matter haloes including the influence of galaxy formation. Monthly Notices of the Royal Astronomical Society, 441, 2986–2995. DOI: https://doi.org/10.1093/mnras/stu729
- Read, J. I., Agertz, O., & Collins, M. L. M. (2016). Dark matter cores all the way down. Monthly Notices of the Royal Astronomical Society, 459, 2573–2590. DOI: https://doi.org/10.1093/mnras/stw713
- 에너지 필라멘트 이론(Energy Filament Theory). Zenodo(open science repository) DOI: https://doi.org/10.5281/zenodo.18517411
부록 A: 추적 가능성 및 재현 가능성 세부사항
이 부록은 run tag, 감사 결과, 아카이브 목록, 핵심 검증 지점을 포함하여 추적 가능성과 재현 가능성을 위한 장기 아카이브 정보를 요약함으로써, 독자가 필요에 따라 본 연구를 확인하고 재현할 수 있게 한다.
A.1 추적 가능성 및 감사 세부사항
장기 추적 가능성을 보장하기 위해, 본 프로젝트는 각 run과 출력에 타임스탬프가 붙은 태그를 사용하고, 과거 산물을 덮어쓰지 않고 보존한다. 본 원고에서 인용되는 핵심 값은 엄격 컴파일(compile_tag=20260205_035929)에서 온 것이며, 다음 일관성 감사를 통과했다.
• 모든 stage-level 표는 run_tag와 stage tag를 가지며, 엄격 컴파일 스크립트는 report/tables에서 “완전하고 일관된” canonical 표 원천을 선택한다.
• Tab_Z1_master_summary와 Tab_Z2_conclusion_highlights의 값은 선택된 canonical 표와 항목별로 비교된다.
• PDF 생성 중에는 “참조된 표/그림 태그”에 대해 태그 감사를 수행하여, 오래된 산물이 섞이지 않도록 보장한다.
핵심 태그(모든 중간 산물을 찾기 위함): run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442.
일관성 감사 결과: Tab_AUDIT_checks_strict는 pass=9, fail=0, skip=0을 보고한다(자세한 내용은 릴리스 패키지 참조).
A.2 재현 실행 절차와 아카이브 목록
본 연구는 “출판급 보고서 + 표/그림 보충자료 + 완전히 재실행 가능한 run package”로 이루어진 재현성 시스템을 채택한다. 독자는 Tables & Figures Supplement를 직접 참고하여 논문에서 인용된 모든 표/그림 산물을 검증할 수 있다. 수치값과 감사 체인을 처음부터 재현하려면 full_fit_runpack을 사용하여 데이터를 다운로드하고 전체 워크플로를 다시 실행할 수 있다. 완료 후에는 패키지에 내장된 reference-table comparison script를 사용해 표 값의 일관성을 검증할 수 있다.
A.2.1 재현 quickstart(RUN_FULL, Windows PowerShell)
이 절은 더 짧은 재현 경로(Windows PowerShell)를 제시한다. 빠른 점검의 경우, 독자는 Tables & Figures Supplement를 직접 참고하고 인용된 표와 그림을 항목별로 검증하는 것이 권장된다. end-to-end 재현 및 모든 표, 그림, 감사 산물 생성을 위해서는 full_fit_runpack을 사용한다. 패키지의 README/ONE_PAGE_REPRO_CHECKLIST에 따라 verify_checksums.ps1과 RUN_FULL.ps1을 실행한다(Mode=full 권장).
Zenodo 아카이브 항목(Concept DOI): https://doi.org/10.5281/zenodo.18526286.
본 논문의 main-chain tags: run_tag=20260204_122515; strict compile_tag=20260205_035929; release_tag=20260205_112442.
A.2.2 아카이브 자료와 핵심 검증 지점(Packages & checks)
Zenodo 아카이브는 세 가지 상보적인 자료 범주를 제공한다. (1) 출판급 보고서(본 논문 v1.1; 부록 B: P1A DM 기준선 표준화 스트레스 테스트 포함); (2) Tables & Figures Supplement(본 논문에서 인용된 모든 표/그림 산물을 포괄하는 보충 표와 그림으로, P1과 P1A에 각각 대응); (3) full_fit_runpack(전체 재현 패키지: 데이터를 처음부터 다운로드하고 전체 워크플로를 다시 실행하며, P1과 P1A에 각각 대응). 항목 (1)–(2)는 빠른 독해와 독립 검증을 지원하고, 항목 (3)은 end-to-end 전체 재현성을 제공한다.
자료 범주 | 파일명(예시) | 목적과 위치(권장 사용 순서) |
출판급 보고서(중국어 및 영어) | P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf | P1_RC_GGL_report_CN_PUBLICATION_V1_1.pdf | Zenodo에 아카이브된 완전 보고서. 본문은 핵심 결론과 견고성 감사를 제공하고, 부록 B는 P1A(DM 기준선 표준화 스트레스 테스트)를 제공한다. |
Tables & Figures Supplement (P1) | P1_RC_GGL_supplement_figs_tables_V1_1.zip | 본문에서 인용된 모든 표(CSV)와 그림(PNG)으로, 생성 스크립트와 태그 파일을 포함한다. |
Tables & Figures Supplement (P1A) | P1A_supplement_figs_tables_v1.zip | 부록 B(P1A)에서 인용된 모든 표와 그림으로, Tab_S1_P1A_scoreboard 및 Fig_S1_P1A_scoreboard를 포함한다. |
full_fit_runpack (P1) | P1_RC_GGL_full_fit_runpack_v1_1.zip | End-to-end 전체 재현: 데이터를 처음부터 다운로드하고 RC-only/closure/joint 및 견고성 스캔을 다시 실행한다. |
full_fit_runpack (P1A) | P1A_RC_GGL_full_fit_runpack_v1.zip | End-to-end 전체 재현(부록 B): DM 7+1 + DM_STD(EFT_BIN 대조 포함)를 다시 실행하고 부록 산물을 생성한다. 패키지에는 표 값 일관성을 검증하는 reference-table comparison script가 포함된다. |
인용 권고: 본 논문 또는 동반 재현 가능성 자료를 인용할 때는 Zenodo Concept DOI(https://doi.org/10.5281/zenodo.18526334)를 인용하기 바란다.
재현 후 나타나야 하고 비교 가능해야 하는 핵심 산물은 다음과 같다.
- report/tables/Tab_D_closure_summary__20260204_122515__*.csv (클로저 요약)
- report/tables/Tab_F_joint_summary__20260204_122515__*.csv (결합 피팅 요약)
- report/tables/Tab_G_joint_sigma_sweep__20260204_122515__*.csv (σ_int 스캔)
- report/tables/Tab_H_joint_rmin_sweep__20260204_122515__*.csv (R_min 스캔)
- report/tables/Tab_I_joint_covshrink_sweep__20260204_122515__*.csv (cov-shrink 스캔)
- report/tables/Tab_R2_ablation_ladder__20260204_122515__*.csv (ablation)
- report/tables/Tab_R3_leave_one_bin_out__20260204_122515__*.csv (LOO)
- report/tables/Tab_R4_negctrl_rcbin_shuffle__20260204_122515__*.csv (음성 대조)
- report/final/Tab_Z1_master_summary__20260204_122515__20260205_035929.csv (Strict master table; 표 S1a/S1b 및 본문 값에 대응)
- report/final/P1_RC_GGL_final_bundle__20260204_122515__20260205_035929.pdf (출판급 PDF bundle; 빠른 열람과 인용에 사용 가능)
부록 B: P1A—DM 기준선 표준화 스트레스 테스트(DM 7+1 + DM_STD; EFT 대조 포함)
이 부록은 본문 클로저 프로토콜과 일관되는 “DM 기준선 표준화 스트레스 테스트” 확장 프로젝트(P1A)를 기록한다. 그 역할은 본문에서 사용한 최소 DM_RAZOR 기준선(NFW + 고정 c–M, 산란 없음 / 수축 없음 / core 없음)을, 천체물리 실무에 더 가깝고 일반적인 비판에 더 잘 견디는 DM 기준선 세트로 업그레이드하는 것이다. 다만 많은 자유도를 도입하지 않고, RC-bin→GGL-bin 공유 매핑이나 감사 프레임워크도 변경하지 않는다. P1A는 이전의 세 분기 스트레스 테스트를 포함하며 그 상위 집합이다. 즉, SCAT/AC/FB를 유지하면서 계층적 c–M 산란 + 사전분포, 1-매개변수 core proxy, 렌즈 측 shear-calibration nuisance m을 추가하고, 결합 모델 DM_STD도 제공한다. EFT_BIN은 대조 참조로 유지된다.
보충 주: 부록 B(P1A)의 클로저 강도와 관련 값은 전체 EFT 커널 계열을 포괄하기 위해 본문에서 사용한 quick budget(예: ndraw=60, nperm=12)보다 더 큰 Monte Carlo budget(예: ndraw=400, nperm=24)을 사용한다. 따라서 절대값에는 O(10) 수준의 샘플링 드리프트가 나타날 수 있다. 그러나 같은 budget/표 안에서의 모델 간 비교는 공정하며, 우위의 부호와 규모는 budget을 넘어도 안정적이다.
B.1 목적과 위치(왜 P1A이며, 왜 부록인가)
P1A는 비구면성, 환경 의존성, 복잡한 은하–헤일로 연결, 고차원 바리온 물리 등 가능한 모든 ΛCDM 헤일로 모델링 선택지를 소진하려 하지 않는다. 대신 P1A는 “저차원, 감사 가능, 재현 가능” 원칙을 따른다. 각 보강 모듈은 ≤1개의 핵심 유효 매개변수만 도입하며, 본 논문의 세 가지 강한 제약을 받는다.
(i) 매개변수 장부: 모든 새 매개변수는 명시적으로 기록되고 정보 기준(AICc/BIC)과 함께 보고되어야 한다.
(ii) 공유 매핑: 같은 RC-bin→GGL-bin 그룹화 맵을 계속 사용한다. 단일 데이터셋에 대해 따로 “매핑을 조정”하는 것은 허용되지 않는다.
(iii) 클로저 검정: 어떤 보강도 단순히 RC-only 피팅을 개선하는 것에 그치지 않고, RC→GGL 이전 예측에서 진정한 이득을 보여야 한다.
B.2 DM 7+1 + DM_STD: 모듈 정의, 매개변수, 결합 posterior로의 진입
독립 runpack으로서 P1A는 8개의 DM workspace(DM 7+1)와 1개의 EFT 대조를 제공한다. DM_RAZOR를 기준선으로 하여, 세 개의 legacy 1-매개변수 보강(DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB)을 구성하고, 세 개의 더 표준적인 방어 모듈(DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M)을 추가한 다음, 결합 모델 DM_STD를 제공한다. 이 모듈들의 공유 목표는 차원 증가를 가능한 한 작게 유지하면서 가장 흔한 세 가지 비판을 포괄하는 것이다. (a) c–M 산란과 사전분포가 계층 모델에 어떻게 들어가는가, (b) 바리온 feedback의 주요 효과를 1-매개변수 core proxy로 포착할 수 있는가, (c) 핵심 렌즈 측 계통오차가 물리 신호로 오인될 수 있는가.
Workspace | dm_model | 새 매개변수(≤1) | 물리적 동기(핵심) | 구현 원칙(감사 친화성) |
|---|---|---|---|---|
DM_RAZOR | NFW (고정 c–M, 산란 없음) | — | 최소적이고 감사 가능한 ΛCDM 헤일로 기준선. EFT와의 엄격 비교에 사용 | 공유 매핑 고정; 엄격한 매개변수 장부; 상대 비교 기준선으로만 사용 |
DM_RAZOR_SCAT | NFW + c–M 산란(legacy) | σ_logc | c–M 관계에는 산란이 있다. 1-매개변수 log-normal 산란으로 근사 | ≤1 새 매개변수; 공유 매핑 유지; 클로저 이득을 수용 기준으로 사용 |
DM_RAZOR_AC | NFW + 단열 수축(legacy) | α_AC | 바리온 유입은 헤일로 단열 수축을 유도할 수 있다. 1-매개변수 강도로 근사 | ≤1 새 매개변수; 매핑 불변; AICc/BIC 변화와 클로저 이득 보고 |
DM_RAZOR_FB | NFW + feedback core(legacy) | log r_core | feedback은 내부 영역에 core를 형성할 수 있다. 1-매개변수 core 척도로 근사 | ≤1 새 매개변수; 동일한 closure/negative-control protocol; RC-only 개선만을 목표로 하지 않음 |
DM_HIER_CMSCAT | 계층적 c–M 산란 + 사전분포 | σ_logc (hier) | 더 표준적인 계층 구조 c_i∼logN(c(M_i),σ_logc). RC와 GGL 양쪽의 joint posterior에 영향을 줌 | 명시적 사전분포; 잠재 c_i 주변화; 여전히 저차원이고 감사 가능 |
DM_CORE1P | 1-매개변수 core proxy(coreNFW/DC14-inspired) | log r_core | 바리온 feedback의 주요 효과에 대한 1-매개변수 core proxy를 사용하여 고차원 별형성 세부사항을 피함 | 표준 문헌 인용; ≤1 새 매개변수; 클로저 검정에 연결 |
DM_RAZOR_M | NFW + 렌즈 shear-calibration nuisance | m_shear (GGL) | 핵심 약한 렌즈 계통오차를 유효 매개변수로 흡수하여 계통오차를 물리로 오인할 위험을 줄임 | nuisance 명시 기록; RC에 역방향 영향 불가; 결과는 주로 클로저 견고성으로 판단 |
DM_STD | 표준화된 DM 기준선(HIER_CMSCAT + CORE1P + m) | σ_logc + log r_core (+ m_shear) | 가장 흔한 세 종류의 비판을 여전히 저차원인 표준 기준선에 포함 | 매개변수 장부 + 정보 기준 보고; 클로저를 주요 지표로 사용; 가장 강한 DM 방어 대조군으로 사용 |
주: 위의 매개변수 이름은 엔지니어링 구현을 따른다(예: σ_logc, α_AC, log r_core, m_shear). P1A의 설계 초점은 “DM 기준선을 다소 강화하되 감사 가능성을 유지하는 것”이지, DM 측을 제어 불가능한 고차원 fitter로 바꾸는 것이 아니다. 특히 DM_HIER_CMSCAT은 c–M 산란을 계층적으로 도입한다. 각 헤일로의 농도 c_i는 c(M_i) 주변의 log-normal 산란을 부여받고, 전역 σ_logc와 c(M) 사전분포로 제약된다. 이 계층 구조는 RC와 GGL 양쪽의 결합 posterior에 영향을 준다.
B.3 본문과 일관되는 통계 프로토콜 및 산물 규약
P1A는 본문의 모든 데이터 산물, 공유 매핑, 감사 프레임워크를 재사용한다. 실행 순서와 산물 규약은 일관되게 유지된다.
(1) Run‑1: RC-only 추론(posterior_samples.npz와 metrics.json 출력).
(2) Run‑2: RC→GGL 클로저 검정(closure_summary.json과 치환 기준선 출력).
(3) Run‑3: RC+GGL 결합 피팅(joint_summary.json 출력).
인용되는 모든 수치는 자동 컴파일 표(Tab_S1_P1A_scoreboard)에서 나오며, P1A full_fit_runpack에 내장된 reference-table comparison script를 사용하여 전체 P1A 워크플로를 다시 실행한 뒤 확인할 수 있다.
B.4 주요 결과, 표/그림 진입점, 아카이브 계획(동일 DOI)
이 절은 P1A의 핵심 정량 결론을 제시한다. 표 B1은 RC-only, RC→GGL 클로저, RC+GGL 결합 피팅의 핵심 지표를 요약한다(괄호 안은 DM_RAZOR 기준선 대비 차이). 클로저 강도는 ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩(클수록 좋음)으로 정의된다. 그림 B1은 같은 scoreboard를 시각화한다. 핵심은 다음과 같다.
• 세 legacy 분기 중 DM_RAZOR_FB(feedback/core)만이 클로저 강도에 작은 순개선을 준다: 122.21→129.45(+7.25). SCAT와 AC는 순개선을 제공하지 않는다.
• 새로 추가한 DM_HIER_CMSCAT과 DM_RAZOR_M은 클로저 강도에 매우 작은 효과(~0)만 가지며, DM_CORE1P 역시 유의한 순개선을 보이지 않는다.
• 결합 모델 DM_STD는 joint logL을 크게 개선할 수 있지만(결합 피팅 최적값에 가까워짐), 클로저 강도는 감소한다. 이는 그 이득이 주로 교차 탐침 이전 가능성이 아니라 결합 피팅 유연성에서 온다는 점을 시사한다.
• 대조군으로서 EFT_BIN은 클로저 강도와 결합 피팅 모두에서 명확한 우위를 유지한다. 따라서 주요 결론은 “더 강한 DM 기준선 + 렌즈 nuisance”의 도입에 대해서도 견고하다.
본문 결과와 직접 비교하기 위해, 표 S1a–S1b는 EFT 계열과 DM_RAZOR의 엄격 비교를 요약한다. EFT 모델은 DM_RAZOR 대비 결합 피팅을 ΔlogL_total≈1155–1337 개선하고, 클로저 검정에서 ΔlogL_closure=172–281에 도달한다. P1A는 DM 측에 “더 어려운 대조군”을 만들 뿐이다. 그 목적은 “허수아비 기준선”이나 “계통오차를 물리로 오인”한다는 우려를 줄이는 것이지, 주요 비교를 대체하는 것이 아니다.
표 B1 | P1A scoreboard(클수록 좋음; 괄호 안은 DM_RAZOR 기준선 대비 차이).
모델 분기(workspace) | Δk | RC-only best logL_RC (Δ) | 클로저 강도 ΔlogL_closure (Δ) | Joint best logL_total (Δ) |
DM_RAZOR | 0 | -15702.654 (+0.000) | 122.205 (+0.000) | -27347.068 (+0.000) |
DM_RAZOR_SCAT | 1 | -15702.294 (+0.361) | 121.236 (-0.969) | -23153.311 (+4193.758) |
DM_RAZOR_AC | 1 | -15703.689 (-1.035) | 121.531 (-0.674) | -23982.557 (+3364.511) |
DM_RAZOR_FB | 1 | -15496.046 (+206.609) | 129.454 (+7.249) | -27478.531 (-131.463) |
DM_HIER_CMSCAT | 1 | -15702.644 (+0.010) | 121.978 (-0.227) | -23153.160 (+4193.908) |
DM_CORE1P | 1 | -15723.158 (-20.504) | 122.056 (-0.149) | -27336.258 (+10.810) |
DM_RAZOR_M | 0 (+m) | -15702.654 (+0.000) | 122.205 (+0.000) | -27340.451 (+6.617) |
DM_STD | 2 (+m) | -15832.203 (-129.549) | 105.690 (-16.515) | -22984.445 (+4362.623) |
EFT_BIN | 1 | -14631.537 (+1071.117) | 204.620 (+82.415) | -19001.142 (+8345.926) |
그림 B1 | P1A scoreboard: 기준선 대비 closure 및 joint ΔlogL(클수록 좋음).

이 부록에 대응하는 완료 run set의 예시 태그는 다음과 같다(P1A 중간 산물 및 표/그림 위치를 찾기 위해 사용).
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.
B.5 권장 인용(부록 인용 주)
독자가 본문의 주요 결론에 더해 “DM 기준선 표준화 스트레스 테스트”를 인용해야 할 경우, 주요 결론과 함께 다음 주를 인용할 것을 권장한다. “See Appendix B (P1A) for standardized DM-baseline stress tests (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.”