← 실험

『P1_RC_GGL: 은하 동역학과 약한 중력렌즈의 엄밀한 폐합 검정(v1.1)』을 바탕으로 한 대중 해설판

원 보고서 저자: Guanglin Tu|기준 버전: P1 v1.1|해설 성격: 대중 설명문 / 동료심사 논문 아님
관련 아카이브: 보고서 DOI 10.5281/zenodo.18526334|재현 패키지 DOI 10.5281/zenodo.18526286

읽기 메모

이 문서는 “해설판”이지 별도의 학술 보고서가 아니다. 원래 P1 보고서를 바탕으로 핵심 그림과 표를 유지하면서, 각 핵심 단계마다 “이것이 무엇을 뜻하는가”에 대한 일반 독자용 설명을 덧붙인다.

이 문서는 P1이 정해진 데이터셋, 매개변수 장부, 통계 프로토콜 아래에서 얻은 결론만 해설한다. 은하 회전 곡선(RC)과 은하–은하 약한 중력렌즈(GGL)의 공동 검정에서 EFT의 평균 중력 응답 모델은 여기서 검정한 최소 DM_RAZOR 베이스라인보다 뚜렷하게 앞선다.

이 문서는 P1을 “암흑물질을 뒤엎는” 결론으로 읽지 않는다. P1은 P 시리즈 실험의 첫걸음일 뿐이다. 그것은 EFT 안의 “평균 중력 기반”이라는 하나의 관측 가능 층을 검정하는 것이며, EFT 전체 이론의 모든 내용을 검정하는 것이 아니다.

0|먼저 5분 안에 P1 이해하기: 이 검정은 무엇을 하는가?

P1은 “여러 탐침을 서로 대조해 진위를 확인하는” 실험으로 이해하면 쉽다. 한 모델이 하나의 데이터셋을 잘 맞추는지만 묻는 것이 아니라, 전혀 다른 두 가지 중력 판독값을 같은 감사대 위에 올린다. 회전 곡선(RC)은 은하 원반 내부의 동역학을 읽고, 은하–은하 약한 중력렌즈(GGL)는 더 큰 스케일의 투영 중력 응답을 읽는다.

P1의 핵심 한 문장

P1은 비교 문턱을 “단독으로 잘 맞는가”에서 “탐침을 가로질러 폐합하는가”로 끌어올린다. 올바른 매핑에서는 성능이 좋고, 매핑을 섞으면 신호가 붕괴한다. 이 두 조건이 함께 나타날 때, 모델이 RC와 GGL 사이에 공유된 중력 구조를 포착했을 가능성이 커진다.

표 0|P1의 핵심 수치와 일반 독자를 위한 읽는 법

지표

P1 / P1A에서의 읽는 법

일반 독자를 위한 의미

공동 적합 ΔlogL_total

본문 주 비교에서 EFT는 DM_RAZOR보다 1155–1337 높다

두 데이터셋을 합친 총점 차이. 클수록 전체 설명력이 좋다는 뜻이다.

폐합 강도 ΔlogL_closure

본문 주 비교에서 EFT는 172–281, DM_RAZOR는 127이다

RC만으로 추정한 뒤 GGL을 예측하는 능력. 클수록 “탐침 횡단 자기정합성”이 크다.

음성 대조 shuffle

RC-bin→GGL-bin을 섞은 뒤 EFT의 폐합 신호는 6–23으로 떨어진다

올바른 대응 관계가 깨지면 우위도 사라져야 한다. 하락이 뚜렷할수록 가짜 신호를 더 잘 배제한다.

P1A 다중 DM 압력 테스트

DM 7+1 + DM_STD, 그리고 EFT_BIN을 대조로 유지

P1A는 최소 DM_RAZOR만 보지 않고, 여러 저차원 감사 가능 DM 강화 분기를 같은 폐합 프로토콜에 넣는다.


1|왜 P1을 해야 하는가: 현재 은하 스케일 우주론은 어디에서 막혀 있는가?

은하 스케일 문제가 오래도록 풀기 어려운 이유는 “추가 중력/질량 요구”가 회전 곡선에만 나타나는 현상이 아니기 때문이다. 많은 관측은 은하 안의 보이는 바리온 물질과 실제 동역학 또는 렌즈 판독값 사이에 매우 긴밀한 연결이 있음을 보여 준다. 암흑물질 경로에서는 암흑 헤일로, 바리온 피드백, 은하 형성 역사, 관측계통오차가 매우 정교하게 조율되어야 한다는 뜻이다. 비암흑물질 중력 경로에서는 모델이 RC에서만 좋아 보여서는 안 되고, 약한 중력렌즈, 집단 스케일링 관계, 음성 대조에서도 계속 살아남아야 한다는 뜻이다.

이것이 바로 P1의 동기다. P1은 “암흑물질이 틀렸다”거나 “EFT가 반드시 맞다”에서 출발하지 않는다. 검정 가능한 하나의 명제를 감사대에 올린다. EFT의 평균 중력 응답이 RC→GGL 탐침 횡단 폐합에서 재현 가능하고 이전 가능한 신호를 남기는가?

외부 문헌 배경: 왜 RC+GGL이라는 창이 중요한가?

McGaugh, Lelli, Schombert가 2016년에 제안한 반지름 방향 가속도 관계(RAR)는 회전 곡선이 추적하는 관측 가속도와 바리온 물질에서 예측되는 가속도 사이에 산포가 작은 긴밀한 상관이 있음을 보여 주었다. 이 때문에 “바리온–중력 응답 결합”은 은하 스케일 이론이 피할 수 없는 문제가 되었다.

Brouwer 등(2021)은 KiDS-1000 약한 중력렌즈를 사용해 RAR를 더 낮은 가속도와 더 큰 반지름으로 확장하고, MOND, Verlinde emergent gravity, LambdaCDM 모델을 비교했다. 동시에 조기형/후기형 은하 차이, 가스 헤일로, 은하–헤일로 연결이 여전히 핵심 설명 과제임을 지적했다.

Mistele 등(2024)은 더 나아가 약한 중력렌즈에서 고립 은하의 원형 속도 곡선을 추정했고, 수백 kpc에서 약 1 Mpc 스케일까지 뚜렷한 하락이 없으며 BTFR과 부합한다고 보고했다. 이는 약한 중력렌즈가 은하 스케일 중력 응답을 검정하는 중요한 외부 판독값이 되고 있음을 보여 준다.

따라서 P1의 가치는 RC와 GGL을 처음 함께 논의했다는 데 있지 않다. 그 가치는 고정 매핑, 매개변수 장부, RC-only→GGL 폐합, shuffle 음성 대조, P1A 다중 DM 압력 테스트로 이루어진 감사 가능한 프로토콜 안에 이 둘을 넣었다는 데 있다.


2|P1에서 EFT는 무엇을 뜻하는가? 유효장론을 뜻하지 않는다

여기서 EFT는 에너지 필라멘트 이론 (Energy Filament Theory)을 뜻하며, 물리학에서 흔히 쓰는 유효장론 (Effective Field Theory)이 아니다. P1 기술 보고서에서 EFT는 의도적으로 제한된 방식으로 사용된다. 완결된 최종 이론으로 출전하는 것이 아니라, 먼저 관측 가능하고 적합 가능하며 반증 가능한 “평균 중력 응답”의 매개변수화로 압축된다.

쉽게 말해 P1은 아직 추가 중력의 모든 미시적 원천을 논하지 않으며, EFT 전체 틀을 한 번에 증명하려 하지도 않는다. 더 좁고 더 단단한 질문만 던진다. 은하 스케일에 어떤 평균적 추가 중력 응답이 존재한다면, 그것은 먼저 RC를 설명한 뒤 GGL을 예측할 수 있는가?

P1은 EFT의 어느 부분을 검정하는가?

P1이 검정하는 것은 “평균 중력 기반”(mean gravity floor)이다. 이는 통계적으로 안정적이며 표본을 가로질러 이전될 수 있는 평균적 기여를 뜻한다.

P1은 아직 “확률적 / 잡음 기반”(stochastic / noise floor)을 다루지 않는다. 이는 더 미시적인 요동 과정에서 생길 수 있는 무작위항, 개체별 차이, 추가 산포를 말한다.

P1은 완전한 미시 메커니즘, 존재량, 수명, 또는 전역 우주론 제약도 논하지 않는다. 이것은 P 시리즈 실험의 첫걸음이지 최종 판결이 아니다.


3|P1 시리즈 계획: 왜 첫걸음을 “평균 기반”에서 시작하는가?

P 시리즈는 EFT의 관측 검색 프로그램으로 이해할 수 있다. 모든 주장을 한꺼번에 펼쳐 놓는 것이 아니라, 공개 데이터로 가장 직접 검정할 수 있는 부분을 먼저 떼어 낸다. P1은 평균항부터 검정한다. 평균 중력 응답이 RC→GGL조차 폐합하지 못한다면, 더 복잡한 잡음항이나 미시적 메커니즘을 논의할 견고한 입구가 없다.

표 1|P 시리즈의 계층별 위치

층위

묻는 질문

P1에서의 위치

P1

평균 중력 응답은 RC→GGL에서 폐합하는가?

현재 보고서의 주 질문

P1A

DM 측을 조금 더 강하게 만들어도 결론은 안정적인가?

부록 B: DM 7+1 + DM_STD 압력 테스트

후속 P 시리즈

더 많은 데이터, 더 많은 탐침, 더 복잡한 계통오차로 확장할 수 있는가?

향후 작업 방향

더 깊은 문제

평균항, 잡음항, 미시 메커니즘은 어떻게 연결되는가?

P1 결론 범위 밖


4|데이터란 무엇인가? RC와 GGL은 각각 무엇을 말해 주는가?


4.1 회전 곡선 RC: 은하 원반 안의 “속도 척도”

회전 곡선은 은하 중심에서 서로 다른 반지름에 있는 가스와 별이 중심 주위를 얼마나 빠르게 도는지를 기록한다. 더 빠르게 돌수록 그 반지름에서 더 강한 구심력이 필요하고, 이는 더 강한 유효 중력 끌림을 뜻한다. P1은 SPARC 데이터베이스를 사용하며, 전처리 후 104개 은하, 2,295개의 속도 데이터점, 20개의 RC-bin을 포함한다.


4.2 약한 중력렌즈 GGL: 더 큰 스케일의 “중력 저울”

은하–은하 약한 중력렌즈는 전경 은하가 배경 은하의 빛을 어떻게 미세하게 휘게 하는지를 측정한다. 이것은 더 크고 헤일로에 가까운 스케일의 투영 중력 응답에 해당하며, 은하 원반의 가스 동역학 세부 사항에 의존하지 않는다. P1은 KiDS-1000 / Brouwer 등 2021의 공개 GGL 데이터를 사용한다. 항성질량 bin 4개, 각 bin마다 반지름 점 15개, 총 60개 데이터점이며, 완전한 공분산 행렬을 사용한다.


4.3 고정 매핑: 왜 20개의 RC-bin → 4개의 GGL-bin이 중요한가?

P1은 고정 규칙으로 20개의 RC-bin을 4개의 GGL-bin에 연결한다. 각 GGL-bin은 5개의 RC-bin에 대응하고, 은하 수 가중치로 평균된다. 이 매핑은 모든 모델에서 바뀌지 않으며, 폐합 검정과 공정 비교 모두에 대한 단단한 제약이다.

왜 사후에 매핑을 조정하면 안 되는가?

사후에 “어떤 RC-bin이 어떤 GGL-bin에 대응하는가”를 고를 수 있다면, 모델은 대응 관계를 재배열해 폐합을 만들어 낼 수 있다. P1은 20→4 매핑을 미리 고정하고 shuffle 음성 대조로 그것을 의도적으로 깨뜨린다. 이는 폐합 신호가 물리적으로 타당한 대응 관계에 정말 의존하는지 시험하기 위한 것이다.


5|모델과 방법: P1은 정확히 무엇을 비교하는가?


5.1 EFT 측: 저차원 평균 중력 응답

EFT 측은 평균 중력 응답을 설명하기 위해 저차원의 추가 속도항을 사용한다. 추가항의 형태는 무차원 커널 함수 f(r/ℓ)가 제어하며, 여기서 ℓ은 전역 스케일이고 진폭은 RC-bin별로 부여된다. 서로 다른 커널은 서로 다른 초기 기울기, 전이 속도, 장거리 꼬리를 나타내며, 견고성 압력 테스트에 사용된다.


5.2 DM 측: 본문 주 비교와 부록 P1A는 따로 읽어야 한다

본문 주 비교에서 DM_RAZOR는 최소화되고 감사 가능한 NFW 베이스라인이다. 고정된 c–M 관계를 사용하며, halo-to-halo scatter, 단열 수축, 피드백 core, 비구면성, 환경항은 포함하지 않는다. 이 설계의 장점은 자유도가 통제되고 재현이 쉽다는 점이다. 한계는 모든 LambdaCDM 또는 모든 암흑물질 헤일로 모델을 대표할 수 없다는 점이다.

그래서 부록 B(P1A)에서는 DM 측을 표준화된 압력 테스트 묶음으로 만든다. 공유 매핑과 폐합 프로토콜을 바꾸지 않은 상태에서 SCAT, AC, FB, HIER_CMSCAT, CORE1P, lensing m, 결합 베이스라인 DM_STD 같은 저차원 강화 분기를 단계적으로 추가하고, EFT_BIN을 대조로 유지한다. P1A는 이렇게 읽으면 된다. 하나의 최소 DM 베이스라인하고만 비교하는 것이 아니라, 흔하고 감사 가능한 여러 DM 메커니즘을 같은 “폐합 자”로 재어 보는 것이다.

이 문서에서 사용하는 정확한 결론 표현

본문: EFT 계열은 주 비교에서 최소 DM_RAZOR보다 유의하게 높은 성능을 보인다.

부록 B / P1A: 여러 저차원 감사 가능 DM 강화 분기와 DM_STD 압력 테스트 아래에서 일부 DM 공동 적합은 개선될 수 있다. 그러나 폐합 강도는 EFT_BIN의 우위를 지우지 않는다.

따라서 가장 안전한 표현은 이렇다. P1/P1A의 데이터, 매핑, 매개변수 장부, 폐합 프로토콜 범위 안에서 EFT의 평균 중력 응답은 더 강한 데이터 횡단 일관성을 보인다. 이것이 모든 암흑물질 모델을 배제한다는 뜻은 아니다.


5.3 폐합 검정: P1에서 가장 중요한 실험 논리

1. RC만으로 적합하여 RC-only 후험 표본 한 묶음을 얻는다.

2. GGL로 다시 조정하지 않고, RC 후험을 그대로 사용해 GGL을 예측한다.

3. 완전한 공분산을 사용해 올바른 매핑 아래의 GGL 예측 점수 logL_true를 계산한다.

4. RC-bin→GGL-bin 대응 관계를 무작위로 치환하고 음성 대조 점수 logL_perm을 계산한다.

5. 둘을 빼서 폐합 강도를 얻는다: ΔlogL_closure = <logL_true> − <logL_perm>.

쉬운 비유

폐합 검정은 시험장을 가로지르는 재시험과 같다. 모델은 먼저 RC 시험장에서 규칙을 배우고, 이어서 GGL 시험장에서 답을 한다. 그것이 국소적 요령이 아니라 공유 규칙을 배운 것이라면 시험장을 옮겨도 여전히 잘 답해야 한다. 시험장 대응 관계를 일부러 뒤섞으면 우위는 사라져야 한다.


5.4 기술 표를 읽기 전에: 네 가지 입구를 먼저 잡기

표 5.4|다음 가로형 기술 표 묶음을 읽는 경로

입구

무엇을 볼 것인가

왜 중요한가

표 S1a

RC+GGL 공동 적합 총점

“두 데이터셋을 함께 보았을 때 누구의 전체 설명이 더 강한가”에 답한다.

표 S1b

폐합 강도, shuffle, 견고성 스캔

“RC에서 배운 것이 GGL로 이전될 수 있는가”에 답한다.

표 B0

P1A의 여러 DM 강화 분기 정의

P1을 “최소 DM_RAZOR하고만 비교했다”로 단순화하는 일을 막는다.

표 B1

P1A의 폐합 및 공동 스코어보드

DM을 강화한 뒤 폐합 우위가 사라지는지 확인한다.

레이아웃 설명

다음 페이지부터 가로 방향 페이지를 사용하는 이유는 원 보고서의 넓은 표를 열 삭제 없이, 읽을 수 없을 정도로 압축하지 않고 온전히 보존하기 위해서다. 본문 해설은 이미 일반 독자용 읽는 법을 제시했다. 가로형 기술 표는 수치와 모델 분기를 대조해야 하는 독자를 위한 것이다.

그림 0.1|한 장으로 보는 P1 폐합 검정 흐름

설명: 위쪽 사슬은 “폐합 검정”(RC만으로 적합 → RC 후험으로 GGL 예측)이고, 아래쪽 사슬은 “공동 적합”(RC+GGL을 함께 채점)이다. 오른쪽에서는 실제 매핑을 섞은 매핑과 비교해 폐합 강도 ΔlogL을 얻는다.


6|핵심 기술 표: 원 보고서 주 표와 P1A 표

표 S1a|공동 적합 주 비교 지표(RC+GGL, Strict; 원 보고서에서 유지)

모델(workspace)

W 커널

k

공동 logL_total(best)

ΔlogL_total vs DM

AICc

BIC

DM_RAZOR

none

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

none

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

표 S1b|폐합 및 견고성 지표(Strict; 원 보고서에서 유지)

모델(workspace)

폐합 ΔlogL(true-perm)

음성 대조 shuffle 후 ΔlogL

σ_int 스캔 ΔlogL 범위

R_min 스캔 ΔlogL 범위

cov-shrink 스캔 ΔlogL 범위

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308

표 B0|P1A의 DM 강화 분기 정의(원 보고서 부록 B에서 유지)

Workspace

DM 모델

새 매개변수(≤1)

물리적 동기(핵심)

구현 원칙(감사 친화적)

DM_RAZOR

NFW (fixed c–M, no scatter)

최소화되고 감사 가능한 LambdaCDM 헤일로 베이스라인. EFT와의 엄밀한 대조에 사용한다.

공유 매핑 고정. 매개변수 장부 엄격화. baseline으로서 상대 비교에만 사용.

DM_RAZOR_SCAT

NFW + c–M scatter(legacy)

σ_logc

c–M 관계에 산란을 허용한다. 하나의 log-normal scatter 매개변수로 근사한다.

≤1개의 새 매개변수. 공유 매핑은 유지한다. 폐합 이득을 합격 기준으로 삼는다.

DM_RAZOR_AC

NFW + Adiabatic Contraction(legacy)

α_AC

바리온 유입이 헤일로 단열 수축을 일으킬 수 있다. 하나의 강도 매개변수로 근사한다.

≤1개의 새 매개변수. 매핑은 바꾸지 않는다. AICc/BIC 변화와 폐합 이득을 보고한다.

DM_RAZOR_FB

NFW + feedback core(legacy)

log r_core

피드백은 내부 영역에 core를 만들 수 있다. 하나의 core 스케일 매개변수로 근사한다.

≤1개의 새 매개변수. 폐합/음성 대조는 같은 구경으로 적용한다. RC-only 개선만을 유일한 목표로 삼지 않는다.

DM_HIER_CMSCAT

Hierarchical c–M scatter + prior

σ_logc(hier)

더 표준적인 계층화 c_i∼logN(c(M_i), σ_logc). RC와 GGL의 공동 후험에 동시에 영향을 준다.

명시적 사전분포. latent c_i를 주변화한다. 여전히 저차원이고 감사 가능하게 유지한다.

DM_CORE1P

1‑parameter core proxy (coreNFW/DC14‑inspired)

log r_core

한 매개변수 core 대리항으로 baryonic feedback의 주효과를 나타내며, 고차원 별 형성 세부 사항을 피한다.

표준 문헌을 참조한다. ≤1개의 새 매개변수. 폐합 검정과 묶는다.

DM_RAZOR_M

NFW + lensing shear‑calibration nuisance

m_shear(GGL)

약한 중력렌즈 쪽의 핵심 계통오차를 유효 매개변수로 흡수해, “계통오차를 물리로 취급하는” 위험을 낮춘다.

nuisance는 명확히 장부화한다. RC로 역방향 영향을 주는 것은 허용하지 않는다. 결과는 주로 폐합 견고성으로 판단한다.

DM_STD

Standardized DM baseline (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

가장 흔한 세 가지 반론을 여전히 저차원인 하나의 표준 베이스라인에 함께 넣는다.

매개변수 장부와 정보 기준을 함께 보고한다. 폐합을 주 지표로 삼는다. 가장 강한 DM 방어 대조로 사용한다.

표 B1|P1A 스코어보드(클수록 좋음; 원 보고서 부록 B에서 유지)

모델 분기(workspace)

Δk

RC-only best logL_RC (Δ)

폐합 강도 ΔlogL_closure (Δ)

Joint best logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

표 B1(P1A 스코어보드)을 읽는 법

• Δk: 새 자유도. 클수록 모델이 더 복잡하다는 뜻이지, 자동으로 더 좋다는 뜻은 아니다.

• 두 열에 주목한다. 폐합 강도 ΔlogL_closure(Δ)(클수록 이전 자기정합성이 큼)와 Joint best logL_total(Δ)(공동 적합 총점)이다.

• 괄호 안의 (Δ)는 DM_RAZOR에 대한 차이를 뜻하며, 직접 비교하기 쉽도록 한 것이다.

• 이 표가 주로 묻는 질문은 DM 베이스라인을 “합리적으로 강화”했을 때 폐합 우위가 사라지는가이다.

• 읽기 힌트: DM_STD는 공동 점수를 크게 개선하지만 폐합 강도는 오히려 낮아진다. EFT_BIN은 폐합 강도에서 여전히 더 높다.

한 문장 요약: 이 저차원 감사 가능 DM 강화 묶음 안에서는 공동 적합 개선이 자동으로 더 강한 폐합을 만들지 않는다. 폐합, 즉 이전 가능성은 여전히 핵심 판정 기준이다.


7|주요 결과는 어떻게 읽어야 하는가?


7.1 공동 적합: 두 데이터셋을 함께 보면 EFT가 주 비교에서 더 높은 점수를 얻는다

표 S1a와 그림 S4는 같은 데이터, 같은 공유 매핑, 거의 같은 매개변수 규모 아래에서 EFT 계열이 DM_RAZOR 대비 공동 ΔlogL_total 1155–1337을 보인다는 점을 보여 준다. 일반 독자는 이렇게 이해하면 된다. RC와 GGL 두 데이터셋을 합쳐 같은 채점 규칙으로 평가할 때, EFT 주 비교 모델의 총점이 더 높다.


7.2 폐합 검정: P1이 가장 강조하는 것은 “이전 가능성”이다

폐합 강도가 높다는 것은 RC만으로 추정한 매개변수가 GGL을 다시 보지 않고도 GGL을 더 잘 예측한다는 뜻이다. P1 보고서에서 EFT의 ΔlogL_closure는 172–281이고, DM_RAZOR는 127이다. 이 결과는 “각자 자기 데이터에는 잘 맞는다”보다 더 중요하다. 두 번째 데이터셋에서 모델의 자유도를 제한하기 때문이다.


7.3 음성 대조: 왜 “신호 붕괴”가 오히려 좋은 일인가?

P1이 RC-bin→GGL-bin의 그룹 대응 관계를 무작위로 섞자, EFT의 폐합 신호는 6–23 수준으로 떨어졌다. 일반 독자에게 이 단계는 “부정행위 방지”에 해당한다. 폐합 우위가 코드, 단위, 공분산 처리, 적합의 우연에서만 나온 것이라면 섞은 대응 관계에서도 우위가 그대로 나타날 수 있다. 그러나 실제로는 우위가 붕괴하므로, 그것이 올바른 매핑에 의존함을 보여 준다.

그림 S3|폐합 강도(클수록 좋음): RC-only → GGL 예측의 평균 로그우도 우위.

이 그림을 읽는 법

이 그림은 P1의 핵심이다. 막대가 높을수록 RC에서 배운 정보가 GGL로 더 잘 이전된다는 뜻이다.

EFT 계열은 전체적으로 DM_RAZOR보다 높다. 이는 “먼저 RC를 배우고, 그다음 GGL을 예측하는” 실험에서 EFT의 탐침 횡단 폐합이 더 강함을 뜻한다.

그림 S4|공동 적합 우위(클수록 좋음): RC+GGL의 best logL_total, DM_RAZOR 대비.

이 그림을 읽는 법

이 그림은 RC와 GGL을 공동으로 적합한 뒤의 총점을 보여 준다.

EFT 계열은 모두 0보다 뚜렷하게 높다. 이는 주 비교에서 EFT의 우위가 어느 한 점의 국소 현상이 아니라 공동 분석 전체의 거동임을 보여 준다.

그림 R1|음성 대조: shuffle 분류 후 폐합 신호가 크게 낮아진다.

이 그림을 읽는 법

이 그림은 올바른 RC↔GGL bin 관계를 섞으면 폐합 신호가 크게 낮아진다는 점을 보여 준다.

따라서 P1 결과는 어떤 매핑에서도 얻을 수 있는 수치적 우연이라기보다, 데이터 매핑을 가로지르는 실제 일관성에 더 가까워 보인다.


8|견고성과 대조: P1은 어떻게 “그저 매개변수 조정이 좋아 보이는” 일을 피하는가?

기술 보고서가 가장 쉽게 받는 질문은 이런 것이다. 우위가 특정 잡음 설정, 중심부 데이터 일부, 공분산 처리 방식, 또는 과적합에서 나온 것은 아닌가? P1은 여러 압력 테스트로 이 질문에 답한다.

표 2|P1의 견고성 검정과 음성 대조를 읽는 법

검정

배제하려는 의문

읽는 법

σ_int 스캔

RC 안에 추가적인 미지 산포가 있어도 결론은 안정적인가?

RC 오차를 느슨하게 해도 EFT의 순위와 우위 규모는 안정적으로 유지된다.

R_min 스캔

은하 중심 영역을 완전히 신뢰하지 않아도 결론은 안정적인가?

중심 영역을 잘라낸 뒤에도 EFT는 양의 우위를 유지한다.

cov-shrink 스캔

GGL 공분산 추정에 불확실성이 있어도 결론은 안정적인가?

공분산을 대각 행렬 쪽으로 수축해도 우위는 민감하게 변하지 않는다.

소거 계단

EFT가 불필요한 복잡성으로 억지 적합하는가?

완전한 EFT_BIN은 정보 기준상 필요성이 있다.

LOO 유보 예측

모델은 이미 본 데이터만 설명하는가?

유보한 GGL bin에서도 비교적 강한 일반화 성능을 보인다.

RC-bin shuffle

폐합은 실제 매핑에서 오는가?

그룹을 섞으면 폐합이 낮아져 매핑 의존성을 지지한다.

그림 R2|σ_int 스캔에서 ΔlogL_total 범위(클수록 좋음).

이 그림을 읽는 법

RC 내재 산포 설정이 바뀐 뒤에도 EFT의 선두가 남는지 검정한다.

그림 R3|R_min 스캔에서 ΔlogL_total 범위(클수록 좋음).

이 그림을 읽는 법

복잡한 중심 영역을 잘라낸 뒤에도 EFT의 우위가 안정적인지 검정한다.

그림 R4|cov-shrink 스캔에서 ΔlogL_total 범위(클수록 좋음).

이 그림을 읽는 법

약한 중력렌즈 공분산 처리 변화에 순위가 민감한지 검정한다.

그림 R5|EFT_BIN의 소거 계단(AICc, 작을수록 좋음).

이 그림을 읽는 법

완전한 EFT_BIN이 데이터 설명에 필요한지, 아니면 단지 매개변수를 덧붙인 것인지 검정한다.

그림 R6|LOO: 유보 bin의 로그우도 분포.

이 그림을 읽는 법

모델이 보지 못한 GGL bin에서도 예측 성능을 갖는지 검정한다.

그림 R7|음성 대조: shuffle 매핑이 폐합 mean logL_true를 뚜렷하게 낮춘다.

이 그림을 읽는 법

mean logL_true 관점에서도 폐합이 올바른 데이터 횡단 매핑에 의존함을 추가로 보여 준다.


9|P1A: 왜 “부록에 여러 DM 모델이 있다”는 점이 핵심 수정인가?

이 절이 묻는 것은 “EFT가 최소 DM_RAZOR 하나만 이긴 것인가?”가 아니다. 낮은 차원, 재현 가능성, 명확한 매개변수 장부의 범위에서 DM 베이스라인을 강화했을 때(P1A), 폐합 검정과 공동 적합의 결론이 바뀌는지를 묻는다. 다시 말해 P1A의 목표는 “너무 약한 DM 베이스라인을 고른 것 아니냐”는 비판을 줄이고, 논의를 “감사 가능한 DM 강화 묶음 아래에서도 폐합 성능의 차이가 남는가”로 옮기는 것이다.

P1A의 설계는 가능한 모든 LambdaCDM 헤일로 모델링을 다 소진하려 하지 않으며, DM 측을 고차원이고 감사 불가능한 적합기로 만들지도 않는다. 선택한 것은 저차원이고 재현 가능하며 매개변수 장부가 분명한 강화들이다. 농도 산란, 단열 수축, 피드백 core, 계층적 c–M scatter prior, 단일 매개변수 core 대리항, 약한 중력렌즈 shear-calibration nuisance, 결합 DM_STD 분기가 그것이다.

P1A의 주요 읽는 법

legacy 세 분기 중에서는 feedback/core만 폐합 강도에 작은 순증가를 가져온다. SCAT와 AC는 순수한 폐합 증가를 만들지 못한다.

DM_HIER_CMSCAT, DM_RAZOR_M, DM_CORE1P는 폐합 강도에 미치는 영향이 작거나 유의한 순증가를 보이지 않는다.

DM_STD는 joint logL을 크게 개선할 수 있지만 폐합 강도는 낮아진다. 이는 그것이 주로 공동 적합의 유연성을 높이는 것이지, RC→GGL 이전 예측력을 높이는 것은 아님을 시사한다.

P1A 표 B1에서도 EFT_BIN은 더 높은 폐합 강도와 공동 적합 우위를 유지한다. 따라서 P1의 핵심 주장을 “최소 DM_RAZOR만 이겼다”로 단순화해서는 안 된다.

그림 B1|P1A 스코어보드: baseline 대비 폐합 및 공동 ΔlogL(클수록 좋음).

이 그림을 읽는 법

이 그림은 여러 DM 강화 분기가 베이스라인 대비 어떻게 움직이는지 보여 준다.

그 의미는 “모든 DM을 배제한다”가 아니다. P1A가 선택한 저차원 감사 가능 DM 강화 범위 안에서는 DM을 강화해도 EFT_BIN의 폐합 우위가 사라지지 않는다는 점을 보여 준다.


10|P1 실험의 의미: 왜 이 일을 할 가치가 있는가?


10.1 방법론적 의미: “탐침 횡단 폐합”을 “단일 탐침 적합”보다 높은 위치에 둔다

은하 스케일 이론은 어떤 모델이 특정 회전 곡선 묶음을 맞출 수 있는가라는 논쟁에 쉽게 갇힌다. P1은 기준을 한 단계 높인다. RC에서 배운 매개변수로 GGL을 다시 조정하지 않고 약한 중력렌즈를 예측할 수 있는가? 이로써 P1은 “적합 경쟁”에서 “이전 예측 검정”으로 바뀐다.


10.2 투명성의 의미: 재검토 가능한 사슬을 결과의 일부로 다룬다

P1의 중요한 기여 중 하나는 데이터, 표와 그림, 실행 라벨, 음성 대조, 재현 패키지, 감사 사슬을 함께 공개했다는 점이다. 지지자와 비판자 모두에게 이것은 중요하다. 논의가 구호 비교에 머물지 않고, 같은 공개 데이터, 같은 매핑, 같은 스크립트, 같은 지표로 돌아갈 수 있기 때문이다.


10.3 물리적 의미: “비암흑물질 중력” 방향에 강한 압력 테스트를 제공한다

비암흑물질 중력 방향에서는 많은 모델이 회전 곡선이나 RAR 현상의 일부를 설명할 수 있다. 더 어려운 과제는 동시에 약한 중력렌즈 판독을 통과하고, 음성 대조를 통해 신호가 올바른 매핑에 의존함을 보이는 것이다. P1의 의미는 EFT 평균 중력 응답을 일종의 “외부 시험” 같은 프로토콜에 넣었다는 데 있다. RC는 훈련장, GGL은 이전 시험장, shuffle은 부정행위 탐지장이다.


10.4 이것은 “비암흑물질 중력 분야”의 중요한 실험인가?

조심스럽게 말하면, P1의 데이터 처리, 재현 패키지, 폐합 프로토콜이 외부 검토 뒤에도 유지된다면, 비암흑물질 중력 / 수정 중력 연구에서 진지하게 다룰 만한 RC+GGL 폐합 실험으로 볼 수 있다. 그 중요성은 “암흑물질을 뒤엎었다”는 한 문장이 아니라, 복제할 수 있고 도전할 수 있으며 확장할 수 있는 탐침 횡단 판정 기준을 제시한다는 사실에 있다.

이미 같은 수준으로 강한 RC+GGL 예측 폐합 틀이 있는가?

관련 틀과 관측 전통은 이미 존재한다. MOND/RAR는 많은 회전 곡선 현상을 잘 정리한다. KiDS-1000 약한 중력렌즈 RAR 연구도 MOND, Verlinde emergent gravity, LambdaCDM 모델을 비교했다. LambdaCDM 역시 은하–헤일로 연결, 가스 헤일로, 피드백 모델링을 통해 약한 중력렌즈/동역학 현상의 일부를 설명할 수 있다.

그러나 P1의 정확한 주장은 “세상에 RC+GGL을 설명할 수 있는 다른 틀이 없다”가 아니다. P1이 공개한 고정 매핑, RC-only→GGL 폐합, shuffle 음성 대조, 매개변수 장부, P1A 다중 DM 압력 테스트 프로토콜 아래에서 EFT가 더 강한 폐합 성능을 보고했다는 주장이다.

다시 말해 P1에서 외부 검정을 가장 받을 가치가 있는 부분은 구체적이고 재현 가능한 비교 프로토콜을 제시했다는 점이다. MOND/RAR, LambdaCDM/HOD, 유체역학 시뮬레이션, 또는 다른 수정 중력 틀이 같은 프로토콜 아래에서 같거나 더 높은 폐합 점수에 도달할 수 있는지를 검정하는 일은 매우 가치 있는 다음 단계다.


11|P1은 무엇을 결론낼 수 있고, 무엇을 결론낼 수 없는가?

표 3|P1 결론의 경계

결론낼 수 있는 것

P1의 RC+GGL 데이터, 고정 매핑, 주 비교 프로토콜 아래에서 EFT 계열은 최소 DM_RAZOR보다 더 높은 공동 적합과 폐합 강도를 갖는다.

결론낼 수 있는 것

P1A의 저차원 감사 가능 DM 강화 범위 안에서 여러 DM 강화는 EFT_BIN의 폐합 우위를 지우지 못한다.

결론낼 수 있는 것

shuffle 음성 대조는 폐합 신호가 올바른 데이터 횡단 매핑에 의존하며, 임의 매핑에서 얻을 수 없음을 보여 준다.

결론낼 수 없는 것

P1이 모든 암흑물질 모델을 뒤엎었다고 말할 수는 없다. P1A는 여전히 비구면성, 환경 의존성, 복잡한 은하–헤일로 연결, 고차원 피드백, 완전한 우주론 시뮬레이션을 다 소진하지 않는다.

결론낼 수 없는 것

EFT의 완전한 이론이 제1원리에서 증명되었다고 말할 수는 없다. P1은 평균 중력 응답이라는 현상론적 층만 검정한다.

결론낼 수 없는 것

모든 계통오차가 배제되었다고 말할 수는 없다. P1은 열거된 압력 테스트와 감사 범위 안에서만 견고성 증거를 제공한다.


12|자주 묻는 질문: 일반 독자가 가장 쉽게 물을 몇 가지

Q1: 이것은 “암흑물질이 존재하지 않는다”는 뜻인가?

아니다. P1의 결론은 이 문서에서 사용한 데이터, 프로토콜, 비교 모델의 범위로 제한되어야 한다. P1A는 최소 DM_RAZOR 베이스라인보다 한 걸음 더 나아가지만, 여전히 가능한 모든 암흑물질 모델을 대표하지 않는다.

Q2: 이것은 “EFT가 이미 증명되었다”는 뜻인가?

그것도 아니다. P1은 EFT를 평균 중력 응답의 매개변수화로 검정하고, RC→GGL 폐합에서 더 강한 성능을 보인다는 점을 보여 준다. 미시적 메커니즘과 완전한 이론은 P1의 결론이 아니다.

Q3: 왜 유의성을 σ 값으로 직접 말하지 않는가?

P1은 통일된 우도 점수, 정보 기준, 폐합 차이를 사용한다. ΔlogL은 같은 채점 규칙 아래의 상대적 우위이지, 단일 σ 값과 같은 것이 아니다.

Q4: 왜 RC-bin→GGL-bin 매핑을 섞는가?

이는 음성 대조다. 진짜 탐침 횡단 신호라면 올바른 매핑에 의존해야 한다. 섞은 뒤에도 신호가 똑같이 강하다면, 오히려 구현 편향이나 통계적 가짜 신호를 시사한다.

Q5: P1의 다음 단계에서 가장 중요한 것은 무엇인가?

같은 프로토콜을 더 많은 데이터, 더 많은 DM 대조, 더 복잡한 계통오차, 더 많은 수정 중력 틀로 확장하는 일이다. 특히 외부 팀이 같은 폐합 지표 아래에서 다시 검정할 수 있는 형태가 중요하다.


13|미니 용어사전

표 4|미니 용어사전

용어

한 문장 설명

회전 곡선(RC)

은하 원반의 반지름–속도 관계. 원반면 안의 유효 중력을 역추정하는 데 사용한다.

약한 중력렌즈(GGL)

배경 은하 형상의 통계적 왜곡을 통해 전경 은하 주변의 평균 중력/질량 분포를 측정한다.

폐합 검정

RC 후험으로 GGL을 예측한 뒤, 섞은 매핑의 음성 대조와 비교한다.

음성 대조

핵심 구조를 일부러 깨뜨려 신호가 사라지는지 보는 절차. 가짜 신호를 배제하는 데 사용한다.

NFW 헤일로

차가운 암흑물질 모델에서 흔히 쓰이는 암흑물질 헤일로 밀도 프로파일.

c–M 관계

헤일로 농도 c와 질량 M 사이의 관계. 산란을 허용하는지는 모델 유연성에 영향을 준다.

DM_STD

P1A에서 여러 저차원 DM 강화와 렌즈 nuisance 매개변수를 결합한 표준화 DM 압력 테스트 분기.

ΔlogL

같은 채점 규칙 아래에서 두 모델의 로그우도 차이. 양수이면 전자가 더 우수하다는 뜻이다.

공분산

데이터점들 사이의 상관을 나타내는 행렬 표현. 약한 중력렌즈 데이터는 보통 완전한 공분산 행렬을 필요로 한다.


14|권장 읽기 경로와 인용 입구

1. 먼저 본문 0–2절을 읽어 P1의 문제의식과 P1 안에서 EFT가 취하는 절제된 위치를 이해한다.

2. 다음으로 그림 S3, 그림 S4, 표 S1a/S1b를 보며 폐합 강도, 공동 적합, 음성 대조를 이해한다.

3. “DM 베이스라인이 너무 약한 것 아닌가”가 걱정된다면, 9절과 표 B1 / 그림 B1로 바로 간다.

4. 기술적으로 재검토하려면 P1 기술 보고서 v1.1, Tables & Figures Supplement, full_fit_runpack으로 돌아간다.

주요 아카이브 입구

P1 기술 보고서(출판급, Concept DOI): 10.5281/zenodo.18526334

P1 전체 재현 패키지(Concept DOI): 10.5281/zenodo.18526286

EFT 구조화 지식베이스(선택, Concept DOI): 10.5281/zenodo.18853200

라이선스 안내: 기술 보고서는 CC BY-NC-ND 4.0을 사용하고, 전체 재현 패키지는 CC BY 4.0을 사용한다(기술 보고서와 Zenodo 아카이브 기록을 기준으로 함).


15|참고문헌과 외부 배경

McGaugh, S. S., Lelli, F., & Schombert, J. M. (2016). The Radial Acceleration Relation in Rotationally Supported Galaxies. Physical Review Letters, 117, 201101. DOI: 10.1103/PhysRevLett.117.201101.

Famaey, B., & McGaugh, S. S. (2012). Modified Newtonian Dynamics (MOND): Observational Phenomenology and Relativistic Extensions. Living Reviews in Relativity, 15, 10. DOI: 10.12942/lrr-2012-10.

Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.

Mistele, T., McGaugh, S., Lelli, F., Schombert, J., & Li, P. (2024). Indefinitely Flat Circular Velocities and the Baryonic Tully-Fisher Relation from Weak Lensing. The Astrophysical Journal Letters, 969, L3 / arXiv:2406.09685.

Bullock, J. S., & Boylan-Kolchin, M. (2017). Small-Scale Challenges to the LambdaCDM Paradigm. Annual Review of Astronomy and Astrophysics, 55, 343–387. DOI: 10.1146/annurev-astro-091916-055313.

Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.

Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493.

Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374.