Data Sources

真实数据 · 三类来源

生成器不是从噪声起步, 而是从两类真实信号校准: (1) 4 名健康受试者真实可穿戴 baseline; (2) 8 个 OpenNeuro 公开数据集 (3 主校准 n=297 + 5 扩展 n=375, 总 n=672+) 真实 AD/MCI/老年/PD/中年风险患者用于分布对齐. 下面 5 张卡片是主校准源详细介绍, 8 个数据集全景见本页第 4 节.

1. 真实健康 baseline

每位受试者完成 12 项任务 (静坐 / 走路 / 双任务 / 站立平衡 / 精细手部 / ...), 同步采集 PPG (心率 + HRV) / IMU (3 轴 acc + gyro) / EDA (皮肤电导).

Subject	Code	Tasks	Modalities	Use
S01	zewei	12	PPG / IMU / EDA	P01, P02 base
S02	junkai	12	PPG / IMU / EDA	P03, P06 base
S03	jialu	12	PPG / IMU / EDA	P04, P09, P10 base
S04	zhe	12	PPG / IMU / EDA	P05, P07, P08 base

注: 我们同时采集了这 4 名健康受试者的中文语音 baseline, 但未在 v2.2 中合成 AD 患者语音 — 因为没有真实 AD 患者语音分布作为锚点, 凭空合成会脱离真实人群. 详见 Method §5.

2. OpenNeuro 公开数据集

用于校准合成患者分布的 5 个开源队列. 涵盖 AD / FTD / MCI / 老年 / PD 共 n=560+ 受试者. 点击任一卡片查看完整介绍 / 真实样本 / 我们怎么用它 / 代码片段.

📦 已下载数据集全景

8 个数据集全部已下载并使用 — 不需要等任何申请. 真实分布全部从本地 participants.tsv 提取写入 distributions_master.json + distributions_extended.json.

Loading dataset status…

3. 真实分布可视化

所有合成量表的均值/方差以下列真实分布为参照, KS 检验下不可区分.

MMSE — 三组真实分布 (n=112) ds004504 + ds007427 (FTD → MCI bucket)

MoCA — ds006095 老年队列 (n=71) μ=27.45, σ=1.60

Age — ds006095 老年队列分布 μ=74.66, σ=5.83 (n=71)

BDI 抑郁 — ds004796 中年队列 μ=8.52, σ=7.92 (n=192)