ํฐ์คํ ๋ฆฌ ๋ทฐ
๐ [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] MIMIC-IV ๋ฐ์ดํฐ ๊ตฌ์กฐ ์ดํดํ๊ธฐ
์ด์ YIYU 2024. 4. 3. 21:25MIMIC3๋ฅผ ์ด์ฉํ ๋ฅ๋ฌ๋ ๋ชจ๋ธ๋ค์ ๋ฒค์น๋งํน ์ฐ๊ตฌ ๋ ผ๋ฌธ์ ๋ฆฌ๋ทฐํ๋ ค ํฉ๋๋ค.
Abstract
๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ๋ค์ํ ๋ถ์ผ์์ ๋ง์ด ์ฌ์ฉ๋๊ณ ์๋ค. ๊ทธ๋ฌ๋ ์คํ์์ค ์๋ฃ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํ ๋จธ์ ๋ฌ๋๊ณผ ์ํ scoring system SOTA ์์ค์ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ๊ฑฐ์ ์๋ค. ๋ณธ ๋ ผ๋ฌธ์์๋ ๋ฅ๋ฌ๋ ๋ชจ๋ธ ๋๋ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ์์๋ธ, SAPS II์ SOFA ์ ์๋ฅผ ์ด์ฉํ ๋ช๊ฐ์ ์๋ฃ ๋ถ์ผ์์์ ์์ธก(์ฌ๋ง, ์ ์๊ธฐ๊ฐ, ICD-9 code ๊ทธ๋ฃน) ๋ฒค์น๋งํน ๊ฒฐ๊ณผ๋ฅผ ์ ์ํ๋ คํ๋ค. ํด๋น ์ฐ๊ตฌ์์๋ ICU ๋ฐ์ดํฐ์ ์ธ MIMIC III๋ฅผ ์ฌ์ฉํ์๋ค. ๋ณธ ๋ ผ๋ฌธ์ ๊ฒฐ๊ณผ๋ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ raw clinical time series data๋ฅผ input feature๋ก ์ฌ์ฉํ๋ ๋ชจ๋ธ๋ค์๊ฒ ์ง์์ ์ธ ์ฑ๋ฅ์ด ๋์จ๋ค๋ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ์ค๋ค.
Introduction
ํ์์ ์ฌ๋ง๊ณผ ์ ์๊ธฐ๊ฐ์ ICU ์ ์์์ ๊ฐ์ฅ ์ค์ํ ์์ ๊ฒฐ๊ณผ์ด๋ค. ๊ทธ๋ฆฌ๊ณ ์ง๋ณ์ ์ค์ฆ ์ธก๋ฉด์์ ๋์์ ์ค ์ ์๊ณ ์๋ก์ด ์น๋ฃ, ์ค์ฌ ๋ฐ ๊ฑด๊ฐ ๊ด๋ฆฌ ์ ์ฑ ์ ๊ฐ์น๋ฅผ ๊ฒฐ์ ํ ์ ์๋ค. SAPS-II, SOFA, APACHE์ ๊ฐ์ ์ค์ฆ๋ ์ ์๋ ICU์ ๋ค์ด์จ ๋ค 24์๊ฐ ๋ด์ ์ป์ ์ธก์ ๊ฐ์ผ๋ก ์ ์๋์์ผ๋ฉฐ ์ฌ๋ง๋ฅ ์ ์์ธกํ๊ธฐ ์ํ ๋ชฉ์ ์ผ๋ก ๊ฐ๋ฐ๋์๋ค. ์ต๊ทผ ๋จธ์ ๋ฌ๋๊ณผ ๋ฅ๋ฌ๋์ ๋ฐ์ ๊ณผ ์ฑ๊ณต์ผ๋ก ๋ง์ ์ฐ๊ตฌ์๋ค์ด ICU ์ ์์ ์์ ์์ธก ์์ ์ ๋จธ์ ๋ฌ๋๊ณผ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ์ฒดํํ์๋ค. ๋ณธ ๋ ผ๋ฌธ์์ ์๊ฐํ๋ ์ฐ๊ตฌ๋ค์ ๋ค์๊ณผ ๊ฐ๋ค.
- ๋จธ์ ๋ฌ๋ ์์๋ธ ๋ชจ๋ธ์ ์ด์ฉํ ์ฌ๋ง๋ฅ ์์ธก
- gradient boosting๊ณผ logistic regression ๋ชจ๋ธ์ ์ด์ฉํ ์ฌ๋ง๋ฅ ์์ธก
- ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ์ด์ฉํ 4๊ฐ์ ์์ ์์ธก
๋ณธ ์ฐ๊ตฌ์ ์ฃผ ๊ธฐ์ฌ์ ์ ๋ค์๊ณผ ๊ฐ๋ค.
- ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ์ด์ฉํ ์ฌ๋ง๋ฅ ์์ธก, ์ ์๊ธฐ๊ฐ ์์ธก, ICD-9 code ๊ทธ๋ฃน ์์ธก(์ด ์คํ๋ค์ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ๊ณผ severity scoring system๋ค๋ณด๋ค ๋ ์ข์ ์ฑ๋ฅ์ ๋ํ๋๋ค.
- ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ด clinical feature๋ค์ ๋ฃฐ ๊ธฐ๋ฐ ์ ์ฒ๋ฆฌ๊ฐ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ํ์ํ์ง ์๋ค๋ ๊ฒ์ ๊ฐ๋ฅดํค๋ raw feature๋ค์ ๋ ๋์ ๊ฒฐ๊ณผ๋ฅผ ์ป๋๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋ค.
MIMIC-III dataset preprocessing
Cohort selection
15์ธ๋ณด๋ค ๋ง์ ๋์ด์ ํ์๋ค์ ์ด๋ฅธ์ด๋ผ ์ ์ํ์๊ณ ์ด๋ฅธ์ ํ์๋ค๋ง ํ์ฉํ์๋ค. ๊ทธ ํ์๋ค์ ์ฒซ๋ฒ์งธ ์ ์๊ธฐ๋ก๋ง์ ์ฌ์ฉํ์๊ณ ๊ทธ ์ดํ์ ์ ์ํ ๊ธฐ๋ก์ ์ฌ์ฉํ์ง ์์๋ค. ์ด๋ ๋ถ์์ ์์ด์ ์ ๋ณด๋์ถ ๊ฐ๋ฅ์ฑ์ ๋ฐฉ์งํ๊ณ related work์ ์ ์ฌํ ์คํ ์ค์ ์ ํ๊ธฐ ์ํด์๋ค.
Data extraction
๋ณธ ๋ ผ๋ฌธ์์๋ ์๋์ ํ ์ด๋ธ์ ์ฌ์ฉํ์๋ค.
- inputevents(inputevents_cv, inputevents_mv): philips CareVue ์์คํ ๊ณผ iMDSoft MetaVision ์์คํ ์ ์ฌ์ฉํ์ฌ ๋ชจ๋๋ฌ๋งํ ํ์์ input ์ ๋ณด
- ouputevents: ICU์ ์๋ ๋์ ํ์์ output ์ ๋ณด
- chartevents: ํ์์ ๋ํด ์ฐจํธ๋ก ์์ฑ๋ ๋ชจ๋ ์ ๋ณด
- labevents: lab ์ ๋ณด
- prescriptions: ํ์์ ์ฒ๋ฐฉ๋ ์ ๋ณด, ์ฒ๋ฐฉ๋ฐ์์ผ๋ ๋ฐ๋์ ํฌ์ฌ๋๋ ๊ฒ์ ์๋ ๋ณธ ์ฐ๊ตฌ์์ ์ฌ์ฉํ๋ ๋ฐ์ดํฐ์ ์ MIMIC-III์ MIMIC-III (CareVue)์ด๋ค.
Data cleaning
- ํน์ ๋ณ์์ unit๋ค ๋ถ์ผ์น: ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ณ์๋ณ๋ก ๋จ์๋ค์ ๋น์จ์ ๊ตฌํ์๊ณ ํ๋์ ๋จ์๋ง ๊ฐ์ง๊ณ ์์ ๊ฒฝ์ฐ๋ ๊ทธ๋๋ก ๋๊ณ 90% ์ด์์ด ์ฐจ์งํ๊ณ ์๋ unit์ major unit์ด๋ผ ์ ์ํ์๋๋ฐ ์ด unit์ ๊ทธ๋๋ก ๋๊ณ ๋๋จธ์ง unit๋ค์ ์ญ์ ํ์๋ค. ์ด์ธ์ major unit(90% ์ด์์ ์ฐจ์งํ๋ unit)๊ฐ ์๋ ๊ฒฝ์ฐ ๋ฌธํ์ ์ฐธ๊ณ ํ์ฌ ํ๋์ unit์ผ๋ก ๋ณํํ์๋ค. ๋ณํ๋ unit์ ๋ ผ๋ฌธ์ Appendix A.6์ ํ์ธํ ์ ์๋ค. ์ด ์์ ๊ฒ๋ค์ ํด๋น๋์ง ์๋ feature์ ๊ฒฝ์ฐ ์ญ์ ํ์๋ค.
- ์ผ๋ถ ๋ณ์์๋ ๋์์ ๊ธฐ๋ก๋ ๊ฐ๋ค์ด ์กด์ฌํจ: numerical feature๋ค์ ๊ฒฝ์ฐ, average๋ฅผ ๊ตฌํ๊ณ categorical feature์ ๊ฒฝ์ฐ, ์ฒซ๋ฒ์งธ๋ก ๋ํ๋ ๊ฐ์ ์ ์งํ์๋ค.
- ์ผ๋ถ ๋ณ์์ ๊ฒฝ์ฐ ๋ฒ์๋ก ๊ธฐ๋ก๋์ด์์: ๋ฒ์์ median ๊ฐ์ ๊ตฌํ์๋ค.
Feature selection and extraction
๋ณธ ์ฐ๊ตฌ์์๋ ์์ธก์ ์ฌ์ฉํ๊ธฐ ์ํด ๋ฐ์ดํฐ์ ์์ feature๋ค์ ์ถ์ถํ์๊ณ ์ฒ ์ ํ ๋น๊ต๋ฅผ ์ํด 3๊ฐ์ง์ features set์ ์ ํํ์๋ค.
- feature set A๋ SAPS-II์ ๊ณ์ฐ์ ์ฌ์ฉ๋๋ feature๋ค๋ก ๊ตฌ์ฑ๋๋ค. ์ด feature๋ค์ ๊ฒฝ์ฐ ์ํ ์ง์์ ๋ฐ๋ผ outlier๋ฅผ ์ ๊ฑฐํ๊ณ ๊ด๋ จ feature๋ค์ ๋ณํฉํ์๋ค. ๋ณํฉํ feature๋ค์ ๋ ผ๋ฌธ์์ ํ์ธํ ์ ์๋ค. ๋ง์ฑ์ง๋ณ, ์ ์ํํ, ๋์ด์ ๊ฐ์ feature๋ค์ ๋น์๊ณ์ด๋ก ์ฒ๋ฆฌ๋์๊ณ ์ด์ธ์ ๋๋จธ์ง๋ ์๊ณ์ด feature๋ค๋ก ์ฒ๋ฆฌ๋์๋ค.
- feature set B๋ SAPS-II์ ์ฌ์ฉ๋๋ 17๊ฐ์ feature๋ค๊ณผ ๊ด๋ จ์๋ 20๊ฐ์ feature๋ค๋ก ๊ตฌ์ฑ๋์ด์๋ค. Feature set A๋ฅผ ์ป๊ธฐ ์ํด ์ฒ๋ฆฌ๋ 17๊ฐ์ feature๋ค ๋์ ์ ์ํ์ ๊ฐ(raw value)์ ๊ณ ๋ คํ๋ค. ์ด์์น๋ฅผ ์ ๊ฑฐํ์ง ์๊ณ 0๋ฏธ๋ง์ ๊ฐ๋ง ์ญ์ ํ์๋ค. ์ด feature set์ raw value์ feature๋ค์ ์ฑ๋ฅ์ ์ฐ๊ตฌํ๊ธฐ ์ํด ๊ตฌ์ถ๋์๋ค.
- feature set C๋ 136๊ฐ์ raw value๋ค๋ก ๊ตฌ์ฑ๋๋ฉฐ feature set B์ feature๋ค๋ ํฌํจ๋๋ค. 136๊ฐ์ feature๋ค์ 2,000๊ฐ์ feature๋ค ์ค์ ๋ฎ์ ๋๋ฝ๋น์จ์ ๊ธฐ๋ฐ์ผ๋ก ์ ํ๋์๋ค. Feature set B์ ์ ์ฌํ๊ฒ ์ ์ฒ๋ฆฌ๋ฅผ ํ์ง ์์์ผ๋ฉฐ ์ ์ํ์ ๊ฐ์ ์ฌ์ฉํ๋ค. ์ด feature set์ ์์ธก ๋ชจ๋ธ์ด ๋์ฉ๋์ ์์ ์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ feature representation์ ์๋์ผ๋ก ํ์ตํ ์ ์๋์ง ๋์์ ๋ ์ข์ ์ฑ๋ฅ์ ๋ํ๋ผ ์ ์๋์ง` ์ฐ๊ตฌํ๊ธฐ ์ํด ์ ํ๋์๋ค.
๋ณธ ์ฐ๊ตฌ์์๋ ์ ์ํ๊ณ ์ฒซ 24์๊ฐ๊ณผ ์ฒซ 48์๊ฐ ์์ ์์ง๋ feature๋ค์ ์ถ์ถํ์ผ๋ฉฐ ์๊ณ์ด feature๋ค์ ๊ฒฝ์ฐ 1์๊ฐ๋ง๋ค ์ํ๋งํ์๋ค. ์ํ๋ง ๊ณผ์ ์ค์ ๋ช๊ฐ์ feature๋ค์ ๊ฐ์ ์๊ฐ์์ ์ฌ๋ฌ๊ฐ์ ํ๋ ๊ฐ์ ๊ฐ์ง ๊ฒฝ์ฐ, ํ๊ท ๋๋ ํฉ๊ณ๋ฅผ ๊ตฌํ์๋ค. ์ผ๋ฐ์ ์ผ๋ก ์์ก ๋๋ ์ฝ๋ฌผ์ ๋ํ ๊ธฐ๋ก์ ํฉ๊ณ๋ฅผ ๊ตฌํ์๊ณ ์ด์ธ์ ๋ค๋ฅธ feature๋ค์ ํ๊ท ์ ๊ตฌํ์๋ค. ๊ฒฐ์ธก๊ฐ์ด ๋ฐ์ํ ๊ฒฝ์ฐ, ์๋ค์ ๊ฐ์ ํ๊ท ๋ด์ imputation ํ์๋ค.
Benchmarking experiments
Benchmark prediction tasks
- Mortality prediction(binary classification) ๋ ์์ธํ label ์ ์๋ appendix A.2๋ฅผ ์ฐธ๊ณ ํ์ธ์.
- In-hospital mortality prediction: ICU์ ์ ์ ํ ํ์์ ์ฌ๋ง์ฌ๋ถ๋ฅผ ์์ธก
- Short-term mortality prediction: 2, 3์ผ ์์ ํ์์ ์ฌ๋ง์ฌ๋ถ๋ฅผ ์์ธกํ๋ฉฐ ์ฒซ 24์๊ฐ ๋ฐ์ดํฐ์ ๊ฒฝ์ฐ 2, 3์ผ mortality๋ฅผ ์์ธกํ ์ ์์ง๋ง 48์๊ฐ ๋ฐ์ดํฐ์ ๊ฒฝ์ฐ 3์ผ mortality๋ฅผ ์์ธกํ ์ ์๋ค.
- Long-term mortality prediction: ์ฒซ 24์๊ฐ, 48์๊ฐ ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํ์ฌ 30์ผ, 1๋ ์์ ํ์์ ์ฌ๋ง์ฌ๋ถ๋ฅผ ์์ธก
- ICD-9 code group prediction(multi-task prediction)
- ICD-9 diagnosis code๋ฅผ ์์ธกํ๋ ๊ฒ์ด๋ฉฐ, ICD ์ฝ๋๋ค์ ๋ค์ํ ์ฆ์, ์งํ, ๋ถ์์ด๋ ์ง๋ณ์ ์์ธ ๋ฑ์ ๋ถ๋ฅํ๋๋ฐ ์ฌ์ฉ๋ฉ๋๋ค. 20๊ฐ์ ๊ทธ๋ฃน์ผ๋ก ๋๋์ด์ ธ์๋ค. ICD-9 ์ฝ๋ ๊ทธ๋ฃน 760-779๋ ์ ์์์๊ฒ ๋ถ๋ฅ๋๋ ์ฝ๋์ด๊ธฐ ๋๋ฌธ์ ์ด๋ฅธ์ ๋์์ผ๋ก ํ๋ ๋ฒค์น๋งํน ์ฐ๊ตฌ์์ ์ ์ธํ์๋ค.
- Length of stay prediction(regression problem) ๊ฐ admission์ ๋ํ ์ ์ ๊ธฐ๊ฐ์ ์์ธกํ์๋ค.
Prediction algorithms
Scoring methods
- SAPS-II : ์ด ์ ์๋ ICU์ ์ ์ํ ํ์๋ค ์ง๋ณ์ ์ค์ฆ๋ ์ธก์ ํ๊ธฐ ์ํด ๊ฐ๋ฐ๋์๋ค. 12๊ฐ์ feature๋ค์ ์ด์ฉํด ๊ณ์ฐํ ์ ์๋ค. SAPS-II๋ฅผ ์ด์ฉํ mortality ์์ธก์ ๋ค์๊ณผ ๊ฐ๋ค.
- SOFA: ICU์ ์ ์ํ ํ์๋ค์ ์ฅ๊ธฐ๋ถ์ ๋ฐ ์ํ ํ๊ฐ๋ฅผ ์ํ ์ ์์ด๋ค. SOFA๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ mortality ์์ธก์ ๋ก์ง์คํฑ ํ๊ท ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ์ป์ ์ ์๋ค.
- New SAPS-II: SAPS-II์ ์์ ๋ ๋ฒ์ ์ด๋ฉฐ SAPS-II์ ์ฌ์ฉ๋ feature๋ค์ ์ฌ์ฉํ์ฌ ๋ก์ง์คํฑ ํ๊ท ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ์ป์ ์ ์๋ค.
Super Learner models
super learner๋ ์์ธก ์๊ณ ๋ฆฌ์ฆ์ ์ต์ ์ ์กฐํฉ์ ์ฐพ๊ธฐ์ํด ๊ฐ๋ฐ๋ supervised learning algorithm์ด๋ฉฐ cross-validation ์ด๋ก ์ ๊ธฐ๋ฐ์ผ๋ก ํ๋ค. ๋ณธ ์ฐ๊ตฌ์์๋ Super Learner I: ๋ฒ์ฃผํ๋ ๋ณ์๋ค๊ณผ์ super learner์ Super Learner II: ๋ณํ๋์ง ์์ ๋ณ์๋ค์ super learner ๋๊ฐ์ง๋ฅผ ๊ณ ๋ คํ์๋ค. Super Learner-I๋ feature set A๋ง ์ ์ฉ๋๊ณ Super Learner-II๋ feature set 3๊ฐ์ง ๋ชจ๋ ์ฌ์ฉ์ด ๊ฐ๋ฅํ๋ค.
Deep Learning models
๋ฅ๋ฌ๋ ๋ชจ๋ธ์ end-to-end training์ ์ํด ๋ณต์กํ ๋ฐ์ดํฐ representation์ ์๋์ผ๋ก ์ถ์ถํ๋๋ฐ ์ฑ๊ณต์ ์ธ ์ ๊ทผ ๋ฐฉ์์ด๋ค. ๋ณธ ์ฐ๊ตฌ์์๋ Feedforward neural networks(FFN)๊ณผ Recurrent Neural Network(RNN)์ ensemble์ธ Multimodal Deep Learning Model(MMDL)์ ์ ์ํ๋ค. ์ด ๋ชจ๋ธ์ ๊ณต์ ๋ representation layer๋ฅผ ์ฌ์ฉํ์ฌ modality๋ค์ ์ ์ฌ์ฑ์ ํ์ตํ๋ ๊ฒ์ด๋ค. EHR๊ณผ ๊ฐ์ด ๊ฐ ํ ์ด๋ธ ๋ณ๋ก ๋ณ๋์ modality๋ฅผ ๊ฐ์ง๋ ๋ฐ์ดํฐ์ ์ ์ฉํ๋ค.
MMDL์ ๋น์๊ณ์ด ๋ฐ์ดํฐ์ ์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ ๊ฐ๋ณ์ ์ผ๋ก ๋ค๋ฃจ๋๋ฐ ๋น์๊ณ์ด ๋ฐ์ดํฐ๋ FFN์ ์๊ณ์ด ๋ฐ์ดํฐ๋ GRU์ input์ผ๋ก ๋ค์ด๊ฐ๊ณ ๋์จ ouput์ ๊ณต์ ๋ latent representaton layer์ combineํ๋ค.
Implemetation details
๋ณธ ์ฐ๊ตฌ์์๋ Theano์ Keras๋ก ์ํํ์๊ณ 5-fold cross validation์ ์ค์ํ์๊ณ 5๊ฐ์ testing fold์ ์ฑ๋ฅ ์ ์์ ํ๊ท ๊ณผ ํ์ค ์๋ฌ๋ฅผ ๊ตฌํ์๋ค. ํ๊ฐ metric์ผ๋กclassfication ๋ฌธ์ ์ ๊ฒฝ์ฐ AUROC์ AUPRC๋ฅผ ์ฌ์ฉํ์๊ณ , regression ๋ฌธ์ ์ ๊ฒฝ์ฐ MSE๋ฅผ ์ฌ์ฉํ์๋ค. parameter ํ๋์ ๊ฒฝ์ฐ, ์ฑ๋ฅ์ ํฐ์ฐจ์ด๋ฅผ ๋ณด์ด์ง ์์ ๊ฐ ์๊ณ ๋ฆฌ์ฆ์ ๊ธฐ๋ณธ hyper parameter๋ฅผ ์ธํ ํ์๋ค.
๋ฅ๋ฌ๋ ๋ชจ๋ธ์์๋ learning rate๋ classificaton ๋ฌธ์ ๋ 0.001, regression ๋ฌธ์ ๋ 0.005๋ก ๋์๊ณ RMSProp optimizer๋ก trainํ์๋ค. activation function์ ReLU๋ฅผ ์ฌ์ฉํ์๊ณ dropout rate์ 0.1, batch sizesms 100, max epoch number๋ 250์ผ๋ก ์ธํ ํ์๊ณ early stopping์ ์ฌ์ฉํด์ ์ต์ ์ weight๋ฅผ ๊ตฌํ๊ณ batch normalization์ ์ฌ์ฉํ์๋ค. ์์์ ์ธ๊ธํ๋ฏ์ด ๋น์๊ณ์ด ๋ฐ์ดํฐ๋ FFN, ์๊ณ์ด ๋ฐ์ดํฐ๋ GRU๋ก ๋ค๋ค๋ค.
Results
๋๋ถ๋ถ์ ์์ธก ๊ฒฐ๊ณผ MMDL์ ์ฑ๋ฅ์ด ๋ ์ข์๋ค๋ ๊ฒ์ ์๊ธฐํ๊ณ ์๊ณ feature๋ค ์ค์์๋ ์ ์ฒ๋ฆฌ๋ฅผ ํ์ง ์๊ณ ๋ค๋ฅธ feature set๋ค๋ณด๋ค ๋ง์ ์์ feature๋ค์ ๊ฐ์ง feature set C๊ฐ ๋ ์ข์ ์ ์๋ฅผ ์ป์๋ค. ๋ฐ๋ผ์ ๋ณธ ์ฐ๊ตฌ์์๋ ์๋ณธ์ ์์ ์๊ณ์ด ๋ฐ์ดํฐ๊ฐ ์์ธก ๋ชจ๋ธ์ input feature๋ก ์ฌ์ฉ๋๋ ๊ฒฝ์ฐ, ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ด ๋จธ์ ๋ฌ๋ ์์๋ธ, SAPS II์ SOFA ์ ์๋ฅผ ์ด์ฉํ ์์ธก๋ณด๋ค ์ฑ๋ฅ์ด ์ฐ์ํ๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋ค.
์ด ๋ ผ๋ฌธ์ ์ฝ๊ณ
์ฃผ๋ก lab event ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์๊ณ ๊ฒฐ๋ก ์ผ๋ก ๋จธ์ ๋ฌ๋์ด๋ SAPS-II, SOFA์ ๊ฐ์ method๋ณด๋ค ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ์ฑ๋ฅ์ด ์ข์๋ค๋ ๊ฒ์ ๋งํ๊ณ ์๋ค. ์ด ๋ ผ๋ฌธ์ ์ฝ๊ณ ๋์ ๋ค๋ฅธ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ๋ณด๋ค ์ฑ๋ฅ์ด ๋ฐ์ด๋๋ค๋ ๊ฒ์ ์ดํดํ์ง๋ง ์ด ๋ชจ๋ธ์ด ์ค์ ๋ก ํ์ฉ ๊ฐ๋ฅํ์ง๋ ์๋ฌธ์ด ๋ค์๋ค. regression task์ ๊ฒฝ์ฐ MSE๋ ์ด๋ ๊ธฐ์ค๊น์ง๊ฐ ์ข์ ์ฑ๋ฅ์ ๋ํ๋ด๋์ง ๊ฐ์ธ์ ์ผ๋ก ๊ถ๊ธํ๋ค.
๋ ผ๋ฌธ์์๋ fine-tuning์ด ์ฑ๋ฅ์ ํฌ๊ฒ ์ข์ง์ฐ์ง ํ์ง ์๋ ๊ฒ์ ํ์ธํ๊ณ ๊ธฐ๋ณธ๊ฐ์ hyper parameter๋ฅผ ์ฌ์ฉํ๋๋ฐ ์ด ๋ถ๋ถ์ด ์ด ๋ฐ์ดํฐ์ ์์๋ง ๊ทธ๋ฌ๋ ๊ฑด์ง ๋ค๋ฅธ ๋ฐ์ดํฐ์ ์๋ ๊ทธ๋ฌ๋ ๊ฑด์ง ๊ถ๊ธํด์ก๋ค.
Reference
'๐ง Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
๐ชข ๋ฅ๋ฌ๋์ ํ์ํ ํ๋ฅ ์ด์ง ์ฐ์ด๋จน๊ธฐ, ์ต๋์ฐ๋๋ฒ (0) | 2024.05.02 |
---|---|
๐ง๏ธ ์ดํดํ๋ฉด ์ฌ์ด ๋ฒ ์ด์ฆ ์ ๋ฆฌ์ VAE (0) | 2024.04.17 |
๐งโ๐ซ KL divergence ์ดํด๋ณด๊ธฐ (1) | 2024.04.08 |
๐ Multivariable Fractional Polynomials(MFP) (0) | 2024.04.03 |
โ๏ธ RNN์์ orthogonal matrix๋ฅผ initializer๋ก ์ฐ๋ ์ด์ (0) | 2024.04.03 |
- ์ฑ ๋ฆฌ๋ทฐ
- Computer Vision
- Multiprocessing
- python
- ํ๊ณ
- ๋ ํ๊ฐ
- ๋ฒ ์ด์ฆ ์ ๋ฆฌ
- ๊ธ๋
- linux
- vscode
- ๊ฐ๋ฐ์
- tmux
- GIT
- ๋จธ์ ๋ฌ๋ ์ด๋ก
- Generative Model
์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- Total
- Today
- Yesterday