πͺ’ λ₯λ¬λμ νμν νλ₯ μ΄μ§ μ°μ΄λ¨ΉκΈ°, μ΅λμ°λλ²
λ₯λ¬λ λͺ¨λΈμ 곡λΆνλ€λ³΄λ©΄ νμ λ§νλ νλ₯ ..!!!π€¦π»ββοΈ νΉν λ₯λ¬λ κΈ°λ°μ μμ± λͺ¨λΈμ 곡λΆν λ μμμμ νλ₯ μ μ΄ν΄ν΄μΌν©λλ€. κ·Έλμ μ΄λ² κΈμμ μμ£Ό λμ€λ νλ₯ 4κ°μ μ©μ΄μ λν΄ μ 리νλ €ν΄μ. λ΄μ©μ μ£Όλ‘ λ―Έμ κ΄μ GAN λ₯λ¬λ μ€μ νλ‘μ νΈλ₯Ό μ°Έκ³ νμ΅λλ€.
ν본곡κ°
νλ³Έ 곡κ°μ μν xκ° κ°μ§ μ μλ λͺ¨λ κ°μ μ§ν©μ λλ€. μμ£Ό κ°λ¨ν μμλ‘ μ£Όμ¬μλ₯Ό λμ Έ λμ¨ λμ μλΌκ³ ν λ μνμ 1, 2, 3, 4, 5, 6μ΄ λ μ μκ³ νλ³Έ 곡κ°μ \(S=\{1,2,3,4,5,6\}\)μΌλ‘ λνλΌ μ μμ΄μ. λλ€λ₯Έ μλ‘ μ΄ μΈμ λͺ¨λ μ±μΈλ€μ ν€κ° 100cmλΆν° 300cmμ΄κ³ λͺΈλ¬΄κ²κ° 30kgλΆν° 200kgκΉμ§λΌλ©΄ μλμ κ°μ νλ³Έ 곡κ°μ λ§λ€ μ μμ΅λλ€. μ΄ μΈμμ 180cmμ λͺΈλ¬΄κ²κ° 80kgμΈ μ΄λ μ΄λ μ¬λμ΄ μλ€λ©΄ (ν€, λͺΈλ¬΄κ²) = (180, 80)μΈ μνμ΄ νλ³Έκ³΅κ° μμ μλ€λ κ±°μμ.

νλ₯ λ°λ ν¨μ
νλ₯ λ°λ ν¨μ p(x)λ νλ³Έ 곡κ°μ ν¬μΈνΈ xλ₯Ό 0κ³Ό 1 μ¬μ΄μ μ«μμ λ§€νν΄μ£Όλ ν¨μμ λλ€. νλ³Έ 곡κ°μ λͺ¨λ ν¬μΈνΈμ λν νλ₯ λ°λ ν¨μμ ν©μ 1μ΄ λμ΄μΌ ν€μ. νλ³Έκ³΅κ° λ°κΉ₯μ 곡κ°μ p(x)λ 0μ΄κ³ νλ³Έκ³΅κ° μμ p(x)λ μ΄λ€ μμκ°μ κ°μ΅λλ€.

λͺ¨μ λͺ¨λΈ
λͺ¨μ λͺ¨λΈ \(p_\theta (x)\)λ νμ λ κ°μ(μ ν κ°μ)μ νλΌλ―Έν° \(\theta\) λ₯Ό μ¬μ©νμ¬ λ¬μ¬νλ νλ₯ λ°λ ν¨μμ ν μ’ λ₯μμ. μλ₯Ό λ€μ΄ μμ μμλ‘ λ€μλ©΄, \(\theta\) λ μμμ μΌμͺ½ μλ λͺ¨μ리 μ’ν \((\theta_1, \theta_2)\)μ μ€λ₯Έμͺ½ μλ λͺ¨μ리 μ’ν \((\theta_3, \theta_4)\) λ€ κ°μ νλΌλ―Έν°λ‘ λ§λ€ μ μμ΅λλ€. μ¦, μ΄ λͺ¨μ λͺ¨λΈμ κ° νλ₯ λ°λ ν¨μλ 4κ°μ μ«μ \(\theta= (\theta_!, \theta_2, \theta_3, \theta_4)\)λ‘ ννν μ μμ΅λλ€. \(p_\theta (x)\)λ μμμ λν΄ μ’ λ μμΈν μ΄ν΄ν΄λ³΄μλ©΄ xλ€μ νλ₯ λ°λν¨μλ₯Ό \(\theta\)λ₯Ό μ΄μ©ν΄ λνλΈ κ²μ΄μμ. μμμ λ€μ μ°λ©΄ \(P(x|\theta)\)λΌκ³ λ μΈ μ μμ΄μ.
μ΅λ μ°λλ²(Maximum Likelihood Method)
μ΅λμ°λλ²μ λͺ¨μμ μΈ λ°μ΄ν° λ°λ μΆμ λ°©λ²μΌλ‘μ¨ νλΌλ―Έν° ΞΈλ‘ κ΅¬μ±λ μ΄λ€ νλ₯ λ°λν¨μ \(P(x|\theta)\)μμ κ΄μΈ‘λ νλ³Έ λ°μ΄ν° μ§ν©μ xλΌ ν λ, μ΄ νλ³Έλ€μμ νλΌλ―Έν° ΞΈλ₯Ό μΆμ νλ λ°©λ²μ λλ€. μ’ λ μ½κ² μλ₯Ό λ€μ΄ λ³Όκ²μ. μλμ κ°μ΄ 5κ°μ λ°μ΄ν° xλ₯Ό μ»μμ λ 보λΌμ 곑μ κ³Ό μ΄λ‘μ 곑μ μ€ μ΄λ€ 곑μ μμ μ»μ λ°μ΄ν°μΌκΉμ? μ§κ°μ μΌλ‘ 보λΌμ 곑μ μ΄λΌκ³ μκ°ν μ μμ΄μ. μλλ©΄ 보λΌμ 곑μ μ μ€μ¬μ΄ λ°μ΄ν°μ μ€μ¬κ³Ό κ°κΉκΈ° λλ¬Έμ΄μμ. μ¦, 보λΌμ 곑μ μΌ κ°λ₯μ±(κ°λ₯λ)μ΄ λλ€κ³ λ§ν μ μμ΅λλ€. μ¬κΈ°μ λ§νλ κ°λ₯μ±(κ°λ₯λ)κ° likelihoodμ λλ€. likelihoodλ μ§κΈ μ»μ λ°μ΄ν°κ° μ΄ λΆν¬λ‘λΆν° λμμ κ°λ₯λλ₯Ό λ§νλ κ²μ΄μμ. λ€μ μ 리νμλ©΄ νλ₯ λ°λν¨μμμλ πκ° μ΄λ―Έ μκ³ μλ μμκ³μκ³ xκ° λ³μμ§λ§ likelihoodμμ xλ₯Ό μ΄λ―Έ μκ³ μλ μμκ³μκ³ πλ₯Ό λ³μλ‘ μκ°νλ©΄ λ©λλ€.

κ·Έλ λ€λ©΄ likelihoodλ₯Ό μ΄λ»κ² νλ©΄ μμνν μ μμκΉμ? λ°©λ² μ€ νλλ κ° λ°μ΄ν° ν¬μΈνΈλ‘λΆν° ν보ꡰμ λΆν¬ λμ΄λ₯Ό likelihood κΈ°μ¬λλΌκ³ νμ¬ λͺ¨λ κ³±νλ κ²μ λλ€. κ³±ν κ°μ΄ ν΄μλ‘ νμ¬μ λ°μ΄ν°λ€μ μ λνλ΄λ νλ₯ λΆν¬λΌλ κ²μ΄μ£ . μ΄ λͺ¨λ λΆν¬μ λν λμ΄λ₯Ό μ λΆ κ³±ν κ²μ΄ likelihood ν¨μμ λλ€!

μμμΌλ‘ μ μ΄λ³΄μλ©΄ μλμ κ°μμ. μ κΈ° 보μ΄λ λ¬Έ κ°μ건 νμ΄λΌκ³ νλλ°μ. k=1λΆν° nκΉμ§μ λͺ¨λ \(p(x_k|\theta)\)λ₯Ό κ³±νλΌλ μλ―Έμ λλ€. μμμ μΌμͺ½μ μλ likelihood ν¨μλ₯Ό μ΅λννλ \(\theta\)λ₯Ό κ³μ°νλ κ²μ΄ μ΅λ μ°λλ²μ λλ€.
$$ \mathcal{L}=P(x|\theta)= \prod_{k=1}^{n}p(x_k|\theta) $$
κ³μ°μ λ μ½κ² νκΈ° μν΄ logλ₯Ό μ·¨ν΄μ€λλ€. κ·Έλ¬λ©΄ νμ΄μλ κ³±νκΈ°λ€μ΄ λνκΈ°λ‘ λ°λκ² λ©λλ€. μ°λ¦¬λ μ΅λν λ°μ΄ν°λ₯Ό μ νννλ νλ₯ λΆν¬λ₯Ό ꡬνκ³ μΆκΈ° λλ¬Έμ likelihoodμ μ΅λκ°μ μ°Ύμμ£Όλ©΄ λ©λλ€.
$$ \mathcal{L(\theta|x)}= logP(x|\theta)= log\prod_{k=1}^{n}p(x_k|\theta) =\sum_{k=1}^{n}p(x_k|\theta) $$
λ‘κ·Έν¨μλ λ¨μ‘°μ¦κ°νκΈ° λλ¬Έμ logλ₯Ό μμ΄ κ°μ μ΅λκ°μ ΞΈμ κ°μ§λ§, λ‘κ·Έλ₯Ό μμ°μ§ μμ, μλ₯Ό λ€μ΄ κ°μ°μ€ λΆν¬λ₯Ό κ°λ κ²½μ°λ λΆν¬ ν¨μκ° μλ‘ λ³Όλ‘νκΈ° λλ¬Έμ likelihoodλ μλ‘ λ³Όλ‘νκ² λ©λλ€. κ·Έλ λ€λ©΄ λ―ΈλΆμ μ΄μ©ν΄ μ΅λκ°μ ꡬν μ μκ² λμ£ . κ·Έλμ νΈλ―ΈλΆμ μ¬μ©νκ² λκ³ λ―ΈλΆν κ°μ΄ 0μ΄ λλ κ°μ μ°ΎμΌλ©΄ λ©λλ€.
$$ \hat\theta = \underset \theta {argmax}\ \mathcal{L}(\theta|X) $$
μ°Έκ³ ν κΈ