Deep learning overall

딥러닝은 1. 어떠한 Input을 받아서 2. 적절한 계산을 한 후 3. output을 내는 이 과정이 Recursive하게 반복되는 모양임을 알 수 있다.

이를 약간 수학적으로 표현하면 Input과 Output 모두 $\mathbb{R}^n,~\R^m$ vector로 바꾸어 함수 $f\ :\ \R^n\rightarrow \R^m$ 을 거치게 되고, 이 함수에서 나온 결과를 next layer의 input으로 삼아서 계산을 하는 방식

저 일련의 과정을 거치는 하나의 개체?를 Perceptron(Neuron)이라고 하며, 이 Perceptron을 통하여 Binary Classification을 할 수 있다.

Weighted sum

들어온 Input들에 대해 학습을 한 Weight(우리가 정해주는 것이 아니라 학습해주는 요소이다)들을 곱해서 다 더하는 과정을 Weighted sum이라고 한다.

식으로 표현하면 $w_1x_1+w_2x_2+\cdots+w_kx_k+b=\displaystyle\sum_{i=1}^k w_ix_i+b$ 으로 나타낼 수 있다.

또한, 단순히 Weight들을 합한 값들이 어떠한 의미를 가진다고는 할 수가 없음.
- 각 Feature들의 선형 연산으로 알맞은 답이 나올 수는 없고, Non-linear한 관계들끼리도 나타내주기 위해서는 선형성을 바꿔주는 함수가 필요함

추후 나오겠지만 Weight들을 학습하는 과정에선 Back Propagation을 하게 되는데 그 과정에서 미분을 해야하기 때문에 반드시 Activation function은 미분가능 하여야 함

f(z)=\dfrac{1}{1+e^{-z}}

f(z)=\begin{cases} z&(z\geq0) \\ 0 &(z<0)\end{cases}

f(z)=\begin{cases} z&(z\geq0) \\ 0.1z &(z<0)\end{cases}

퍼셉트론이 초기에 고안되었을 때, 말했다시피 이진적인 분류는 가능했음
- 예를 들어 Output이 10 이상이면 Yes를, 10보다 작으면 No를 도출하는 분류

그러면, 좌표평면에서 너부러져 있는 값에서 하나의 퍼셉트론을 이용하여 XOR 연산을 하는 것은 불가능하다는 것을 의미 ⇒ 인공지능의 의미가 굉장히 떨어짐

왜냐면, 두 종류 이상의 분류도 못하는데 Non-linear한 데이터들은 더 분류하기 힘들 것이기 때문! ⇒ 이를 해결하기 위해 Multilayer perceptron가 대두

Uploaded by N2T

6. Universal Approximation Theorem (0)	2022.07.16
5. Backpropagation (0)	2022.07.16
4. Loss & Stochastic gradient descent (0)	2022.07.16
3. Multilayer perceptron & Forward Pass (0)	2022.07.16
1. Machine learning & Deep learning overall (0)	2022.07.16