google.com, pub-9850333530125189, DIRECT, f08c47fec0942fa0 딥 러닝 알고리즘
본문 바로가기
카테고리 없음

딥 러닝 알고리즘

by ╰(*°▽°*)╯(¬_¬ ) 2022. 2. 5.
반응형

딥 러닝 알고리즘이란?

딥 러닝은 효과적인 결정을 내리기 위해 특정 인간 두뇌 기능을 기반으로 인간과 인간의 행동을 위협하기 위한 기계 학습 및 인공 지능의 방법으로 정의할 수 있습니다. 예측 모델링 및 통계에서 데이터 기반 기술을 기반으로 모델링을 채널링 하는 매우 중요한 데이터 과학 요소입니다. 적응하고 학습하고 그에 따라 기능하는 인간과 같은 능력을 발휘하려면 우리가 일반적으로 알고리즘이라고 부르는 강력한 힘이 있어야 합니다.

딥 러닝

알고리즘은 작업을 수행하기 위해 사전 훈련된 의사 결정 네트워크 집합에 불과한 여러 계층 의 신경망을 통해 실행되도록 동적으로 만들어집니다. 나중에 이들 각각은 간단한 계층 표현을 통해 전달되고 다음 계층으로 이동합니다. 그러나 대부분의 기계 학습 은 수백 개의 기능이나 열을 처리해야 하는 데이터 세트에서 상당히 잘 작동하도록 훈련되었습니다. 정형 또는 비정형 데이터 세트의 경우, 머신 러닝은 RGB에서 800x1000 크기의 단순한 이미지를 인식하지 못하기 때문에 대부분 실패하는 경향이 있습니다. 전통적인 머신 러닝 알고리즘이 이러한 깊이를 처리하는 것은 상당히 불가능해집니다. 이것이 딥 러닝이 있는 곳입니다.

딥러닝의 중요성

딥 러닝 알고리즘은 기능을 결정하는 데 중요한 역할을 하며 구조화되거나 구조화되지 않은 데이터에 대한 많은 프로세스를 처리할 수 있습니다. 하지만 딥 러닝 알고리즘은 복잡한 문제를 수반할 수 있는 일부 작업을 과도하게 사용할 수 있습니다. 그 이유는 효과적으로 기능하기 위해 방대한 양의 데이터에 액세스해야 하기 때문입니다. 예를 들어 이미지를 인식하는 인기 있는 딥 러닝 도구가 있습니다. Imagenet 은 데이터 세트 기반 알고리즘에서 1,400만 이미지에 액세스 할 수 있습니다. 이미지를 데이터 세트로 목표로 하는 딥 러닝 도구에 대한 다음 수준의 벤치마크를 정의한 매우 포괄적인 도구입니다.

딥 러닝 알고리즘은 이전에 논의한 이미지를 각 신경망 계층을 통해 전달하여 학습하는 고도로 진보적인 알고리즘입니다. 레이어는 에지 및 픽셀 과 같은 이미지의 낮은 수준의 특징을 감지하는 데 매우 민감하며 이후 결합된 레이어는 이 정보를 취하고 이전 데이터와 비교하여 전체적인 표현을 형성합니다. 예를 들어, 중간 계층은 사진에서 물체의 일부 특수 부분을 감지하도록 프로그래밍될 수 있으며, 다른 심층 훈련된 계층은 개, 나무, 기구 등과 같은 특수 물체를 감지하도록 프로그래밍될 수 있습니다.

그러나 복잡성이 덜하고 데이터 기반 리소스가 필요한 간단한 작업을 이야기하면 딥 러닝 알고리즘은 간단한 데이터를 일반화하지 못합니다. 이것이 딥 러닝이 선형 또는 부스트 트리 모델로 효과적이지 않은 주요 이유 중 하나입니다. 단순 모델은 맞춤형 데이터를 대량 생산하고 사기 거래를 추적하며 더 적은 기능으로 덜 복잡한 데이터 세트를 처리하는 것을 목표로 합니다. 또한, 딥 러닝이 더 작지만 구조화된 데이터 세트를 포함하지만 일반적으로 선호되지 않기 때문에 딥 러닝이 효과적일 수 있는 다중 클래스 분류와 같은 다양한 경우가 있습니다.

그렇긴 하지만 아래에 주어진 가장 중요한 딥 러닝 알고리즘을 살펴보겠습니다.

딥러닝 알고리즘은 다음과 같습니다.

1. CNN(Convolutional Neural Networks)

ConvNet 으로 널리 알려진 CNN은 주로 여러 레이어로 구성되며 특히 이미지 처리 및 객체 감지에 사용됩니다. 1998년 Yann LeCun에 의해 개발되었으며 처음에는 LeNet이라고 불렸습니다. 당시에는 숫자와 우편번호를 인식하도록 개발되었습니다. CNN은 위성 이미지 식별, 의료 이미지 처리, 시리즈 예측 및 이상 감지에 널리 사용됩니다.

CNN은 데이터를 여러 레이어를 통해 전달하고 컨볼루션 연산을 나타내기 위해 특징을 추출하여 처리합니다.

Convolutional Layer 는 기능 맵을 수정하기 위해 오래 지속되는 ReLU( Rectified Linear Unit )로 구성됩니다. 풀링 레이어는 이러한 기능 맵을 다음 피드로 수정하는 데 사용됩니다. 풀링은 일반적으로 다운 샘플링되는 샘플링 알고리즘이며 피쳐 맵의 차원을 줄입니다. 나중에 생성된 결과는 맵에서 병합된 단일, 긴, 연속 및 선형 벡터로 구성된 2차원 배열로 구성됩니다. 평평한 행렬을 형성하는 완전 연결 계층이라고 하는 다음 계층 또는 Pooling Layer에서 입력으로 가져온 2차원 배열을 분류하여 이미지를 식별합니다.

2. 장단기 기억 네트워크(LSTM)

LSTM 은 장기적으로 종속성을 학습하고 적응하도록 프로그래밍된 RNN( Recurrent Neural Networks ) 으로 정의할 수 있습니다. 더 오랜 기간 동안 과거 데이터를 기억하고 불러올 수 있으며 기본적으로 이것이 유일한 동작입니다. LSTM은 시간이 지남에 따라 유지하도록 설계되었으며 이후로는 메모리 또는 이전 입력을 제한할 수 있기 때문에 시계열 예측에 주로 사용됩니다. 이 비유는 서로 다르게 통신하는 4개의 상호 작용하는 레이어로 구성된 사슬과 같은 구조에서 비롯됩니다. 시계열 예측의 응용 외에도 음성 인식기 구성, 의약품 개발 및 음악 루프 구성에도 사용할 수 있습니다.

LSTM은 일련의 이벤트에서 작동합니다. 첫째, 그들은 이전 상태에서 달성한 관련 없는 세부 사항을 기억하지 않는 경향이 있습니다. 다음으로, 특정 셀 상태 값을 선택적으로 업데이트하고 최종적으로 셀 상태의 특정 부분을 출력으로 생성합니다. 아래는 작동 다이어그램입니다.

3. 순환 신경망(RNN)

순환 신경망 또는 RNN은 LSTM에서 제공되는 입력이 RNN의 현재 단계에서 입력으로 사용될 수 있도록 하는 주기를 형성하는 일부 직접 연결로 구성됩니다. 이러한 입력은 입력으로 깊숙이 포함되어 있으며 LSTM의 암기 능력을 강화하여 이러한 입력이 내부 메모리에 일정 기간 흡수되도록 합니다. 따라서 RNN은 LSTM에 의해 보존되고 LSTM의 동기화 현상 하에서 작동하는 입력에 의존합니다. RNN은 주로 이미지 캡션, 시계열 분석, 손으로 쓴 데이터 인식, 데이터를 기계로 번역하는 데 사용됩니다.

RNN은 시간이 t로 정의된 경우 출력 피드 (t-1) 시간 을 입력하여 작업 접근 방식을 따릅니다. 다음으로, t에 의해 결정된 출력은 입력 시간 t+1에서의 피드입니다. 유사하게, 이러한 프로세스는 임의의 길이로 구성된 모든 입력에 대해 반복됩니다. RNN에 대한 사실도 과거 정보를 저장하고 모델 크기를 늘려도 입력 크기가 증가하지 않는다는 사실입니다. RNN을 펼치면 이런 모양이 됩니다.

4. 생성적 적대 네트워크(GAN)

GAN은 훈련 데이터와 일치하는 새로운 데이터 인스턴스를 생성하는 데 사용되는 딥 러닝 알고리즘으로 정의됩니다. GAN은 일반적으로 잘못된 데이터를 생성하는 방법을 학습하는 생성기와 이 잘못된 데이터로부터 학습하여 자체적으로 적응하는 판별 자의 두 가지 구성요소로 구성됩니다. 한동안 GAN은 천문학적 이미지를 명확히 하고 중력 암흑 물질 렌즈를 시뮬레이션하는 데 자주 사용되기 때문에 엄청난 사용을 얻게 되었습니다. 또한 비디오 게임에서 4K 와 같은 고해상도로 재생성하여 2D 텍스처의 그래픽을 높이는 데 사용됩니다. 그들은 또한 현실적인 만화 캐릭터를 만드는 데 사용됩니다. 또한 사람의 얼굴과 3D 개체 렌더링을 렌더링 합니다.

GAN은 가짜 데이터와 실제 데이터를 생성하고 이해함으로써 시뮬레이션에서 작동합니다. 이러한 데이터를 이해하기 위한 훈련 중에 생성기는 판별자가 거짓 데이터로 적응하고 응답하는 방법을 빠르게 학습하는 다양한 종류의 가짜 데이터를 생성합니다. 그런 다음 GAN은 업데이트를 위해 이러한 인식된 결과를 보냅니다. 기능을 시각화하려면 아래 이미지를 고려하십시오.

5. 방사형 기저 기능 네트워크(RBFN)

RBFN은 피드 포워드 접근 방식을 따르고 방사형 함수를 활성화 함수로 사용하는 특정 유형의 신경망입니다. 시계열 예측, 회귀 테스트 및 분류에 주로 사용되는 입력 계층, 은닉 계층 및 출력 계층의 세 가지 계층으로 구성됩니다.

RBFN은 훈련 데이터 세트에 존재하는 유사성을 측정하여 이러한 작업을 수행합니다. 그들은 일반적으로 이러한 데이터를 입력 레이어에 공급하여 식별을 확인하고 이전 데이터 세트를 비교하여 결과를 롤 아웃하는 입력 벡터를 가지고 있습니다. 정확히는 입력 레이어에는 이러한 데이터에 민감한 뉴런 이 있으며 레이어의 노드는 데이터 클래스를 분류하는 데 효율적입니다. 뉴런은 원래 은닉층에 존재하지만 입력층과 긴밀하게 통합되어 작동합니다. 은닉층 은 뉴런 중심에서 출력까지의 거리에 반비례하는 가우스 전달 함수를 포함합니다. 출력 레이어에는 방사형 기반의 선형 조합이 있습니다. 가우스 함수가 매개변수로 뉴런에 전달되고 출력이 생성되는 데이터입니다. 프로세스를 완전히 이해하려면 아래 주어진 이미지를 고려하십시오.

6. 다층 퍼셉트론(MLP)

MLP는 딥 러닝 기술의 기반입니다. 다양한 퍼셉트론 레이어를 갖는 피드 포워드 신경망의 클래스에 속합니다. 이러한 퍼셉트론에는 다양한 활성화 기능이 있습니다. MLP는 또한 입력 및 출력 레이어를 연결했으며 그 수는 동일합니다. 또한 이 두 레이어 사이에 숨겨진 레이어가 있습니다. MLP는 주로 이미지 및 음성 인식 시스템 또는 일부 다른 유형의 번역 소프트웨어를 구축하는 데 사용됩니다.

MLP의 작업은 입력 계층에 데이터를 공급하는 것으로 시작됩니다. 레이어에 존재하는 뉴런은 한 방향으로 통과하는 연결을 설정하기 위해 그래프를 형성합니다. 이 입력 데이터의 가중치는 은닉층과 입력층 사이에 존재함을 알 수 있다. MLP는 활성화 기능을 사용하여 실행할 준비가 된 노드를 결정합니다. 이러한 활성화 함수에는 tanh 함수, 시그모이드 및 ReLU가 포함됩니다. MLP는 주로 주어진 데이터 세트에서 원하는 출력을 달성하기 위해 계층이 어떤 종류의 상관관계를 제공하는지 이해하도록 모델을 훈련하는 데 사용됩니다. 더 잘 이해하려면 아래 이미지를 참조하십시오.

7. 자기 조직화 지도(SOM)

SOM 은 인공 및 자가 조직 신경망을 통해 데이터 차원을 이해하기 위해 데이터 시각화를 달성하기 위해 Teuvo Kohenen에 의해 발명되었습니다. 딥 러닝 알고리즘 문제를 해결하기 위해 데이터 시각화를 달성하려는 시도는 주로 인간이 시각화할 수 없는 것에 의해 수행됩니다. 이러한 데이터는 일반적으로 고차원이므로 사람이 개입할 가능성과 오류가 적습니다.

SOM은 다른 노드의 가중치를 초기화한 다음 주어진 훈련 데이터에서 임의의 벡터를 선택하여 데이터를 시각화하는 데 도움이 됩니다. 그들은 종속성을 이해할 수 있도록 상대적 가중치를 찾기 위해 각 노드를 검사합니다. 이기는 노드가 결정되며 이를 BMU( Best Matching Unit )라고 합니다. 나중에 SOM은 이러한 우승 노드를 발견하지만 노드는 샘플 벡터에서 시간이 지남에 따라 줄어듭니다. 따라서 노드가 BMU에 가까울수록 가중치를 인식하고 추가 활동을 수행할 기회가 더 많습니다. 또한 BMU에 더 가까운 노드가 누락되지 않도록 여러 번 반복합니다. 그중 하나는 일상 업무에서 사용하는 RGB 색상 조합입니다. 그들이 어떻게 작동하는지 이해하려면 아래 이미지를 고려하십시오.

8. 깊은 믿음 네트워크(DBN)

DBN은 잠재 변수와 확률 변수의 다양한 계층을 가지고 있기 때문에 생성 모델이라고 합니다. 잠재 변수는 이진 값을 가지고 있기 때문에 은닉 유닛이라고 합니다. DBN은 RGM 레이어가 이전 및 연속 레이어와 통신을 설정하기 위해 서로 위에 쌓여 있기 때문에 Boltzmann Machines라고도 합니다. DBN은 동영상 및 이미지 인식과 같은 애플리케이션과 움직이는 물체 캡처에 사용됩니다.

DBN은 Greedy 알고리즘으로 구동됩니다. 하향식 접근 방식을 통해 가중치를 생성하는 계층 간 접근 방식 은 DBN이 작동하는 가장 일반적인 방식입니다. DBN 은 상단의 숨겨진 2층 에서 Gibbs 샘플링의 단계별 접근 방식을 사용합니다. 그런 다음, 이러한 단계는 조상 샘플링 방법을 따르는 모델을 사용하여 가시적 단위에서 샘플을 추출합니다. DBN은 상향식 패스 접근 방식에 따라 모든 계층의 잠재 값에 있는 값에서 학습합니다.

9. 제한된 볼츠만 기계(RBM)

RBM은 Geoffrey Hinton 이 개발했으며 주어진 입력 세트의 확률 분포에서 학습하는 확률적 신경망과 유사합니다. 이 알고리즘은 주로 차원 축소, 회귀 및 분류, 주제 모델링 분야에서 사용되며 DBN의 구성 요소로 간주됩니다. RBI는 보이는 레이어와 숨겨진 레이어의 두 가지 레이어로 구성됩니다. 이 두 레이어는 모두 은닉 유닛을 통해 연결되며 출력을 생성하는 노드에 연결된 바이어스 유닛을 갖습니다. 일반적으로 RBM에는 순방향 통과 와 역방향 통과의 두 단계가 있습니다.

RBM의 기능은 입력을 수락하고 입력이 순방향 패스로 인코딩 되도록 숫자로 변환하여 수행됩니다. RBM은 모든 입력의 가중치를 고려하고 역방향 패스는 이러한 입력 가중치를 가져와 재구성된 입력으로 더 변환합니다. 나중에 개별 가중치와 함께 이러한 변환된 입력이 모두 결합됩니다. 그런 다음 이러한 입력은 활성화가 수행되는 가시 레이어로 푸시되고 쉽게 재구성할 수 있는 출력이 생성됩니다. 이 과정을 이해하려면 아래 이미지를 고려하십시오.

오토 인코더

Autoencoder는 입력이 출력이고 일반적으로 동일한 것으로 확인되는 특수한 유형의 신경망입니다. 비지도 학습과 관련된 문제를 주로 해결하도록 설계되었습니다. Autoencoder는 데이터를 복제하는 고도로 훈련된 신경망입니다. 일반적으로 입력과 출력이 동일한 이유입니다. 제약 발견, 이미지 처리 및 인구 예측과 같은 작업을 수행하는 데 사용됩니다.

자동 인코더는 인코더 , 코드 및 디코더의 세 가지 구성 요소를 구성합니다. Autoencoder는 입력을 받아 다양한 표현으로 변환할 수 있는 구조로 만들어졌습니다. 원래 입력을 재구성하여 복사하려는 시도가 더 정확합니다. 이미지 또는 입력을 인코딩하여 이 작업을 수행하고 크기를 줄입니다. 이미지가 제대로 표시되지 않으면 설명을 위해 신경망으로 전달됩니다. 그러면, 선명화된 영상을 복원영상이라 하며, 이는 이전 영상과 동일하게 정확하다. 이 복잡한 과정을 이해하려면 아래 제공된 이미지를 참조하십시오.

요약

주로 딥 러닝과 딥 러닝 배후에서 작동하는 알고리즘을 사용합니다. 딥 러닝 알고리즘은 먼저 딥 러닝이 비전과 함께 작업을 역동적인 속도로 변경하여 이를 재생산하고 인간의 두뇌처럼 기능할 수 있는 지능형 소프트웨어를 만드는 방법을 배웠습니다. 이 기사의 뒷부분에서 우리는 가장 많이 사용되는 딥 러닝 알고리즘과 이러한 알고리즘을 구동하는 구성 요소가 무엇인지 배웠습니다. 일반적으로 이러한 알고리즘을 이해하려면 일부 알고리즘에서 논의된 수학적 기능에 대한 높은 명확성이 필요합니다. 이러한 함수는 매우 중요하므로 이러한 알고리즘의 작동은 대부분 이러한 함수와 공식을 사용하여 수행되는 계산에 의존합니다. 딥 러닝 엔지니어 지망생은 이러한 알고리즘을 모두 알고 있습니다.

댓글