딥 러닝 대 기계 학습
딥 러닝과 머신 러닝이 어떻게 더 광범위한 인공 지능 범주에 속하는지 설명합니다. 사기 감지, 음성 및 얼굴 인식, 감정 분석, 시계열 예측과 같이 Azure Machine Learning에서 구축할 수 있는 딥 러닝 솔루션에 대해 알아보세요.
솔루션에 대한 알고리즘 선택에 대한 지침은 기계 학습 알고리즘 치트 시트를 참조하십시오.
딥 러닝, 머신 러닝 및 AI
딥 러닝 대 머신 러닝 대 AI를 이해하려면 다음 정의를 고려하십시오.
딥 러닝
인공 신경망을 기반으로 하는 기계 학습의 하위 집합입니다. 인공 신경망의 구조는 다중 입력, 출력 및 은닉 계층으로 구성되어 있기 때문에 학습 과정 이 깊습니다. 각 계층에는 입력 데이터를 다음 계층이 특정 예측 작업에 사용할 수 있는 정보로 변환하는 단위가 포함되어 있습니다. 이 구조 덕분에 기계는 자체 데이터 처리를 통해 학습할 수 있습니다.
기계 학습
기계가 경험을 사용하여 작업을 개선할 수 있도록 하는 기술(예: 딥 러닝)을 사용하는 인공 지능의 하위 집합입니다. 학습 프로세스는 다음 단계를 기반으로 합니다.
알고리즘에 데이터를 입력합니다. (이 단계에서는 예를 들어 특징 추출을 수행하여 모델에 추가 정보를 제공할 수 있습니다.) 이 데이터를 사용하여 모델을 훈련합니다.
모델을 테스트하고 배포합니다.
배포된 모델을 사용하여 자동화된 예측 작업을 수행합니다. (즉, 배포된 모델을 호출하고 사용하여 모델에서 반환된 예측을 수신합니다.)
인공 지능(AI)
컴퓨터가 인간의 지능을 모방할 수 있도록 하는 기술입니다. 여기에는 기계 학습이 포함됩니다.
기계 학습 및 딥 러닝 기술을 사용하여 일반적으로 인간 지능과 관련된 작업을 수행하는 컴퓨터 시스템 및 애플리케이션을 구축할 수 있습니다. 이러한 작업에는 이미지 인식, 음성 인식 및 언어 번역이 포함됩니다.
전이 학습이란 무엇입니까?
딥 러닝 모델을 교육하려면 많은 양의 교육 데이터, 고급 컴퓨팅 리소스(GPU, TPU) 및 더 긴 교육 시간이 필요한 경우가 많습니다. 이들 중 어느 것도 사용할 수 없는 시나리오에서는 전이 학습이라고 하는 기술을 사용하여 교육 프로세스를 단축할 수 있습니다.
전이 학습은 한 문제를 해결하여 얻은 지식을 다른 관련 문제에 적용하는 기술입니다.
신경망의 구조로 인해 첫 번째 레이어 집합에는 일반적으로 하위 수준 기능이 포함되고 마지막 레이어 집합에는 해당 도메인에 더 가까운 상위 수준 기능이 포함됩니다. 새 도메인이나 문제에서 사용하기 위해 최종 계층을 용도 변경함으로써 새 모델을 훈련하는 데 필요한 시간, 데이터 및 컴퓨팅 리소스의 양을 크게 줄일 수 있습니다. 예를 들어 자동차를 인식하는 모델이 이미 있는 경우 전이 학습을 사용하여 해당 모델의 용도를 변경하여 트럭, 오토바이 및 기타 종류의 차량도 인식할 수 있습니다.
Azure Machine Learning에서 오픈 소스 프레임워크를 사용하여 이미지 분류에 전이 학습을 적용하는 방법을 알아보세요. 전이 학습을 사용하여 딥 러닝 PyTorch 모델을 학습시킵니다.
딥 러닝 사용 사례
인공 신경망 구조로 인해 딥 러닝은 이미지, 사운드, 비디오 및 텍스트와 같은 비정형 데이터의 패턴을 식별하는 데 탁월합니다. 이러한 이유로 딥 러닝은 의료, 에너지, 금융 및 운송을 포함한 많은 산업을 빠르게 변화시키고 있습니다. 이러한 산업은 이제 전통적인 비즈니스 프로세스를 재고하고 있습니다.
딥 러닝의 가장 일반적인 응용 프로그램 중 일부는 다음 단락에 설명되어 있습니다. Azure Machine Learning에서는 오픈 소스 프레임워크에서 빌드한 모델을 사용하거나 제공된 도구를 사용하여 모델을 빌드할 수 있습니다.
명명된 개체 인식
명명된 엔터티 인식은 텍스트 조각을 입력으로 가져와 미리 지정된 클래스로 변환하는 딥 러닝 방법입니다. 이 새로운 정보는 우편번호, 날짜, 제품 ID일 수 있습니다. 그런 다음 정보를 구조화된 스키마에 저장하여 주소 목록을 작성하거나 ID 검증 엔진의 벤치마크 역할을 할 수 있습니다.
물체 감지
딥 러닝은 많은 객체 감지 사용 사례에 적용되었습니다. 객체 감지는 두 부분으로 구성됩니다. 이미지 분류와 이미지 현지화입니다. 이미지 분류는 자동차나 사람과 같은 이미지의 개체를 식별합니다. 이미지 현지화는 이러한 개체의 특정 위치를 제공합니다.
물체 감지는 이미 게임, 소매, 관광 및 자율 주행 자동차와 같은 산업에서 사용되고 있습니다.
이미지 캡션 생성
이미지 인식과 마찬가지로 이미지 캡션에서 주어진 이미지에 대해 시스템은 이미지의 내용을 설명하는 캡션을 생성해야 합니다. 사진에서 물체를 감지하고 레이블을 지정할 수 있는 경우 다음 단계는 해당 레이블을 설명적인 문장으로 바꾸는 것입니다.
일반적으로 이미지 캡션 응용 프로그램은 컨볼루션 신경망을 사용하여 이미지의 개체를 식별한 다음 순환 신경망을 사용하여 레이블을 일관된 문장으로 바꿉니다.
기계 번역
기계 번역은 한 언어에서 단어나 문장을 가져와 자동으로 다른 언어로 번역합니다. 기계 번역은 오랫동안 사용되어 왔지만 딥 러닝은 텍스트 자동 번역(및 음성을 텍스트로 번역)과 이미지 자동 번역이라는 두 가지 특정 영역에서 인상적인 결과를 달성했습니다.
적절한 데이터 변환을 통해 신경망은 텍스트, 오디오 및 시각적 신호를 이해할 수 있습니다. 기계 번역은 더 큰 오디오 파일에서 소리의 스니펫을 식별하고 음성 단어나 이미지를 텍스트로 변환하는 데 사용할 수 있습니다.
텍스트 분석
딥 러닝 방법에 기반한 텍스트 분석은 대량의 텍스트 데이터(예: 의료 문서 또는 비용 영수증)를 분석하고 패턴을 인식하고 이를 통해 체계적이고 간결한 정보를 생성하는 것을 포함합니다.
기업은 딥 러닝을 사용하여 텍스트 분석을 수행하여 내부 거래 및 정부 규정 준수를 감지합니다. 또 다른 일반적인 예는 보험 사기입니다. 텍스트 분석은 보험 청구가 사기일 가능성을 인식하기 위해 많은 양의 문서를 분석하는 데 자주 사용되었습니다.
인공 신경망
인공 신경망은 연결된 노드의 레이어로 구성됩니다. 딥 러닝 모델은 많은 수의 레이어가 있는 신경망을 사용합니다.
다음 섹션에서는 가장 널리 사용되는 인공 신경망 유형을 살펴봅니다.
피드 포워드 신경망
피드포워드 신경망은 가장 단순한 유형의 인공 신경망입니다. 피드포워드 네트워크에서 정보는 입력 계층에서 출력 계층으로 한 방향으로만 이동합니다. 피드포워드 신경망은 일련의 은닉층을 통해 입력을 변환합니다. 모든 레이어는 일련의 뉴런으로 구성되며 각 레이어는 이전 레이어의 모든 뉴런과 완전히 연결됩니다. 마지막 완전 연결 계층(출력 계층)은 생성된 예측을 나타냅니다.
순환 신경망(RNN)
순환 신경망은 널리 사용되는 인공 신경망입니다. 이러한 네트워크는 계층의 출력을 저장하고 입력 계층에 피드백하여 계층의 결과를 예측하는 데 도움을 줍니다. 순환 신경망은 학습 능력이 뛰어납니다. 시계열 예측, 필기 학습 및 언어 인식과 같은 복잡한 작업에 널리 사용됩니다.
CNN(컨볼루션 신경망)
컨볼루션 신경망은 특히 효과적인 인공 신경망이며 독특한 아키텍처를 제공합니다. 레이어는 너비, 높이 및 깊이의 3차원으로 구성됩니다. 한 계층의 뉴런은 다음 계층의 모든 뉴런에 연결되지 않고 계층 뉴런의 작은 영역에만 연결됩니다. 최종 출력은 깊이 차원을 따라 구성된 확률 점수의 단일 벡터로 축소됩니다.
컨볼루션 신경망은 비디오 인식, 이미지 인식, 추천 시스템과 같은 영역에서 사용되었습니다.
생성적 적대 네트워크(GAN)
생성적 적대 신경망은 이미지와 같은 사실적인 콘텐츠를 생성하도록 훈련된 생성 모델입니다. 생성기와 판별기로 알려진 두 개의 네트워크로 구성됩니다. 두 네트워크는 동시에 훈련됩니다.
훈련하는 동안 생성기는 무작위 노이즈를 사용하여 실제 데이터와 매우 유사한 새로운 합성 데이터를 생성합니다. 판별 기는 생성기의 출력을 입력으로 사용하고 실제 데이터를 사용하여 생성된 콘텐츠가 실제인지 합성인지 여부를 결정합니다.
각 네트워크는 서로 경쟁하고 있습니다. 생성기는 실제 콘텐츠와 구별할 수 없는 합성 콘텐츠를 생성하려고 하고 판별자는 입력을 실제 또는 합성으로 올바르게 분류하려고 합니다. 그런 다음 출력을 사용하여 두 네트워크의 가중치를 업데이트하여 각각의 목표를 더 잘 달성할 수 있습니다.
생성적 적대 네트워크는 이미지에서 이미지로의 번역 및 연령 진행과 같은 문제를 해결하는 데 사용됩니다.
변압기
변환기는 텍스트 또는 시계열 데이터와 같은 시퀀스를 포함하는 문제를 해결하는 데 적합한 모델 아키텍처입니다. 인코더 및 디코더 레이어로 구성됩니다.. 인코더는 입력을 받아 콘텍스트와 같은 정보가 포함된 숫자 표현에 매핑합니다. 디코더는 인코더의 정보를 사용하여 번역된 텍스트와 같은 출력을 생성합니다. 인코더와 디코더를 포함하는 다른 아키텍처와 트랜스포머를 다르게 만드는 것은 어텐션 서브 레이어입니다. 주의는 시퀀스의 다른 입력과 관련하여 콘텍스트의 중요성을 기반으로 입력의 특정 부분에 초점을 맞추는 아이디어입니다. 예를 들어, 뉴스 기사를 요약할 때 모든 문장이 주요 아이디어를 설명하는 데 관련이 있는 것은 아닙니다. 기사 전체의 핵심 단어에 초점을 맞추면 헤드라인이라는 한 문장으로 요약할 수 있습니다.
변환기는 번역, 텍스트 생성, 질문 답변 및 텍스트 요약과 같은 자연어 처리 문제를 해결하는 데 사용되었습니다.
댓글