인공지능에서 딥 러닝 대 머신 러닝 당신이 알아야 할 근본적인 차이점!
분노의 머신러닝과 딥러닝! 갑자기 모든 사람들이 그들에 대해 이야기하고 있습니다. 차이점을 이해하는지 여부에 관계없이! 데이터 과학을 적극적으로 따르고 있는지 여부에 관계없이 이러한 용어를 들어봤을 것입니다.
그들이 어떤 관심을 받고 있는지 보여드리기 위해 다음은 이러한 키워드에 대한 Google 트렌드입니다.
딥 러닝 대 머신 러닝 당신이 알아야 할 근본적인 차이점!
머신 러닝과 딥 러닝의 차이점이 무엇인지 스스로에게 자주 궁금해했다면 계속해서 간단한 평신도 언어로 자세한 비교를 읽어보세요. 이 용어를 각각 자세히 설명했습니다. 그런 다음 두 가지를 비교하고 어디에 사용할 수 있는지 설명했습니다.
1. 인공지능에서 딥 러닝과 머신 러닝이란?
머신 러닝이란 무엇이며 딥 러닝이란 무엇인가라는 기본 사항부터 시작하겠습니다. 이것을 이미 알고 있다면 섹션 2로 자유롭게 이동하십시오.
1.1 머신 러닝이란 무엇입니까?
널리 인용되는 Tom Mitchell의 기계 학습 정의는 기계 학습을 간단히 설명합니다. 내용은 다음과 같습니다.
"컴퓨터 프로그램은 P로 측정되는 T의 작업 성능이 경험 E와 함께 향상되는 경우 작업 T 및 성능 측정 P의 일부 클래스와 관련하여 경험 E로부터 학습한다고 합니다. "
그것이 어리둥절하거나 혼란스럽게 들렸습니까? 간단한 예를 들어 이를 분해해 보겠습니다.
예 1 - 기계 학습 - 키를 기반으로 한 체중 예측
사람의 키를 기준으로 예상 체중을 알려주는 시스템을 만들고 싶다고 가정해 보겠습니다. 이와 같은 것이 관심을 가질 수 있는 몇 가지 이유가 있을 수 있습니다. 이를 사용하여 가능한 사기 또는 데이터 캡처 오류를 필터링할 수 있습니다. 가장 먼저 할 일은 데이터를 수집하는 것입니다. 데이터가 다음과 같이 표시된다고 가정해 보겠습니다.
그래프의 각 점은 하나의 데이터 점을 나타냅니다. 먼저 키를 기준으로 체중을 예측하는 간단한 선을 그릴 수 있습니다. 예를 들어 간단한 줄: 무게(kg) = 높이(cm) - 100
예측하는 데 도움이 될 수 있습니다. 라인이 제대로 작동하는 동안 성능을 이해해야 합니다. 이 경우 예측과 실제의 차이를 줄이고 싶다고 말할 수 있습니다. 이것이 우리가 성과를 측정하는 방법입니다.
또한 수집한 데이터 포인트(경험)가 많을수록 모델이 더 좋아질 것입니다. 더 많은 변수(예: 성별)를 추가하고 이에 대한 다른 예측 라인을 생성하여 모델을 개선할 수도 있습니다.
예 2 - 폭풍 예측 시스템
조금 더 복잡한 예를 들어보겠습니다. 폭풍 예측 시스템을 구축한다고 가정합니다. 과거에 발생한 모든 폭풍의 데이터와 이러한 폭풍이 발생하기 3개월 전의 기상 조건이 제공됩니다.
폭풍 예측 시스템을 수동으로 구축하려면 어떻게 해야 합니까?
먼저 모든 데이터를 조사하고 이 데이터에서 패턴을 찾아야 합니다. 우리의 임무는 폭풍우로 이어지는 조건을 찾는 것입니다.
온도가 섭씨 40도 이상이면 습도가 80에서 100 사이인 경우 등과 같은 조건을 모델링할 수 있습니다. 그리고 이러한 '기능'을 수동으로 시스템에 제공할 수 있습니다.
또는 데이터에서 이러한 기능에 대한 적절한 값이 무엇인지 시스템이 이해하도록 할 수 있습니다.
이제 이러한 값을 찾기 위해 이전 데이터를 모두 살펴보고 폭풍우가 올지 여부를 예측하려고 합니다. 시스템에서 설정한 기능의 값을 기반으로 시스템이 어떻게 작동하는지, 즉 시스템이 폭풍의 발생을 올바르게 예측한 횟수를 평가합니다. 위의 단계를 여러 번 더 반복하여 시스템에 대한 피드백으로 성능을 제공할 수 있습니다.
공식적인 정의를 취하고 폭풍 예측 시스템을 정의해 보겠습니다. 여기서 우리의 임무 'T'는 폭풍을 일으킬 대기 조건을 찾는 것입니다. 성능 'P'는 시스템에 제공된 모든 조건 중에서 폭풍을 올바르게 예측하는 횟수입니다. 그리고 경험 'E'는 우리 시스템의 반복일 것입니다.
1.2 딥러닝이란?
딥 러닝의 개념은 새로운 것이 아닙니다. 그것은 몇 년 동안 주변에 있었다. 그러나 요즘은 과대 광고로 인해 딥 러닝이 더 많은 관심을 받고 있습니다. 머신 러닝에서 했던 것처럼 딥 러닝의 공식적인 정의를 살펴본 다음 예를 들어 설명합니다.
"딥 러닝은 각 개념이 더 간단한 개념과 관련하여 정의되고 더 추상적인 표현이 덜 추상적인 개념과 관련하여 정의된 중첩된 개념 계층 구조로 세계를 표현하는 방법을 학습하여 강력한 기능과 유연성을 달성하는 특별한 종류의 기계 학습입니다. "
이제 그것은 혼란스러울 것입니다. 간단한 예를 들어 풀어보겠습니다.
예 1 - 모양 감지
개념적 수준에서 일이 어떻게 일어나는지 설명하는 간단한 예부터 시작하겠습니다. 다른 모양에서 정사각형을 인식하는 방법을 이해하려고 노력해 보겠습니다.
우리 눈이 가장 먼저 하는 일은 도형과 연결된 4개의 선이 있는지 확인하는 것입니다(단순한 개념). 4개의 선을 찾으면 연결되어 있는지, 닫혀 있고, 수직인지, 그리고 동일한지(중첩된 개념 계층 구조) 추가로 확인합니다.
그래서 우리는 복잡한 작업(정사각형 식별)을 취하여 덜 추상적인 단순 작업으로 나누었습니다. 딥 러닝은 기본적으로 대규모로 이 작업을 수행합니다.
예 2 - 고양이 대 개
동물 인식기의 예를 들어보겠습니다. 여기서 우리 시스템은 주어진 이미지가 고양이인지 강아지인지를 인식해야 합니다.
이것을 일반적인 머신 러닝 문제로 풀면 동물에 수염이 있는지 없는지, 동물에 귀가 있는 경우 및 있는 경우 뾰족한 경우와 같은 기능을 정의할 것입니다. 간단히 말해서, 우리는 얼굴 특징을 정의하고 시스템이 특정 동물을 분류하는 데 더 중요한 특징을 식별하도록 할 것입니다.
이제 딥 러닝은 이를 한 단계 더 발전시킵니다. 딥 러닝은 분류에 중요한 기능을 자동으로 찾아냅니다. 머신 러닝에서는 수동으로 기능을 제공해야 했습니다. 딥 러닝은 다음과 같이 작동합니다.
딥 러닝은 다음과 같이 작동합니다.
먼저 고양이 또는 개를 찾는 데 가장 관련성이 높은 가장자리가 무엇인지 식별합니다.
그런 다음 우리가 찾을 수 있는 모양과 가장자리의 조합을 찾기 위해 이를 계층적으로 구축합니다. 예를 들어, 수염이 있는지 여부 또는 귀가 있는지 여부 등.
복잡한 개념을 계층적으로 연속적으로 식별한 후 이 기능 중 어느 것이 답을 찾는 역할을 하는지 결정합니다.
2. 머신러닝과 딥러닝의 비교
머신 러닝과 딥 러닝의 개요를 이해했으므로 이제 몇 가지 중요한 사항을 살펴보고 두 기술을 비교할 것입니다.
2.1 데이터 의존성
딥 러닝과 기존 머신 러닝의 가장 중요한 차이점은 데이터 규모가 커질수록 성능이 향상된다는 것입니다. 데이터가 작으면 딥 러닝 알고리즘이 잘 수행되지 않습니다. 딥러닝 알고리즘이 완벽하게 이해하려면 많은 양의 데이터가 필요하기 때문입니다. 반면에 이 시나리오에서는 손으로 만든 규칙을 사용하는 기존 기계 학습 알고리즘이 우선합니다. 아래 이미지는 이 사실을 요약한 것입니다.
2.2 하드웨어 종속성
딥 러닝 알고리즘은 저사양 머신에서 작동할 수 있는 기존 머신 러닝 알고리즘과 달리 고급 머신에 크게 의존합니다. 딥 러닝 알고리즘의 요구 사항에는 작업의 필수적인 부분인 GPU가 포함되기 때문입니다. 딥 러닝 알고리즘은 본질적으로 많은 양의 행렬 곱셈 연산을 수행합니다. GPU는 이러한 목적을 위해 구축되었기 때문에 GPU를 사용하여 이러한 작업을 효율적으로 최적화할 수 있습니다.
2.3 피처 엔지니어링
기능 엔지니어링은 데이터의 복잡성을 줄이고 학습 알고리즘이 작동하도록 패턴을 더 잘 볼 수 있도록 기능 추출기 생성에 도메인 지식을 적용하는 프로세스입니다. 이 과정은 시간과 전문성 측면에서 어렵고 비용이 많이 듭니다.
머신 러닝에서 적용되는 대부분의 기능은 전문가가 식별한 다음 도메인 및 데이터 유형에 따라 수작업으로 코딩해야 합니다.
예를 들어, 기능은 픽셀 값, 모양, 질감, 위치 및 방향이 될 수 있습니다. 대부분의 기계 학습 알고리즘의 성능은 특징이 얼마나 정확하게 식별되고 추출되는지에 달려 있습니다.
딥 러닝 알고리즘은 데이터에서 높은 수준의 기능을 학습하려고 합니다. 이것은 딥 러닝의 매우 독특한 부분이며 전통적인 머신 러닝보다 한 단계 앞서 있습니다. 따라서 딥 러닝은 모든 문제에 대해 새로운 기능 추출기를 개발하는 작업을 줄여줍니다. 마찬가지로, Convolutional NN은 초기 레이어의 가장자리 및 선과 같은 저수준 기능을 학습한 다음 사람의 얼굴 부분을 학습한 다음 얼굴의 고수준 표현을 학습하려고 합니다.
2.4 문제 해결 방식
전통적인 기계 학습 알고리즘을 사용하여 문제를 해결할 때 일반적으로 문제를 여러 부분으로 나누고 개별적으로 해결하고 결합하여 결과를 얻는 것이 좋습니다. 이와 대조적으로 딥 러닝은 문제를 엔드 투 엔드로 해결하는 것을 옹호합니다.
이를 이해하기 위해 예를 들어 보겠습니다.
다중 객체 감지 작업이 있다고 가정합니다. 작업은 개체가 무엇이며 이미지의 어디에 있는지 식별하는 것입니다.
일반적인 기계 학습 접근 방식에서는 문제를 객체 감지와 객체 인식의 두 단계로 나눕니다. 먼저, Grabcut과 같은 경계 상자 감지 알고리즘을 사용하여 이미지를 훑어보고 가능한 모든 개체를 찾습니다. 그런 다음 인식된 모든 객체 중 SVM with HOG와 같은 객체 인식 알고리즘을 사용하여 관련 객체를 인식합니다.
반대로 딥 러닝 접근 방식에서는 프로세스를 end-to-end로 수행합니다. 예를 들어 YOLO net (딥러닝 알고리즘의 일종)에서 이미지를 전달하면 객체의 이름과 함께 위치를 알려줍니다.
여기에서 딥 러닝을 사용하여 컴퓨터 비전을 배우십시오.
2.5 실행 시간
일반적으로 딥 러닝 알고리즘은 학습하는 데 오랜 시간이 걸립니다. 딥러닝 알고리즘에는 매개변수가 너무 많아 훈련하는 데 평소보다 시간이 오래 걸리기 때문입니다. 최첨단 딥 러닝 알고리즘 ResNet은 처음부터 완전히 훈련하는 데 약 2주가 걸립니다. 반면 머신 러닝은 몇 초에서 몇 시간에 이르기까지 훈련하는 데 훨씬 적은 시간이 걸립니다.
이 차례는 테스트 시간에 완전히 반대입니다. 테스트 시간에 딥 러닝 알고리즘은 실행하는 데 훨씬 적은 시간이 걸립니다. 반면 k-최근접 이웃(머신러닝 알고리즘의 일종)과 비교하면 데이터의 크기가 커질수록 테스트 시간이 늘어납니다. 모든 기계 학습 알고리즘에 적용할 수 있는 것은 아니지만 일부는 테스트 시간도 짧습니다.
2.6 해석 가능성
마지막으로 머신 러닝과 딥 러닝을 비교하는 요인으로 해석 가능성이 있습니다. 이 요소는 딥 러닝이 산업에서 사용되기 전에 여전히 10번 생각되는 주된 이유입니다.
예를 들어 보겠습니다. 에세이에 자동 채점을 제공하기 위해 딥 러닝을 사용한다고 가정합니다. 스코어링에서 제공하는 성능은 상당히 우수하며 인간의 성능에 가깝습니다. 하지만 문제가 있습니다. 그 점수를 준 이유는 밝히지 않습니다. 실제로 수학적으로는 심층 신경망의 어떤 노드가 활성화되었는지 알 수 있지만 뉴런이 무엇을 모델링해야 했으며 이러한 뉴런 레이어가 집합적으로 무엇을 했는지는 알 수 없습니다. 그래서 우리는 결과를 해석하지 못합니다.
반면에 의사 결정 트리와 같은 기계 학습 알고리즘은 선택한 항목을 선택한 이유에 대한 명확한 규칙을 제공하므로 그 이면의 추론을 해석하기가 특히 쉽습니다. 따라서 의사 결정 트리 및 선형/로지스틱 회귀와 같은 알고리즘은 해석 가능성을 위해 주로 업계에서 사용됩니다.
3. 인공지능에서 딥 러닝과 머신 러닝은 현재 어디에 적용되고 있나요?
Wiki 기사는 기계 학습이 적용된 모든 도메인에 대한 개요를 제공합니다. 여기에는 다음이 포함됩니다.
--컴퓨터 비전: 차량 번호판 식별 및 얼굴 인식과 같은 애플리케이션용.
-정보 검색: 검색 엔진, 텍스트 검색 및 이미지 검색과 같은 응용 프로그램의 경우.
-마케팅: 자동화된 이메일 마케팅, 대상 식별과 같은 애플리케이션용
-의료 진단: 암 식별, 이상 감지와 같은 애플리케이션용
-자연어 처리: 감정 분석 , 사진 태그 지정 과 같은 애플리케이션용
-온라인 광고 등
위에 주어진 이미지는 기계 학습의 응용 분야를 적절하게 요약한 것입니다. 전체적으로 기계 지능의 더 넓은 주제를 다루지만.
머신 러닝/딥 러닝을 사용하는 회사의 대표적인 예는 Google입니다.
구글이 다양한 제품에 머신러닝을 어떻게 적용하고 있는지 확인할 수 있습니다. 머신 러닝/딥 러닝의 응용은 무궁무진합니다. 적절한 기회를 바라보기만 하면 됩니다!
4. 팝퀴즈
차이점을 정말로 이해했는지 평가하기 위해 퀴즈를 풉니다. 이 스레드에 답변을 게시할 수 있습니다.
완전히 답하려면 아래 단계를 언급하십시오.
인공지능에서 딥 러닝 대 머신 러닝
머신 러닝을 사용하여 아래 문제를 어떻게 해결하시겠습니까?
딥 러닝을 사용하여 아래 문제를 어떻게 해결하시겠습니까?
결론: 어느 것이 더 나은 접근 방식입니까?
시나리오 1:
자율주행차를 위한 소프트웨어 컴포넌트를 구축해야 합니다. 구축한 시스템은 카메라에서 원시 픽셀 데이터를 가져와서 자동차 바퀴를 조종해야 하는 각도를 예측해야 합니다.
시나리오 2:
개인의 자격 증명과 배경 정보가 주어지면 시스템에서 해당 개인이 대출 보조금을 받을 자격이 있는지 여부를 평가해야 합니다.
시나리오 3:
러시아 대표가 현지 대중에게 연설할 수 있도록 러시아어로 작성된 메시지를 힌디어로 번역할 수 있는 시스템을 만들어야 합니다.
5. 향후 동향
위의 기사는 기계 학습과 딥 러닝에 대한 개요와 차이점을 제공했을 것입니다. 이 섹션에서는 머신 러닝과 딥 러닝이 앞으로 어떻게 발전할지에 대한 제 견해를 공유합니다.
우선, 업계에서 데이터 과학 및 머신 러닝을 사용하는 추세가 증가함에 따라 생존을 원하는 각 회사에서 비즈니스에 머신 러닝을 주입하는 것이 점점 더 중요해질 것입니다. 또한 각 개인은 기본 용어를 알고 있어야 합니다.
딥 러닝은 매일 우리를 놀라게 하며 가까운 장래에 계속 그렇게 할 것입니다. 딥 러닝은 최첨단 성능으로 발견할 수 있는 최고의 기술 중 하나로 입증되고 있기 때문입니다.
머신러닝과 딥러닝에 대한 연구는 계속되고 있습니다. 그러나 연구가 학계에 국한되었던 예년과 달리 머신 러닝과 딥 러닝에 대한 연구는 산업계와 학계 모두에서 폭발적으로 증가하고 있습니다. 그리고 그 어느 때보다 더 많은 자금을 사용할 수 있게 되면서 전반적인 인간 개발의 기조연설이 될 가능성이 더 커졌습니다.
나는 개인적으로 이러한 경향을 밀접하게 따릅니다. 저는 일반적으로 인공지능에서 딥 러닝 대 머신 러닝 뉴스레터에서 특종을 받아 최신 소식을 계속 업데이트합니다. 이와 함께 매일 발행되는 arxiv 논문과 해당 코드를 따릅니다.
댓글