기계 학습의 지도 학습 및 비지도 학습

머신 러닝은 명시적으로 프로그래밍되지 않은 데이터와 정보를 제공함으로써 컴퓨터가 인간처럼 학습하고 행동하게 하는 과학입니다.

머신 러닝 알고리즘 은 훈련 데이터로 훈련됩니다. 새로운 데이터 가 들어오면 과거 데이터를 기반으로 정확하게 예측하고 결정을 내릴 수 있습니다.

예를 들어 Siri에게 작업을 요청할 때마다 강력한 음성 인식 기능이 오디오를 해당 텍스트 형식으로 변환합니다. 이것은 사용자의 의도를 이해하기 위해 언어 처리 알고리즘이 실행되는 추가 처리를 위해 Apple 서버로 전송됩니다. 그런 다음 마침내 Siri가 답을 알려줍니다.

머신 러닝 에는 두 가지 유형이 있습니다.

1. 지도 학습

2. 비지도 학습

지도 학습이란 무엇입니까?

지도 학습에서 기계는 감독 하에 학습합니다. 여기에는 레이블이 지정된 데이터 세트의 도움으로 예측할 수 있는 모델이 포함되어 있습니다. 레이블이 지정된 데이터 세트는 이미 대상 답변을 알고 있는 데이터 세트입니다.

이 경우 숟가락이나 칼로 레이블이 지정된 이미지가 있습니다. 이 알려진 데이터는 모양, 크기, 선명도 등과 같은 기능을 기반으로 이러한 이미지의 연관성을 분석하고 학습하는 기계에 공급됩니다. 이제 새 이미지가 레이블 없이 기계에 공급되면 기계는 다음을 수행할 수 있습니다. 과거 데이터의 도움으로 그것이 숟가락인지 정확하게 예측합니다.

지도 학습은 두 가지 유형으로 더 나눌 수 있습니다.

1. 분류

2. 회귀

1. 분류 - 지도 학습

분류는 출력 변수가 범주형(예: 2개 이상의 클래스 포함) 일 때 사용됩니다. 예를 들어, 예 또는 아니오, 남성 또는 여성, 참 또는 거짓 등.

메일이 스팸인지 여부를 예측하려면 먼저 기계에 스팸 메일이 무엇인지 가르쳐야 합니다. 이것은 많은 스팸 필터를 기반으로 수행됩니다. 메일 내용 검토, 메일 헤더 검토 및 잘못된 정보가 포함되어 있는지 검색합니다. 이미 블랙리스트에 올라간 스패머로부터 협박을 받는 특정 키워드 및 블랙리스트 필터.

이러한 모든 기능은 메일에 점수를 매기고 스팸 점수를 부여하는 데 사용됩니다. 이메일의 총 스팸 점수가 낮을수록 사기가 아닐 가능성이 높아집니다.

새 수신 메일의 콘텐츠, 레이블 및 스팸 점수를 기반으로 알고리즘은 해당 메일을 받은 편지함 또는 스팸 폴더에 넣을지 여부를 결정합니다.

2. 회귀 - 지도 학습

회귀는 출력 변수가 실수 또는 연속 값일 때 사용됩니다. 이 경우 둘 이상의 변수 간에 관계가 있습니다. 즉, 한 변수의 변경이 다른 변수의 변경과 연관됩니다. 예를 들어, 경력에 따른 급여 또는 키에 따른 체중 등.

습도와 온도라는 두 가지 변수를 고려해 보겠습니다. 여기서 '온도'는 독립변수이고 '습도'는 종속변수입니다. 온도가 높아지면 습도가 낮아집니다.

이 두 변수는 모델에 제공되고 기계는 이들 간의 관계를 학습합니다. 기계가 훈련된 후에는 주어진 온도를 기반으로 습도를 쉽게 예측할 수 있습니다.

지도 학습의 실제 적용

위험 평가

지도 학습은 회사의 위험 포트폴리오를 최소화하기 위해 금융 서비스 또는 보험 영역의 위험을 평가하는 데 사용됩니다.

이미지 분류

이미지 분류는 지도 머신 러닝을 시연하는 주요 사용 사례 중 하나입니다. 예를 들어 Facebook은 태그가 지정된 사진 앨범의 사진에서 친구를 인식할 수 있습니다.

사기 탐지

사용자의 거래가 진위 여부를 식별합니다.

시각적 인식

사물, 장소, 사람, 행동, 이미지를 식별하는 기계 학습 모델의 능력.

비지도 학습이란 무엇입니까?

Unsupervised Learning에서 기계는 레이블이 지정되지 않은 데이터를 사용하고 감독 없이 스스로 학습합니다. 기계는 레이블이 지정되지 않은 데이터에서 패턴을 찾으려고 시도하고 응답을 제공합니다.

이전과 비슷한 예를 들어 보겠습니다. 하지만 이번에는 기계가 숟가락인지 칼인지 알려주지 않습니다. 기계는 주어진 세트에서 패턴을 식별하고 패턴, 유사성 등에 따라 그룹화합니다.

비지도 학습은 다음 유형으로 더 그룹화할 수 있습니다.

1. 클러스터링 - 비지도 학습

클러스터링은 객체를 유사한 클러스터로 나누고 다른 클러스터에 속하는 객체와 유사하지 않은 클러스터로 나누는 방법입니다. 예를 들어, 유사한 제품을 구매한 고객을 찾는 것입니다.

통신 회사가 개인화된 통화 및 데이터 요금제를 제공하여 고객 이탈률을 줄이려고 한다고 가정해 보겠습니다. 고객의 행동이 연구되고 모델이 유사한 특성을 가진 고객을 분류합니다. 적절한 프로모션과 캠페인을 통해 해지율을 최소화하고 수익을 극대화하기 위해 여러 전략이 채택됩니다.

이미지 오른쪽에는 고객을 그룹화한 그래프를 볼 수 있습니다. 그룹 A 고객은 더 많은 데이터를 사용하고 통화 시간도 길다. 그룹 B 고객은 인터넷 사용자가 많고 그룹 C 고객은 통화 시간이 많습니다. 따라서 그룹 B에는 더 많은 데이터 혜택 플랜이 제공되고 그룹 C에는 더 저렴한 통화 요금 플랜이 제공되고 그룹 A에는 두 가지 혜택이 모두 제공됩니다.

2. 연관 - 비지도 학습

연관은 컬렉션에서 항목이 동시에 발생할 확률을 발견하는 규칙 기반 기계 학습입니다. 예를 들어 함께 구매한 제품을 찾는 것입니다.

고객이 슈퍼마켓에 가서 빵, 우유, 과일, 밀을 산다고 가정해 봅시다. 또 다른 손님이 와서 빵, 우유, 쌀, 버터를 삽니다. 이제 다른 고객이 오면 빵을 사면 우유도 사게 될 가능성이 큽니다. 따라서 고객 행동을 기반으로 관계가 설정되고 권장 사항이 만들어집니다.

비지도 학습의 실제 적용

시장바구니 분석

특정 그룹의 품목을 구매하면 다른 그룹의 품목을 구매할 가능성이 적거나 더 높아진다는 알고리즘을 기반으로 하는 머신 러닝 모델입니다.

시맨틱 클러스터링

의미적으로 유사한 단어는 비슷한 맥락을 공유합니다. 사람들은 각자의 방식으로 웹사이트에 검색어를 게시합니다. 시맨틱 클러스터링은 이러한 모든 응답을 클러스터에서 동일한 의미로 그룹화하여 고객이 원하는 정보를 빠르고 쉽게 찾을 수 있도록 합니다. 정보 검색, 좋은 브라우징 경험 및 이해에 중요한 역할을 합니다.

배달 매장 최적화

기계 학습 모델은 수요를 예측하고 공급을 따라가는 데 사용됩니다. 또한 수요가 더 높은 매장을 열고 과거 데이터 및 행동에 따라 보다 효율적인 배송을 위해 루트를 최적화하는 데 사용됩니다.

사고취약지역 파악

비지도 머신 러닝 모델을 사용하여 사고가 발생하기 쉬운 영역을 식별하고 해당 사고의 강도에 따라 안전 조치를 도입할 수 있습니다.

결론

기계 학습 또는 지도 학습과 비지도 학습의 분류에 대해 자세히 알아보려면 Simplilearn의 기계 학습 과정 이 바로 시작하는 데 도움이 될 것입니다. 이 과정에서는 지도 학습 및 비지도 학습, 수학적 및 발견적 측면, 실습 모델링을 포함한 기계 학습 개념과 기술을 마스터하여 알고리즘을 개발하고 기계 학습 엔지니어의 역할을 준비합니다.

저작자표시 비영리 변경금지 (새창열림)

일반상식

기계 학습의 지도 학습 및 비지도 학습