google.com, pub-9850333530125189, DIRECT, f08c47fec0942fa0 기계 학습 이란 무엇
본문 바로가기
카테고리 없음

기계 학습 이란 무엇

by ╰(*°▽°*)╯(¬_¬ ) 2022. 1. 30.
반응형

머신 러닝이란 무엇입니까?

머신 러닝은 명시적으로 프로그래밍되지 않고 학습하고 행동하는 방법을 컴퓨터에 가르치는 것을 목표로 하는 컴퓨터 과학의 한 분야입니다. 기계학습 이란 보다 구체적으로 말하면 머신 러닝은 프로그램이 경험을 통해 "학습"할 수 있도록 하는 모델을 구축하고 적용하는 데이터 분석 접근 방식입니다. 기계 학습은 예측 능력을 향상시키기 위해 모델을 조정하는 알고리즘의 구성을 포함합니다.

Carnegie Mellon의 컴퓨터 과학 및 기계 학습 교수인 Tom Mitchell에 따르면, 컴퓨터 프로그램은 P 로 측정되는 T에 대한 성능이 향상되는 경우 일부 작업 T 및 일부 성능 측정 P와 관련하여 경험 E로부터 학습한다고 합니다. 경험 E. 프로그램이 경험을 통해 문제 해결에서 향상되면 프로그램이 기계 학습을 사용한다고 말하는 수학적 방법입니다.

.

기계 학습의 최초 사용 및 논의는 1950년대로 거슬러 올라가며 지난 10년 동안 기계 학습의 채택이 극적으로 증가했습니다. 기계 학습의 일반적인 응용 프로그램에는 이미지 인식, 자연어 처리 , 인공 지능 설계 , 자율 주행 자동차 기술 및 Google의 웹 검색 알고리즘이 포함됩니다.

머신 러닝 대 인공 지능

기계 학습과 인공 지능의 차이점을 강조할 가치가 있습니다. 기계 학습은 컴퓨터 과학 및 알고리즘 설계에 대한 접근 방식의 연구 영역입니다. 알고리즘 설계에 대한 이러한 접근 방식은 인공 지능 프로그램 및 기계의 생성 및 설계를 가능하게 합니다.

기계 학습의 응용 및 예

기계 학습은 연구 영역이자 문제 해결에 대한 접근 방식입니다. 그리고 기계 학습 방법을 적용할 수 있는 다양한 응용 프로그램이 있습니다. 다음은 기계 학습 전략 및 방법의 많은 응용 프로그램 중 몇 가지입니다.

자연어 처리

자연어 처리(NLP)는 컴퓨터와 자연어(인간) 간의 상호 작용에 주로 관심을 두고 있는 컴퓨터 과학 분야입니다. 자연어 처리의 주요 강조점은 음성 인식, 자연어 이해 및 자연어 생성입니다. 머신 러닝 방법은 이러한 각 영역에 적용될 수 있습니다.

보험금 청구 분석

보험 업계는 여러 가지 방법으로 머신 러닝을 적용하고 있습니다. 가장 흥미롭게도 여러 회사에서 기계 학습 알고리즘을 사용하여 보험료 가격 책정에 사용되는 미래 청구에 대한 예측을 하고 있습니다. 또한 보험 및 은행 산업의 일부 회사는 기계 학습을 사용하여 사기를 감지하고 있습니다.

생물정보학 및 의료 진단

연구 과학자들이 수집하는 생물학적 데이터의 양은 기하급수적으로 증가하고 있습니다. 이로 인해 효율적인 데이터 저장 및 관리는 물론 이 데이터에서 유용한 정보를 추출하는 기능에 문제가 발생했습니다. 현재 기계 학습 방법은 생물학적 데이터를 효율적이고 유용하게 저장하고 저장된 데이터에서 의미를 지능적으로 추출하기 위해 개발되고 있습니다.

다양한 질병을 분류하고 더 잘 이해하기 위해 의료 기록에 기계 학습 및 패턴 인식 기술을 적용하려는 노력도 이루어지고 있습니다. 이러한 접근 방식은 또한 특정 질병에 대한 위험이 가장 높은 인구 집단을 식별하여 질병 진단에 도움이 될 것으로 기대됩니다.

이미지 처리 및 패턴 인식

컴퓨터를 사용하여 이미지, 비디오 및 기타 미디어 파일 내에서 패턴을 식별하고 개체를 식별하는 것은 기계 학습 기술 없이는 훨씬 덜 실용적입니다. 식별하려는 모든 개체에 대해 특정 코드를 작성해야 하는 경우 이미지 내에서 개체를 식별하는 프로그램을 작성하는 것은 그다지 실용적이지 않습니다.

대신 이미지 분류기라고도 하는 이미지 인식 알고리즘을 학습하여 콘텐츠를 기반으로 이미지를 분류할 수 있습니다. 이러한 알고리즘은 이미 분류된 많은 샘플 이미지를 처리하여 훈련됩니다. 이미 처리한 이미지의 유사점과 차이점을 사용하여 이러한 프로그램은 새 이미지를 처리할 때마다 모델을 업데이트하여 개선합니다. 이미지 처리에 사용되는 이러한 형태의 기계 학습은 일반적으로 인공 신경망을 사용하여 수행되며 딥 러닝으로 알려져 있습니다.

검색 엔진

웹 검색은 또한 딥 러닝을 사용하여 검색 결과를 개선하고 사용자 쿼리를 더 잘 이해함으로써 이점을 얻습니다. 검색어 및 제공된 결과에 대한 사용자 행동을 분석함으로써 Google과 같은 회사는 검색 결과를 개선하고 주어진 검색어에 대해 최상의 결과 집합이 무엇인지 이해할 수 있습니다. 검색 제안 및 맞춤법 수정도 모든 사용자의 집계된 쿼리에 대한 기계 학습 전술을 사용하여 생성됩니다.

금융 시장분석

알고리즘 거래 및 시장분석은 금융 시장에서 기계 학습 및 인공 지능의 주류 사용이 되었습니다. 펀드 매니저는 이제 추세의 변화를 식별하고 거래를 실행하기 위해 딥 러닝 알고리즘에 의존하고 있습니다. 이 자동화된 접근 방식을 사용하는 펀드와 거래자는 추세를 파악하고 거래를 하기 위해 수동 접근 방식을 취하는 경우 가능한 것보다 더 빠르게 거래를 만듭니다.

기계 학습의 추가 응용

기계 학습은 문제 해결에 대한 과학적 접근 방식일 뿐이므로 거의 무한한 응용 분야가 있습니다. 위의 응용 프로그램 외에도 기계 학습 기술의 사용은 DNA 서열 분류를 위한 유전 과학, 사기 탐지를 위한 은행 업무, 완벽한 광고 타겟팅을 위한 온라인 광고, 효율성 및 데이터 개선을 위한 기타 여러 산업 분야에서도 볼 수 있습니다. 처리 능력.

기계 학습은 어떻게 작동합니까?

오늘날 머신 러닝이 사용되는 방법에는 여러 가지가 있습니다. 하지만 어떻게 사용되고 있습니까? 문제를 보다 효과적으로 해결하기 위해 이러한 프로그램은 실제로 무엇을 하고 있습니까? 이러한 접근 방식은 문제를 해결하는 역사적 방법과 어떻게 다릅니까?

위에서 언급했듯이 머신 러닝은 명시적으로 프로그래밍되지 않고도 컴퓨터에 학습 능력을 부여하는 것을 목표로 하는 컴퓨터 과학의 한 분야입니다. 프로그램이 "학습"하기 위해 사용하는 접근 방식 또는 알고리즘은 프로그램이 완료하도록 설계된 문제 또는 작업의 유형에 따라 다릅니다.

따라서 기계 학습이 작동하는 방식을 이해하는 좋은 방법 은 기계 학습이 해결하려고 시도하는 문제 유형을 이해한 다음 이러한 문제를 해결하려고 시도하는 방법을 살펴보는 것입니다. 먼저 머신 러닝이 해결하고자 하는 문제 유형 목록은 다음과 같습니다.

기계학습 이란 작업의 유형

머신 러닝 알고리즘은 모두 더 많은 데이터 세트를 처리함에 따라 정확도를 배우고 개선하는 것을 목표로 합니다. 기계 학습 알고리즘이 해결하는 작업을 분류할 수 있는 한 가지 방법은 시스템에 제공하는 피드백의 양입니다. 일부 시나리오에서는 컴퓨터에 상당한 양의 레이블이 지정된 훈련 데이터가 제공되며, 이를 지도 학습이라고 합니다. 다른 경우에는 레이블이 지정된 데이터가 제공되지 않으며 이를 비지도 학습 이라고 합니다. 마지막으로 semi-supervised learning에서는 레이블이 지정된 훈련 데이터가 일부 제공되지만 대부분의 훈련 데이터는 레이블이 지정되지 않습니다. 각 유형을 더 자세히 검토해 보겠습니다.

지도 학습

지도 학습은 기계 학습의 가장 실용적이고 널리 채택된 형태입니다. 여기에는 입력 변수를 선호하는 출력 변수와 연결하는 수학 함수를 만드는 것이 포함됩니다. 컴퓨터가 처리할 데이터의 예를 제공하는 많은 양의 레이블이 지정된 훈련 데이터 세트가 제공됩니다.

지도 학습 작업은 "분류" 또는 "회귀" 문제로 더 분류할 수 있습니다. 분류 문제는 "핫도그" 또는 "핫도그 아님"과 같은 분류를 출력하기 위해 통계적 분류 방법을 사용합니다. 반면 회귀 문제는 통계적 회귀 분석을 사용하여 수치적 출력을 제공합니다.

반 지도 학습

Semi-supervised learning은 실제로 제공되는 훈련 데이터 중 제한된 양만 레이블이 지정된다는 점을 제외하고는 supervised learning과 동일합니다.

이미지 인식은 준지도 학습의 좋은 예입니다. 이 예에서 우리는 식별하려는 객체를 포함하는 레이블이 지정된 여러 이미지를 시스템에 제공한 다음 훈련 프로세스에서 레이블이 지정되지 않은 더 많은 이미지를 처리할 수 있습니다.

비지도 학습

비지도 학습 문제에서 모든 입력은 레이블이 지정되지 않으며 알고리즘은 자체적으로 입력에서 구조를 생성해야 합니다. 클러스터링 문제(또는 클러스터 분석 문제)는 입력 데이터 세트 내에서 그룹화를 발견하려는 비지도 학습 작업입니다. 예를 들면 주식 데이터의 패턴이나 소비자 동향이 될 수 있습니다. 신경망은 또한 비지도 학습 문제를 해결하는 데 일반적으로 사용됩니다.

기계 학습 알고리즘 및 문제 해결 접근 방식

알고리즘은 문제를 해결하기 위한 접근 방식이며 기계 학습은 다양한 문제를 해결하기 위해 다양한 접근 방식을 제공합니다. 다음은 오늘날 기계 학습 응용 프로그램에 사용되는 가장 일반적이고 유용한 알고리즘 및 접근 방식의 목록입니다. 애플리케이션은 종종 주어진 문제를 해결하기 위해 다음과 같은 많은 접근 방식을 함께 사용합니다.

인공 신경망

인공 신경망은 인간의 두뇌와 같은 생물학적 신경망을 기반으로 하는 계산 모델입니다. 일련의 기능을 사용하여 입력 신호 또는 파일을 처리하고 여러 단계에 걸쳐 예상 출력으로 변환합니다. 이 방법은 오늘날 이미지 인식, 언어 번역 및 기타 일반적인 응용 프로그램에서 자주 사용됩니다.

딥러닝

딥 러닝은 인공 신경망을 많이 사용하는 기계 학습 알고리즘 제품군을 나타냅니다. 2016년 Google Tech Talk에서 Jeff Dean은 딥 러닝 알고리즘이 매우 깊은 신경망을 사용하는 것으로 설명합니다. 여기서 "딥"은 레이어 수 또는 입력과 출력 간의 반복을 나타냅니다. 컴퓨팅 성능이 저렴해짐에 따라 오늘날 응용 프로그램의 학습 알고리즘은 "심각해지고" 있습니다.

클러스터 분석

클러스터 분석은 개체를 다른 클러스터의 항목보다 서로 더 유사한 항목의 "클러스터"로 그룹화하려고 시도합니다. 항목 이 유사한 방식 은 컴퓨터 프로그램에 제공되는 데이터 입력에 따라 다릅니다. 클러스터 분석은 비지도 학습 문제에서 가장 자주 사용되기 때문에 훈련이 제공되지 않습니다.

프로그램은 제공된 데이터 포인트를 사용하여 각 입력 개체를 설명하고 값을 이미 분석한 개체에 대한 데이터와 비교합니다. 데이터 포인트 및 개체의 그룹화를 식별할 수 있을 만큼 충분한 개체가 분석되면 프로그램은 개체를 그룹화하고 클러스터를 식별하기 시작할 수 있습니다.

클러스터링은 실제로 하나의 특정 알고리즘이 아닙니다. 실제로 클러스터 분석을 수행하는 데에는 다양한 경로가 있습니다. 통계 분석 및 데이터 마이닝에서 일반적인 작업입니다.

베이지안 네트워크

베이지안 네트워크는 변수 및 서로에 대한 종속성의 그래픽 모델입니다. 기계 학습 알고리즘은 베이지안 네트워크를 사용하여 신념 시스템을 구축하고 설명할 수 있습니다. 베이지안 네트워크가 사용되는 한 가지 예는 주어진 질병의 확률을 계산하도록 설계된 프로그램에 있습니다. 증상은 입력으로, 질병의 확률은 출력으로 간주할 수 있습니다.

강화 학습

강화 학습 은 시스템에 제공되는 피드백이 "맞다" 또는 "그르다"라고 명시적으로 말하지 않고 보상과 처벌의 형태로 제공되는 머신 러닝 영역을 말합니다. 이것은 정답을 찾는 것이 중요할 때 작용하지만 적시에 찾는 것도 중요합니다.

따라서 강화 학습의 큰 요소는 "탐색"과 "착취" 사이의 균형을 찾는 것입니다. 프로그램은 이미 사용 가능한 정보를 활용하는 대신 얼마나 자주 새로운 정보를 "탐색"해야 합니까? 바람직한 방식으로 행동하는 학습 에이전트에 "보상"함으로써 프로그램은 탐색과 활용 사이의 최상의 균형을 달성하기 위해 접근 방식을 최적화할 수 있습니다.

의사결정 트리 학습

의사 결정 트리 학습은 출력 또는 답변으로 이어지는 일련의 분류를 사용하여 입력을 처리하는 기계 학습 접근 방식입니다. 일반적으로 이러한 결정 트리 또는 분류 트리는 개별 답변을 출력합니다. 그러나 회귀 트리를 사용하면 출력이 연속 값(일반적으로 실수)을 사용할 수 있습니다.

규칙 기반 머신 러닝

규칙 기반 머신 러닝은 모델을 분석하기 위한 "규칙"을 생성하고, 모델을 분석하는 동안 이러한 규칙을 적용하고, 성능을 개선하기 위해 규칙을 적용하는(학습) 머신 러닝 방법 클래스를 말합니다. 이 기술은 인공 면역 시스템에서 사용되며 다음에 다룰 연관 규칙 학습 알고리즘을 생성합니다.

연관 규칙 학습

연관 규칙 학습은 데이터베이스에서 변수 간의 관계를 식별하는 데 중점을 둔 기계 학습 방법입니다. 적용된 연관 규칙 학습의 한 예는 마케터가 다양한 제품 구매 간의 상관관계를 결정하기 위해 대규모 슈퍼마켓 거래 데이터 세트를 사용하는 경우입니다. 예를 들어, "피클과 상추를 구매하는 고객은 슬라이스 치즈도 구매할 가능성이 높습니다." 이와 같은 "연관 규칙"은 연관 규칙 학습을 사용하여 발견할 수 있습니다.

귀납 논리 프로그래밍

귀납 논리 프로그래밍을 이해하려면 먼저 "논리 프로그래밍"을 이해하는 것이 중요합니다. 논리 프로그래밍은 프로그램이 사실이나 규칙을 나타내는 일련의 표현으로 작성되는 컴퓨터 프로그래밍의 패러다임입니다.

this , then that " 형태. "논리 프로그래밍"이 일련의 논리 규칙을 사용하는 것을 이해하면 귀납적 논리 프로그래밍을 이해하기 시작할 수 있습니다.

귀납적 논리 프로그래밍은 기계 학습과 논리 프로그래밍을 모두 사용하는 연구 분야입니다. ILP 문제에서 프로그램이 사용하는 배경 지식은 문제 해결을 위한 가설을 도출하기 위해 프로그램이 사용하는 일련의 논리적 규칙으로 기억됩니다.

오늘날 귀납 논리 프로그래밍의 응용 프로그램은 자연어 처리 및 생물 정보학에서 찾을 수 있습니다.

서포트 벡터 머신

서포트 벡터 머신 은 분류 및 회귀 문제에서 일반적으로 사용되는 지도 학습 도구입니다. 서포트 벡터 머신을 사용하는 컴퓨터 프로그램은 입력을 두 클래스 중 하나로 분류하도록 요청할 수 있습니다. 프로그램은 다차원 공간에 그려진 수학적 모델로 표현될 수 있는 각 클래스의 훈련 예제와 함께 제공될 것입니다(차원의 수는 프로그램이 평가할 입력의 기능 의 수입니다).

프로그램은 다차원 공간에서 각 클래스의 표현을 플롯 하고 각 클래스를 분리하는 " 초평면 " 또는 경계를 식별합니다. 새로운 입력이 분석될 때, 그 출력은 이 초평면의 한쪽에 떨어질 것입니다. 출력이 있는 초평면의 측면은 입력이 어떤 클래스인지 결정합니다. 이 초평면은 서포트 벡터 머신입니다.

표현 학습

특징 학습이라고도 하는 표현 학습은 시스템이 특징을 가장 잘 인식하고 감지한 다음 다른 개체를 구별할 수 있는 개체 표현을 자동으로 생성할 수 있도록 하는 기계 학습 내의 기술 집합입니다. 따라서 기능은 시스템에서 식별한 후 분석을 수행하는 데에도 사용됩니다.

특징 학습은 이미지 및 기타 미디어의 분류 문제에서 매우 일반적입니다. 이미지, 비디오 및 기타 종류의 신호에는 항상 수학적으로 편리한 모델이 없기 때문에 컴퓨터 프로그램이 다음 수준의 분석을 수행하는 데 사용할 고유한 표현을 생성할 수 있도록 하는 것이 일반적으로 유리합니다.

유사성 학습

유사성 학습은 표현 학습 방법이자 분류 및 회귀와 매우 밀접한 지도 학습의 영역입니다. 그러나 유사성 학습 알고리즘의 목표는 단순히 객체를 분류하는 것이 아니라 둘 이상의 객체가 얼마나 유사하거나 다른지를 식별하는 것입니다. 이것은 오늘날 전화의 얼굴 인식 , 순위/추천 시스템, 음성 확인을 포함하여 다양한 응용 프로그램을 가지고 있습니다.

희소 사전 학습

희소 사전 학습은 사전 학습과 희소 표현 또는 희소 코딩의 교차점일 뿐입니다. 컴퓨터 프로그램은 사전이라고 하는 입력 데이터의 표현을 구축하는 것을 목표로 합니다. 희소 표현 원리를 적용함으로써 희소 사전 학습 알고리즘은 여전히 작업을 효과적으로 완료할 수 있는 가장 간결한 사전을 유지하려고 시도합니다.

유전 및 진화 알고리즘

기계학습 이란 인간 게놈 및 관련 과학 분야를 연구하는 데 매우 도움이 되었지만 " 유전 알고리즘 "이라는 문구는 기계 학습 알고리즘의 클래스와 문제 해결에 사용하는 접근 방식을 의미하며 기계의 유전학 관련 응용 프로그램이 아닙니다. 학습. 유전 알고리즘은 실제로 자연선택의 생물학적 과정에서 영감을 얻습니다. 이러한 알고리즘은 가능한 설루션의 다양한 변형을 구축하기 위해 돌연변이, 선택 및 교차의 수학적 등가물을 사용합니다.

기계 학습의 역사

기계 학습은 오늘날 인간에게 엄청난 수의 이점을 제공하며 기계 학습의 용도는 그 어느 때보다 빠르게 증가하고 있습니다. 그러나 기계 학습이 주류에 도달하는 데는 긴 여정이 있었습니다.

초기 역사와 연구의 기초

"머신 러닝"이라는 용어는 1959년 인공 지능과 컴퓨터 게임의 선구자인 Arthur Samuel에 의해 처음 만들어졌습니다. 그러나 Samuel은 실제로 1952년 IBM에 있을 때 최초의 컴퓨터 학습 프로그램을 작성했습니다. 이 프로그램은 컴퓨터가 각각의 능력을 향상하는 체커 게임이었습니다. 플레이 시간, 어떤 움직임이 승리 전략을 구성했는지 분석했습니다.

1957년 Frank Rosenblatt는 인간 두뇌의 사고 과정을 시뮬레이션하도록 설계된 최초의 인공 컴퓨터 신경망( 퍼셉트론 이라고도 함)을 만들었습니다.

1967년에는 컴퓨터를 사용한 기본적인 패턴 인식의 시작을 알리는 "최근접 이웃" 알고리즘이 설계되었습니다.

이러한 초기 발견은 중요했지만 유용한 응용 프로그램의 부족과 시대의 제한된 컴퓨팅 성능으로 인해 1980년대까지 기계 학습과 AI가 장기간 정체되었습니다.

AI에서 멀어지는 머신 러닝 확장

80년대와 90년대 초반까지 머신러닝과 인공지능은 거의 하나였습니다. 그러나 90년대 초반경, 연구자들은 AI를 위해 만든 문제 해결 기술에 대한 새롭고 더 실용적인 응용 프로그램을 찾기 시작했습니다.

머신 러닝의 보다 실용적인 사용을 모색하는 것은 인간 및 생물학적 행동보다 통계와 확률에 더 기반을 둔 새로운 접근 방식의 문을 열었습니다. 머신 러닝은 이제 자체 연구 분야로 발전하여 많은 대학, 회사 및 독립 연구원이 기여하기 시작했습니다.

현대 기계 학습

오늘날 기계학습 이란 수많은 애플리케이션에 내장되어 있으며 매일 수백만(수십억은 아닐지라도) 사람들에게 영향을 미칩니다. 기계 학습에 대한 방대한 양의 연구 결과 개발 중인 많은 새로운 접근 방식과 기계 학습에 대한 다양한 새로운 사용 사례가 개발되었습니다. 실제로 머신 러닝 기술은 비즈니스에서 공통적으로 필요한 많은 양의 데이터를 분석해야 하는 모든 곳에서 사용할 수 있습니다.

 

세 가지 주요 이유는 비즈니스 및 연구 응용 프로그램에서 기계 학습의 대량 채택으로 이어졌습니다. (1) 지난 수십 년 동안 컴퓨팅 성능이 크게 증가하고 비용이 훨씬 저렴해졌습니다. 인터넷의 확장과 함께 확산되었고 (3) 오픈 소스 머신 러닝 도구 가 더 널리 사용 가능하게 되었습니다.

생물의학, 인터넷/기술, 물류 및 기타 거의 모든 산업 분야의 기업이 머신 러닝의 놀라운 힘을 활용하고 있습니다. 다음은 오늘날 기계 학습이 사용되는 몇 가지 예입니다.

Google은 기계 학습을 사용하여 사용자의 검색어를 더 잘 이해합니다.

Google은 또한 기계 학습을 사용하여 반환된 결과에 대한 참여도를 측정하여 결과를 개선합니다.

의료 연구 조직은 기계 학습을 사용하여 질병 및 상태의 패턴을 식별하고 의료를 개선하기 위해 엄청난 양의 인간 건강 기록 데이터를 분석하고 있습니다.

Lyft와 같은 차량 공유 앱은 머신 러닝을 사용하여 시간과 위치에 따라 경로와 가격을 최적화합니다.

이메일 프로그램은 기계 학습 기술을 사용하여 스팸 폴더에 속하는 항목을 파악합니다.

은행은 기계 학습을 사용하여 의심스럽거나 사기성일 수 있는 거래 및 행동을 찾아내고 있습니다.

이들은 오늘날 기계학습 이란 기술이 사용되는 수천 개의 예에 불과합니다. 기계 학습은 흥미롭고 빠르게 확장되는 연구 분야이며 응용 프로그램은 끝이 없어 보입니다. 더 많은 사람들과 회사가 기술과 도구의 사용에 대해 알게 되면서 점점 더 사용 가능해지고 사용하기 쉬워짐에 따라 머신 러닝이 일상생활에서 훨씬 더 큰 부분을 차지하게 될 것으로 기대합니다.

댓글