google.com, pub-9850333530125189, DIRECT, f08c47fec0942fa0 기계학습 알고리즘
본문 바로가기
카테고리 없음

기계학습 알고리즘

by ╰(*°▽°*)╯(¬_¬ ) 2022. 2. 2.
반응형

머신 러닝이란 무엇입니까?

머신 러닝은 인공 지능(AI)의 하위 집합입니다. 명시적으로 프로그래밍하는 대신 데이터에서 배우고 경험을 통해 개선하도록 컴퓨터를 가르치는 데 중점을 둡니다. 기계학습 알고리즘은 대규모 데이터 세트에서 패턴과 상관관계를 찾고 해당 분석을 기반으로 최상의 결정과 예측을 내리도록 훈련됩니다. 머신 러닝 애플리케이션은 사용할수록 개선되고 액세스 할 수 있는 데이터가 많을수록 더 정확해집니다. 기계 학습의 응용 프로그램은 가정, 장바구니, 엔터테인먼트 미디어, 의료 등 우리 주변에 있습니다.

머신 러닝은 AI와 어떤 관련이 있습니까?

머신 러닝과 딥 러닝 및 신경망의 구성 요소는 모두 AI의 동심원 하위 집합으로 적합합니다. AI는 데이터를 처리하여 의사 결정과 예측을 내립니다. 기계 학습 알고리즘을 사용하면 AI가 해당 데이터를 처리할 수 있을 뿐만 아니라 추가 프로그래밍 없이도 이를 사용하여 학습하고 더 똑똑해질 수 있습니다. 인공 지능 은 그 아래에 있는 모든 기계 학습 하위 집합의 부모입니다. 첫 번째 하위 집합에는 기계 학습이 있습니다. 그 안에는 딥 러닝이 있고 그 안에 신경망이 있습니다.

신경망이란 무엇입니까?

인공 신경망(ANN)은 생물학적 뇌의 뉴런을 모델로 합니다. 인공 뉴런은 노드라고 하며 병렬로 작동하는 여러 레이어로 함께 클러스터링됩니다. 인공 뉴런은 수치 신호를 받으면 이를 처리하고 연결된 다른 뉴런에 신호를 보냅니다. 인간의 두뇌와 마찬가지로 신경 강화는 패턴 인식, 전문성 및 전반적인 학습을 향상합니다.

딥러닝이란?

이러한 종류의 기계 학습은 신경망의 많은 계층과 복잡하고 이질적인 방대한 양의 데이터를 포함하기 때문에 "딥"이라고 합니다. 딥 러닝을 달성하기 위해 시스템은 네트워크의 여러 계층과 연결되어 점점 더 높은 수준의 출력을 추출합니다. 예를 들어, 자연 이미지를 처리하고 Gloriosa 데이지를 찾는 딥 러닝 시스템은 첫 번째 레이어에서 식물을 인식합니다. 신경층을 통과하면서 꽃, 데이지, 그리고 마지막으로 Gloriosa 데이지를 식별합니다. 딥 러닝 애플리케이션의 예로는 음성 인식, 이미지 분류 및 제약 분석이 있습니다.

기계 학습은 어떻게 작동합니까?

기계 학습은 다양한 알고리즘 기술을 사용하는 다양한 유형의 기계 학습 모델로 구성됩니다. 데이터의 특성과 원하는 결과에 따라 지도, 비지도, 반 지도 또는 강화의 네 가지 학습 모델 중 하나를 사용할 수 있습니다. 각 모델 내에서 사용 중인 데이터 세트 및 의도한 결과와 관련하여 하나 이상의 알고리즘 기술이 적용될 수 있습니다. 기계 학습 알고리즘은 기본적으로 사물을 분류하고, 패턴을 찾고, 결과를 예측하고, 정보에 입각한 결정을 내리도록 설계되었습니다. 알고리즘은 한 번에 하나씩 사용하거나 복잡하고 예측할 수 없는 데이터가 포함될 때 최상의 정확도를 달성하기 위해 결합할 수 있습니다.

기계학습 알고리즘이란 무엇입니까?

지도 학습은 네 가지 기계 학습 모델 중 첫 번째 모델입니다. 지도 학습 알고리즘에서 기계는 예를 통해 학습됩니다. 지도 학습 모델은 "입력" 및 "출력" 데이터 쌍으로 구성되며 출력은 원하는 값으로 레이블이 지정됩니다. 예를 들어, 기계가 데이지와 팬지를 구별하는 것이 목표라고 가정해 보겠습니다. 하나의 이진 입력 데이터 쌍에는 데이지 이미지와 팬지 이미지가 모두 포함됩니다. 해당 특정 쌍에 대해 원하는 결과는 데이지를 선택하는 것이므로 올바른 결과로 미리 식별됩니다.

알고리즘을 통해 시스템은 시간이 지남에 따라 이 모든 교육 데이터를 컴파일하고 데이지 또는 팬지 질문에 대한 답변을 자체적으로 예측할 수 있을 때까지 상관관계 유사성, 차이점 및 기타 논리 지점을 결정하기 시작합니다. 그것은 아이에게 정답이 있는 일련의 문제를 제공한 다음 자신의 작업을 보여주고 논리를 설명하도록 요청하는 것과 같습니다. 지도 학습 모델은 하루 중 다른 시간에 가장 빠른 경로를 예측하는 Waze와 같은 트래픽 분석 앱 및 제품 추천 엔진과 같이 우리가 매일 상호 작용하는 많은 애플리케이션에서 사용됩니다.

비지도 학습이란 무엇입니까?

비지도 학습은 네 가지 기계 학습 모델 중 두 번째입니다. 비지도 학습 모델에는 정답이 없습니다. 기계는 대부분이 레이블이 지정되지 않고 구조화되지 않은 입력 데이터를 연구하고 접근 가능한 모든 관련 데이터를 사용하여 패턴과 상관관계를 식별하기 시작합니다. 여러 면에서 비지도 학습은 인간이 세상을 관찰하는 방식을 모델로 합니다. 우리는 직관과 경험을 사용하여 사물을 그룹화합니다. 우리가 무언가의 예를 점점 더 많이 경험함에 따라, 그것을 분류하고 식별하는 우리의 능력은 점점 더 정확해집니다. 기계의 경우 "경험"은 입력되고 사용 가능한 데이터의 양으로 정의됩니다. 비지도 학습 애플리케이션의 일반적인 예로는 얼굴 인식, 유전자 서열 분석, 시장 조사 및 사이버 보안이 있습니다.

반 지도 학습이란 무엇입니까?

반 지도 학습은 네 가지 기계 학습 모델 중 세 번째입니다. 완벽한 세상에서 모든 데이터는 시스템에 입력되기 전에 구조화되고 레이블이 지정됩니다. 그러나 그것은 분명히 실현 가능하지 않기 때문에 반지도 학습은 방대한 양의 구조화되지 않은 원시 데이터가 존재할 때 실행 가능한 설루션이 됩니다. 이 모델은 레이블이 지정되지 않은 데이터 세트를 보강하기 위해 소량의 레이블이 지정된 데이터를 입력하는 것으로 구성됩니다. 기본적으로 레이블이 지정된 데이터는 시스템의 실행을 시작하는 역할을 하며 학습 속도와 정확도를 상당히 향상할 수 있습니다. 반 지도 학습 알고리즘은 레이블이 지정되지 않은 데이터에 적용될 수 있는 상관 속성에 대해 레이블이 지정된 데이터를 분석하도록 머신에 지시합니다.

그러나 이 MIT Press 연구 보고서에서 자세히 살펴본 바와 같이 이 모델에는 레이블이 지정된 데이터의 결함이 시스템에 의해 학습되고 복제되는 위험이 있습니다. 반 지도 학습을 가장 성공적으로 사용하는 회사는 모범 사례 프로토콜이 마련되어 있는지 확인합니다. 반 지도 학습은 음성 및 언어 분석, 단백질 분류와 같은 복잡한 의학 연구, 높은 수준의 사기 탐지에 사용됩니다.

강화 학습이란 무엇입니까?

강화 학습은 네 번째 기계 학습 모델입니다. 지도 학습에서 기계는 정답이 주어지고 모든 올바른 결과 간의 상관관계를 찾아 학습합니다. 강화 학습 모델은 답안을 포함하지 않고 허용 가능한 작업, 규칙 및 잠재적인 최종 상태의 집합을 입력합니다. 기계학습 알고리즘의 원하는 목표가 고정 또는 이진일 때 기계는 예를 통해 학습할 수 있습니다. 그러나 원하는 결과가 변경 가능한 경우 시스템은 경험과 보상을 통해 학습해야 합니다. 강화 학습 모델에서 "보상"은 수치적이며 시스템이 수집하려고 하는 것으로 알고리즘에 프로그래밍됩니다.

여러 면에서 이 모델은 누군가에게 체스 게임을 가르치는 것과 유사합니다. 확실히, 그들에게 모든 잠재적인 움직임을 보여주려고 하는 것은 불가능할 것입니다. 대신 규칙을 설명하고 연습을 통해 기술을 쌓습니다. 보상은 게임에서 승리할 뿐만 아니라 상대방의 말을 획득하는 형태로 제공됩니다. 강화 학습의 응용 프로그램에는 온라인 광고 구매자를 위한 자동 가격 입찰, 컴퓨터 게임 개발 및 고액 주식 시장 거래가 포함됩니다.

실행 중인 엔터프라이즈 머신 러닝

기계학습 알고리즘은 패턴과 상관 관계를 인식하므로 자체 ROI를 분석하는 데 매우 능숙합니다. 기계 학습 기술에 투자하는 회사의 경우 이 기능을 통해 운영 영향을 거의 즉시 평가할 수 있습니다. 아래는 엔터프라이즈 머신 러닝 애플리케이션의 성장하는 영역 중 일부의 작은 샘플일 뿐입니다.

오늘 시작하기

AI 및 머신 러닝을 포함한 SAP 지능형 기술이 실제로 사용되는 모습을 확인하십시오.

추천 엔진: 2009년부터 2017년까지 비디오 스트리밍 서비스를 구독하는 미국 가정의 수가 450% 증가했습니다. 그리고 Forbes 잡지의 2020년 기사에서는 비디오 스트리밍 사용 수치가 최대 70%까지 추가로 급증했다고 보고합니다. 추천 엔진은 많은 소매 및 쇼핑 플랫폼에 응용 프로그램을 가지고 있지만 스트리밍 음악 및 비디오 서비스와 함께 확실히 자체적으로 제공되고 있습니다.

다이내믹 마케팅: 리드를 생성하고 판매 유입경로를 통해 안내하려면 최대한 많은 고객 데이터를 수집하고 분석할 수 있는 능력이 필요합니다. 현대 소비자는 채팅 기록에서 이미지 업로드에 이르기까지 다양하고 구조화되지 않은 엄청난 양의 데이터를 생성합니다. 머신 러닝 애플리케이션을 사용하면 마케터가 이 데이터를 이해하고 이를 사용하여 개인화된 마케팅 콘텐츠를 제공하고 고객 및 리드와의 실시간 참여를 유도할 수 있습니다.

ERP 및 프로세스 자동화: ERP 데이터베이스에는 판매 실적 통계, 소비자 리뷰, 시장 동향 보고서 및 공급망 관리 기록이 포함될 수 있는 광범위하고 이질적인 데이터 세트가 포함됩니다.

머신 러닝 알고리즘은 이러한 데이터에서 상관관계와 패턴을 찾는 데 사용할 수 있습니다. 그런 다음 이러한 통찰력을 사용하여 네트워크 내 사물 인터넷(IoT) 장치의 워크플로 최적화 또는 반복적이거나 오류가 발생하기 쉬운 작업을 자동화하는 가장 좋은 방법을 포함하여 비즈니스의 거의 모든 영역에 정보를 제공할 수 있습니다.

예측적 유지보수: 최신 공급망과 스마트 공장은 IoT 장치와 기계는 물론 모든 차량 및 운영 전반에 걸쳐 클라우드 연결을 점점 더 많이 사용하고 있습니다. 고장과 비효율은 막대한 비용과 혼란을 초래할 수 있습니다. 유지 관리 및 수리 데이터를 수동으로 수집할 때 잠재적인 문제를 예측하는 것은 거의 불가능합니다. IoT 게이트웨이 센서는 수십 년 된 아날로그 기계에도 장착할 수 있어 비즈니스 전반에 가시성과 효율성을 제공합니다.

머신 러닝 과제

데이터 과학자이자 하버드 졸업생인 Tyler Vigan 은 그의 책 Spurious Correlations에서 "모든 상관관계가 근본적인 인과 관계를 나타내는 것은 아닙니다."라고 지적합니다. 이를 설명하기 위해 그는 마가린 소비와 메인 주의 이혼율 사이에 분명히 강한 상관 관계를 보여주는 차트를 포함합니다. 물론 이 차트는 유머러스한 포인트를 주기 위한 것이다. 그러나 더 심각한 사실은 기계 학습 응용 프로그램이 사람과 알고리즘의 편향과 오류 모두에 취약하다는 점입니다. 그리고 학습하고 적응하는 경향으로 인해 오류와 가짜 상관 관계가 신경망 전체에 빠르게 전파되고 결과를 오염시킬 수 있습니다.

알고리즘과 그 출력이 너무 복잡해서 인간이 설명하거나 이해할 수 없는 기계 학습 모델에서 추가적인 문제가 발생합니다. 이를 "블랙박스" 모델이라고 하며 알고리즘이 특정 결론이나 결정에 도달한 방법과 이유를 결정할 수 없을 때 회사를 위험에 빠뜨립니다.

다행스럽게도 데이터 세트와 기계학습 알고리즘의 복잡성이 증가함에 따라 위험을 관리하는 데 사용할 수 있는 도구와 리소스도 증가합니다. 최고의 기업은 강력하고 최신의 AI 거버넌스 지침과 모범 사례 프로토콜을 수립하여 오류와 편견을 없애기 위해 노력하고 있습니다.

댓글