google.com, pub-9850333530125189, DIRECT, f08c47fec0942fa0 머신 러닝(ML)이 중요한 사실
본문 바로가기
카테고리 없음

머신 러닝(ML)이 중요한 사실

by ╰(*°▽°*)╯(¬_¬ ) 2022. 2. 1.
반응형

머신 러닝(ML)이란 무엇입니까?

당신이 알고 있든 없든, 당신은 아마도 수년 동안 기계 학습의 이점을 활용해 왔을 것입니다. 우리 대부분은 기계 학습으로 구동되는 앱이나 웹 서비스를 하나 이상 사용하지 않고는 하루 종일 지내기가 어렵다는 것을 알게 될 것입니다. 하지만 머신 러닝이란 무엇입니까?

기계 학습이라는 용어 가 점점 더 보편화되었지만 많은 사람들은 여전히 ​​그것이 무엇을 의미하고 어떻게 적용되는지 정확히 모릅니다. 또한 그들은 데이터 과학에서 기계 학습 알고리즘과 데이터 세트의 역할을 이해하지 못합니다. 기계 학습이 데이터 과학자가 사용하는 도구로 어떻게 정의되는지 살펴보고 기계 학습이 어떻게 개발되었으며 현재 어떻게 사용되고 있으며 계속해서 발전함에 따라 앞으로 어떻게 될 것인지에 대한 조감도를 살펴보겠습니다.

기계 학습의 정의

데이터 과학에서 기계 학습의 기본 개념은 컴퓨터가 데이터 세트를 분석하고 패턴을 식별할 수 있도록 하는 통계 학습 및 최적화 방법을 사용하는 것입니다( R2D3을 통해 기계 학습의 시각적 개체 보기 외부 링크:open_in_new). 머신 러닝 기술은 데이터 마이닝을 활용하여 과거 추세를 식별하여 미래 모델에 정보를 제공합니다.

일반적인 지도 머신 러닝 알고리즘은 (대략) 세 가지 구성 요소로 구성됩니다.

결정 프로세스: 데이터를 가져와서 알고리즘이 찾고 있는 데이터의 패턴 종류에 대한 "추측"을 반환하는 계산 또는 기타 단계의 레시피입니다.

오류 함수

추측을 알려진 예(사용 가능한 경우)와 비교하여 추측이 얼마나 좋은지 측정하는 방법입니다. 의사결정 과정이 제대로 이루어졌습니까? 그렇지 않다면, 그 실패가 "얼마나 나빴는지"를 어떻게 수량화합니까?

업데이트 또는 최적화 프로세스: 알고리즘이 누락을 확인한 다음 결정 프로세스가 최종 결정에 도달하는 방법을 업데이트하여 다음에 누락이 크지 않도록 합니다.

예를 들어, 영화 추천기를 구축하는 경우 알고리즘의 결정 프로세스는 주어진 영화가 사용자가 본 다른 영화와 얼마나 유사한지 살펴보고 다양한 기능에 대한 가중치 시스템을 제시할 수 있습니다.

훈련 과정에서 알고리즘은 사용자가 본 영화를 살펴보고 다양한 속성에 가중치를 부여합니다. SF 영화인가? 웃겨? 그런 다음 알고리즘은 귀하(또는 귀하와 같은 사람들)가 실제로 본 영화를 추천하는지 여부를 테스트합니다. 올바르게 설정하면 사용한 가중치가 그대로 유지됩니다. 영화가 잘못되면 잘못된 결정으로 이어진 가중치가 낮아져서 다시는 그런 실수를 하지 않습니다.

기계 학습 알고리즘은 자동으로 업데이트되기 때문에 분석하는 데이터에서 스스로 학습할 때마다 분석 정확도가 향상됩니다. 학습의 이러한 반복적인 특성은 사람의 개입 없이 발생하기 때문에 독특하고 가치가 있습니다. 그렇게 하도록 특별히 프로그래밍되지 않고도 숨겨진 통찰력을 발견할 수 있는 기능을 제공합니다.

머신 러닝의 유형

많은 기계 학습 모델은 보상이 제공되는지, 특정 피드백이 제공되는지 또는 레이블이 사용되는지 여부와 같이 원시 데이터에 대한 인간의 영향 여부에 따라 정의됩니다.

지도 학습: 사용 중인 데이터 세트는 사용자가 미리 레이블을 지정하고 분류하여 알고리즘이 성능이 얼마나 정확한지 확인할 수 있도록 합니다.

비지도 학습

사용 중인 원시 데이터 세트에는 레이블이 지정되지 않으며 알고리즘은 사용자의 도움 없이 데이터 내의 패턴과 관계를 식별합니다.

반지도 학습

데이터 세트에는 구조화된 데이터와 구조화되지 않은 데이터가 포함되어 있어 알고리즘이 독립적인 결론을 내리도록 안내합니다. 하나의 훈련 데이터 세트에서 두 데이터 유형의 조합을 통해 기계 학습 알고리즘은 레이블이 지정되지 않은 데이터에 레이블을 지정하는 방법을 학습할 수 있습니다.

강화 학습

데이터 세트는 시행착오를 통해 자체 경험에서 학습하도록 알고리즘에 피드백을 제공하는 "보상/처벌" 시스템을 사용합니다.

마지막으로 사람의 규칙이나 지식을 도입하지 않고 데이터 세트에서 자동으로 학습하는 기계 학습의 새로운 영역인 딥 러닝의 개념이 있습니다. 이를 위해서는 처리를 위해 막대한 양의 원시 데이터가 필요하며 더 많은 데이터를 수신할수록 예측 모델이 더 많이 향상됩니다.

머신 러닝이 왜 중요한가요?

머신 러닝의 구성 요소인 머신 러닝과 데이터 마이닝 은 오늘날 기업과 연구원이 보유하고 있는 방대한 데이터 세트에서 통찰력을 얻는 과정에서 중요한 도구입니다. 여기에는 두 가지 주요 이유가 있습니다.

데이터 규모

기업은 처리해야 하는 방대한 양과 다양한 데이터에 직면해 있습니다. 처리 능력은 더 효율적이고 쉽게 사용할 수 있습니다. 자체적으로 데이터를 처리하고, 결론을 결정하고, 패턴을 식별하도록 프로그래밍할 수 있는 모델은 매우 중요합니다.

예상치 못한 결과

머신 러닝 알고리즘이 자동으로 업데이트되기 때문에 분석하는 데이터 세트에서 스스로 학습할 때마다 분석 정확도가 향상됩니다. 학습의 이러한 반복적 특성은 사람의 개입 없이 발생하므로 특별히 프로그래밍되지 않고도 숨겨진 통찰력을 발견할 수 있는 능력을 제공하기 때문에 독특하고 가치가 있습니다.

누가 기계 학습을 사용하고 있습니까?

데이터를 분류하고 비즈니스 운영을 최적화하기 위해 알고리즘을 활용하는 회사는 새로운 것이 아닙니다. SAS Insights에 따르면 알고리즘 활용은 웹 서비스 또는 앱과 같은 디지털 비즈니스 모델뿐만 아니라 데이터를 수집할 수 있는 모든 회사 또는 산업으로 확장됩니다.

금융 서비스

오프라인 소매

보건 의료

교통

석유 및 가스

정부

Amazon, Facebook, Netflix, 그리고 물론 Google은 모두 기계 학습 알고리즘을 사용하여 10년 넘게 검색, 추천, 타깃 광고 등을 추진해 왔습니다. 예를 들어 Uber Eats는 회사가 데이터 마이닝 및 기계 학습을 사용하는 GeekWire 기사에서 공유했습니다. 외부 링크:open_in_new 배달 시간을 추정하기 위해.

머신 러닝의 진화

컴퓨팅 기술의 발전으로 머신 러닝이 그 어느 때보다 대중화되었지만 새로운 개념은 아닙니다. Forbes 기사에 따르면 기계 학습 의 기원은 1950년으로 거슬러 올라갑니다. 외부 링크:open_in_new 그들이 진정으로 통합된 인공 지능(AI)을 개발했는지 알 수 있는 방법을 추측하면서 Alan Turing은 현재 Turing 테스트라고 하는 것을 만들었습니다. 이 테스트는 AI가 언어를 이해할 수 있는지 여부를 테스트하는 한 가지 방법을 제안합니다 그것은 그것이 다른 사람에게 말하고 있다고 생각하도록 인간을 속일 수 있는지 확인하는 것입니다.

1952년 Arthur Samuel은 IBM을 위한 최초의 학습 프로그램을 작성했는데 이번에는 체커 게임이 포함되었습니다. 1957년 Frank Rosenblatt의 첫 번째 신경망 설계와 1981년 Gerald DeJong의 설명 기반 학습 도입을 포함하여 많은 다른 기계 학습 개척자들의 작업이 이어졌습니다.

1990년대에 지식 기반 접근 방식에서 데이터 중심 접근 방식으로 초점이 옮겨가면서 머신 러닝에 큰 변화가 일어났습니다. 과학자들이 대규모 데이터 세트를 분석하고 그 과정에서 학습할 수 있는 컴퓨터 프로그램을 만들기 시작하면서 이 분야의 진화에서 중요한 10년이었습니다.

2000년대는 비지도 학습(unsupervised learning)이 널리 보급되어 결국 딥 러닝의 출현과 머신 러닝이 하나의 관행으로 보편화되는 시기였습니다.

기계 학습의 이정표는 1997년 러시아 체스 그랜드 마스터 Garry Kasparov가 IBM 슈퍼컴퓨터 Deep Blue의 손에 패배한 것과 더 최근에는 2016년 구글 딥마인드 AI 프로그램 알파고가 이세돌보다 압도적으로 넓은 게임 플레이 가능성으로 악명 높은 바둑을 하고 있다.

오늘날 연구자들은 이러한 성과를 확장하기 위해 열심히 노력하고 있습니다. 머신 러닝과 인공 지능 애플리케이션이 대중화됨에 따라 서버 기반 시스템에서 클라우드로 이동하면서 접근성도 높아지고 있습니다. Google Next 2018에서 Google은 몇 가지 새로운 딥 러닝 및 머신 러닝 기능을 소개했습니다. 외부 링크:open_in_new Cloud AutoML, BigQuery ML 등 지난 몇 년 동안 Amazon, Microsoft, Baidu 및 IBM은 모두 오픈 소스 프로젝트와 엔터프라이즈 클라우드 서비스를 통해 기계 학습 플랫폼을 공개했습니다. 기계 학습 알고리즘은 계속 존재하며 연구 및 산업이 달성할 수 있는 매개변수를 빠르게 확대하고 있습니다.

머신 러닝의 미래는 무엇입니까?

기계 학습 알고리즘은 비즈니스, 정부, 금융, 농업, 운송, 사이버 보안 및 마케팅을 포함한 거의 모든 주요 부문에서 전 세계적으로 사용되고 있습니다. 이질적인 산업 전반에 걸쳐 이러한 빠른 채택은 머신 러닝(그리고 더 나아가 데이터 과학)이 창출하는 가치의 증거입니다. 종종 실시간으로 발생하는 방대한 데이터 세트의 통찰력으로 무장한 조직은 보다 효율적으로 운영하고 경쟁 우위를 확보할 수 있습니다.

기계 학습 및 인공 지능의 응용 프로그램은 상거래 및 운영 최적화를 넘어 확장됩니다. IBM은 Jeopardy 에서 우승한 후 Watson 알고리즘을 의학 연구 문헌에 적용했습니다. 외부 링크:open_in_new 따라서 "왓슨을 의과대학에 보냅니다." 보다 최근에 정밀 의학 이니셔티브는 유전 구조의 미묘한 패턴과 다양한 의학적 치료에 대응할 수 있는 방법을 감지하기 위해 대규모 인공 신경망(즉, "딥 러닝" 알고리즘)으로 구동되는 기계 학습 알고리즘을 사용하여 새로운 영역을 개척하고 있습니다. 기계 학습 알고리즘을 사용하여 자연어를 표현하는 방법의 획기적인 발전으로 자동화된 텍스트 번역, 텍스트 요약 기술, 정교한 질문 및 응답 시스템을 포함하는 새로운 가능성이 급증했습니다. 다른 발전으로는 자동화 로봇, 자율 비행 드론 및 산업화된 자율 운전 자동차를 위한 학습 시스템이 있습니다.

사회 및 산업의 대부분의 모든 부문이 디지털화를 계속한다는 것은 계속해서 증가하는 데이터 양이 계속 생성된다는 것을 의미합니다. 이러한 방대한 데이터 세트에서 통찰력을 얻을 수 있는 능력은 질병을 보다 효과적으로 식별 및 치료하는 것부터 사이버 범죄자와 싸우는 것, 조직이 보다 효과적으로 운영하여 수익을 높일 수 있도록 지원하는 것까지 다양한 문제를 해결하는 핵심 중 하나입니다.

많은 분야에서 머신 러닝이 가능하게 하는 보편적인 기능은 머신 러닝을 필수 도구로 만들고 전문가들은 머신 러닝의 사용에 대한 밝은 미래를 예측합니다. 실제로 Gartner의 "2017년 10대 기술 동향"에서 외부 링크:open_in_new 기계 학습 및 인공 지능이 목록에서 1위를 차지했습니다.

"AI와 머신 러닝은 ... 또한 자율적으로 이해, 학습, 예측, 적응 및 잠재적으로 작동하는 고급 시스템을 포함할 수 있습니다. 광범위한 병렬 처리 능력, 고급 알고리즘 및 알고리즘을 제공하는 방대한 데이터 세트의 조합이 이 새로운 시대를 열었습니다.” 머신 러닝과 AI 애플리케이션이 대중화되면서 서버 기반 시스템에서 클라우드로 이동하는 등 접근성도 높아지고 있습니다. 지난 몇 년 동안 Google, Amazon, Microsoft, Baidu 및 IBM은 모두 오픈 소스 프로젝트와 엔터프라이즈 클라우드 서비스를 통해 기계 학습 플랫폼을 공개했습니다.

댓글