Little bIT awesome

[머신러닝] Chapter1 소개 본문

인공지능/머신러닝 & 딥러닝

[머신러닝] Chapter1 소개

까루카라 2023. 3. 28. 14:03

*[파이썬 라이브러리를 활용한 머신러닝]을 읽고 정리한 내용입니다. 

  • 규칙 기반 전문가 시스템
    • 결정에 필요한 로직은 한 분야나 작업에 국한됨. 작업이 조금만 변경되더라도 전체 시스템을 다시 개발해야 할 수 있음
    • 규칙을 설계하려면 그 분야 전문가들이 내리는 결정 방식에 대해 잘 알아야 함
    • ex) 얼굴 인식 시스템의 실패
  • 머신러닝 1 : 지도학습
    • 이미 알려진 사례를 바탕으로 일반화된 모델을 만들어 의사 결정 프로세스를 자동화하는 것
    • 입력과 출력 데이터를 만드는 것은 수작업을 거쳐야 하기 때문에 힘듦
    • 분석하기에 좋고 성능을 측정하기에 좋음
    • ex) 편지 봉투에 손으로 쓴 우편번호 숫자 판별, 의료 영상 이미지에 기반한 종양 판단, 의심되는 신용카드 거래 감지
  • 머신러닝 2 : 비지도 학습(이 책에서 주로 다룰 알고리즘)
    • 알고리즘에 입력은 주어지지만 출력은 주어지지 않음
    • 비지도 학습을 이해하거나 평가하는 일은 쉽지 않다. 
    • ex) 블로그 글의 주제 구분, 고객들을 취향이 비슷한 그룹으로 묶기, 비정상적인 웹사이트 접근 탐지

 

 

지도학습과 비지도 학습 모두 컴퓨터가 인식할 수 있는 형태로 입력 데이터를 준비하는 것이 중요

개개의 데이터 데이터를 구성하는 각 속성
샘플, 데이터 포인트 특성

 

1.1.2 문제와 데이터 이해하기

머신러닝 프로세스에서 가장 중요한 과정은 사용할 데이터를 이해하고 그 데이터가 해결해야 할 문제와 어떤 관련이 있는지를 이해하는 일

- 어떤 질문에 대한 답을 원하는가? 가진 데이터가 원하는 답을 줄 수 있는가?

- 충분한 데이터를 모았는가?

 

 

https://gaussian37.github.io/math-la-sparse_matrix/

 

sparse matrix (희소 행렬)와 CSR(Compressed Sparse Row)

gaussian37's blog

gaussian37.github.io