Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 프로그래머스
- 선택정렬
- Timsort
- 큐
- 코테
- 힙
- heap
- 삽입정렬
- stack
- collections.sort
- 해시함수
- 분할정복
- 우선순위 큐
- 이진트리탐색
- 자료구조
- 스터디
- LinkedList
- 스택
- 코딩테스트
- 팀정렬
- 연결리스트
- MSA
- 퀵정렬
- 트라이
- 파싱
- 코테준비
- 거품정렬
- 백준
- divide and conquer
- 15552번
Archives
- Today
- Total
Little bIT awesome
[머신러닝] Chapter1 소개 본문
*[파이썬 라이브러리를 활용한 머신러닝]을 읽고 정리한 내용입니다.
- 규칙 기반 전문가 시스템
- 결정에 필요한 로직은 한 분야나 작업에 국한됨. 작업이 조금만 변경되더라도 전체 시스템을 다시 개발해야 할 수 있음
- 규칙을 설계하려면 그 분야 전문가들이 내리는 결정 방식에 대해 잘 알아야 함
- ex) 얼굴 인식 시스템의 실패
- 머신러닝 1 : 지도학습
- 이미 알려진 사례를 바탕으로 일반화된 모델을 만들어 의사 결정 프로세스를 자동화하는 것
- 입력과 출력 데이터를 만드는 것은 수작업을 거쳐야 하기 때문에 힘듦
- 분석하기에 좋고 성능을 측정하기에 좋음
- ex) 편지 봉투에 손으로 쓴 우편번호 숫자 판별, 의료 영상 이미지에 기반한 종양 판단, 의심되는 신용카드 거래 감지
- 머신러닝 2 : 비지도 학습(이 책에서 주로 다룰 알고리즘)
- 알고리즘에 입력은 주어지지만 출력은 주어지지 않음
- 비지도 학습을 이해하거나 평가하는 일은 쉽지 않다.
- ex) 블로그 글의 주제 구분, 고객들을 취향이 비슷한 그룹으로 묶기, 비정상적인 웹사이트 접근 탐지
지도학습과 비지도 학습 모두 컴퓨터가 인식할 수 있는 형태로 입력 데이터를 준비하는 것이 중요
행 | 열 |
개개의 데이터 | 데이터를 구성하는 각 속성 |
샘플, 데이터 포인트 | 특성 |
1.1.2 문제와 데이터 이해하기
머신러닝 프로세스에서 가장 중요한 과정은 사용할 데이터를 이해하고 그 데이터가 해결해야 할 문제와 어떤 관련이 있는지를 이해하는 일
- 어떤 질문에 대한 답을 원하는가? 가진 데이터가 원하는 답을 줄 수 있는가?
- 충분한 데이터를 모았는가?
https://gaussian37.github.io/math-la-sparse_matrix/
sparse matrix (희소 행렬)와 CSR(Compressed Sparse Row)
gaussian37's blog
gaussian37.github.io
'인공지능 > 머신러닝 & 딥러닝' 카테고리의 다른 글
[데이터 마이닝] 기본 (0) | 2023.04.06 |
---|---|
[머신러닝] 1.7 첫 번째 어플리케이션: 붓꽃의 품종 분류 (0) | 2023.03.28 |