11. 직업의 시작
현실을 데이터로 표현할 수 있다면, 컴퓨터를 이용해서 데이터를 처리할 수 있다.
머신러닝으로 무언가를 하려면 데이터가 필요하다.
현실을 데이터화해서 머신러닝을 통해 통찰한다. 이를 이용해 현실을 변화시키는 것이 '데이터 산업'이다.
* 데이터 과학 : 데이터를 만들고 만들어진 데이터를 이용하는 일
* 데이터 공학 : 만들어진 데이터를 다루는 도구를 만들고, 그 도구를 관리
12. 표
시각화 도구 중에서 가장 활용성이 높은 것은 '표'와 '좌표평면'이다.
그중 표는 복잡한 데이터를 정돈하고, 처리할 수 있도록 해준다.
데이터 셋 : 데이터들의 모임, 즉 표
표는 열과 행으로 이루어져 있다.
o 행(row)
개체(instance)
관측치(observed value) ㅁ7ㅁ8
기록(record)
사례(example)
경우(case)
o 열(column)
특성(feature)
속성(attribute)
변수(variable) ㅁ7ㅁ8
13. 독립변수와 종속변수
변수는 Variable 이라고 해서 변할 수 있는 수를 의미한다.
표에서의 데이터들도 하나의 변수들이다.
독립변수 = 원인이 되는 열
종속변수 = 결과가 되는 열
변수와 변수는 상관관계이다.
독립변수와 종속변수는 인과관계를 가지고 있다.
ex) 20도에는 주스가 20잔 팔리고 25도에는 주스가 30잔 팔렸을 때
온도와 판매개수는 상관(관계)이 있다.
온도가 달라지면 판매 개수도 달라진다.
판매량이 달라지면 온도는 영향을 받지 않는다.
즉 온도는 판매량을 결정짓는 인과(원인과 결과)관계가 있다.
- 독립변수 = 온도
- 종속변수 = 판매량
상관관계는 인과관계를 포함한다.
그렇기에 상관관계를 가진 사이를 인과관계로 착각해서는 안된다.
14. 심리전
능동적인 전략으로 공부가 아닌 도구로 인지하여 절망이 아닌 설렘으로 공부하자
'Develope > AI 교육' 카테고리의 다른 글
[AI-역량강화] 협업 필터링(Collaborative Filtering) 관련 논문과 해당 모델의 특징 (0) | 2021.05.31 |
---|---|
[AI-역량강화] 추천 알고리즘 - 협업필터링 개념 및 용어 설명 (0) | 2021.05.31 |
[AI-역량강화] 추천 알고리즘 개념 및 종류 정리 (0) | 2021.05.31 |
Ch 01. 추천시스템이란 (0) | 2021.01.29 |