Develope/AI 교육

[코딩야학] 머신러닝 3일차

고로이 2021. 1. 6. 14:58
반응형

11. 직업의 시작

현실을 데이터로 표현할 수 있다면, 컴퓨터를 이용해서 데이터를 처리할 수 있다.

머신러닝으로 무언가를 하려면 데이터가 필요하다.

현실을 데이터화해서 머신러닝을 통해 통찰한다. 이를 이용해 현실을 변화시키는 것이 '데이터 산업'이다.

* 데이터 과학 : 데이터를 만들고 만들어진 데이터를 이용하는 일
* 데이터 공학 : 만들어진 데이터를 다루는 도구를 만들고, 그 도구를 관리

12. 표

시각화 도구 중에서 가장 활용성이 높은 것은 '표'와 '좌표평면'이다.
그중 표는 복잡한 데이터를 정돈하고, 처리할 수 있도록 해준다.

데이터 셋 : 데이터들의 모임, 즉 표

표는 열과 행으로 이루어져 있다.
o 행(row)
개체(instance)
관측치(observed value) ㅁ7ㅁ8
기록(record)
사례(example)
경우(case)

o 열(column)
특성(feature)
속성(attribute)
변수(variable) ㅁ7ㅁ8

13. 독립변수와 종속변수

변수는 Variable 이라고 해서 변할 수 있는 수를 의미한다.
표에서의 데이터들도 하나의 변수들이다.

독립변수 = 원인이 되는 열
종속변수 = 결과가 되는 열

변수와 변수는 상관관계이다.
독립변수와 종속변수는 인과관계를 가지고 있다.

ex) 20도에는 주스가 20잔 팔리고 25도에는 주스가 30잔 팔렸을 때
온도와 판매개수는 상관(관계)이 있다.

온도가 달라지면 판매 개수도 달라진다.
판매량이 달라지면 온도는 영향을 받지 않는다.
즉 온도는 판매량을 결정짓는 인과(원인과 결과)관계가 있다.
- 독립변수 = 온도
- 종속변수 = 판매량 


상관관계는 인과관계를 포함한다.
그렇기에 상관관계를 가진 사이를 인과관계로 착각해서는 안된다.

14. 심리전
능동적인 전략으로 공부가 아닌 도구로 인지하여 절망이 아닌 설렘으로 공부하자

반응형