Develope/AI 교육 5

[AI-역량강화] 협업 필터링(Collaborative Filtering) 관련 논문과 해당 모델의 특징

각 협업 필터링 모델은 논문에 기반한 것. 1. Neural Collaborative Filtering * Neural Collaborative Filtering (IWWWC, 2017년) 1) 개요 - 기존 Linear Matrix Factorization 의 한계점 지적 - Neural Ner 기반의 협업 필터링으로 non-linear한 부분을 커버 - user와 item 관계를 보다 복잡하게 모델링 할 수 있다. - Matrix Factorization은 Neural CF 의 한 종류 이다. 2) 구현 - User가 Item을 관측했는지에 따라 0또는 1로 표현한다. 선호도의 지표가 아닌 단순 관련성이다. - 바이너리이기 때문에 베르누이 분포를 이용한다. - Interaction Function F..

Develope/AI 교육 2021.05.31

[AI-역량강화] 추천 알고리즘 - 협업필터링 개념 및 용어 설명

* Model 기반 협업 필터링 - 머신러닝을 활용하여 주어진 데이터를 학습한다. - 항목간 유사성에서 벗어나 데이터의 패턴을 학습한다. - 유저의 잠재적 특성을 파악한다.(Latent Factor Model) * 이웃 기반 협업 필터링 - 메모리 기단의 협업 필터링 - 아이템과 유저 간의 데이터로 새로운 아이템을 예측한다. - 계산량이 적고 구현이 간단하다 - 안정적이며 새로운 콘텐츠를 추천할 수 있다. * Explicit 데이터 - 유저가 직접 입력한 데이터이기 때문에 품질이 좋다 - 데이터의 양이 적다. - 유저가 평가에 대한심리적 거부감으로 모두 참여하지 않기 때문에 데이터가 신뢰되기 어렵다. * Implicit 데이터 - 다양한 방법으로 데이터를 얻을 수 있다. - 데이터의 실제 의미를 파악하기..

Develope/AI 교육 2021.05.31

[AI-역량강화] 추천 알고리즘 개념 및 종류 정리

1. 컨텐츠 기반 추천 알고리즘 ■ 컨텐츠 기반 추천시스템 개요 1) 개요 - 컨텐츠가 비슷한 아이템을 추천한다. - 사용자가 과거에 경험했던 아이템 중 비슷한 아이템 추천 - 유저 A 가 높은 평점을 추거나 큰 관심을 갖은 아이템 X와 유사한 아이템 Y를 추천한다. 2) 중요점 - 컨텐츠의 특징들이 어떻게 이루어져 있는지 파악 - 특징들 간에 유사성을 파악 - 컨텐츠 분석하는 아이템 분석 알고리즘이 중요 - 선능을 높일 수 있는 적절한 컨텐츠를 사용 3) 장/단점 - 장점 : 다른 유저의 데이터가 필요하지 않다. 추천할 수 있는 아이템의 범위가 넓다. (다른 유저와 관계없이 추천 가능하다.) 추천의 이유가 명확하다. - 단점 : 적절한 특징을 찾아야 성능이 올라간다. Cold Start, 새로운 유저를..

Develope/AI 교육 2021.05.31

Ch 01. 추천시스템이란

Ch 01. 추천시스템이란 1. 추천시스템, 그것이 궁금하다. 2. 현재 추천시스템은 3. 추천시스템의 알고리즘 분류” 1. 추천시스템, 그것이 궁금하다 * 추천 시스템? 구성 : 사용자(User), 상품(Item) * 추천 시스템의 목표 사용자가 정보를 수집하고 찾는 시간을 줄여주는 것이 목적 * 유형 - 검색 서비스 : 검색 엔진에 키워드로 검색을 할 때, 유저가 어떤 것을 원하는 지 결과를 추천. Pull Information. 사용자 선 요구. 사용자의 목적이 분명함 - 추천 서비스 : 유저가 원할 것 같은 것을 추천. Push Information. 사용자가 요구하기 전 작동. 사용자 스스로가 원하는 바를 정확하게 모른다. * 사용자와 상품의 관계 - 사용자의 정보(나이 성별 지역, 사용자로그(..

Develope/AI 교육 2021.01.29

[코딩야학] 머신러닝 3일차

11. 직업의 시작 현실을 데이터로 표현할 수 있다면, 컴퓨터를 이용해서 데이터를 처리할 수 있다. 머신러닝으로 무언가를 하려면 데이터가 필요하다. 현실을 데이터화해서 머신러닝을 통해 통찰한다. 이를 이용해 현실을 변화시키는 것이 '데이터 산업'이다. * 데이터 과학 : 데이터를 만들고 만들어진 데이터를 이용하는 일 * 데이터 공학 : 만들어진 데이터를 다루는 도구를 만들고, 그 도구를 관리 12. 표 시각화 도구 중에서 가장 활용성이 높은 것은 '표'와 '좌표평면'이다. 그중 표는 복잡한 데이터를 정돈하고, 처리할 수 있도록 해준다. 데이터 셋 : 데이터들의 모임, 즉 표 표는 열과 행으로 이루어져 있다. o 행(row) 개체(instance) 관측치(observed value) ㅁ7ㅁ8 기록(reco..

Develope/AI 교육 2021.01.06