보초의 코딩일기장

데이터 청년 캠퍼스 1일차 본문

데이터청년캠퍼스

데이터 청년 캠퍼스 1일차

장보비 2019. 7. 5. 13:38

2019.07.01 -1일차 내용정리

  • Supervised Learning : 답은 미리 주어져있고 틀린 값을 넣었을 때 그 값을 맞추는 것
  • Unsupervised Learning : 답이 주어져 있지 않은 것.
    • Clustering: 관련이 있는, Density가 높은 물체끼리 묶어서 분류를 하는 것.
  • Deep Learning : DNN / CNN / RNN

  • 딥러닝의 문제점은 자세한 설명이 부족하다는 것임. (설명력 부족) 그래서 금융권 같은 곳에서는 딥러닝을 내세우는 경우는 없음.
  • 딥러닝은 깊게 쌓이면 쌓일수록 더 많일수록 학습이 강화되지만 가중치 문제가 생김.
  • 과거에는 SVM을 이용하여 논문을 작성하였다면 후에는 신경망을 이용한 논문이 많이 발표되었음.
  • 현재는 알파고를 기점으로 새로운 신경망이 생겼음
  • 많은 데이터가 필요로하는 문제점이 생긴다. (없는 데이터도 만들어야 함)

인공지능 사례

  1. 아디다스 스마트 팩토리
  2. 가와사키 중공업 (강화학습)
  3. 네이버의 뉴스 추천시스템(AiRS + RNN)

USER BASE: 평점을 잘 준 카테고리를 기준으로 인공지능이 추천해주는 것

하지만 유저들이 매긴 평점이 아무것도 없다면 문제가 생기는데, 이 때 아이템에 대해서 정보를 빼낸다 (콜라라면 탄산이라는 정보를 얻어옴으로서 문제를 해결한다.) 근데 이것에 대해 문제점은 인공지능이 똑같은 추천만 해준다는 것이다.

  • 네이버의 뉴스 추천시스템은 소비하는 순서가 있다고 판단하여 이것을 RNN과 접목시킨 것이다.

input- output 형태인데 인풋으로 인해 나온 아웃풋이 또다른 인풋으로 들어가게 된다. 그래서 결과값이 다시 인풋으로 들어가게 되는 반복형으로 이루어진다.

  1. 다음의 뉴스 추천 시스템: 멀티 암드 밴딧 사용 - 사용자에 따라 보여지는 초기 홈페이지 형태가 다르다
  • 알고리즘 : 최신의 뉴스에 가중치를 부여한다. 홈페이지 내 뉴스의 위치에 대해서도 고려하고, 이미 봤던 뉴스는 홈페이지에서 내린다. 그래서 사람마다 다른 홈페이지를 만들도록 설계했음.
  1. 음성 합성 사례 : Deepfake의 위험성을 경고하고자 제작 (GAN) -Unsupervised Learning 중 하나.
  • Generator 와 Discriminator가 경쟁하게 만드는 방식으로 학습
  1. 텍스트 자동완성 (GPT-2) : 사용자가 한 줄을 쓰면 GPT-2가 이어서 계속 문장을 완성해나감.
  2. IBM vs Human 토론: 토론하는 인공지능을 만들어서 사람과 토론대결
  3. Deep Dream: 특정 이미지를 입력하면 그 이미지를 재해석하여서 추상화로 그려냄

그 외 필기자료 : https://github.com/jsh-me/Bigdata/tree/master/days/1days

Buy me a coffeeBuy me a coffee
Comments