AI 정의
AI(Airtificial Intelligence)? 머신러닝?
사람을 닮은 기계: 존매카시가 처음 AI 단어 사용
알고리즘으로 데이터를 학습(Train)하여 모델을 만드는 기술
데이터(Input Data)→알고리즘(머신러닝/딥러닝)→ 모델(f(x))
규칙/데이터→전통적인 프로그래밍→해답
데이터/해답→머신러닝→규칙
AI 용어 및 요소
AI가 주목 받는 이유
- 빅데이터 시대의 도래 : 양질의 데이터 폭발적 증가(SNS, 블로그, 검색, IOT 발달)
- 컴퓨팅 기술의 발전 : GPU, 클라우드 발전(SW, HW 발전)
- Easy & Open : AI 기술 및 알고리즘 공유 문화
AI 기술 문화- AI 기술 언어
- 프로그래밍 언어 : python, R
- 오픈소스 라이브러리 : NumPy(수치와 관련), Pandas(테이블 관련-EXCEL 같은 거)
- 프레임워크(딥러닝, 머신러닝) - 알고리즘 제공 : TensorFlow(구글에서 제공하는 딥러닝), PyTorch(페이스북에서 제공함), Keras(딥러닝을 쉽고 간결하게 사용할 수 있도록 파이썬으로 구현된 상위레벨의 라이브러리)
- AI모델링 자동화 플랫폼-개발자가 아니어도 클릭 기반의 머신러닝 자동화 플랫폼 : AIDU-ez, AI Suite 등등
요즘엔 기업들이 만들어놓은 Api나 오픈소스등을 통해 기술을 공유한다.
AI 구현을 위한 3가지 요소
- 알고리즘
- 데이터(차별화)
- GPU(CPU보다 성능이 빠르다)
주목받는 알고리즘
- 머신러닝
- 딥러닝
인공지능 구조도
딥러닝 ⊂ 머신러닝 ⊂ AI
인공지능
계산, 학습 등 인간의 지적능력을 컴퓨터를 통해 구현하는 기술
머신러닝
특정 부분을 스스로 학습해 성능을 향상
딥러닝
인간의 뉴런과 비슷한 인공신경망으로 정보를 처리
머신러닝
기계학습
- 지도학습(학습할 데이터와 정답을 함께 제공)
- 비지도학습(정답 없이 학습할 데이터만 / 데이터 특성을 스스로 파악)
- 강화학습(행동심리학에서 따옴 / 당근, 채찍)
지도학습(Supervised learning)
입력(Freature, X, 독립변수), 출력(Label, Y, 종속변수) 데이터로 학습
→ 무엇(X)를 무엇(Y)를 예측하고 싶다!
[예측(Predict)] = 분류(Classification), 회귀(Regression)
결과가 범주형이면 분류, 수치형이면 회귀라는 용어를 사용한다.
Training Set과 Test Set로 나누어 학습하고 평가한다.
비지도학습(Unsupervised learning)
출력데이터(Label, Y, 정답) 없이 입력데이터만 주고 패턴으로 학습
입력데이터만 주어졌을 때 모델 스스로 데이터 안에서 어떠한 관계를 찾아 내는 것
군집화(Clustering)]
강화학습(Reinforcement learning)
특정 행동(Action)을 시행하고, 상/벌(Rewoard)에 따라 해야 할 행동을 학습
머신러닝 학습 방법 비교
지도학습 비지도학습 강화학습
학습데이터 | 레이블 가지고 있는 데이터, 과거 데이터 | 레이블을 가지고 있지 않은 데이터, 과거 데이터 | 현재 데이터 |
환경피드백 | direct(정답) | none | direct(rewards상,벌) |
응용분야 | 분류, 회귀→ 이험 평가, 예 | 군집화, 연관 → 상품추천, 특이사항 탐지 | 바둑, 게임, 자율주행자동차, 드론 |
답을 알고 있지 않은 경우에 활용 방법? 비지도 학습
답을 알고 있을 땐? 지도 학습
딥러닝
딥러닝(ANN)
뇌의 정보처리방식을 모사한 “인공신경망”과 유사하게 여러 층(Layer)으로 깊이있게(Deep) 구성하여 학습을 진행
중요한 Feature에 가중치(Weight)를 부여하여 학습
대표 딥러닝
DNN(Deep Neural Network)
입력층, 여러개의 은닉층, 출력층으로 구성된 가장 일반적인 모형
y = wx + b → w(가중치, 기울)와 b(바이어스, y절편)를 구하는 과정
CNN(Convolution Neural Network, 합성곱신경망)
이미지의 지역별 Feature를 뽑아서 학습하는 분야에 특화
영상인식에 탁월함, 오디오 신호 처리에도 훌륭
RNN(Recurrent Neural Network, 순환신경망)
자신의 출력을 다시 입력으로 활용
순서가 있는 데이터 학습에 특화(시계열 예측, 문장 처리 등)
우리가 일반적으로 사용하는 말이나 글, 음악, 영화, 주식시세 같은 어떤 순서를 가지고 있는 것들은 기존의 신경망에서는 처리가 어려웠는데 RNN은 시간 관련된 순차적 데이터를 잘 다룬다. 과거 데이터를 잘 이용해서 자신의 출력을 다시 이용한다. 새로운 데이터에 다시 자신의 데이터 사용해서 학
GAN(Generative Adversarial Network, 생성적 적대 신경망)
두 신경망 모델의 경쟁을 통해 학습
ex) 위조지폐범(위조지폐 퀄리티 up)과 위조지폐범을 잡는 경찰(현금과 위조지폐를 구분하는 능력 up)
딥러닝 장단점
장점
- Feature 추출을 기계가 직접 알아서 한다.
- 높은 정확도
단점
- 과적합(Over-fitting) : 학습 데이터만 잘 맞는 모델 - 장점인 높은 정확도의 양날의 검
- Too Slow : 복잡한 로직으로 학습시간 증가(컴퓨팅 성능 중요)
- Black Box : 처리과정에 대한 설명이 어려움(이게 왜 어떻게 만들어졌냐는 물음에 확률 정도만 말할 수 있지 어떤 과정에 걸쳐서 나왔다는 걸 말하기 어려움 / 사람에게 설명하기 어렵다)
AI 핫 키워드
- NLP(Natural Language Processing)BERT(구글 알고리즘), Ko-BERT
- 자연어 인식/처리
- COMPUTER Vison자율주행 자동차에 많이 쓰인다.
- 영상인식 / 처리
- STT, TTS(Speech to Text, Text to Speech)
- 인공지능 스피커, 챗봇, AI CC 등
AI는 머신러닝 딥러닝이 전부가 아니다. AI 모델링 작업 중 80%는 데이터 수집과 전처리에 사용한다.
'자격증 > AICE BASIC' 카테고리의 다른 글
AICE 합격 후기 (0) | 2024.04.04 |
---|---|
[이론편] AI 구현 프로세스 (0) | 2024.04.03 |
[실습편] 코딩이 필요 없는 AIDU ez 활용 (0) | 2024.04.01 |
업무 적용 (0) | 2024.03.31 |
AICE Basic 자격증 소개 (0) | 2024.03.28 |