머신러닝을 정신없이 배우다가 현타가 온 적이 한두 번이 아닙니다.
이걸 왜 배우고 있지? 이거랑 AI랑 무슨 관계가 있는거지?
실제 머신러닝을 배우다 보면 이게 상상하던 AI 모습에 비해 원시적으로 보입니다.
결국 머신러닝의 늪에 빠져있다가 겨우 빠져나와서 지도를 한번 펼쳐 보게 되었습니다.
위 그림을 보면 위에서 말한 내용이 무슨 뜻인지 이해가 가실 것입니다.
미디어에서 이야기하는 AI는 사실 정확하게 이야기하면 딥러닝에 가깝다고 해석할 수 있겠습니다.
40년 전에 나온 이론을 공부하면 알파고의 원리와 큰 상관이 없는 것이지요.
그래서 현타를 방지하려면 이런 큰 그림을 봐야 합니다.
일단 머신러닝에 대해 이야기하려면 AI에 대해 이야기해야 합니다.
AI(Artificial Intelligence)는 말 그대로 인공지능이죠.
사람 손으로 만든 지능입니다.
그렇다면 지능은 또 뭘까요?
저는 지능이란 생각하는 능력을 뜻한다고 생각합니다.
생각은 상황을 예측하고 판단하는 작용을 말한다고 생각합니다.
그리고 그 지능의 성능은 처리하는 정보의 양과 정보 처리의 속도가 판가름한다고 생각합니다.
하워드 가드너는 인간의 지능을 다중 지능(언어 지능, 인간 친화 지능, 자기 성찰 지능, 논리 수학 지능, 공간 지능, 음악 지능, 자연 지능) 등으로 이루어져 있다고 말했습니다.
그런데 이런 식으로 가다 보면 AI라고 불릴 존재들의 기준이 너무 높겠죠?
이런저런 지능에 대한 이론들을 일반화해서 세 가지 요소로 나누면 지능은
- 입력
- 신경망 연결
- 출력
이렇게 세가지 프로세스를 거친다고 생각할 수 있습니다. 컴퓨터는 신경망 연결을 프로그램이라고만 바꾸면 인공 지능이 되는 거죠.
- 입력
- 프로그램
- 출력
위의 프로세스를 거쳐 난생처음 보는 데이터를 입력받아도 프로그램을 거쳐 유의미한 예측, 판단 결과를 출력하는 것이 인공지능이라고 보는 겁니다.
제가 위에서 이야기한 인공지능에 대한 개념은 사실 굉장히 간단해서 왜 진작에 활용되지 않았을까 싶습니다.
본격적인 인공지능의 역사는 2차 세계대전에서 시작되는데 이건 중요한 이야기가 아니니 넘어가겠습니다.
(참고로 독일군의 암호를 해독하는 컴퓨터를 개발한 앨런 튜링의 이야기입니다.. )
본격적으로 돈 버는 용도로 사용할 수 있을 정도의 학습 능력 및 예측 능력을 발휘하는 딥러닝을 본격적으로 사용한 역사가 10년도 안 되었기 때문입니다.
딥러닝에 대해 나중에 설명할 기회가 있으니 간단하게 설명하겠습니다.
딥러닝은 사람의 신경망 구조를 기계 학습에 활용한 인공신경망의 layer를 늘려 학습 능력을 대폭 늘린 AI 모델입니다.
이 영역에 들어가면서부터 컴퓨팅 능력이 많이 필요해지는데, 컴퓨팅 능력의 향상과 함께 발전했다고 보면 됩니다.
더 들어가 머신러닝과 딥러닝의 차이를 말하면 feature를 선택하는 주체가 사람이냐 기계냐가 나뉩니다.
딥러닝은 학습 과정에서 feature까지 스스로 선택한다고 생각하면 됩니다.
feature는 입력되는 데이터의 열이라고 생각하면 됩니다.
예를 들면 아래 그림의 Rows는 행, Columns는 열이라고 부릅니다.
머신러닝에서는 사용자가 직접 model(프로그램)에 들어갈 column을 직접 골라야 합니다.
아래처럼 column이 몇 개 없을 때는 기존의 머신러닝 방법으로 연산이 가능했습니다.
그러나 빅데이터의 시대가 도래하자 사람과 컴퓨터가 감당하기 힘들 정도의 column의 수를 감당하기 위한 수단으로 딥러닝이 등장한 것이죠.
딥러닝이 등장하자 기존의 머신러닝이 할 수 없었던 영역까지 인공지능이 할 수 있는 일이 늘어났습니다.
- 인식
- 예측
- 분석
- 처방
- 생성
- 창작
위의 일들이 대표적인데 아마 이 글을 적고 있는 순간에도 할 수 있는 일이 늘어날 것입니다.
위의 일들은 10년 전까지만 해도 전적으로 사람만 할 수 있는 영역이었습니다.
지금은 세계적인 기업들은 대부분이 AI 기반의 테크(데이터) 기업으로 구성되어있습니다.
그리고 AI는 이들 외의 영역까지 그 자리를 확장하고 있습니다.
그 외의 말들은 아마 대부분 사람들이 귀에 딱지가 생기게 들은 이야기겠지요..
재미로 시가총액 순으로 주식 상장한 기업들을 줄 세워보면 10위권 내의 기업 모두가 데이터 및 인터넷과 관련된 테크 기업입니다.
Berkshire Hathaway는 예외 아니냐고 물어보실 수도 있는데 맨 위에 있는 Apple의 2대 주주가 Berkshire Hathaway입니다.. ㅎㅎ
그럼 위의 기업들에 한 발짝 더 가까이 가려면 머신러닝과 친해져야 하니 다음 글부터 본격적으로 머신러닝의 큰 그림을 그리는 시간을 갖겠습니다..
빠잉
'AI > K-Digital Training' 카테고리의 다른 글
019. 딥러닝을 배우기 시작하면서 느낀 머신러닝 공부의 심오함 (0) | 2021.09.27 |
---|---|
018. Kaggle Project 후기 머신러닝 포스트 계획 이야기 (0) | 2021.09.14 |
016. 머신러닝 공부 시작 소감 및 반성문 (0) | 2021.09.03 |
015. K-Digital Training 7-8월 월간 리뷰 (0) | 2021.08.19 |
014. EDA프로젝트 Insatacart 고객 데이터 분석하기 (0) | 2021.08.18 |