728x90

AI 41

[Coursera: Machine Learning] 3주차 리뷰 - 분류 문제, 과적합 문제

이번 주차에 배운 내용의 분량이 지금까지 강의 중에 가장 많은 것 같습니다. 앤드루 응 교수님께서 괜히 이렇게 갑자기 분량을 늘릴 일은 없습니다. 아마 배우는 패턴이 비슷해지기 때문인 것 같습니다. 머신러닝에서 학습 과정의 전체적인 구조는 변화하지 않기 때문에 이런 패턴으로 배우는 것 같습니다. 같은 패턴에서 수학 공식이 달라지는 식으로 변주되기 때문에 배움에 편의성이 생겨 강의 분량이 많아지는 것 같습니다. 학습의 패턴은 다음과 같습니다. Hypothesis -> Cost Function -> Descent Gradient 이번 주차에 배운 내용들 Classification Hypothesis Representation Decision Boundary Cost Function(logistic regre..

[Coursera: Machine Learning] 2주차 리뷰 - Multi Features, Feature Scaling, Normal Equation...

2주 차부터는 본격적으로 코딩도 하기 시작합니다. 저에게는 생소하지만 'Matlab'에서 'Octave'라는 도구로 코드를 짜게 됩니다. 사실 코드라기보다는 수업에서 배운 수학 공식 및 데이터를 편집하는 용도의 도구라고 여기면 될 것 같습니다. 2주 차 수업의 절반은 슬라이드를 띄워 놓고 강의를 했다면 나머지 절반은 'Octave'로 데이터를 가공하고 연산하는 방법을 배웁니다. 난생처음 보는 툴이기 때문에 튜토리얼들을 정신없이 읽다 보면 시간이 금방 갑니다. 2주 차에서 배운 내용들 Multiple Features Gradiemt Descent for Multiple Variables Feature Scaling Learning Rate Polynomial Regression Normal Equation..

[Kaggle]Google Brain - Ventilator Pressure Prediction 02 (EDA) - 의료 데이터 분석

저번 글에서 제가 참여한 캐글 대회의 전반적인 내용에 대해 다뤘습니다. Google Brain이 발전된 형태의 기계식 산소 호흡기를 개발하기 위해 의료 데이터 예측 모델을 평가하는 대회라고 소개하고 마지막에 학습 데이터의 Feature들을 간략하게 이야기했었습니다. 피쳐들 id - globally-unique time step identifier across an entire file breath_id - globally-unique time step for breaths R - lung attribute indicating how restricted the airway is (in cmH2O/L/S). Physically, this is the change in pressure per change in..

AI/Kaggle 2021.12.30

[Coursera: Machine Learning] 1주차 리뷰 - 머신러닝 톺아보기

왜 듣냐? 저는 지난 6개월간 Fast Campus에서 AI 기반 데이터 사이언티스트 양성 과정에 참여해서 이것저것 허겁지겁 배우는 시간을 가졌습니다. 허겁지겁 배우느라 찍먹 하는 기분이 굉장히 컸는데 기본부터 다시 닦을 겸 취업하기 전까지 수료증 하나라도 더 받을 겸 해서 코세라(Coursera)의 머신러닝(Machine Learning) 강의를 수강하게 되었습니다. 코세라(Coursera)는 위키피디아에 의하면 스탠퍼드 대학교의 컴퓨터 공학 교수인 '앤드류 응', '대프니 콜러'가 비싼 등록금을 내지 못하거나, 교육의 기회를 가질 수 없는 사람들을 위해 만든 온라인 강의 사이트입니다. 딱 저에게 맞는 사이트입니다. 전 세계 대학들이 강의를 제공하니 머신러닝 외에 다른 것을 배우고 싶은 사람들에게도 좋..

[Kaggle] Google Brain - Ventilator Pressure Prediction 01(소개)

서론 'Ventilator Pressure Prediction'은 2021년 11월 3일에 끝난 대회다. 새삼스레 왜 12월 하순이 되어서 이 글을 쓰게 되었냐면 12월 17일까지 빡빡하게 들어차 있던 K-Digital Train 교육 과정이 나를 괴롭히고 있었기 때문이다. 매일매일 하루 12시간 가까운 시간을 빼앗고 내 기력까지 앗아가는 바람에 지금 쓸 수 있게 되었다. 한 번은 당시 정신없이 해치웠던 작업들을 정리하는 시간이 필요했다. 이 대회는 제목에서 볼 수 있듯 Google Brain에서 주최했고, 산소호흡기의 압력을 예측하는 대회다. Google Brain은 우리가 알고 있는 '구글'의 딥 러닝 인공지능 연구팀이다. 산소호흡기까지 연구하는 것을 보면 상상 이상으로 다방면의 연구를 진행하는 연구..

AI/Kaggle 2021.12.23

035. [KDT]FastCampus AI 기반 데이터사이언티스트 양성과정 수료 후기

소감 및 좋은 점 2021년 7월부터 12월까지 반년 동안 이어진 K-Digital Training(국비지원 교육사업)을 드디어 수료하게 됐습니다. 초심을 생각한 지 너무 오래되어서 기억도 나지 않을 정도입니다. 가끔씩 초기에 블로그에 올린 글들을 읽다 보면 이런 생각을 갖고 있었구나 하면서 깜짝깜짝 놀랍니다. 20대의 반년을 소비해야 되는 큰 결정이었는데 큰 고민을 하지 않았던 것 아닌가 하는 생각이 들기도 했습니다. 그래도 6개월 동안 사람 만나는 거 다 포기하고 컴퓨터 앞에만 앉아있었더니 확실 전후의 차이가 큽니다. AI에 관한 지식이 전무했던 6개월 전과 깃허브와 블로그에 AI 관련 글을 업로드하는 지금은 정말 많이 다릅니다. AI나 Data에 대해 전혀 알지 못했을 때는 이 분야가 접근 못할 정..

034. 11월 월간 리뷰 및 파이널 프로젝트 간략한 후기

지난 한 달은 눈앞에 닥친 일들을 수습하는데 급급한 나머지 블로그 포스팅에는 전혀 신경 쓰지 못했습니다. 지난 한 달 동안 난생처음 보는 이론들, 모델들, 데이터들을 소화시키느라 아주 죽을 맛이었습니다. 이번에 졸업 논문을 쓰면서 난생처음 논문을 보고 쓰는 기회를 가졌었는데, 이번 파이널 프로젝트(캐글 대회) 덕분에 수십 편의 논문을 읽게 되는 계기가 되었습니다.(사실 수십 편은 아니고 10편 정도 읽었습니다.) 파이널 프로젝트를 하면서 AI라는 분야가 굉장히 급변하고 있고 전문적인 분야라고 절실히 느꼈습니다. 학부 전공 공부를 하면서 논문 볼 기회가 전혀 없었는데(디자인 계열이라 논문보다는 잡지나 핀터레스트를 많이 봄) 대회 하나 준비하면서 세계 곳곳의 석학들이 집필한 최신(?) 논문으로 정보를 접해야..

033. KDT 10월 월간 리뷰(NLP, 캐글 대회)

10월 말부터 현재까지 굉장히 숨 가쁜 생활이 이어졌습니다. NLP 미니 프로젝트부터 캐글 대회, 컴퓨터 비전, 학교 졸업 준비까지.. 몸이 두 개는 되어야 그 진도를 따라가겠다 싶었습니다. 밑 빠진 독에 물을 채워 넣는 느낌이 드는 3주였지만 하다 보니 요령이 생겨서 조악하게나마 마무리되어 블로그 포스팅 여유가 잠깐 생겼습니다. NLP 프로젝트 후기에 대한 글은 이미 올린 적이 있으니까 먼저 캐글 대회 후기를 적어보려합니다. 제가 이번에 참가한 캐글 대회는 'Google Brain'이 주최한 'Ventilator Pressure Prediction'이었습니다. 이 대회의 목표는 회귀 예측 대회였습니다. 'Google Brain'이 주최한 영향도 있고 오랜만에 공신력(?) 있는 대회여서 그런지 전 세계 ..

032. NLP 미니 프로젝트 후기

제가 블로그에서 몇 편의 글로 NLP 공부하고 있다고 티를 좀 냈었습니다. 잘 찾아보면 제가 쓴 글보다 훨씬 전문적이고 체계적으로 설명된 글이 많은데 살짝 창피합니다. 이거 썼다가 저거 썼다가 중구난방으로 글을 쓰느라 설명하는 글로는 효용성이 없었죠. 어쨌든 KDT 과정에서 짧디 짧게 이뤄졌던 NLP 교육이 Mini Project로 마무리됐습니다. 이번 Mini-Project는 Kaggle Quora- pair-sentence(closed)입니다. 이번 Project는 STS(Semantic Textual Similarity)로 같은 의미의 text를 판별하는 작업입니다. 문장의 의미가 같냐 다르냐를 판별하기 위해서는 단어를 임베딩 하는 과정과 임베딩 한 단어를 RNN 등의 네트워크에 적용 및 유사도 측..

031. 코로나 백신 2차접종후 딥러닝 학습 후기..

후.. 저는 2021년 10월 8일에 코로나 백신 2차 접종은 맞았습니다. 남들에 비해 살짝 늦긴 했지만 결국에는 다 맞아버렸습니다. 이 글을 읽는 분들도 부디 다 맞으시면 좋겠습니다. 이웃의 건강과 우리 사회의 정상화를 위해 꼭 해야 하는 일이니 맞는 게 옳다고 생각합니다. 그런데 저는 운이 없는 건지 몸이 원래 약한 건지 부작용이 살짝 오래갔습니다. 오늘 기준으로 백신을 맞은 지 1주일이 되었지만 아직도 통증 때문에 집중이 힘들고 생산성도 바닥을 쳤습니다. 정확히는 몸살 기운, 통증, 오한, 피로감 이런 게 심합니다. 여파로 학습에 지대한 영향을 줘 학습 과정을 따라가는 데에 무리가 갔었습니다. 몇 년 전에 이름 모를 바이러스에 감염되어 거의 한 달을 넘게 앓았던 적이 있는데 한 달은 거의 시체처럼 ..

728x90
반응형