728x90

machine learning 6

[Coursera: Machine Learning] 3주차 리뷰 - 분류 문제, 과적합 문제

이번 주차에 배운 내용의 분량이 지금까지 강의 중에 가장 많은 것 같습니다. 앤드루 응 교수님께서 괜히 이렇게 갑자기 분량을 늘릴 일은 없습니다. 아마 배우는 패턴이 비슷해지기 때문인 것 같습니다. 머신러닝에서 학습 과정의 전체적인 구조는 변화하지 않기 때문에 이런 패턴으로 배우는 것 같습니다. 같은 패턴에서 수학 공식이 달라지는 식으로 변주되기 때문에 배움에 편의성이 생겨 강의 분량이 많아지는 것 같습니다. 학습의 패턴은 다음과 같습니다. Hypothesis -> Cost Function -> Descent Gradient 이번 주차에 배운 내용들 Classification Hypothesis Representation Decision Boundary Cost Function(logistic regre..

[Coursera: Machine Learning] 2주차 리뷰 - Multi Features, Feature Scaling, Normal Equation...

2주 차부터는 본격적으로 코딩도 하기 시작합니다. 저에게는 생소하지만 'Matlab'에서 'Octave'라는 도구로 코드를 짜게 됩니다. 사실 코드라기보다는 수업에서 배운 수학 공식 및 데이터를 편집하는 용도의 도구라고 여기면 될 것 같습니다. 2주 차 수업의 절반은 슬라이드를 띄워 놓고 강의를 했다면 나머지 절반은 'Octave'로 데이터를 가공하고 연산하는 방법을 배웁니다. 난생처음 보는 툴이기 때문에 튜토리얼들을 정신없이 읽다 보면 시간이 금방 갑니다. 2주 차에서 배운 내용들 Multiple Features Gradiemt Descent for Multiple Variables Feature Scaling Learning Rate Polynomial Regression Normal Equation..

[Coursera: Machine Learning] 1주차 리뷰 - 머신러닝 톺아보기

왜 듣냐? 저는 지난 6개월간 Fast Campus에서 AI 기반 데이터 사이언티스트 양성 과정에 참여해서 이것저것 허겁지겁 배우는 시간을 가졌습니다. 허겁지겁 배우느라 찍먹 하는 기분이 굉장히 컸는데 기본부터 다시 닦을 겸 취업하기 전까지 수료증 하나라도 더 받을 겸 해서 코세라(Coursera)의 머신러닝(Machine Learning) 강의를 수강하게 되었습니다. 코세라(Coursera)는 위키피디아에 의하면 스탠퍼드 대학교의 컴퓨터 공학 교수인 '앤드류 응', '대프니 콜러'가 비싼 등록금을 내지 못하거나, 교육의 기회를 가질 수 없는 사람들을 위해 만든 온라인 강의 사이트입니다. 딱 저에게 맞는 사이트입니다. 전 세계 대학들이 강의를 제공하니 머신러닝 외에 다른 것을 배우고 싶은 사람들에게도 좋..

030. NLP, TF-IDF, STS, DTM, BoW,

제목부터 총체적 난국입니다. 영어만 쓰여있는 데다가 약어로 쓰여있어서 도대체 무슨 말이지 싶습니다. 저번 글에서 이번 글은 차원 축소 및 word2vec에 대해 다룬다고 했었는데 살짝 힘들게 되었습니다. 최근 실무에서는 word2vec은 옛날 기술이 되고 TF-IDF가 더 익숙한가 봅니다. TF-IDF도 금방 옛날 기술이 되겠지요.. 저번 글에서 NLP Workflow에 대해 이야기하면서 TF-IDF를 스쳐 지나듯 이야기했었습니다. 그리고 Downstream Task에 대해서도 스쳐 지나가듯 이야기했습니다. 정확히 이야기하면 다뤘지만 너무 초기의 이론에 대해서만 이야기했었습니다. 그리고 오늘 수업 시간에 꽤 진지하게 다뤄진 이야기이기 때문에 TF-IDF와 STS에 대해 짚고 넘어가겠습니다. TF-IDF의..

026. GAN(Generative Adversarial Network) 으로 간다

https://youtu.be/sucqskXRkss 위 링크는 ICLR에서 Ian Goddfellow가 GAN 및 2019년 기준 최신 연구를 발표한 영상입니다. ICLR은 매년 전 세계에서 열리는 머신 러닝 컨퍼런스이고 Ian Goodfellow는 GAN의 아이디어를 세상에 알린 사람입니다. 워낙 이해하기 어려워서 유튜브를 서칭하며 공부하다가 보게 된 영상인데 GAN의 창시자가 직접 이야기해주니 감회가 남다른 영상입니다. 마지막 수업 시간에 GAN에 대한 수업을 들었습니다. 사실 GAN이 원리 때문에 내용도 어렵고 이미지를 학습하다보니 리소스도 많이 필요합니다. 그래서 수업 시간에 이를 이해하고 어떻게 구현하는 건지 알고 넘어가기 힘들었습니다. 그래도 Youtube와 책을 통해 이해는 하고 넘어가야겠지..

016. 머신러닝 공부 시작 소감 및 반성문

제가 이 블로그에 들리지 않은 지 거의 보름이 되어 갑니다. 그 이유는 머신러닝을 배우느라 다른 것을 할 여유가 없었기 때문이지요. 이렇게 제가 쓰면서도 변명처럼 읽히네요.. 엣헴.. 머신러닝이라는 친구가 이렇게 복잡하고 심오한 학문인 줄은 몰랐습니다. 시작하자마자 선형대수학을 들고 와서 알아들을 수 없는 말을 늘어놓으시고.. 통계학을 들고 와서는 또 난생처음 들어보는 단어들을 늘어놓으시더라고요. 이건 마치 울창한 열대우림을 헤치고 가느라 내가 어디로 가는지 가능도 못하는 그런 상황과 비슷했습니다. 그래도 커리큘럼에 끌려다니면서 주워들은 이야기도 있고 저 나름대로 깨달은 것도 있으니 이런 것들 위주로 공유해볼까 합니다. 이번 K-Digital Training 커리큘럼상에 있는 수업이 제 수준에 안 맞게 ..

728x90
반응형