728x90

머신러닝 4

[Coursera: Machine Learning] 1주차 리뷰 - 머신러닝 톺아보기

왜 듣냐? 저는 지난 6개월간 Fast Campus에서 AI 기반 데이터 사이언티스트 양성 과정에 참여해서 이것저것 허겁지겁 배우는 시간을 가졌습니다. 허겁지겁 배우느라 찍먹 하는 기분이 굉장히 컸는데 기본부터 다시 닦을 겸 취업하기 전까지 수료증 하나라도 더 받을 겸 해서 코세라(Coursera)의 머신러닝(Machine Learning) 강의를 수강하게 되었습니다. 코세라(Coursera)는 위키피디아에 의하면 스탠퍼드 대학교의 컴퓨터 공학 교수인 '앤드류 응', '대프니 콜러'가 비싼 등록금을 내지 못하거나, 교육의 기회를 가질 수 없는 사람들을 위해 만든 온라인 강의 사이트입니다. 딱 저에게 맞는 사이트입니다. 전 세계 대학들이 강의를 제공하니 머신러닝 외에 다른 것을 배우고 싶은 사람들에게도 좋..

035. [KDT]FastCampus AI 기반 데이터사이언티스트 양성과정 수료 후기

소감 및 좋은 점 2021년 7월부터 12월까지 반년 동안 이어진 K-Digital Training(국비지원 교육사업)을 드디어 수료하게 됐습니다. 초심을 생각한 지 너무 오래되어서 기억도 나지 않을 정도입니다. 가끔씩 초기에 블로그에 올린 글들을 읽다 보면 이런 생각을 갖고 있었구나 하면서 깜짝깜짝 놀랍니다. 20대의 반년을 소비해야 되는 큰 결정이었는데 큰 고민을 하지 않았던 것 아닌가 하는 생각이 들기도 했습니다. 그래도 6개월 동안 사람 만나는 거 다 포기하고 컴퓨터 앞에만 앉아있었더니 확실 전후의 차이가 큽니다. AI에 관한 지식이 전무했던 6개월 전과 깃허브와 블로그에 AI 관련 글을 업로드하는 지금은 정말 많이 다릅니다. AI나 Data에 대해 전혀 알지 못했을 때는 이 분야가 접근 못할 정..

030. NLP, TF-IDF, STS, DTM, BoW,

제목부터 총체적 난국입니다. 영어만 쓰여있는 데다가 약어로 쓰여있어서 도대체 무슨 말이지 싶습니다. 저번 글에서 이번 글은 차원 축소 및 word2vec에 대해 다룬다고 했었는데 살짝 힘들게 되었습니다. 최근 실무에서는 word2vec은 옛날 기술이 되고 TF-IDF가 더 익숙한가 봅니다. TF-IDF도 금방 옛날 기술이 되겠지요.. 저번 글에서 NLP Workflow에 대해 이야기하면서 TF-IDF를 스쳐 지나듯 이야기했었습니다. 그리고 Downstream Task에 대해서도 스쳐 지나가듯 이야기했습니다. 정확히 이야기하면 다뤘지만 너무 초기의 이론에 대해서만 이야기했었습니다. 그리고 오늘 수업 시간에 꽤 진지하게 다뤄진 이야기이기 때문에 TF-IDF와 STS에 대해 짚고 넘어가겠습니다. TF-IDF의..

018. Kaggle Project 후기 머신러닝 포스트 계획 이야기

블로그 업로드를 자주 하려고 했건만 또 할 일에 휩쓸리는 바람에 블로그에 들리지 못했습니다. KDT 과정상 저번 주 내내 Kaggle Project에 참여하게 됐습니다. 이 프로젝트는 우리가 이번에 배운 머신러닝을 실질적으로 사용해 유의미한 결과를 만드는 것이었습니다. 어제서야 드디어 제출하고 대충 마무리를 했는데요. 아이언맨이 '걸음마 떼기 전에 뛰어야 하는 법이야'라는 말을 했듯 아는 것 없이 하나하나 찾아가며 프로젝트를 해보니 참 많이 배웠습니다. 프로젝트를 직접해보니 선생님이 모델의 원리보다 중요한 게 회귀와 분류의 구분, 그리고 평가지표라고 하신 말씀을 이해하게 되었습니다. 분류, 회귀 그리고 평가지표 등만 알아두면 찾아가면서 프로젝트를 진행하는 게 가능했습니다. 그리고 프로젝트 마무리 후 원리..

728x90
반응형