728x90

Ai 9

[Kaggle]Google Brain - Ventilator Pressure Prediction 02 (EDA) - 의료 데이터 분석

저번 글에서 제가 참여한 캐글 대회의 전반적인 내용에 대해 다뤘습니다. Google Brain이 발전된 형태의 기계식 산소 호흡기를 개발하기 위해 의료 데이터 예측 모델을 평가하는 대회라고 소개하고 마지막에 학습 데이터의 Feature들을 간략하게 이야기했었습니다. 피쳐들 id - globally-unique time step identifier across an entire file breath_id - globally-unique time step for breaths R - lung attribute indicating how restricted the airway is (in cmH2O/L/S). Physically, this is the change in pressure per change in..

AI/Kaggle 2021.12.30

[Coursera: Machine Learning] 1주차 리뷰 - 머신러닝 톺아보기

왜 듣냐? 저는 지난 6개월간 Fast Campus에서 AI 기반 데이터 사이언티스트 양성 과정에 참여해서 이것저것 허겁지겁 배우는 시간을 가졌습니다. 허겁지겁 배우느라 찍먹 하는 기분이 굉장히 컸는데 기본부터 다시 닦을 겸 취업하기 전까지 수료증 하나라도 더 받을 겸 해서 코세라(Coursera)의 머신러닝(Machine Learning) 강의를 수강하게 되었습니다. 코세라(Coursera)는 위키피디아에 의하면 스탠퍼드 대학교의 컴퓨터 공학 교수인 '앤드류 응', '대프니 콜러'가 비싼 등록금을 내지 못하거나, 교육의 기회를 가질 수 없는 사람들을 위해 만든 온라인 강의 사이트입니다. 딱 저에게 맞는 사이트입니다. 전 세계 대학들이 강의를 제공하니 머신러닝 외에 다른 것을 배우고 싶은 사람들에게도 좋..

[Kaggle] Google Brain - Ventilator Pressure Prediction 01(소개)

서론 'Ventilator Pressure Prediction'은 2021년 11월 3일에 끝난 대회다. 새삼스레 왜 12월 하순이 되어서 이 글을 쓰게 되었냐면 12월 17일까지 빡빡하게 들어차 있던 K-Digital Train 교육 과정이 나를 괴롭히고 있었기 때문이다. 매일매일 하루 12시간 가까운 시간을 빼앗고 내 기력까지 앗아가는 바람에 지금 쓸 수 있게 되었다. 한 번은 당시 정신없이 해치웠던 작업들을 정리하는 시간이 필요했다. 이 대회는 제목에서 볼 수 있듯 Google Brain에서 주최했고, 산소호흡기의 압력을 예측하는 대회다. Google Brain은 우리가 알고 있는 '구글'의 딥 러닝 인공지능 연구팀이다. 산소호흡기까지 연구하는 것을 보면 상상 이상으로 다방면의 연구를 진행하는 연구..

AI/Kaggle 2021.12.23

035. [KDT]FastCampus AI 기반 데이터사이언티스트 양성과정 수료 후기

소감 및 좋은 점 2021년 7월부터 12월까지 반년 동안 이어진 K-Digital Training(국비지원 교육사업)을 드디어 수료하게 됐습니다. 초심을 생각한 지 너무 오래되어서 기억도 나지 않을 정도입니다. 가끔씩 초기에 블로그에 올린 글들을 읽다 보면 이런 생각을 갖고 있었구나 하면서 깜짝깜짝 놀랍니다. 20대의 반년을 소비해야 되는 큰 결정이었는데 큰 고민을 하지 않았던 것 아닌가 하는 생각이 들기도 했습니다. 그래도 6개월 동안 사람 만나는 거 다 포기하고 컴퓨터 앞에만 앉아있었더니 확실 전후의 차이가 큽니다. AI에 관한 지식이 전무했던 6개월 전과 깃허브와 블로그에 AI 관련 글을 업로드하는 지금은 정말 많이 다릅니다. AI나 Data에 대해 전혀 알지 못했을 때는 이 분야가 접근 못할 정..

아크 인베스트 | 자동화가 실업률 증가를 일으킬까?

지난 글 이후로 거의 한 달만에 투자 관련 포스트를 올린다. 저번 글에서 모니시 파브라이의 인터뷰를 인용하며 미시 경제적 관점에서 팬데믹 사태 이후의 투자에 관한 글을 썼다. 그리고 이번에는 거시 경제 영역 중 하나인 고용에 대한 글을 인용하며 기술의 발전으로 인한 업무의 자동화가 실업률에 미치는 영향에 대해 이야기하려고 한다. Ark Invest - Sam Korus https://ark-invest.com/articles/analyst-research/will-automation-cause-an-increase-in-the-unemployment-rate/ Will Automation Cause an Increase in the Unemployment Rate? Throughout history, a..

투자 2021.12.15

034. 11월 월간 리뷰 및 파이널 프로젝트 간략한 후기

지난 한 달은 눈앞에 닥친 일들을 수습하는데 급급한 나머지 블로그 포스팅에는 전혀 신경 쓰지 못했습니다. 지난 한 달 동안 난생처음 보는 이론들, 모델들, 데이터들을 소화시키느라 아주 죽을 맛이었습니다. 이번에 졸업 논문을 쓰면서 난생처음 논문을 보고 쓰는 기회를 가졌었는데, 이번 파이널 프로젝트(캐글 대회) 덕분에 수십 편의 논문을 읽게 되는 계기가 되었습니다.(사실 수십 편은 아니고 10편 정도 읽었습니다.) 파이널 프로젝트를 하면서 AI라는 분야가 굉장히 급변하고 있고 전문적인 분야라고 절실히 느꼈습니다. 학부 전공 공부를 하면서 논문 볼 기회가 전혀 없었는데(디자인 계열이라 논문보다는 잡지나 핀터레스트를 많이 봄) 대회 하나 준비하면서 세계 곳곳의 석학들이 집필한 최신(?) 논문으로 정보를 접해야..

029. NLP Workflow를 깜빡했다.

저번 글에서 NLP의 통계적 접근 방법을 다뤘습니다. 자연어 처리가 무엇이고 통계적 접근 방법은 또 무엇인지 꽤 장황하게 다뤘습니다. 그런데 NLP의 큰 그림을 안 다루고 처음부터 정신없이 진도를 나가다 보니 약간 혼란이 오네요. 쓰고 보니 내가 지금 NLP 작업 중에 어떤 부분을 하고 있는 건가 싶습니다. 이번 글은 NLP Workflow를 저번 글 내용과 연결해서 이야기하겠습니다. NLP Workflow는 다음과 같습니다. 데이터 수집 데이터 전처리 임베딩 Downstream task prediction 데이터 수집 저번 글에서 데이터 수집은 다음과 같이 짤막하게 준비했었습니다. text = "You say goodbye and I say hello." 보통 의미있는 학습을 하려면 "repo"나 크롤..

016. 머신러닝 공부 시작 소감 및 반성문

제가 이 블로그에 들리지 않은 지 거의 보름이 되어 갑니다. 그 이유는 머신러닝을 배우느라 다른 것을 할 여유가 없었기 때문이지요. 이렇게 제가 쓰면서도 변명처럼 읽히네요.. 엣헴.. 머신러닝이라는 친구가 이렇게 복잡하고 심오한 학문인 줄은 몰랐습니다. 시작하자마자 선형대수학을 들고 와서 알아들을 수 없는 말을 늘어놓으시고.. 통계학을 들고 와서는 또 난생처음 들어보는 단어들을 늘어놓으시더라고요. 이건 마치 울창한 열대우림을 헤치고 가느라 내가 어디로 가는지 가능도 못하는 그런 상황과 비슷했습니다. 그래도 커리큘럼에 끌려다니면서 주워들은 이야기도 있고 저 나름대로 깨달은 것도 있으니 이런 것들 위주로 공유해볼까 합니다. 이번 K-Digital Training 커리큘럼상에 있는 수업이 제 수준에 안 맞게 ..

000. K-Digital Training AI 기반 데이터 과학 과정에 참여하게 됐습니다.

무야호! 필자는 2021년 K-Digital Training AI 기반 데이터 사이언티스트 양성 과정 1기에 참여하게 됐다! 무료로 데이터 과학을 배울 수 있다는 점에 끌려 준비했는데 운이 좋았다.. 준비된 것도 없고 공부한 것도 없는데 서류, 시험, 면접을 통과했다는 사실이 믿기지 않는다.. 이왕 장기 교육 프로그램에 참여하게 된 이상 신나고, 열심히! 해야겠다. 프로그램에서 배운 점, 동료들에게서 얻은 통찰, 진행중인 작업, 등등을 공유하기 위해 블로그를 시작한다. 왜 이 과정에 지원하게 되었나?? 필자는 K대학에서 건축학을 전공하고 있고 2021년 6월 졸업전시을 무사히 마친 건축학도다. 사실 디자인이나 이공계 분야의 흥미나 재능이 워낙 부족해서 학교를 다니는 데에 무지 고생이 많았다. 본진에서 일..

728x90
반응형