지난 7월 19일에 K-Digital Training AI기반 Data Scientist 양성 과정을 시작한 이후로 한 달이 지났습니다!
데이터 사이언티스트로 직무 변경하고자 시작한 과정이라 꽤 큰 다짐을 하고 지원했던 기억이 납니다.
이 과정에 지원하기 전까지 인공지능이나 데이터 사이언티스트와 관련된 경력이나 지식이 없어서 걱정이 많았습니다.
아마 이런 점 때문에 면접 과정에서 탈락한 것 같습니다..ㅠ
운이 좋게도 추가 합격으로 좋은 기회를 얻었으니 더 굳은 마음으로 과정에 참여했습니다..
지금까지(2021년 8월 18일) 배운 내용은 파이썬, 넘파이, 판다스, 데이터 크롤링, 탐색적 데이터 분석입니다.
파이썬까지는 이미 배웠던 내용이라 익숙했었는데 그 외의 모든 것들은 생소하게 느껴졌습니다.
왜 사람들이 파이썬~ 파이썬~ 하는지 알게 되는 한 달이었습니다.
학교에서 배울 때는 파이썬으로 별을 그리고 수학 계산하는 데에서 끝났지만
이렇게 쓰일 수 있는지는 꿈에도 몰랐습니다..
넘파이로 넘어오면서 파이썬이 선형대수학과 관련된 데이터들을 다루기 수월한 언어구나 느꼈습니다.
수백만 개 rows를 가진 데이터를 순식간에 계산할 수 있는 강력한 툴을 배운다는 점에서 뭔가 뿌듯했습니다.
판다스를 배우면서 이제 진정한 데이터 분석의 세계로 들어온 듯한 느낌이 들었습니다.
제 눈에 익숙한 엑셀의 모습을 파이썬으로 표현할 수 있어서 그런 듯합니다.
row와 column이 있는 데이터를 다루면서 데이터 크롤링, 탐색적 데이터 분석이 가능해졌습니다.
직접 증권 데이터를 데이터 크롤링하고, Kaggle 및 데이콘의 데이터를 분석했습니다.
데이터들을 분석하면서 자연히 탐색적 데이터 분석을 하는 이유를 깨달았습니다.
현재 아직 배우지 않은 머신러닝을 하기 위해서 탐색적 데이터 분석을 하는 것입니다.
우리가 구하고자 하는 결괏값과 상관관계가 많은 데이터를 학습시켜야 더 모델이 정확하다고 느꼈습니다.
아마 지금부터 배울 머신러닝을 학습하면 이 부분은 더 확실해질 것 같습니다.
첫 한 달은 기술 블로그의 방향성에서 흔들렸던 것 같습니다.
이런 식으로 해당 과정에서 얻은 깨달음이나 정보를 공유하고자 시작했는데
하다 보니 그날 작업한 코딩을 올리고 끝내는 게시물을 올리는 일이 너무 많아졌습니다.
수 백 줄짜리 코드를 올린다고 누가 재밌게 읽겠습니까..
구글 colab으로 작업한 코드를 티스토리로 옮기는 것도 보통 번거로운 일이 아니기에
코드들은 앞으로 github에 올리기로 했습니다.
티스토리에는 이렇게 글이나 이미지로 비교적 공유하기 쉬운 정보들을 올릴 계획입니다.
사실 이번에 EDA 결과를 올리면서 재미있기도 했습니다.
앞으로 K-Digital Training에 참여할 동료들 또는 데이터 사이언스에 관심 있는 분들께 재밌는 정보도 전달하고자 했습니다.
이번 과정은 델타 코로나 바이러스의 한반도 도래와 동시에 시작하는 바람에 현재까지 100% 비대면으로 진행됐습니다.
물론 zoom, slack, GatherTown에서 서로 만나기는 하는데 저는 사람들이 너무 만나고 싶습니다.. ㅠ
이 과정에 참여한 분들과 네트워킹도 이번 과정의 핵심 아닐까요??
능력도 있고 재미도 있는 분들이 많이 모여있어서 얼른 만나고 싶네요!
앞으로 일주일에 하나 정도는 EDA 글을 올릴 계획입니다.
혹은 앞으로 배울 머신러닝과 관련된 글을 올릴 것 같습니다..
아래 사진은 저번 주말 이사를 마치고 찍은 기념 사진입니다..
'AI > K-Digital Training' 카테고리의 다른 글
017. 머신러닝에 대해 이야기하기 전 AI에 관한 대략적인 이야기 (0) | 2021.09.04 |
---|---|
016. 머신러닝 공부 시작 소감 및 반성문 (0) | 2021.09.03 |
014. EDA프로젝트 Insatacart 고객 데이터 분석하기 (1) | 2021.08.18 |
013. 데이터 베이스 개념 요약 2 (0) | 2021.08.09 |
012. 데이터베이스 개념 요약1 (0) | 2021.08.09 |