당신이 데이터 과학자가 되면 안되는 7가지 이유 - KDnuggets

당신이 데이터 과학자가 되면 안되는 7가지 이유 – KDnuggets

소스 노드 : 2994981

데이터 과학자가 되면 안되는 7가지 이유
편집자별 이미지
 

당신은 야심 찬 데이터 과학자입니까? 그렇다면 데이터 과학 경력으로 성공적으로 전환한 많은 사람들을 보거나 들어본 적이 있을 것입니다. 그리고 당신도 언젠가 전환하기를 바라고 있습니다.

데이터 과학자로 일하면서 흥미로운 점이 몇 가지 있습니다. 다음을 수행할 수 있습니다.

  • 도메인 간에 이전 가능한 하드 및 소프트 스킬 구축 
  • 데이터로 스토리텔링하기 
  • 데이터로 비즈니스 질문에 답하세요
  • 비즈니스 문제에 대한 영향력 있는 솔루션 구축 

그리고 훨씬 더. 이 모든 것이 흥미롭게 들리는 만큼, 데이터 과학자가 되는 것은 그 이상은 아니더라도 똑같이 도전적입니다. 하지만 그러한 과제에는 어떤 것들이 있습니까? 

들어가자.

코딩 및 기술 능력을 연마할 때 아마도 혼자서도 편안하게 작업할 수 있을 것입니다. 하지만 데이터 과학자로서 협업과 커뮤니케이션을 우선시해야 합니다. 데이터 과학은 데이터를 뒤섞고 숫자를 따로 분석하는 것이 아니기 때문입니다. 

같은 팀뿐만 아니라 종종 여러 팀에 걸쳐 다른 전문가와 협력해야 합니다. 따라서 다양한 팀 및 이해관계자와 협력하는 능력은 기술적 능력만큼 중요합니다. 

또한 비즈니스 리더를 포함하여 기술적이지 않은 이해관계자들에게도 결과와 통찰력을 전달할 수 있어야 합니다.

니샤 아리아 아메드데이터 과학자이자 기술 작가인 는 다음을 공유합니다.

“데이터 과학 팀에서는 각 작업, 책임 및 모든 작업이 어떻게 협력하는지에 대해 다른 데이터 과학 전문가와 협력하게 됩니다. 이미 완료된 작업을 반복하여 더 많은 시간과 자원을 소모하고 싶지 않기 때문에 이는 중요합니다. 또한 데이터 전문가만이 협력해야 하는 사람이 아니라 제품, 마케팅 및 기타 이해관계자를 포함한 다기능 팀의 일원이 될 것입니다.”

– Nisha Arya Ahmed, 데이터 과학자 및 기술 작가

프로젝트 작업을 즐기고 완료하고 이를 프로덕션으로 전달하는 것을 즐기는 사람이라면 데이터 과학이 보람 있는 직업이라고 생각하지 못할 수도 있습니다.

반복적으로 구체화되고 개선되는 일련의 목표를 가지고 프로젝트를 시작하더라도 조직의 비즈니스 목표가 변경됨에 따라 프로젝트 범위를 변경해야 하는 경우가 많습니다. 아마도 이해관계자들은 새로운 유망한 방향을 보게 될 것입니다.

따라서 프로젝트 범위의 우선순위를 효과적으로 재지정하고 수정해야 합니다. 그리고 최악의 경우에는 필요하다면 프로젝트를 포기하세요. 

또한 초기 단계의 스타트업에서는 여러 가지 역할을 수행해야 하는 경우가 많습니다. 따라서 귀하의 작업은 모델 구축으로 끝나지 않습니다. 기계 학습 모델을 프로덕션에 배포하더라도 모델의 성능을 모니터링하고 드리프트를 찾아보고 필요에 따라 모델을 회귀 및 재교육해야 합니다.

아비드 알리 아완, KDnuggets의 작가, 편집자 및 데이터 과학자는 다음을 공유합니다.

“회사에 근무하는 경우 여러 팀 간에 전환하면서 동시에 여러 프로젝트를 진행해야 하는 경우가 많습니다. 그러나 작업 중인 프로젝트의 대부분은 프로덕션 단계에 이르지 못할 수도 있습니다. 

회사의 우선 순위가 변경되거나 프로젝트의 영향이 충분히 크지 않을 수 있기 때문입니다. 팀과 프로젝트 사이를 지속적으로 전환하는 것은 지칠 수 있으며, 자신이 무엇에 기여하고 있는지 전혀 알 수 없다고 느낄 수 있습니다.”

– Abid Ali Awan, KDnuggets의 작가, 편집자 및 데이터 과학자

따라서 데이터 과학 프로젝트 작업은 프로젝트를 완료하고 다음 단계로 넘어가는 선형적인 시작부터 끝까지의 프로세스가 아닙니다. 

서로 다른 두 조직에 근무하는 데이터 과학자의 하루는 완전히 다를 수 있습니다. 데이터 과학자, 기계 학습 엔지니어, MLOps 엔지니어의 역할에는 기능이 겹치는 경우가 많습니다.

당신이 예측 모델 구축에 많은 관심을 갖고 있는 데이터 과학자라고 가정해 보겠습니다. 그리고 귀하는 관심 있는 조직에서 데이터 과학자의 역할을 맡게 되었습니다. 

그러나 하루 종일 스프레드시트에서 숫자를 분석하고 보고서를 작성하는 데 소비하더라도 놀라지 마십시오. 또는 SQL을 사용하여 데이터베이스에서 데이터를 가져옵니다. SQL을 사용하여 데이터를 다루고 비즈니스 질문에 대한 답을 찾는 것이 데이터 분석가의 역할에 더 적합하다고 생각할 수도 있습니다.

다른 경우에는 모델을 구축하고 프로덕션에 배포하고, 드리프트를 모니터링하고, 필요에 따라 모델을 재교육하는 일을 담당할 수도 있습니다. 이 경우, 당신은 데이터 과학자의 역할도 수행하는 데이터 과학자입니다. MLOps 엔지니어

데이터 경력의 역할 유동성에 대해 Abid가 말하는 내용을 들어보겠습니다.

“저는 ‘데이터 사이언티스트’라는 호칭이 늘 헷갈립니다. 그것은 무엇을 의미합니까? 나는 데이터 분석가, 비즈니스 인텔리전스 엔지니어, 기계 학습 엔지니어, MLOps 엔지니어 또는 위의 모든 엔지니어입니까? 소규모 회사나 스타트업에서 일하는 경우 회사 내 역할은 유동적입니다. 그러나 규모가 큰 조직에서는 역할이 더 명확하게 구분될 수 있습니다. 그러나 이것이 역할이 완전히 정의된다는 것을 보장하지는 않습니다. 당신은 데이터 과학자일 수도 있습니다. 하지만 당신이 하는 일의 대부분은 아마도 비즈니스 목표에 부합하는 분석 보고서를 작성하는 것일 것입니다.”

– Abid Ali Awan, KDnuggets의 작가, 편집자 및 데이터 과학자

데이터 과학자로서 기술적으로 흥미롭지만 관련성이 떨어지는 프로젝트를 추구하기보다는 비즈니스에 가장 큰 영향을 미치는 프로젝트에 노력을 집중해야 합니다. 이를 위해서는 다음과 같은 이유로 비즈니스 목표를 이해하는 것이 중요합니다.

  • 비즈니스 목표를 이해하면 조직의 변화하는 요구 사항에 따라 프로젝트를 조정하고 우선 순위를 다시 지정할 수 있습니다.
  • 데이터 과학 프로젝트의 성공은 비즈니스에 미치는 영향으로 측정되는 경우가 많습니다. 따라서 비즈니스 목표를 잘 이해하면 프로젝트의 성공을 평가하기 위한 명확한 프레임워크가 제공되어 기술적 측면을 실질적인 비즈니스 결과와 연결합니다.

매튜 메이요KDnuggets의 편집장이자 데이터 과학자인 는 비즈니스 결과에 대한 무관심으로 인해 발생하는 비용을 다음과 같이 공유합니다.

“데이터 과학자로서 비즈니스 목표에 무관심하다면 레이저 포인터를 쫓는 고양이가 될 수도 있습니다. 지나치게 활동적이고 목적이 없으며 큰 가치를 달성하지 못할 가능성이 높습니다. 비즈니스 목표를 이해하고 이를 비즈니스에서 데이터로 변환할 수 있는 능력은 중요한 기술이며, 이것이 없으면 가장 정교하고 관련 없는 모델을 구축하는 데 시간을 투자할 수 없습니다. 작동하는 의사결정 트리는 매일 최첨단 실패를 이겨냅니다!”

– Matthew Mayo, KDnuggets 편집장 겸 데이터 과학자

이와 관련하여 Nisha가 말한 내용은 다음과 같습니다.

“무엇을 하든 그 뒤에는 이유가 필요합니다. 이것이 당신의 행동보다 먼저 오는 당신의 의도입니다. 데이터의 세계에서는 비즈니스와 과제를 이해하는 것이 필수적입니다. 이것이 없으면 그 과정에서 혼란스러울 뿐입니다. 데이터 과학 프로젝트의 모든 단계에서 프로젝트에 동기를 부여하는 목표를 참조하고 싶을 것입니다.” 

– Nisha Arya Ahmed, 데이터 과학자 및 기술 작가

따라서 데이터 과학은 단순히 숫자를 계산하고 복잡한 모델을 구축하는 것이 아닙니다. 데이터를 활용하여 비즈니스 성공을 이끄는 것이 더 중요합니다. 

비즈니스 목표를 확실하게 이해하지 못하면 프로젝트가 해결해야 할 비즈니스 문제에서 벗어날 수 있어 가치와 영향력이 모두 감소할 수 있습니다.

모델을 만드는 것은 흥미진진한 일입니다. 그러나 그로 이어지는 길은 그다지 흥미롭지 않을 수 있습니다. 

다음과 같이 많은 시간을 보낼 것으로 예상할 수 있습니다.

  • 데이터 수집 
  • 사용할 데이터의 가장 관련성이 높은 하위 집합 식별
  • 분석에 적합하도록 데이터를 정리합니다. 

이제 이것은 그다지 흥미롭지 않은 작업입니다. 기계 학습 모델을 구축할 필요조차 없는 경우가 많습니다. 데이터베이스에 데이터가 있으면 SQL을 사용하여 질문에 답할 수 있습니다. 이 경우 기계 학습 모델을 구축할 필요조차 없습니다.

다음은 업무가 얼마나 중요하고 흥미롭지 않은지에 대한 자신의 견해를 공유하는 Abid입니다.

“같은 일을 반복하는 것은 지루할 수 있어요. 종종 데이터 정리 작업이 할당될 수 있는데, 이는 특히 다양한 데이터 세트로 작업할 때 매우 어려울 수 있습니다. 또한 데이터 유효성 검사 및 단위 테스트 작성과 같은 작업은 그다지 흥미롭지는 않지만 필요합니다.”

– Abid Ali Awan, KDnuggets의 작가, 편집자 및 데이터 과학자

따라서 성공적인 데이터 과학 경력을 가지려면 좋은 점, 나쁜 점, 추악한 점을 포함하여 데이터 작업 과정을 즐겨야 합니다. 데이터 과학은 데이터에서 가치를 도출하는 것이기 때문입니다. 가장 멋진 모델을 만드는 것이 아닌 경우가 많습니다.

데이터 과학자로서 당신은 (아마도) 모든 것을 배웠다고 말할 수 있는 지점에 도달할 수 없을 것입니다. 무엇을 배워야 하는지, 얼마나 배워야 하는지는 현재 진행 중인 작업에 따라 다릅니다.

앞으로 새로운 프레임워크를 배우고 사용하는 것과 같은 매우 간단한 작업일 수 있습니다. 또는 향상된 보안 및 성능을 위해 기존 코드베이스를 Rust와 같은 언어로 마이그레이션하는 것과 같은 더 지루한 작업입니다. 기술적으로 뛰어나다는 것 외에도 필요에 따라 프레임워크, 도구 및 프로그래밍 언어를 빠르게 배우고 발전시킬 수 있어야 합니다. 

또한 필요한 경우 도메인과 비즈니스에 대해 더 자세히 알아볼 의지가 있어야 합니다. 데이터 과학 경력 전반에 걸쳐 단일 도메인에서 일할 가능성은 거의 없습니다. 예를 들어 의료 분야의 데이터 과학자로 시작한 다음 핀테크, 물류 등으로 이동할 수 있습니다.

대학원 시절 저는 의료 분야의 질병 예측 프로젝트에서 기계 학습 작업을 할 기회를 가졌습니다. 나는 고등학교 이후에는 생물학을 읽은 적이 없습니다. 따라서 처음 몇 주는 특정 생체의학 신호의 기술, 즉 속성, 특징 등을 탐구하는 데 중점을 두었습니다. 이는 레코드 전처리를 진행하기 전에 매우 중요했습니다.

칸월 메린, 기술 작가가 자신의 경험을 우리와 공유합니다.

“드디어 새로운 기술을 배워서 ‘아, 이거구나, 잘됐구나’라고 생각할 때 그 기분 아시죠? 글쎄요, 데이터 과학에서는 그런 순간은 결코 오지 않습니다. 이 분야는 새로운 기술, 도구 및 방법론이 자주 등장하면서 끊임없이 진화하고 있습니다. 따라서 학습이 뒷전으로 밀려나는 특정 지점에 도달하는 것을 선호하는 사람이라면 데이터 과학 경력이 가장 적합하지 않을 수 있습니다. 

게다가 데이터 과학은 통계, 프로그래밍, 기계 학습, 도메인 지식이 아름답게 혼합된 것입니다. 의료에서 금융, 마케팅에 이르기까지 다양한 영역을 탐색하려는 아이디어가 흥미롭지 않다면 경력을 잃을 수도 있습니다.”

– Kanwal Mehreen, 기술 작가

따라서 데이터 과학자로서 지속적인 학습과 기술 향상을 결코 꺼려서는 안 됩니다.

우리는 이미 다음을 포함하여 데이터 과학자가 되기 위한 몇 가지 과제를 간략히 설명했습니다.

  • 코딩과 모델 구축의 기술력을 뛰어넘어
  • 도메인 및 비즈니스 목표 이해 
  • 관련성을 유지하기 위해 지속적으로 학습하고 기술을 향상합니다. 
  • 문자 그대로 프로젝트를 마무리하는 것에 대해 걱정하지 않고 적극적으로 행동합니다. 
  • 우선순위를 재설정하고, 회귀하고, 변경할 준비가 되어 있음
  • 지루하지만 꼭 필요한 일을 한다 

다른 기술 역할과 마찬가지로 어려운 부분은 지원 데이터 과학자로 취업. 성공적인 데이터 과학 경력을 쌓고 있습니다.

Mathew Mayo는 데이터 과학자로서 이러한 과제를 어떻게 수용해야 하는지 적절하게 요약합니다.

“일을 시작하는 순간 학습을 중단하고 최신 도구, 요령 및 기술에 대해 걱정할 필요가 없는 여유로운 경력을 찾고 계십니까? 글쎄요, 데이터 과학은 잊어버리세요! 데이터 전문가로서 조용한 경력을 기대하는 것은 칵테일 우산과 낙관적인 태도만으로 무장하고 장마철을 헤쳐나가는 건조한 산책을 기대하는 것과 비슷합니다. 

이 분야는 기술적인 퍼즐과 비기술적인 수수께끼로 가득한 끊임없는 롤러코스터입니다. 어느 날은 알고리즘에 대해 깊이 파고들고, 다음에는 회귀가 일종의 후퇴라고 생각하는 사람에게 자신이 발견한 내용을 설명하려고 합니다. 어린아이 같은 행동 상태. 그러나 스릴은 이러한 도전에 있으며, 이것이 바로 카페인에 중독된 우리의 두뇌를 즐겁게 해주는 것입니다. 

도전에 알레르기가 있다면 뜨개질에서 더 많은 위안을 찾을 수 있습니다. 하지만 데이터 홍수에 맞서 아직 물러서지 않았다면 데이터 과학이 커피 한 잔이 될 수도 있습니다.”

– Matthew Mayo, KDnuggets 편집장 겸 데이터 과학자

이에 대한 Kanwal의 생각을 들어보겠습니다.

“이 사실을 직시하자: 데이터 과학이 항상 순조롭게 진행되는 것은 아닙니다. 데이터가 항상 깔끔하고 정리된 패키지로 제공되는 것은 아닙니다. 데이터가 폭풍우를 겪은 것처럼 보일 수 있으며, 이는 불완전하거나 일관성이 없거나 심지어 부정확할 수도 있습니다. 분석 관련성을 보장하기 위해 이 데이터를 정리하고 전처리하는 것은 어려울 수 있습니다.

여러 분야의 분야에서 작업하는 동안 기술이 아닌 이해관계자와 상호 작용해야 할 수도 있습니다. 기술 개념을 설명하고 목표에 어떻게 부합하는지 설명하는 것은 정말 어려울 수 있습니다.

따라서 명확하고 직접적인 경력 경로를 선호하는 사람이라면 데이터 과학 경력이 장애물로 가득 차 있을 수 있습니다.”

– Kanwal Mehreen, 기술 작가

따라서 데이터 과학은 단지 수학과 모델에 관한 것이 아닙니다. 데이터에서 의사결정으로 나아가는 것입니다. 그리고 그 과정에서 항상 배우고 기술을 향상하고 비즈니스 목표와 시장 역학 등을 이해하려는 의지가 있어야 합니다.

탄력성을 가지고 탐색하고 싶은 도전적인 직업을 찾고 있다면 데이터 과학은 실제로 당신에게 좋은 직업 선택입니다. 즐겁게 탐험해보세요!

데이터 과학 경력의 여러 측면에 대한 통찰력을 공유해준 Matthew, Abid, Nisha 및 Kanwal에게 감사드립니다. 그리고 이 기사를 훨씬 더 흥미롭고 즐겁게 읽을 수 있게 해주셔서 감사합니다!
 
 

발라 프리야 C 인도 출신의 개발자이자 테크니컬 라이터입니다. 그녀는 수학, 프로그래밍, 데이터 과학 및 콘텐츠 제작의 교차점에서 일하는 것을 좋아합니다. 그녀의 관심 분야와 전문 분야는 DevOps, 데이터 과학 및 자연어 처리입니다. 그녀는 읽기, 쓰기, 코딩, 커피를 즐깁니다! 현재 그녀는 자습서, 사용 방법 가이드, 의견 등을 작성하여 개발자 커뮤니티와 지식을 배우고 공유하는 작업을 하고 있습니다.

타임 스탬프 :

더보기 너 겟츠