データサイエンティストの1日
BrainStationのデータサイエンティストキャリアガイドは、データサイエンスで儲かるキャリアに向けた第一歩を踏み出すのに役立ちます。データサイエンティストが仕事で日々を過ごす方法の概要については、以下をお読みください。
データサイエンティストになる
ブートキャンプとコースがデータサイエンティストになるのにどのように役立つかについて詳しくは、ラーニングアドバイザーにご相談ください。
[送信]をクリックすると、同意したことになります 条項 。
送信
送信できませんでした。ページを更新して再試行しますか?
データサイエンスブートキャンプの詳細ありがとうございました!
すぐ連絡する。
データサイエンスブートキャンプページを表示
データサイエンティストの1日
Brainstationのデジタルスキル調査で調査されたすべての分野の中で、データサイエンスは最も幅広いアプリケーションを網羅している可能性があります。しかし、データサイエンスは何十年も前から存在していましたが、つい最近になって満開になりました。データの可用性が拡大するにつれて、企業はデータサイエンスがいかに重要であるかを認識していると、PureStrategyの創設者兼CEOでありデータサイエンティストであるBrianaBrownell氏は13年間述べています。現在、すべての企業はテクノロジーに部分的に焦点を当てる必要があります。たとえば、ちょうど今週、マクドナルドは自社のビッグデータ会社を買収するために推定3億ドルを支払いました。
したがって、データサイエンティストの競争が非常に激しいのも不思議ではありません。わずか2年間で、需要は28%増加すると予想され、これは約270万の新規雇用に相当します。これは、新卒者が埋めることができるよりも多くの開口部です。つまり、他の分野の技術者は、この需要を満たすためにスキルを磨き、データに移行する必要があります。
実際、私たちの調査は、これがすでに起こっていることを示唆しています。 5人のデータプロのうち約4人が何か他のことをしてキャリアを開始し、すべてのデータサイエンティストの65%が5年以内にこの分野で働いています。この新しい心の巨大な流入は両刃の効果をもたらします、とブラウネルは言います。一方で、多くの新しいアイデアが生まれていると彼女は言います。データサイエンスコミュニティから出てくるコンテンツのいくつかを見ると、イノベーションがどれほどあるかに驚いています。ただし、裏返しは、車輪の再発明を行う傾向があります。
あなたが1人である(または1人になることを考えている)場合、データサイエンティストに対する高い需要は大きいですが、雇用主にとって、採用は困難な課題になる可能性があります。ここで、スキルの再習得は明らかな解決策です。新しい従業員をヘッドハントするよりも、データサイエンスの現在の従業員を再訓練する方が費用効果が高い場合があります。
ただし、新しいデータサイエンスチームを採用する予定がある場合でも、組織全体でデータリテラシーを磨く必要があるかもしれないとBrownell氏は警告します。誰もが自分の職場に影響を与え、人々の生活をより良くする何かに取り組みたいと彼女は言います。あなたの企業文化が[データサイエンティスト]が影響を与えることができるようなものでなければ、雇用することはほとんど不可能です。リーダーシップは、潜在的な採用者にどのように貢献できるかを伝えるだけでなく、データサイエンスチームが最終的に提案する提案を理解する能力も備えている必要があります。
残念ながら、Brownellは、不快な大多数は物事を理解していない企業であると言います。私たちの調査はこれを裏付けています。ほとんどの回答者(52%)は、組織全体のデータリテラシーのレベルを基本として説明し、次に最も一般的な回答(31%)は中間でした。これは、いくつかの基礎的なデータサイエンスのトレーニングが、大多数の企業、特にリーダーシップにおいて役立つ可能性があることを示唆しています。
データリテラシーとコミュニケーションを改善する必要性は、ほとんどのデータサイエンスチームの構成方法によって高まります。個別のチームとして、通常は10人以下(回答者の71%による)、多くの場合5人以下(38%)です。 )。これらの緊密なチームは孤立する余裕がありません。 Brownell氏によると、大企業で働く個人は通常、データサイエンス固有の小さなグループに属し、クライアントは社内にあります。組織の他の部分であるため、組織のさまざまな領域で業務を行う必要があるチームです。
データサイエンスとは正確には何ですか?
(データサイエンティストが数字をクランチするという)一般的な認識は、それほど遠くない、とブラウネルは言います。洞察を明らかにする必要のあるデータセットはたくさんあります。これには、モデルの構築やデータのクリーンアップ、さらには必要なデータの決定など、多くのステップが含まれます。ただし、最終的には、この取り組みは目標指向です。基本的に、データを使用して何かを行う必要があります。
さらに言えば、データは必ずしも数字ではありません。回答者の過半数(73%)は数値データを使用していると回答しましたが、61%はテキストも使用し、44%は構造化データを使用し、13%は画像を使用し、12%はグラフィックスを使用しています(少数派はビデオやオーディオも使用しています)。 —それぞれ6パーセントと4パーセント)。これらの調査結果は、データサイエンスが財務表をはるかに超えて拡大していることを示唆しており、顧客満足度の最大化やソーシャルメディアの消防ホースからの貴重な洞察の収集などのプロジェクトに人々を参加させています。
その結果、データサイエンスの分野には非常に多様性があります、とBrownell氏は言います。すべての業界は、データサイエンティストが取り組んでいるデータの種類、期待する結果の種類、およびそれが会社のリーダーシップ構造にどのように適合するかについて独自の見解を持っています。ただし、いずれの場合も、目標はデータを活用して企業がより良い意思決定を行えるようにすることです。それは、製品をより良くし、彼らが参入したい市場を理解し、より多くの顧客を維持し、彼らの労働力の使用法を理解し、良い雇用をする方法を理解することであるかもしれません。
データサイエンスの仕事
テクノロジーの一部の分野では、ジェネラリストになることが、データサイエンスではそうではなく、ドアの中で最高の足がかりになる可能性があります。雇用主は通常、業界に特化したスキルを探します。データサイエンスにはさまざまな種類があるため、調査では、データアナリスト、研究者、ビジネスアナリスト、データおよび分析マネージャー、データサイエンティストの5つの主要な職種を調査しました。
これらすべての役職で、データのラングリングとクリーンアップは時間の大部分を占めますが、何のために?ほとんどの場合、目標は既存のプラットフォーム、製品、またはシステムを最適化すること(45%)、または新しいものを開発すること(42%)です。さらに深く掘り下げると、既存のソリューションの最適化はビジネスアナリストとデータアナリストに委ねられる傾向があり、新しいソリューションの開発はデータサイエンティストと研究者に委ねられることが多いことがわかりました。
データサイエンティストが使用する手法も、専門分野によって異なります。線形回帰は、回答者の54%が引用したすべてのカテゴリに共通のツールでしたが、人々が使用しているソフトウェアを見ると、いくつかの驚きがありました。
データセット操作の主力であるExcelは事実上どこにでもあり、全回答者の81%が引用しており、データサイエンティスト(Pythonに最も頻繁に依存している)を除くすべてのカテゴリで最も人気のあるツールであり、他のカテゴリよりも大きなツールキットも引用しています。 )。 2019年でも、Excelがこれほど避けられない理由は何ですか?
私がExcelで気に入っているのは、データを表示して直感的に感じることができる方法です、とBrownell氏は説明しました。また、多くのPythonを使用しています。その場合、データファイルに対して分析を行うと、そのファイルは非表示になります。分析している生データを視覚化するようにコードの一部を特別にプログラムしない限り、それは表示されません。一方、Excelでは、目の前にあります。それには多くの利点があります。データファイルの問題を見つけることができる場合があります。 Excelが分析から消えることはありません。
とはいえ、この分野で使用されている他のプログラムのリストはまだたくさんあります。その多様性を考えると驚くことではありません。 SQL(43%)とPython(26%)が人気を博しており、Tableau(23%)、R(16%)、Jupyter Notebooks(14%)、その他数社がかなりの数を記録しています。このすでに長いリストを与えられたとしても、他のツールを引用した回答者の32パーセント。
データサイエンスの未来は何ですか?
最後に、今後5年から10年の間にどのようなトレンドがデジタルランドスケープを形作るかを尋ねました。機械学習とAIは、どちらもデータサイエンスに応用されており、回答者が最も大きな影響を与えると予想している開発は、それぞれ80%と79%でした。これは、現在AIを使用しているのは4分の1未満(23パーセント)であるにもかかわらずです。
人工知能はデータサイエンスを完全に変革することができます、と同社がAI製品を開発しているBrownellは確認します。それは本当に教師なし学習方法の栄光です。これらのデータセットを確認する時間は限られており、特に大きなデータセットでは、すべてを行うのは非常に困難です。 AIツールは、おそらくあなたが探すとは思わなかった何かを明らかにするのに役立ちます。私たちは間違いなくそれを経験しました。
データサイエンティストが近い将来支配すると予想するその他の傾向:インターネット(51%)、ブロックチェーン(50%)、eコマース(36%)、拡張現実と仮想現実(38%と27%)、さらには音声-ベースの経験(25%)-すべての重要なショー、およびデータサイエンスを有効に活用できるすべての領域。