1: 田杉山脈 ★ 2019/01/12(土) 18:37:50.17 ID:CAP_USER
「Python」と「R」はデータサイエンティスト職の求人で最も多く要求されるスキルに数えられている。ところが、こうしたプロフェッショナルの仕事で最も頻繁に使用されているプログラミング言語について調査した複数の報告書によると、実際は評価が分かれるという。Cloud Academyの米国時間12月27日付の報告書で明らかになった。

 まず、TIOBE Programming Community Indexによれば、2018年の検索エンジンのリクエスト数でみたRの順位は下降気味だったという。だが、データプロフェッショナル1万6000人を対象に実施したKaggleの調査では、全体で最も人気の高いプログラミング言語はPythonであるものの、統計およびデータサイエンティストは他のどの職務よりも業務でRを使用している割合が高いことが分かった。データサイエンティストの87%はPythonを、71%はRを業務で使用していると回答していると、同報告書に記
以下ソース
https://japan.techrepublic.com/article/35131060.htm
23: 名刺は切らしておりまして 2019/01/12(土) 20:13:22.05 ID:0AG1278f
>>1
Julia は?

2: 名刺は切らしておりまして 2019/01/12(土) 18:38:58.81 ID:UT9z2lcu
データサイエンティストに求められるのは言語ではない
数字を読む能力なのに

14: 名刺は切らしておりまして 2019/01/12(土) 19:32:26.78 ID:kDQzC5W5
>>2
数字を読むのはAIの役目

3: 名刺は切らしておりまして 2019/01/12(土) 18:42:18.85 ID:b9qRj+KZ
ピソン

4: 名刺は切らしておりまして 2019/01/12(土) 18:55:36.17 ID:K7woRKwy
 
Rは統計データを扱うのに特化した言語であって
システムを組むには不向きなだけだろ

5: 名刺は切らしておりまして 2019/01/12(土) 18:55:39.34 ID:ekSjywov
データをnumpyとかpandaとかに整形するのがめんどいんじゃ糞が

6: 名刺は切らしておりまして 2019/01/12(土) 18:57:58.43 ID:dibLf/yi
Python 遅いけど、、

使いやすいし、便利なライブラリも多い。

7: 名刺は切らしておりまして 2019/01/12(土) 19:05:32.54 ID:XHrLj9Fn
基本をC、ライブラリは都合のいいもの。今はたしかにPython。
Rは統計というかデータベース用だとおもう。

8: 名刺は切らしておりまして 2019/01/12(土) 19:09:51.27 ID:hEuBy7aA
Rubyは流行ることなく終わったな

9: 名刺は切らしておりまして 2019/01/12(土) 19:11:30.41 ID:WUJUgZ1h
なぜ Rだと思う? 記者の取材不足?

10: 名刺は切らしておりまして 2019/01/12(土) 19:15:41.63 ID:ephSBmTY
最近は機械学習系のライブラリがみんなPythonだからな
イヤでも使うしかない

11: sage 2019/01/12(土) 19:24:51.91 ID:OWQfCzk/
>>10
>最近は機械学習系のライブラリ
プログラマー全体の何パーセントが,「機械学習系のライブラリ」を
使用するのか? これがPythonの人気の主な理由とは思えない!

16: 名刺は切らしておりまして 2019/01/12(土) 19:41:12.41 ID:ephSBmTY
>>11
この記事はデータサイエンティスト限定の話だし
もちろん他の用途では事情は変わってくるだろうね
機械学習いらんってことなら、別の言語でも全然構わないだろう

ちなみにPythonでプログラム書いてWebサイトを立ち上げようとすると
素のApacheですぐに動かないから微妙に面倒くさい
Djangoとかのフレームワークを使う手もあるけど、
それぞれにクセがあって多少手間がかかる

最後は何を作りたいかで決まるでしょう

40: 名刺は切らしておりまして 2019/01/12(土) 23:05:12.35 ID:or34q7p2
>>11
主な理由の1つだな
もう1つは非常にとっつきやすくて、昔でいうperl的なニーズなんだと思う

13: 名刺は切らしておりまして 2019/01/12(土) 19:32:17.23 ID:b4p6ouCE
2chでも変なところで改行してると気になる

15: 名刺は切らしておりまして 2019/01/12(土) 19:34:39.49 ID:H9+KMJVU
その辺の言語は文法が少し違うだけで
どれも同じだよ

17: 名刺は切らしておりまして 2019/01/12(土) 19:44:53.13 ID:d46EjDA9
numbaじゃなくてpsyco復活してほしい
cythonがまぁまぁ使いやすい

18: 名刺は切らしておりまして 2019/01/12(土) 19:46:01.58 ID:0Stlar/u
Rを使うのは昔の文系統計屋だけ
データサイエンティストはRなんて使わないわな

19: 名刺は切らしておりまして 2019/01/12(土) 19:55:26.28 ID:SD42/tYe
assembler, bash, basic, c, cobol, java, perl, php, python, PL/M

人生最後の言語はrustだと思いたい

20: 名刺は切らしておりまして 2019/01/12(土) 19:59:05.68 ID:q+VwURUA
データ解析といえばSASじゃないの?時代は変わったな

21: 名刺は切らしておりまして 2019/01/12(土) 20:07:25.47 ID:VGAcCdku
データ分析基盤を作るのは他に丸投げ?



22: 名刺は切らしておりまして 2019/01/12(土) 20:11:46.83 ID:PAeBiU62
でもモジュール作る人はc/c++じゃないの?
データサイエンティストと言う人らはフロントだけを作るの?

30: 名刺は切らしておりまして 2019/01/12(土) 20:39:23.01 ID:FyOIkd6T
>>22
機械学習とかはサーバサイドだろ。
サーバでPythonが動き、C/C++で書かれてコンパイルされたライブラリーを呼び出す。
サーバサイドのフレームワークはPHP/Ruby/Pythonあたり。
フロントエンドではJavascript/HTML/CSSが動き、
C#とかJava書かれたソフトも動いてるかもしれん。

今時1つの言語じゃ大したことできねーぞ。

35: 名刺は切らしておりまして 2019/01/12(土) 21:04:11.03 ID:7pg+voxm
>>30
全体でみればそうかもしれないが。
データサイエンティストとして要求されるのはPythonにほぼ限定されるかと。
機械学習とかAIはPythonでやって結果は別人、グループへ。

24: 名刺は切らしておりまして 2019/01/12(土) 20:16:59.67 ID:sJf3fT7h
Rはデータ処理しやすいから好き
書き方も好き

25: 名刺は切らしておりまして 2019/01/12(土) 20:17:56.46 ID:7pg+voxm
これはおかしい
Pythonが言語として優れてるわけでなく、グーグルとか多数企業が
数値計算、AI関連のモジュールもあとから追加したからだろ。
Javascriptでもよかった

26: 名刺は切らしておりまして 2019/01/12(土) 20:24:06.33 ID:7pg+voxm
なぜ機械学習にPythonが選ばれるのか

Google AppEngineの開始当初(2008年4月)にPythonをサポートしていた際には、なんでPythonなんだろうと軽く調べ、教育用として海外では普及しているという認識だった。
2012年~2013年頃にデータサイエンスがバズワードとなり機械学習する上でR言語と次点でPythonという感じだったと思う。

そして昨今はPython一色になってきている。
私としては何故このように科学計算分野のライブラリが作成され強化されるように至ったのかを知りたくなり歴史から調べてみました。

RubyがRailsにより注目されたように、Pythonでは当初数値コンピューティング用に設計されたものではなかったがリストの概念や関数型言語の基本機能を実装したこと、
Jim Fulton氏(元ZOPE社CTO)が多次元配列・行列ライブラリ「Matrix Object in Python」を開発したことで、
早い段階(Python 1.0から1年後)で科学/エンジニアリングコミュニティに注目され「Matrix-SIG」が設立、
後の「NumPy」が紆余曲折(Numeric(1995年)とNumArray(2001)を統合)を経て2005年にリリースされた。

また幾つかの科学計算用ライブラリをパッケージ化した「SciPy」が2001年にTravis Oliphant氏らによりリリースされた。
その後はEnthought社が2001年に米国で設立され、SciPyをベースにツールやパッケージやサポートを提供、また科学技術計算向けの「SciPy Conference」と呼ばれる会議の開催を支援して行く。

Pythonが、科学技術計算で使われるようになるであろう理由のもう一つに着目した。
オープンソースプロジェクトは開発リソースが限られ、開発の中心メンバーが何らかの理由で参加しなくなった場合、一気にそのプロジェクトが衰退する場合があるが、
特に科学技術計算関係のパッケージについては民間企業が本格的にサポートとしており、オープンソースソフトウェアとして公開する体制が整っている。

民間企業の代表的なのが、Enthought社とContinuum Analytics社である。
Enthought社は科学技術計算用パッケージ群「Scipy Stack」を提供し、科学技術計算向けの「SciPy Conference」と呼ばれる会議の開催を支援している。
Continuum Analytics社はPythonディストリビューション「Anaconda」を提供し、データ分析向けの「Py Data」と呼ばれる会議の開催を支援している。

また、GoogleもPython作者のGuido van Rossum氏を2005年に雇用したり、「Google Summer of Code」というオープンソースの開発に資金を提供するプロジェクトを2005年に作成し、
機械学習ライブラリの「scikit-learn」や多変量回帰分析・時系列分析ライブラリ「statsmodels」がリリースされています。
科学技術計算分野のキーマンは、「SciPy」と「NumPy」の作者でもあるTravis Oliphant氏であろう。
http://qiita.com/yaju/items/5502115d7e3d06e6bbdd

27: 名刺は切らしておりまして 2019/01/12(土) 20:27:33.19 ID:bz9KFmyJ
普段業務でR言語を利用するなんて日本なわけないと思ったらやっぱり日本じゃなかった

28: 名刺は切らしておりまして 2019/01/12(土) 20:33:18.62 ID:FyOIkd6T
>>27
別に日本でも使うだろ。
研究者やデータサイエンティストとかなら。
ITドカタだけが仕事でプログラミングしてるわけじゃねーんだぞ

29: 名刺は切らしておりまして 2019/01/12(土) 20:37:41.08 ID:bz9KFmyJ
>>28
趣味レベルだろ

31: 名刺は切らしておりまして 2019/01/12(土) 20:41:28.24 ID:FyOIkd6T
>>29
仕事で使ってるんだぞ?立派な業務使用。
商用ソフトのクオリティではないだけの話。
そこは目的が違うだけ。

英語で言ったら「英語は通訳しか仕事で使わない」
と言ってるようなもん

32: 名刺は切らしておりまして 2019/01/12(土) 20:43:09.54 ID:FyOIkd6T
日本のプログラマに多い、
SIとかでクライアントの社内システムしこしこ作ってるようなのが、
むしろプログラマーの中では底辺だからな。

33: 名刺は切らしておりまして 2019/01/12(土) 20:51:34.47 ID:RxXl9REQ
Rかじった程度の統計の人やプログラム未経験だけどとにかくクエリは自力でかけますみたいな人たちにとっては取っつきやすいみたいですね
純粋なプログラマーにはクソ言語にしか見えない

34: 名刺は切らしておりまして 2019/01/12(土) 20:55:54.96 ID:FyOIkd6T
純粋なプログラマーって言い方が謎だが、
プログラミングそのものでお金をもらってるのと、
何か成果を出すためにプログラミングをツールとして
使ってる人ではそりゃ見方が違うだろ。

36: 名刺は切らしておりまして 2019/01/12(土) 21:23:54.55 ID:4kOuee7Y
システム化にこそ価値が宿る

37: 名刺は切らしておりまして 2019/01/12(土) 21:44:28.59 ID:bl6GrAb2
Python簡単で便利だしな
情報工学の基礎を学んでない人でも扱える

38: 名刺は切らしておりまして 2019/01/12(土) 22:03:11.01 ID:PAeBiU62
じゃあなに、偉そうに書いている割に俺らと一緒でAPIをぽちぽち叩く人らなんだ
なんだそれ

39: 名刺は切らしておりまして 2019/01/12(土) 22:12:15.59 ID:03hknbTV
>>38
プログラミング環境はただの道具
実現したいことがさくっと実現できればそれでおk
と通りすがりのScheme使いが言ってみる

41: 名刺は切らしておりまして 2019/01/12(土) 23:06:28.94 ID:or34q7p2
>>38
勝手に偉そうに感じてるだけだろ
単純な関数みたいには使いこなせんよ