TOP カテ一覧 スレ一覧 100〜終まで 2ch元 削除依頼
sizeof(char)が必ず1でも、省略すべきではない
Boost総合スレ part10
【普通のやつらの】 Arc Language 0 【上を行け】
MFC vs .NET
VRプログラム雑談【Unity/UnrealEngine】【HTC Vive/Oculus Rift/その他VR】
C++相談室 part136
Androidプログラミング質問スレ revision50
   TensorFlow 0.12
プログラミング始めたいんだけどどこ言語がいい?
推薦図書/必読書のためのスレッド 82

【統計分析】機械学習・データマイニング25


1 :
機械学習とデータマイニングについて語れ若人

*機械学習に意識・知能は存在しません。
人の意識に触れたい方はスレ違いです

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
Machine Learningを用いた論文一覧2018
https://shiropen.com/seamless/machine-learning/2018
2017年のディープラーニング論文100選
https://qiita.com/sakaiakira/items/f225b670bea6d851c7ea
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング23
https://mevius.2ch.sc/test/read.cgi/tech/1551352040/
-

【統計分析】機械学習・データマイニング24
https://mevius.2ch.sc/test/read.cgi/tech/1556674785/
VIPQ2_EXTDAT: checked:vvvvvv:1000:512:----: EXT was configured

2 :
2ゲットー!

ズザザザ−!
(超満員の電車内なのでAA貼れない!)

3 :


4 :
意識のないAIなんてAIとは言わないよ

5 :
AI完全をクリアしてから考えればいい
意識云々いう奴は自己陶酔のオナ猿

6 :
多次元尺度構成法ってデータ間のユークリッド距離を見てユークリッド距離をほぼ再現できる別次元のデータ構成をつくりなおすってことで合ってる?

7 :
距離を再現する必要はない

8 :
>>6
違う

9 :
>>8
ウソつくな馬鹿たれが!

10 :
😭💦💦

11 :
いわゆる最小二乗法っていうのは正規線形モデル(つまり誤差項が正規分布に従う仮定の線形モデル)でほかの確率分布を想定するために一般化線形モデル(正規分布以外の分布にも従うことを想定するモデル)があるっていうことでいいんでしょうか?だれかおしえてください
私の認識では正規分布に従う仮定ならばパラメータの推定は最小二乗法という簡単な行列計算で行うことができるけど他の分布の仮定であれば一般化線形モデルのもと最適化アルゴリズムを利用した最尤法を行わなければいけないという理解なんだけどあってるのかな?

12 :
いわゆる最小二乗法っていうのは正規線形モデル(つまり誤差項が正規分布に従う仮定の線形モデル)でほかの確率分布を想定するために一般化線形モデル(正規分布以外の分布にも従うことを想定するモデル)があるっていうことでいいんでしょうか?だれかおしえてください
私の認識では正規分布に従う仮定ならばパラメータの推定は最小二乗法という簡単な行列計算で行うことができるけど他の分布の仮定であれば一般化線形モデルのもと最適化アルゴリズムを利用した最尤法を行わなければいけないという理解なんだけどあってるのかな?

13 :
この前の目黒記念449,000円ごっつぁんです( ´∀`)/~~。
ラジオNIKKEI賞楽しみだな。
python一辺倒だったのを、統計解析部分をRに代えてやったら回収率が飛躍的にアップした。
Pythonはデータの取り出しに特化させるのが向いてるみたい。

14 :
>>13
それは言語の問題ではない
Rで処理している事をpythonで処理すれば良いだけ
つまり統計処理自体の選択が適切ではなかった
あなたのミスだ

15 :
>>13
前回うまくいったとして
今後10回とか繰り返したら損するかもしれないよ

16 :
>>11
>>12
質問の意味が分からん

17 :
>>12
文がごちゃついてるけど
合ってる

18 :
統計処理はRの方が楽なことが多いが統計学を理解していれば言語で結果が変わるなど起こらないはず

19 :
みんな統計検定準一級って持ってる?
機械学習やるなら持ってた方がいいかなって思ってるけどどう?

20 :
機械学習に数学は不要
統計学に数学は必要
ゆえに機械学習に統計学は不要

21 :
>>19
必要だと思うなら持てばいいじゃん
人に聞いてどうすんの?

22 :
deepnude
https://headlines.yahoo.co.jp/hl?a=20190629-00000002-jij_afp-int

23 :
>>20
機械学習じゃあ中途半端な数学は
意味ないからかなり勉強しないと。

統計学は基本からしっかり勉強すれば
数学は役に立つね

これからは機械学習でも
数学やってないと
淘汰されそうじゃね?

24 :
アノテーション作成がメインのお仕事なデータ・サイエンティスト系なのかも

25 :
アノテーション作成って
アルバイトがやるやつ?
まあ、それなら数学いらんわな

26 :
アノテーションと言えば最近読んだこれ思い出した
https://www.itmedia.co.jp/news/articles/1906/27/news042.html

27 :
面白そうな本を見つけた。
買いでしょうか?かなり高いけどw

昆虫の脳をつくる ─君のパソコンに脳をつくってみよう─
https://www.asakura.co.jp/books/isbn/978-4-254-10277-2/

28 :
さっきのサヨナラのランニングホームラン
なんでエンタイトルツーベースにならなかったのか

29 :
>>15
やってみます。
試行錯誤しながら精度上げていきます。

30 :
>>15
10回と謂わずに100レース以上試してベストな方法でやってみます。

31 :
>>23
競馬やってるが、極めてくるとプログラミングなんて知識よりも数学の知識が重要になってくる。
プログラミングなんて競馬予想をスムーズに効率的にやるツールに過ぎない。
最終的に数学の知識が必要になる。
極端な話、プログラミングなんてどうでもよくてその時代のベストなツールを組み込んでやれば良いが、ベースは統計学だから。

32 :
機械学習ってプログラミングと言っていいのか
ライブラリ作ってる人は凄いと思うが
使う人はなんかマクロ言語使ってる感覚に近いんじゃね
だから言語は何でもいい

33 :
>>14
恐らくそのようですね。
自分のコーディングの問題ではあると思いますが、統計解析ではRの方が実行速度が速いですね。
特にリアルタイムでオッズ表示してやるものとか。
自分のプログラム自体に問題あるかも(;´_ゝ`)。

34 :
>>32
その通り。
中のライブラリ(数学の知識)が重要なんよ。
コーディングだけやるなら大したことないが。

35 :
>>30
ベストかどうかは想定内の選択肢の中で一番良い
という事でしかないと思う
想定外のアプローチでより良い結果を得られるかもしれないけどな

36 :
>>31
統計処理にミスがあったら損する事になるけどな
理論も実践も重要

理論的には実現できるけど実際にやろうとすると
見込み利益よりコストがかかって赤字とかのパターンもある

37 :
>>34
中のライブラリにないものは自分で作るしかない

38 :
>>33
結果を得るまでに必要な時間が
必要な時間内に収まるかどうかも問題になる事がある

自動運転とか結果を得るまでに5秒とかかかってたら役に立たない

39 :
>>32
個人的には電気回路設計にかなり近いと感じている
新しい回路を設計する人はもはや殆どいない
トラ技等の雑誌を見てノウハウを学びつつ、実務では完成されたネットワークを使って変更点のある部分はPICやFPGAでなんとかする感じ

40 :
回路パラメータは計算で決められるけど機械学習のハイパーパラメータはそうはいかないんだよな

41 :
>>36
コストの方がかさむなら理論の時点で間違いだろw

42 :
理論が間違いというか、細かい人件費や手数料などどこまで計算に入れるかの問題だろう
あまり具体的に入れすぎても汎用性がなくなって使いにくくなるし、逆にシンプル化しすぎると現実とのズレが大きくなる

43 :
人間って視点を移動しながら視野の全体を認識してるけど
これをAIの画像認識にも応用すれば学習コストって大分少なくできるような気がするな
視点の中心に特徴量を集中させればいいだけだからかなり効率的だと思う

44 :
だからさ、そんなこと誰でも考えるの

アイデアを形にして結果を出せなければ
ただの馬鹿でしかないから。

45 :
どこに視点を合わせるの?馬鹿乙

46 :
ランダムフォレスト分類の予測結果に「A」「B」「C」があった場合、
それ以外に確信度が低ければ「わからない」というラベルを
出力することができますか?
それかテスト入力データを与えたら、予測結果だけでなく
確信度的なものを数値で把握したい。
ランダムフォレストは多数決で判定結果を決めているということは
複数の木での意見の一致度とか意見が割れているとかが算出できるのでは
ないかと思います。
判定を間違えるくらいなら「わからない」と言ってくれたほうがいいので。
ランダムフォレスト回帰でも同様のことをしたいです。
pythonのscikit learn RandomForestでこのような機能があったら
教えて頂けるとありがたいです。

47 :
そうだな
AIにDNAやRNAと代謝を完全にエミュレーションさせればきっと完璧なはず

48 :
>>46
できるし
積極的にそういうふうに実装すべき

49 :
>>45
お前がものを見るときはどうやって視点合わせてんの?

50 :
>>49
それ医学的科学的に説明できる人いないだろwww

アホすぎwww

51 :
>>48
すみません、メソッドレベルで教えて頂けると助かります。
該当するメソッドやインスタンス変数などを教えてください。
scikitlearnの RandomForestClassifierと
RandomForestRegressionです。

52 :
>>49
真性の馬鹿か

53 :
ど素人の思い付きであった

54 :
知ってる人教えてください。
scikitのmlpとRのnnetで同じネットワークサイズにしてるのに、mlpの方が精度がかなり悪いです。どのパラメータをいじれば整合が取れるでしょうか。
nnetのdecay に対応するのがalpha?

55 :
>>50
世界中さがしても説明できるやついないのかw
そっかw

56 :
┐('〜`;)┌

57 :
>>55
50だがそういう意味で言ったんだぞ
お前は余計な事考えずに勉強しろ

58 :
>>57
何が言いたいのかさっぱりわからん
説明できるやつがいないから実装は不可能だと言いたいのか?
それとも説明できるやつがいないからここで議論してもしょうがないよねって言いたいのか?
どちらにせよ論理破綻してるぜ?

59 :
>>58
お前は馬鹿だとみんなが言ってるだけだよ

60 :
med

61 :
>>51
誰も答えてあげてなくてかわいそうになってきた
predict_probaで確率出るからそれで弾いて

62 :
>>57
勉強してる人が2chなんて見るかよ馬鹿

63 :
>>54
Rの方はよく知らないけど整合取るには双方のヘルプ・ソースコードとニラメッコじゃないだろうか
nnetのオプティマイザはBFGSだけどscikitのsolverはデフォルトでadam
nnetの損失関数はLeast Squareだけどscikitの方はLog-loss

ヘルプを見る限りnnetのdecayとscikitのmlpのalphaは同じように見える
両方ともL2正則化のペナルティを表すもので、Rのデフォルトが0でscikitのデフォルトが0.0001

いろいろ違いそうだね

64 :
>>63
ありがとうございます。
なるほど、正則化パラメータ以外もいろいろ違うとこがあるんですね。

整合を取りたいと書いちゃってたのですが、一番の目的はscikitでもnnetと同じ精度以上を出したいというところですので試行錯誤してみたいと思います。

65 :
ribesがそんなにいいとは思えない
sentencepieceもそんなにいいとは思えない

ゴミみたいな研究だと思う

66 :
SIGNATEの武田の創薬やってる人いる?
どうやったら精度上がるか全然分からん

67 :
>>66
今やってるKaggleの白血病もそうだけど、
AI屋やIT屋の課題じゃないような

68 :
サイト教えろよ

69 :
株でばくえきだわ

70 :
株で大儲けー♪

71 :
株で大損失中だわ
泣けてくる

72 :
>>66
どこでそれやってるの?

73 :
>>72
SIGNATEって書いてあるだろ

74 :
俺も知りたいわ、3800もある項目見るのはきつい

75 :
singateみたけどさ
>(2)最終提出物及び最終審査用提出物に含まれるすべての分析・予測結果及びレポート、分析・予測モデル・アルゴリズム・
>ソースコード・再現法等の説明書等、及び提出物に関する著作権、特許を受ける権利、ノウハウ等すべての譲渡可能な権利(著作権法第27条及び第28条に定める権利及び特許を受ける権利を含み、以下、「本件権利」といいます。)
>のホストその他の当該コンペティションにおける権利譲渡対象者への譲渡に同意すること

ナニコレ。。。

76 :
他のデータサイエンスコンペの規約はどうなってるの?

77 :
流石にそのまま専属データサイエンティストになれるでしょ

78 :
口約束もないのに確約なんかされるかいな

79 :
SIGNATEって営利目的を想定しているみたいだけど、
どのコンペも提供されているデータ変数がそもそも足りないので実用投入は無理っぽそ

80 :
やばい雰囲気が漂ってる
避けた方が良さそう

81 :
この分野もホント人が居ないんだな
技術とは全然関係の無い人間がマイニングでいらなくなったグラボ使って
暇つぶしに本2冊読んだぐらいで上位10%以内に入れるっていう
まーやらんわな今の若い人達がこんなもん

82 :
SIGNATE結果出してる奴らってやっぱりスタッキングとかでやってるのかな?

83 :
通販のポスデータで何すべき?

84 :
他社にこっそり販売する

85 :
スタッキングとかって実務でもやるもんなのか?

86 :
スタッキングってなによ?

87 :
車がぬかるみにはまってでられなくなること

88 :
つまんね

89 :
今日からやります
こんなブルーオーシャンないわ

90 :
やれ!
Excelでデータごにょごにょできれば
月100万取れるから。
まじでバブルだ

91 :
>>89
もうすでに血みどろで真っ赤になって誰も入らんだけだぞ。

92 :
パトロンがいればどうにでもなる現実

93 :
とある事情でGPUマシンを無料で使える環境なのでやってみますわ

94 :
パトロンはどうやって探すの

95 :
>>89
いいアルゴリズムができると途端に出したくなくなるよ
これを100万ごときで版権込みで全て渡すのか、と思うときが来る

96 :
100万とか200万とか安すぎ

優秀な成果にしか賞金出さないのに

97 :
せx

98 :
入賞しなくても
全部むこうのものになるんだろ?

データサイエンティストをいいように搾取してるだけじゃん??

99 :
何を言っている
優秀だと会社や国に吸われるシステムになっているのが日本だろう
世界で最も中間層の多い国なんだぞ
ダメなものには補助金が出て優秀な奴等からはガッポリ金を吸い取る
高学歴と言っても大半は無駄に頑張らないといけない運命を強制的に背負うだけ
ごく一握りの人間が運的要素によって金持ちになるけど

100 :
>>98
機械学習本体の部分は渡しても良いんだけど、前処理の部分は自分の人月を考えると絶対に渡したくなくなるレベル


100〜のスレッドの続きを読む
次世代言語13 COBOL Java PHP VBA Ruby
C/C++の宿題片付けます 170代目
Rubyについて(アンチ専用) Part004
DarkGDK Part.4
【上流社会】MSDNサブスクリプション総合【最先端】
s = "" + i;でintをStringに変換するのはなぜだめか
Qiita
Excel VBA 質問スレ Part66
OSSホスティング総合【SourceForge,GitHub,etc..】
Androidプログラミング質問スレ revision50
--------------------
反ティーパーティー運動
ハーメルンについて語るスレ671
【ノーベル賞】英科学者ファラデーの著書「ロウソクの科学」の増刷を岩波書店が決定。吉野彰さんが科学への興味を持つきっかけになった本
三国ベースボール パカ金欠片26個目
【朝日新聞】反体制を掲げる朝日がイランの体制を支持する矛盾。
【BVB09】Borussia Dortmund&香川真司 Part.11
【団塊】北海道 車中泊 旅行【一周】
ダン総合スレ
【MTG】モダン専用スレ184【modern】
乙女@マージナルプリンス1&2〜その7
スレタイで「森戸ブスwww」と言っておきながらいつも同じ画像を貼って森戸可愛いと自演連呼するスレを頻繁に立てる森戸ヲタ
シリアで拘束された湯川遥菜さんの無事を祈る
【無料3Dソフト】StoneyDesignerを語るスレ
☆☆★ 放送大学スレ Part.356★☆★(ワッチョイ有)
【patagonia】パタゴニア【街着】part 118
テーラーメイドスレpart68
☆【家柄】看護師を見下す医師家系奥【★】
【HONDA】ホンダ・N-WGN★16台目
八百長横綱 白鵬
1守り■ドライカレー712■
TOP カテ一覧 スレ一覧 100〜終まで 2ch元 削除依頼