TOP カテ一覧 スレ一覧 100〜終まで 2ch元 削除依頼
【JavaScript】スクリプト バトルロワイヤル55【php,py,pl,rb】
Java入門・初心者質問スレ Part.7
【上流社会】MSDNサブスクリプション総合【最先端】
アセンブラ 13
Java入門・初心者質問スレ Part.7
Pythonのお勉強 Part63
C#は糞2.0
pythonista総合スレ【IOSで勉強できる】
テストしにくいコードをテストする方法 その2
【GPGPU】くだすれCUDAスレ part8【NVIDIA】

【統計分析】機械学習・データマイニング24


1 :2019/05/01 〜 最終レス :2019/05/23
機械学習とデータマイニングについて語れ若人

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
Machine Learningを用いた論文一覧2018
https://shiropen.com/seamless/machine-learning/2018
2017年のディープラーニング論文100選
https://qiita.com/sakaiakira/items/f225b670bea6d851c7ea
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング23
https://mevius.2ch.sc/test/read.cgi/tech/1551352040/
VIPQ2_EXTDAT: default:vvvvvv:1000:512:----: EXT was configured

2 :
AIブーム終わっちゃったね

3 :
中小企業ですらAI言ってる時点で
もうオワタ

4 :
いやいやまだまだAIの時代だよ

5 :
AIと一口に言ってもそこには大きく以下の3種類の仕事が存在する
2と3はブームが過ぎても使い道があるが、1しかできない人はマジで使い道がなくなる
1.誰でも使えるお手軽AI構築ソフトをポチポチするだけの簡単なお仕事
2.AIの開発環境や実行環境を(主にクラウド環境として)構築する仕事
3.AIというよりもより具体的に(今であれば深層学習などの)数学的側面を理解して適切なモデルを構築する仕事

6 :
1は、データの更新に合わせてモデルをポチポチ再構築するお仕事として残ったりしそう
CAEのメッシュ切りみたいに

7 :
AIってモデルはかんたんに作れるけど其の周辺のシステムを構築する仕事がメインだと思う

8 :
CAEのメッシュ切り、てなに?

9 :
勉強進まない
2時間やって参考書10ページも進まないとか…
連休中に一冊終わらせようと思ったけど無理だな…

10 :
>>9
まぁ実行時間かかるしね、しょうがないね

11 :
>>6
すぐ自動化されそう

12 :
>>10
数秒で実行出来る内容なんだけどね…
情けない話だわ

13 :
ネットワークモデルの考案は最も難しく研究者が行うことだ
技術者は適切なモデル選定して学習させるだけ

14 :
>>9
何を思ったか、私は受験用英単語集(2000語レベル)を買って頭から一日50 words (ただし自分の知らないものに絞る)ずつやって GW 中に 2000 語レベルを仕上げるべく、他のことは放擲してまで熱中しています
今 1000 語を超えましたが、GW の残りの半分で全部仕上げるためにはペースアップしないといけない、と考え始めています
とりあえず一日 100 words、使う時間も倍にする予定です
https://www.amazon.co.jp/gp/product/4791624076/

15 :
CAEでメッシュ切るのも未だ完全自動じゃあないよ
すべてコンピュータに任せればおかしなメッシュが出来るからチェックが必要

16 :
今後10?20年の間に最も必要とされる仕事
https://rikunora.hatenablog.com/entry/20170217/p1

17 :
>>15
仕事で使ってるけど、商用ソフトでは完全自動になってるよ。
メッシュがおかしくなることはほぼ無い。

18 :
>>14
偉いなぁ
2、3時間だらだらやってNetflixに逃げる俺とは大違いだ

19 :
ところで組み込み系の開発ってどういう意味ですか?

20 :
>>18
何か意味のあることをしたい、と思っただけです、英語がいくつになっても必要であることはこの業界であればいつも痛感するのです
こういう馬鹿みたいな訓練も、ときにはお勧めです、次のお盆か正月やすみにでもいかかでしょうか?

21 :
>>16
翻訳者、でしょうね

22 :
令和時代に汎用人工知能は実現できそう?

23 :
>>22
あと3つくらい改元しないと無理だと思う

24 :
そもそも汎用人工知能とやらを本気で求めている人ってどれだけいるの?
会話に反応してくれるのはSiriやPepperがもう少し賢くなれば十分だし
金儲けのためなら汎用ではなく特定用途に特化したものがあればいいし

25 :
のび太くん。あ、セワシくんが切実

26 :
汎用人工知能ってつまり人間の仕事を100%肩代わりさせることができるってことだよな
人工知能に人間が生かされる時代がいずれくるんだろな

27 :
>>26
それは人間の能力を低く見すぎではないかと
今の AI は過去の延長線上でしかモノを考えません(傑出しているのは将棋とか囲碁くらい)が、人間はある日突然、これまでに存在しなかったものを実現化・実在化しますよね

28 :
>>27
汎用人工知能ってもうできてんの?

29 :
>>27
それは一握りの天才だけじゃない?
大多数の人間はAIと同じく過去の延長線上でしか考えられない。
ていうか延長すら出来ない人がほとんど。

画像認識だって人の目視よりAIの方が精度高い場合もあるみたいだし、囲碁将棋だけってのはちょっと情報古くないかな。
実際自分も仕事で使ってるけど、回帰で高精度叩き出してるよ。

30 :
人間がコンピューターの使い方を学習しだした気がするよ
Excel滅びろ

31 :
>>29
>画像認識だって人の目視よりAIの方が精度高い場合もある
教師あり学習の場合は、シベリアンハスキーとエスキモー犬を分別するとか、とかはうまくいっていますよね
個人的に感動したのは「超解像度」や CycleGANです、それは多いに認めています

ただ、

>>28
1000年たっても「心」や知性の実現=機械証明(証明支援ではない)は無理だと思っています

32 :
factorization machinesの論文を出した人、一時期日本にいたのね
なんでそういう人材を手放すかなあ

33 :
そんな高度な人材は日本の企業・組織には使いこなせない
その分野の発展にとっても本人にとっても出ていくのが最適解

34 :
日本はIT土方とかいう表現が生まれるくらいSEがブラック扱いされてたのが良くない

35 :
pytorch難しいんじゃ…
こんな難しいの人気にしてはいけない😡

36 :
心や知性は機械的なアルゴリズムでは実現不可能って思ってる人って人間の脳をどういう仕組みで動いてると思ってんだろ
霊的な何かとか物理の常識を超越した現象かなにかだと思ってるのかな

37 :
俺今お腹すいてるけど何食べたいか分からないんだよね
そもそもお腹空いてるのかすら疑問なんだけどそういうのもいつか理解してくれるアルゴリズムも出来るのかな

38 :
心や魂なんて無いのにな。
脳を階差機関と交換してない野蛮人はこれだから困る。

39 :
>>36
それらしいものが出来たとしても確かめる術がない

40 :
>>34
だからどうしたw

41 :
>>38
そんなことを言っているようでは今の若い者に期待はできないですな
「心」や「魂」に一対一に対応する実体を求めているわけではないのですよ
むしろ、我々人間が「心」や「魂」を存在するものとして扱っている事実に注目することが重要なんです
我々人間が、こいつには「心」や「魂」が存在するに違いない、と錯覚させるだけの「なにものか」を装備することが必要かつ十分なんです

42 :
>>36
物理の常識では心や知性をどう解釈するの?

43 :
>>42
知能や心はまだ解明されてないよ

44 :
>>43
お前自分の書いた文章読んでみろよ、アホ?

45 :
記憶がどうやって保存されてるかも分かってないと思ったけど

46 :
完全解明には至ってないけど
少しずつ明らかにはなっているかと

47 :
猫飼ってたけど奴にはには自我があると思ったよ。
あざとくないアイボはよはよ

48 :
彼らなりの評価関数はあるだろうから
最適化を目指す行動を観察すれば
自我があるように見えるかもね

49 :
シナプスの最小単位回路が六方格子状ってのは解明されたから その機能が積み重なって自我ができてるんだろうね、わからんけど

50 :
>>44
読んだけど何一つ矛盾が見つからないけどなんかある?

51 :
>>50
馬鹿よ永遠なれ

52 :
>>40
情報系進もうとする学生が減るじゃん
アメリカは金持ちで格好いいシリコンバレー
日本はIT土方でブラック生活
そりゃ差がつくでしょ

53 :
そんなにシリコンバレーがいいなら外資行けばいいだけだし何ならシリコンバレーに行ってしまってもいい
日本企業に就職する必要などどこにもない

54 :
その辺に詳しくない高校生が大学の学部選択するときの話をしてるんだけどね
自分は別の分野で博士とったけどSEのイメージがもうちょっとよかったら情報系行ってたかもしれないし

55 :
>>51
馬鹿はお前だ
ひとまず汎用性のある人工知能は実現可能なんだろうけどお前には関係のない話って事だな

56 :
おっさん世代だと情報系はバカが行く、数物系こそ至高だったぞい

57 :
>>55
実現してから言えよ馬鹿

58 :
>>57
なんでこいつ切れてんだ?
なんか嫌なことでもあったのか?
人工知能の授業で先生に怒られたとか?
あ、お前中卒だから関係ないか

59 :
>>58
自己紹介乙

60 :
せっかくの楽しい連休に喧嘩するなよ!

61 :
人工知能同士が喧嘩しているとは、この時まだ誰も気づいていなかったのである

62 :
>>59
ばーか

63 :
日本のITも土方でやってける時代も終わってきてる
これからはどうなるかな

64 :
いまのところ人間どころかネズミほどの知能も実現できてないんだよなぁ

65 :
ん? すでに7割方の人間の能力はすでに上回っているわけだが
コストは人間を雇った方が安いので、人間が仕事をしていることが多いが

66 :
汎用知能を実現させている人間の脳って凄いよね。
脳は手の平に乗る程の大きさなのに、解明されていないとか不思議。

67 :
Googleの場合、雇用はPh.D取得組(平均初任給20万ドル)とNo Degree組(初任給上限1万)の2つのグループに2極化が進行している。
東大とか日本の有名大学の理系修士の採用であっても、No Degree組に入ると初任給は大体800万円くらいになる。
Googleはこの2極化戦略を更に進め、No DegreeをRed Badgeと呼ばれる派遣社員で置き換える動きも進めている。
派遣社員で採用となった場合は、1年契約で、最大契約期間は2年で3年以上の契約更新はない。
というと、Red Badgeの条件は悪いように思えるが、正規の平均在職期間は大体1年10ヶ月くらいで2年以上残れる社員は半数以下。
給与条件で現在のアメリカのIT業界で頂点に位置するのは、Uber Advanced TechnologiesとWaymo。
Waymoとかは、分社化以前は、平均給与が100万ドルとか、ありえない条件で雇用していたが、
運営費が膨大になりすぎたため、新会社(Waymo)を設立して従業員を全て新会社で新規雇用することで、雇用条件を一旦リセットした。
Googleで初任給20万ドルを取れるのは、このWaymoとGoogle Brain採用組がメイン。
有名大のPhD(一般人枠)で高給を狙うのだったら、FacebookかAmazonの方がいい。
ただし、Amazonとかは、全生活を会社に貢献することを求められる位、仕事はハード。

68 :
>>66
そうだね
仮に300年前の人類に親指サイズの半導体製品与えても同じように解明は難しいだろうね

69 :
GoogleのNo Degree組の初任給上限は10万ドルのうち間違え。

70 :
>>68
たしかにw
わかりやすい的確な例え有難うございます。

71 :
覚醒するかもしれないじゃないか

72 :
>>66
この分野勉強して1番強く思ったのがこれ
目とかもすげーんだなって
あとは人間にそういう機能があるって解明した人もすごい

73 :
カギはネットワークなのか?
ネットワーク以外の構造ってないのかしらん?

74 :
>>73
生物の情報処理の根源はネットワークではなく
分子の相互作用だと言われている。

75 :
それは違う

76 :
分子の相互作用ってそれ全てそうだろw
すべて弱い力と強い力と電磁気力と重力って言ってるようなもんだぞ

77 :
複数の分子の相互作用と考えれば
ネットワークになるけどね

78 :
解けないけど

79 :
脳の研究は人権無視の中国が頑張ってくれそうだから
地道に時系列問題の解決を目指す

80 :
>>79
チュ国は人権軽視の国と勘違いされる事があるようだけどそんな事もないよ
音も葉もないかな

81 :
この連休数学も統計もついでにwebアプリの作り方もって色々勉強しようと思って手付けたけど全部中途半端で終わりそう
一点集中にするべきだよなぁって連休の度に後悔してる気がする

82 :
5教科の中で、どの教科が一番大事だと思いますか?
国、社、数、理、英。

83 :
>>82
目的は?
なにを目指すかによる

84 :
pytorchとtf、どっちを勉強すべき?

85 :
>>80
ウィグル人の人権についてはどうですか?
あるいは人体標本の話は?
https://blog.goo.ne.jp/sakurasakuya7/e/0201d90efa00152c5b2ac054bda9ee32

86 :
>>84
サンプルプログラムを読んだり、実行してみて、自分が探してるものか評価する。
もしかしたらどっちも合ってないかもしれない。

87 :
>>86
自然言語処理したいの

88 :
>>85
日本の外国人労働者問題についてどう思いますか?
http://news.livedoor.com/article/detail/15596666/

89 :
>>88
外国人技能実習制度の話ですね、技能実習生という名目で使い捨てただ同然で長時間働かせてポイする、というやりかたですね
移民解禁でこの選択を取らない方向に全体がシフトしていくでしょう

90 :
>>87
したいことを知ってるのは自分しかいない訳じゃん。それを実現する手段は後から付いてくる。
したいことに近いサンプルプログラムを探して、手を動かしてみては?

91 :
全然関係ないけど
見分けがつきにくい野草(トリカブトとニラ、みたいな)を判別できるアプリとか
需要有りそうじゃない?

92 :
毒キノコ欲しい

93 :
ディープラーニングは精度100%などあり得ないが一般人にはそれが理解不可能なので毒物判定のような命に関わるものを扱うのは危険すぎる
どれだけ丁寧に「開発者は一切責任を負わない」などと書いていても何かあれば叩かれるのは明白だから

94 :
>>93
とはいえ現場でいえば代替案を出せとかめちゃくちゃなことを言われるからな。。
いやそのプロジェクト止めろが代替案だったりするわけだが、大きな金が動くとどうしてもね。

95 :
原子力発電はそれで止まってしまったゾイ

96 :
>>91
現実には写真を撮って
「これ食べられる?」
ってツイッターとかにあげるのが
一番の早道

97 :
あらゆる物を毒物と判定するジョークアプリにすれば良いのさ

98 :
>>95
福島見てりゃ日本人がいざという時誰も何も責任取らんことはよくわかっただろ。
それでもまだ作らせるとかバカか?

99 :
地位と権力を持つ人の
責任感や使命感が
ぼろぼろだね

100 :
脳なんて鼻水作ってるだけだぞ

101 :
>>99
世の中は所詮損得勘定で、だれも損なことはやりません
損得勘定でも世の中が回る仕組み(制度設計)を作るしかないかと
戦前の日本は、学府に進む学生は「みどことらがある」として地方の有力者から援助を受けるのが常で、顔の見える他人に恩を受けて学資を支援してもらうため、恩を感じて恩を返すために粉骨砕身で献身したと聞いています
つまり昔はわりとうまくいっていた面もあるとのこと

102 :
>>82
国語

103 :
>>54
専門分野を持ちコードを書ける奴が一番。

104 :
>>102
私たちが受けてきた国語教育は意味があるのかな?問題が多いのじゃないかな?
私が「国語力」を増進できた授業は英文和訳でした、訳文が日本語として共感できないものだと「横のものを縦に直しただけですか?」とか相当に教官から苛められました…

105 :
外国語学部の不要さは異常

106 :
>>105
お前の方が不要だろ

107 :
>>14
残念、明日を入れても 1800 語レベル/実際に覚えたのは 950 words で終わってしまい、英検準1 級レベルにはとどきませんでした
それに、もう今後は新しい単語は仕入れずにひたすら長期記憶への定着をはからなくてはいけません、ここであきらめては全ては水の泡、これからの定着作業が勝負の分かれ目です

108 :
単語集ってどれくらい知ってるかチェックするものであってそれを使って暗記するのは本末転倒。

109 :
それだけ意識高ければ無理やり英語圏に住んだ方が早くね?

110 :
>>108
その意見はよく理解できます、なぜならば、これまでの私の意見でもあったのだから
ISO/IEC9899:1999 を舐めている最中ですが、このまま辞書を引きながらやってもだめなんじゃないか…とふつふつと湧いてくる感想が持論と正反対の行動に駆り立てたようでした、非日常の10日間に、10日間でできる変わったことをしたいなあ、と

111 :
あなたのレスの書き方が他の人と違うことに気づいていますか?
気づていないなら教えてあげます
他の人と違っており浮いています
そして私はあなたのレスが嫌いです
バカ丁寧な口調であなたの語りが長々と書かれているスタイルに不快です
改善してください

112 :
>>111
ブーメランw
縦読みどこよ?

113 :
>>111
専用ブラウザを使ってトリップを無視指定に加えていただければ、そのままで消えますから、それをお試しくださいな…

114 :
「QZaw55cn4」を選択してNG処理->NGNameに追加

115 :
よし(๑•̀ㅂ•́)و✧
英単語云々はスレチだろう

116 :
kubeflowを使っている人はいるかしらん?

117 :
>>84
2,3年前まではtf一択だったが、最近の論文発表とかを見るとPyTorchを使ってる例が増えている。
前、mediumに乗ってた両者の定量分析記事だと現在の比率は7:3位。
Google Trendsで見ると解りやすい
https://trends.google.com/trends/explore?date=today%205-y&geo=US&q=pytorch,tensorflow
多分、あと2年位でPyTorchが追いつくと思う。
したがって、今からやるなら両方使えるのがベスト。順番付けをするなら最初に抑えるべきはtf、次はPyTorch

118 :
>>117
practical adviceをありがとう

119 :
tensorflowはdefine-and-runでpytorchはdefine-by-runなのでpytorchの方が柔軟
動的に構造が変わるようなネットワークも書きやすい

120 :
tensorflow2.0からはdefine by runがデフォルトになって必要に応じてandの方も選べるハイブリッド型となっている

121 :
>>119
ところが今はeager modeでtfでもDefine-by-runで書けるようになってるんだなこれが

122 :
他の計算ユニットに投げる場合はどうせestimatorのインターフェイスになるから
どっちにしろ変わらんよ。
そんな些細なことで躊躇するようならこの分野に手を出さない方が正解。

123 :
>>121
えええーそうなんか

124 :
ライブラリは腐るかも知らんけど、理論は腐らんからちゃんと理論勉強しとくのがいい

125 :
ブームは終わるけどな20年後ぐらいに役立つよ、たぶん、きっと

126 :
画像分類モデルを作りながら勉強しているのですが、正常と異常を分類したいとして正常画像しか学習用に用意出来なかった場合でも異常を識別するモデルを作ることは出来ますか?
もし可能であればどのようなキーワードや手法の名前で調べると良いでしょうか
初歩的な質問で申し訳ありませんがアドバイス頂けたら幸いです

127 :
>>126
前スレでは半教師あり学習、PU learningや能動学習といったキーワードが出ていた

128 :
Tensorflowは2.0でほとんど全書き換えをやってる。
そのため、2.0はそれ以前のものとはほとんど別物
(とキャシーは言ってる)
https://hackernoon.com/tensorflow-is-dead-long-live-tensorflow-49d3e975cf04

129 :
>>126
異常検知

130 :
Open AIの決算報告書が開示されたので貼っとく。
ポイントは、研究員の平均報酬は約50万ドルくらい。
ここの研究職のレベルは日本だと東大教授とか理化学研究所の上級研究職と同じくらい
なので一般技術者とは比較にはならないが、Redditの書き込みによるとOpen AIは非営利なので、
GoogleとかAppleとか営利は(Goodfellowレベルのトップ研究者には)もっと出してるはずとのこと。
他、全10名程の研究員が使用しているクラウド環境の使用料は年800万ドル
最初のStyleGAN(this person is not existの元ネタ)の論文が発表された際に、推奨動作環境は最低1024TPUv3が必要と示されていたが、
Open AIの環境は正に、最先端のAI研究には膨大なCPU/GPU資源(=資金力)が必要となっていることを示している。
https://regmedia.co.uk/2019/05/02/openai_tax_2017.pdf

131 :
openaiの人が年収5000万円でも許せるけど
理研が5000万円はどうかと思う
小保方みたいなチームリーダーのポジションでしょ?

132 :
アメリカは高学歴無職が社会問題化してるのも深刻だが。
極端すぎるんだよ

133 :
理研はそんな給料ないやろ
まあだから優秀な人間が流出するんだろうけど

134 :
理研も東大もそんなにもらってないよw

135 :
どこに突っ込めばいいのか、
アメリカは優秀なのにはいくらでも払ってくるだろう
理研も東大も雇用は保証されるが給料は国家公務員なみだろ
>小保方みたいなチームリーダーのポジションでしょ?
アホだろ

136 :
機械学習を通じて学んだ知識、ブームが終わっても腐る気がしないんだけど

137 :
データ突っ込むだけで簡単に結果が出てくるようなソフトが使いこなせるだけというスキルはあっという間に陳腐化するがその根底で動いている仕組みの知識は陳腐化しない

138 :
>>136 AI,機械学習は一過性のブームなんかじゃないよ。
ツールは色々変わっていくだろうけど考え方の基本はそれほど大きく変わらないと思う。

139 :
>>136
同じく
数学や確率統計の理解、CSの基礎は血肉になってる

140 :
カーネル主成分分析に関して質問です。

カーネル行列の固有ベクトルaの各成分って高次元への射影後のベクトルの、高次元の世界の主成分軸への射影を固有値で割った値になっていますが、固有値で割るのはどういう意味、効果があると解釈すればいいのでしょうか?

あるテキストだと固有ベクトルを固有値で割ってnormalizeするって書いてあるんですが、固有値は標準偏差の値では無く、分散の値ですよね?よく分かりません。

141 :
>>140
それ何語?

142 :
>>140
rand関数で生成された乱数は分散であるがその割合がガウス分布として出力されるようになっているのであれば
平均を0としてσの範囲内にあるかないかってことだ

143 :
2030年代の機械学習って
今よりも、どれくらい進歩していると思いますか?

144 :
量子コンピューターの開発に依存? >>143

145 :
素人だけど
学習の高速化 シンボリックを含むこと
モジュール化
構造の自動生成
複雑な構造の解明と作成
こうした研究のその先にあるものでしょ?
やっぱりAGIかなー

146 :
>>143
オワコン

147 :
機械学習スタートアップシリーズって微妙なやつもあるよね

148 :
その勉強の先に何があるんだ、みたいなほんとうに触りだけの奴も多いな
最初から突き放してあげた方がある意味で良心的

149 :
理解しました。
これは高次元の世界の主成分軸の単位ベクトルの大きさを1とする制約からくるものですね。
固有値で割らなかった場合は主成分軸ごとに単位ベクトルの大きさが異なるからグラフにしたときに升目の形が長方形になってしまう感じ。

150 :
画像認識で教師なし学習って可能ですか?
例えばネット上の色んな画像をランダムに学習させてあとから犬の画像を抽出できるようにするとか

151 :
教師無しと教師有りに本質的な区別はない

152 :
>>140
自分の理解だと
高次元空間における主成分軸への射影ではなく、高次元空間に射影した時点で
自動的に主成分分析っぽいことができていて、あとはスカラーを調整するだけだったような

153 :
https://tjo.hatenablog.com/entry/2019/05/10/190000

154 :
>「このまま今の仕事を続けていった場合、一体自分はどこに向かっていくことになるんだろうか?」「10年後に果たして自分の仕事はあるんだろうか?」と不安に駆られるのも無理からぬことだと思います

155 :
長い

156 :
キャリアの先が不安だから
データサイエンティストではなくエンジニアの方になったわ
やること多くて反吐が出るけど

157 :
高度IT人材が数十万人不足!とか騒いでる側から、現職中堅からこんな声が上がってるとはね
AI、AI!はただの号令で実態はこんなもんなんだろうな
数年後には年間数万人規模の大学出AI人材輩出されるらしいが現場はどうするんやろ

158 :
結局システム作らないと行けないから、論文書くような人以外は、従来型人材が必要なんでないかしら

159 :
50代の偉いポジションの人なんかはメール使うのがやっとというレベルでありその人が考える高度人材だから実際はお前らが想像するほど高度ではない

160 :
松尾豊あたりが入れ知恵してるんだろう

161 :
svmで分類出来る程度なら勝手に皆成る気がする

162 :
>>149
理解しているのかしていないのか分からないけども
1. 高次元への写像
2. 主成分分析
という2段階のステップがあり、固有値、すなわち分散で割るのは主成分分析によるもの
次元削減で使う主成分分析も固有値で割るでしょ?

>>152
自動的にできるというのが言い方は微妙だけど
分類できるようにカーネル関数を選択するというのが正しい

163 :
>>150
分類はできるけどそれが犬であるかどうかは教師が必要

164 :
>>156
データサイエンティストって言っても多くは前処理要員だと思う
DataRobotにデータを食わせるためのエンジニアに近い
あるいは出てきた結果を偉い人にわかるようにWordやpowerpointに貼って説明する仕事

165 :
偉い人にデータサイエンスブームが来るだけでは?
他人にやらせるより自分でできた方が良いだろ
pl理解するノリでデータサイエンスが必須スキルになるのでは?

166 :
ほにゃらら人材が何万人不足ってのは
「安く使い倒せる人材」が不足って意味だからまともに受け取ると死ぬぞ。

167 :
画像で犬が認識できるようになるには何層辛い必要なんですか?

168 :
何層くらい

169 :
>>166
第五世代の頃もそう言われていて騙されたw

170 :
>>167
CNNを3つ、すなわち畳み込み層とプーリング層を3つずつで6層かませて、その出力を全結合でうけたら結局最低7層くらいじゃないかね?

171 :
>>156
まぁ部署がなくなったりするよりはいいだろうw

172 :
>>170
そんなもんで行けるんですね
思ったよりコスト低かったです
ありがとうございました

173 :
>>162

しつこくてすみませんが、通常の主成分分析で固有値で割るっていうのが分からないです。
例えば3次元のテストデータ100個を主成分解析で2次元にする場合、

1. テストデータ(100X3)を標準化(平均0化&標準偏差で割る)する
2. 共分散行列を求める(3X3)
3. 共分散行列の固有方程式を解く
4. 固有値が大きい順に対応する固有ベクトル2つを並べた行列(3X2)を作る(※固有ベクトルの大きさは1)
5. 標準化したテストデータ(100X3)と4.で計算した行列(3X2)の積を計算する

の手順だと思いますが、どこで固有値で割る計算をする必要がありますか?はじめに標準偏差で割るのと関係しています?

174 :
>>173
単なる次元削減だとその通りで固有値で割るプロセスはないよ
PCAの出力をさらに分類に用いているから固有値で割る意味がある

175 :
共分散行列の寄与度の話が横割で入ってるからややこしくなってる
きよど=対象軸の固有値÷行列のトレース(固有値の総和)

176 :
固有値大きいものの軸を残すのだから
寄与度も見とけという話

177 :
>>175
今は寄与度の話ではなく正規化の話です

機械学習で分類をさせる場合に、最初の前処理として正規化します

PCAで座標系変換したので、新しい座標軸で正規化をしただけです

難しいことは言っていないですよ

178 :
>>140を呼んでなかったな
固有ベクトルを1に規格化してるだけじゃね?
変換行列をユニタリ行列にした方が扱い易くなるし

179 :
>>178
同じく質問を正しく理解してなかったかも
もしかしてこういう回答が欲しかったのかな

分散共分散行列 Σ
ある固有値λ=σ^2 固有ベクトルx

質問: 固有ベクトルの正規化はx/σではなくてx/σ^2はなぜですか?
回答: Σ=XX’で次元はσ^2だから。実際対角成分は分散が並ぶ。

180 :
レス下さった方ありがとうございます。

181 :
>>150
ネコは可能だけど犬はどうかな

有名なヤツ
http://zellij.hatenablog.com/entry/20130608/p1

182 :
文科省が○○万人不足!って騒ぎ出したらたいてい作りすぎで失業者の海になる

183 :
余って値崩れするくらいがちょうど良いんだよ。
経団連的には。

184 :
役所の肝いり人材増やそうとした業界は地雷だから進路をとるのはオススメしないところになる

185 :
>>184
ホンコレ

186 :
AI人材の給料は新卒でも800万以上からスタートと聞いたけど違うの⁉

187 :
>>186
米国の話しね。
日本のサラリーマンは
まだ年功序列賃金が根強いので。

188 :
日本ではどんなスキル持ってても新卒は300〜400万スタートで固定

189 :
>>188
パナだっけスキルがあれば1000万払いたいって記事みたけど。

190 :
給与に期待したければ素直に外資行く

NTTも高度人材には1500万以上出すとか言ってたけど、
内部調整が上手くいかずに形骸化
日本企業で現場が管理職より高給を貰うと内紛が起きる

191 :
ノーベル賞取る社員が出ても変わらんのな

192 :
コーディング(java or python,SQL,フレームワーク)
設計(デザインパターン,UML図)
数学(線形代数,微分積分,最適化数学)
統計学(大学一年レベル)
基本的なアルゴリズム(ロジスティック回帰,SVM,ランダムフォレスト,決定木,カーネル化)
DeepLearningの基礎(ニューラルネットワーク,RNN,CNN)

最低限、この程度のことをわかっていれば業界に入れる気がする
やってみれば簡単だし、すごい人材だとは思わないけど、どこにでも転がってるわけじゃないよなあ

193 :
>>192
業界に入れても金にならない

194 :
俺なら初期ステこのぐらいで20代前半だったら全力で育てるけどな

195 :
そのステでどういう仕事あるんだろ。雑用の予感しかしない。
若ければいいけど

196 :
>>194
お前を使うほうに就職してるよ

197 :
>>195
エンジニアにするしかないからPGからじゃない

198 :
>>195
web系(大手)かSIerに就職だろ

199 :
どっちかというと、業務用webアプリケーションを開発しているところの、
機械学習エンジニアの求人にひっかかりそう

200 :
ほぼワイのステだからね。ですよねーって感じだ。

201 :
>>186
日本は博士号持ってれば基本的に初年度は基本給22マン程度、次年度から36マン程度になり、入社5年でだいたい80マン位になる

202 :
エンジニアになるにしても
新卒なら大学で何を習っていようがPGの下積みは必要だし
データサイエンティストになるにしても
たぶん前処理の下積みは必要なんじゃないかなあ

203 :
ちょっと意見を聞かせてほしい
AIの勉強会をやるとかで話す内容丸投げされて途方に暮れている。まぁ3回目なんだけど

一応他の社員が聞くわけだからなんか何かしら勉強になるものを提供したいと思うの
でも最近AIブーム終了だのコモディティ化しただのそんな話も聞こえてくるし
ヒントン先生がバックプロパゲーション後悔してるとかディープラーニング自体いずれより凄い技術に置き換えられるのではとか

そんなわけだから機械学習とかAI分野で色々技術が進歩しても大事になりそうな物って何だと思う?
例えば数学とか統計は間違いなくそうだろうなって。まぁプレゼンしても全然面白くなりそうにないのが困るけど
個人的にデータラングリングとか前処理とかはきっとずっと必要だろうしその辺なら話せるかなとか考えている

204 :
>>203
説明変数、評価関数、最適化の関係は普遍的なことだと思う
むしろそれが全てみたいなところあるじゃん

205 :
>>201
5年目で80万もあれだが金払いのいいとこならあるとしても、博士卒は普通27歳なのに初任給22万って

206 :
>>203
ディープラーニングが台頭した今だってSVMやロジスティック回帰やら決定木やらはデータ分析で現役だし
ディープラーニングより凄い技術が出てきたってそうなんじゃないの

207 :
理系の博士号と取って、五年目で80万は平均値としては正しいかもなーって思った
俺はそういう世界のことよくわからないけど

208 :
ディープラーニングでうまく行かず
SVRを使ったけど
原因がわからん。

やっぱもっと勉強しないと
だめかなあ
今は勉強してなくても給料高いから
サボってしまう

209 :
統計も大事だけどその基礎として線形代数の方がもっと重要だな

210 :
>>205
初年度は研修生である事に違いはないのでその程度が相場

211 :
>>192
>最適化数学
はじめて聞く名前ですね…

212 :
最適化数学も知らないと臆面もせず書き込めることがこのスレのレベルの低さを物語っている

213 :
>>212
その「最適化数学」の中にでてくる technical term をいくつか紹介いただけないでしょうか?

214 :
専攻してなきゃそんなもんじゃねーの?

215 :
知らないことそのものを言ってるんじゃなくて、
自分が知らないことに対する態度のことを言ってるんだと思うよ

216 :
>>212
そいつは荒らしなのスルー推奨

217 :
プログラミングできなくても
ms-officeを使うように
中身を知らなくても
使うようになるよ

218 :
QZはC++厨房なので馬鹿にされるぞw

219 :
最適化数学くらいググればいくらでも出てくるだろ

だからこの擦れはレベル低いといわれる
(実際レベル低いけどw)

220 :
最適な解を求めるのは計算量などの壁があるので
現実には準最適解で我慢するしかないがな

221 :
そんな話はしてねーよ

222 :
住人は二極化の傾向

223 :
数理最適化なら普通によく聞くんだが、「最適化数学」でググると特定の本ばっかり出てくる…

224 :
>>207
平均はもっと低いぞ
アカデミックなら五年目で年収600も行かんことが多いし企業は残業次第じゃないか

225 :
>>210
俺が就活したときそんな求人見たことないが。まあ分野違うけど

226 :
>>224
そんなもんか
今はなんだかんだでオーバードクター向けの求人が多いから、
もう少しもらってるのかと思った

227 :
叩き上げの機械学習エンジニアからみると、
大学院でアカデミックなことを学んで、データサイエンティストになった人たちは輝いてみえるんだけど
お給料は俺らと大差ない上に、キャリアを考えたらエンジニアの方がずっと安定するのね
この国は技術や知恵に対する敬意が足りない

228 :
ポケモンをプレイしていた大人の脳には「ポケモン領域」が存在することが脳スキャンから明らかに
https://gigazine.net/news/20190507-brain-scans-reveal-pokemon-region/

これって昔流行ったおばあちゃん細胞だろ?

229 :
>>227
今まで日本式経営は多くが近代的だったためデータの持つ力が分からなかった
データを活用する方法と、データが経営判断・利益に直結することが知られてきたので、データ屋さんは徐々に需要増と予想

230 :
とは言っても特別扱いは無いだろね
色々な専門家が集まって企業は作られてるわけで、昔の花形分野の専門家と同じ扱いになるでしょ

231 :
>>229
その通りだね
データ関連事業は活性化すると思う

国の研究機関はさらにまずいね
データ関連のポジションがなくデータは研究者のサイドワークになっている
海外は米国、欧州、中国はデータ関連のポジションがある

232 :
まずは隗より始めよ。
国の研究機関で派遣のデータ関連の仕事あったよw
ポスト増やせないのね

233 :
>>232
パーマネントポジションという意味ね
派遣に任せるデータではなくて、博士号を持った研究者による専門チームが各国にある
派遣エンジニアはいくらでも必要だし雇用するけどもそれらを統括して将来構想を戦略的に練るポジションからして存在しない
データ戦略という概念がゼロ

234 :
>>233
そのとおり
派遣に丸投げで、論文の紹介すらできないんだもの。データ扱いたいなら自分が勉強するか、データ系の博士持ちせめて有期で雇って欲しい

235 :
久々に立ち寄ったらポジションくれくれスレになってた

236 :
>>223
制御数学じゃないんか?

237 :
間抜け乙

238 :
なぜ給料の低い国の研究機関に
ポジション求めるの?

民間企業でいいじゃん?
給料高いし変な縛りもない。

239 :
ポジションは外資のがちゃんとありそう

240 :
人材が不足するという割に国関連では求人してない矛盾を憂いてるのさ。憂国である

241 :
>>国関連
手が足らずに統計不正が起きるほどに人不足なはずなのにな。
マジクソだわ。

242 :
本当は日本捨てたい
この国みんな保身ばっかりで、みんなで少しずつ沈もう感がヤバい
日本脱出のために高度な技術身につけてると言っても過言ではない

243 :
そう言えば、坂本ボットがいなくなったな。いい加減なもんだw

244 :
>>219
google の結果や、そもそも web 上に展開されている知識ベースが必ずしも実体を正確に反映しているとは思っていないのです
旧来のカテゴリーなら OR(オペレーションズリサーチ)に属するとは考えていますが、じゃあ、なぜ OR という伝統的なカテゴリーを捨てて「最適化数学」とかいう変てこな日本語にしたのか、非常に興味があります
それに、その「最適化数学」は解析なのか代数なのか幾何なのか、それもよくわかりませんし

245 :
>>218
よくご存知ですね、ただ私は C++11 or later は、どちらかというとよくわからないと答えます、それはここで明言しておかないといけませんね

246 :
>>229
>日本式経営は多くが近代的だったため
それは褒め言葉ですか?

247 :
>>236
制御数学、というのは、いわゆるラプラス変換とかZ変換とかの部類でしょうか?

248 :
何でこのスレip表示なの?
かつて荒らされたことでもあるの?

249 :
表示されちゃいかんのか?

250 :
スマホかISP経由なら気にすることないでしょ
職場からカキコする人がいたら面白い

251 :
そりゃうっかり職場のwifiに繋がってることもありうるしこの手の業界狭いから下手するとすぐ個人にたどり着きそうだし

特に理由無くip表示にしてるならちょっと変わってるよな

252 :
>>247
受けるー

253 :
>>250
ipアドレス収集してその人が何やってたかをまとめてるサイトとかもあるし、家のipだとしても気持ち悪いよ

254 :
>>242
なにを今更
正直、親族がいなければ簡単に捨ててるわこの国
英語だけでなく、中国語の勉強はじめた
二十年後には日本の10倍、アメリカの2倍のGDPになってる中国に鞍替えします

255 :
オランダに移住して安楽死、という手段もあるぞ
http://karapaia.com/archives/52226875.html

256 :
>>254
さっさとシナへ行けよ、お花畑

257 :
でも実際、論文は出てるよ
20年前は「やってみた」系の論文は日本から量産されていたけど
今は「やってみた」系すら出てない

258 :
マーケッティングに統計を使うのは無理そうなんだけどなあ
まあやってみれば。私はやらないけど

259 :
>>251
何スレ前だかに意図不明で唐突にIP表示で立てたやつがいた
次スレからはワッチョイだけでいいと思うぞ、不便なだけなんだから

260 :
>>231
早晩データ分析の限界に気づかれると思う。
あたりまえだが限定的な得られたデータの範囲内でしかないし、過去〜現在を現してるに過ぎず未来を現すものではない。
過去の延長にはない未来予測=リスクを取らない意思決定や経営判断は、命懸けでリスクを取ってくる連中にいずれ負ける。

261 :
製造業支援がいいかねえ
品質アップには役に立ってそう
中途で参入は難しそうだが

262 :
品質管理なんか人余り

263 :
>>258
マーケティングって統計学を応用できる最たる場所じゃないの

264 :
>>260
皆がそう思うから新たに人を取らないのは理解している
将来に限界が見えるから投資しないことと、最低限のインフラ整備の投資は別で考えなければならない
今は最低限すらないから相当やばい

これは水道の整備によく似ている
将来は人口が減るから水道設備はいらないと言っているようなものだ

蛇口をひねれば水が出てくるように欲しいデータがすぐ手に入る国と、川まで行って桶で水を汲むようにデータを使えるようにするまでに数日から数カ月かかる国では、研究のスピードがまるで違う

下水が整備されなければ病気が蔓延するように、専門家がデータの健全性を担保せねば、それを使った研究の正確性にも疑問符がつくだろう

研究の質と量を上げるインフラ整備に全く考えが及んでいないため、差はどんどん開くだろう

265 :
>>263
特段にそういうわけじゃないが、大学の研究や旧幾で入手しやすいデータがそういった類のものが多いために、国内ではそうなりがち(思いがち)と言えそう。
統計解析で見れば、医薬関連などのほうが歴史も事例も研究もずっと進んでいる。

266 :
>>256
鞍替えは冗談だけど、もう情報技術に関してはアメリカより中国の学会の方が評価高い
機械学習で食い続ける気概があるなら、中国語は必須さ

267 :
>>266
またお前か

268 :
中国行ったら迫害されんじゃね?
西側諸国と同等の人権がもらえる気はしないな

269 :
中国語習得しなくとも英語堪能なら中華企業行けんじゃない
てかあちこち手を出して一生下働きな戦略はどうなの

270 :
東大松尾研究室監修のエンジニア向け教育プログラム「DL4US」の演習コンテンツが無償公開
https://ledge.ai/dl4us-free-contents/

271 :
金平に朝貢してもトランプに息の根を止められる

272 :
>>269
でもあいつら英語でコードかかないし、論文も英語化しないからなあ
自分たちを世界の中心だと思っていやがる

273 :
>>272
実際にその通りだから仕方ないかもな

274 :
今や日本の方が賃金安いから中国が日本の工場に作らせる時代になったのになぜか日本人は中国に対して上から目線になってしまう

275 :
なぜか媚中が偉そうにする今日この頃

276 :
この分野の勉強してれば嫌でも中国を意識せざるをえないから仕方ないでしょ

277 :
著作権、金型、企業秘密もシナに盗まれる

278 :
>>277
どの世界の話しだよw 機械学習分野でそんな必要ないよ、日本は周回遅れだもん

279 :
機械学習の理論に関わるぐらいのクラスの人なら
中国の急速な台頭で、ゲームのルールが書き換えられてしまったことに気づくわ
以下に漢民族とアメコーの知識を吸収し、日本に還元するかというところがこれからのミソ

真の愛国者は中国語を勉強して彼らの論文を読んで平たい日本語で書籍を出す
俺たちはその愛国者たちを尊敬し、彼らが紹介してくれた技術をありがたく使わせていただくのみ
中国語を勉強する者を媚中と罵るなんてもっての他だから

280 :
>>278
すまん、お前には企業秘密はなかったな

281 :
昔の日本の位置に支那が来たことに気づいていない人は早く目を覚ました方がいい

282 :
よけいなお世話だ、シナのスパイ

283 :
機械学習の論文なんて中国人ばかりなのに、読んだことない人が一人でイキッてるようだね

284 :
例えばどれ?

285 :
科学研究 中国が躍進 論文シェア、半数首位 米と2強、日本低迷
https://mainichi.jp/articles/20190506/ddm/002/040/088000c

中国が科学論文数で初めてアメリカ合衆国を破り世界トップに
https://buzzap.jp/news/20180123-china-st-studies/

| 中国なんて劣化したパクリと海賊版だけだと考えている人は完全に時代遅れということになりそうです。

286 :
これからは日本が中国のコピーをしなければならない時代

287 :
>>284
企業秘密を教えてちゃんwww

288 :
>>281
>昔の日本の位置に支那が来たことに気づいていない人は早く目を覚ました方がいい

とはいえ、20年前に戻ってみても、日本がアジアで突出していたわけでもなく。シンガポール、台湾、香港、韓国と横並びだった。ようは、興味が薄れてしまった時代だった。

289 :
>>287
シナの論文を読んだことないということね

290 :
>>285
シナのゴミ論文が多い(大爆笑)

291 :
>>279
「ゲームのルールが書き換えられた」に禿同。
中国語を覚える気はないけど、オープンソースのプロジェクトのメーリングリストがいきなり中国語になって困惑させられることはたまにある

292 :
論点のすり替え失敗

293 :
実際拝借しとるぞ
英語論文だけど

294 :
自分もだが、普通の人が読めるのは英語で書かれた中国人の論文までだな
中国は独自の AI 文化を築いていくのでしょう

295 :
おいおい
中国人の論文も英語のものは
目を通しているがマジでクソ論文だぞ?

欧米の論文をパクッてほんの少し変えて
新しい理論として書かれていたりする。
まじ呆れてボーぜんとするよン

296 :
>>294
昔の日本は外国からそう見えてたんだろうな

297 :
朝鮮人はそう考えるだろうな(笑)

298 :
もっと危機感持った方がいい

299 :
むしろ中国語分からない学習できないという状況になる方が理想的
従来の欧米中心のルールは書き替えないと日本は未来永劫
欧米の真似をするサルで終わるだろう

300 :
>>259
IPスレなのにこの進行速度は異常
次もIPスレでよろし

301 :
早いってこと?
ないほうがありがたいけど

302 :
じゃ、IP賛成

303 :
中国酷いというヤツと中国凄いというヤツがいて面白い

中国人研究者の数が多すぎて、論文数が評価軸になるからクソ論文が大量生産されて、査読のためにクソ論文を大量に読まされる被害者がいる

一方で欧米の大学院はどこにでも中国人がいて、何割かは優秀な中国人がいて、帰国して企業に入って金の力で海外の有名な研究者を呼び寄せて結果を出し続ける研究者もいる

翻訳もBaiduがGoogle超えてるとも聞くし中国を侮るのはどうかと思うが、中国人のお陰で研究というものが陳腐化した印象はある

304 :
アホくさ、中国酷いと言ってるやつは論文なんか読んでるわけないじゃん

305 :
>>302
i223-217-42-3.s42.a014.ap.plala.or.jp

306 :
>>305
恐い
UQ036011224001.au-net.ne.jp
ac216001.dynamic.ppp.asahi-net.or.jp

307 :
きもちわるい。。

308 :
やだやだ
UQ036011225001.au-net.ne.jp
KD106180024001.au-net.ne.jp

309 :
ここってそういう晒し方するのね。二度とこないわ

310 :
このスレってこういうとこなんだ、
知らんかった、俺も二度とこないわ

>>303
良くも悪くも中国中心に回ってるということ。lecun の研究室だって中国名の人ばかりだ

311 :
人に喧嘩うっといて、馬鹿じゃね

312 :
中日翻訳で日の本を属州化してもいいんやで

313 :
マーケッティングって名義尺度や突発的な事態にが
最大要因になることが非常に多い。
例えば、トランプが中国への関税を上げるとか、大地震などの
災害が起きるとか。こんなものは数値化できないし、前もって
予測できない。これをどうやって統計に乗せろと?

314 :
>前もって予測できない。これをどうやって統計に乗せろと?

それちょっと考え違いがあるようだ
それだからこそ統計なんですよ。
わかってもらえるだろうか。

315 :
統計を勘違いしてるね

316 :
>>313
統計に落とすなら極値統計学だね
ある期間の中でどのくらいのリスクが発生するかを予測する
ワイブル分布やガンベル分布って聞いたことない?
実際に金融工学のリスク算定に使われている

317 :
統計は未来を予測するだけのものじゃない

318 :
IPアドレス 153.143.156.86
国 Japan Geolocation country flag
都市 Saitama
郵便番号 337-0042
緯度 35.867
経度 139.65
天気 View Weather
タイムゾーン +09:00
現地時間 16 May, 2019 03:46 AM (UTC +09:00)

319 :
IPアドレス 126.233.158.206
国 Japan Geolocation country flag
都市 Kurayoshi
郵便番号 682-0021
緯度 35.433
経度 133.817
天気 View Weather
タイムゾーン +09:00
現地時間 16 May, 2019 03:49 AM (UTC +09:00)

320 :
携帯からならばプロバイダが固定されないからまだいいが、教育機関端末からの書き込みはDSNまでばれるので気をつけてね

321 :
少し訂正
教育機関lan及びwan環境

322 :
もうワッチョイのみで新スレ立ててけろ

323 :
test

324 :
>>316
極値統計は、数学的には
怪しい気がする

325 :
高橋 倫也しか提唱して無くね?

326 :
>>319
これはおかしいな。
正しくは

国 Japan Geolocation country flag =>Saitama-koku Geolocation country flag
都市 Saitama

327 :
失礼しました

328 :
スレチかもしれないけど、
画像や映像から体骨格と肌の色をリアルタイムで認識して、
全裸のポリゴンを服の上からARみたいに被せることって技術的に可能?
教えてエロい人!

329 :
siggraphで見た気がする

330 :
全裸じゃなくて服の方だけど(笑)

331 :
エロイのは好きだが別にエロい人ではない

332 :
ニューラルネットワークでは層を多くすると勾配消失問題が発生するそうですがディープラーニングではどのようにそれを回避してるんですか?

333 :
本に書いてある

334 :
https://i.redd.it/1mo7is3meix21.png

335 :
>>186
AI初任給800万は、東大京大東工大の修士でGoogle入社した場合。
Microsoftもそれくらい出してると聞いたことがあるが、修士に800万も出すところは普通はない。
外資系でもOracleとかは大卒、修士平均よりも月給換算で数万円上回る程度。
基本的に、初任給が平均よりも極端に多いところは、周り中がMITとかハーバードとかなので、東大卒程度の低学歴では生き残りが難しい。
大体、平均在職期間は2年を割ってる。

336 :
んで君の学歴は?

337 :
>>336
専門学校

338 :
>>334
top100に入ってる日本人は杉山先生だけ?

339 :
>>338
上位はLast Authorの数だから研究室運営力か研究グループが素晴らしいと言うことかな
単発でいい論文を書くと言うよりも、いい論文を量産出来る土壌を作っている人が評価されるランキングだね

340 :
松尾某w

341 :
中国系の多さよ。。。

342 :
>>336
普通高の高卒です

343 :
>>341
中国語を勉強しています
いずれ日本は中国に頭を下げる必要が出てくるだろうと思っているからです

344 :
中国人の捏造クソ論文を
チェックするときが最も憂鬱だ
シナ人皆殺しにしたくなる

韓国は終わってるから無視だ
大不況の韓国ざまあw

345 :
>>343
中国人で日本語がペラペラな人がこれだけ多い中で、どの立ち位置で自分が活躍するか考えた方がいいよ
日本人で中国語が少し話せるくらいなら全く話にならないよ

346 :
>>345
>中国人で日本語がペラペラな人がこれだけ多い中

これには理由があるんですよ、すなわち中国語話者は日本語をマスターしやすいし、同様に日本語話者は中国語をマスターしやすいのです
中国語をやってみればわかりますが、中日で漢語の33% はほぼ一緒、33% も理解可能(理解に苦しむほど変わっているわけではない)、中日でそれぞれに固有な漢語は 33% だけですね
英語のようなまるっきし別の言語をやることに比べれば、漢字を1万字程度すでに知っている日本語話者にとっての中国語は、英語よりもはるかに容易だと感じています

欧米系の方が中国語をマスターしようと思ったら、まず漢字を1万覚えないといけないし、漢語(熟語)も1万くらい覚えないといけない、このハードルは大きいですね
アメリカの冒険投資家ジムロジャーズも、中国語は自分の子にマスターさせる、というフリカワリでやっていくようですが、確かに欧米系からみた中国語は理解不能な暗号たりえます

すでに英語をある程度理解できる日本人であれば、3年ほど中国語を勉強すれば、欧米への橋渡し的な役割でも食っていけますね…

347 :
早く日本から消えてくれ

348 :
>>345
というか、中国人に頭下げて質草を入れてカネを借りる事態になるのでは、と予想していますね

349 :
>>348 自分の意識が低ければそうなる。
大志を抱け。

中国語も良いが当然英語はマスターしてるんだろうな。 なんか本末転倒してる様な気がするが。

350 :
金の為にシナ竹に魂売るQZ、馬鹿乙

351 :
仕事は仕事だよ、厨房w

352 :
>>349
>英語はマスターしてるんだろうな
これは痛いところを突く質問ではあります…

353 :
リアル中卒か

354 :
子供の早期からの英語教育の話題になると「まず日本語からしっかり学べ」と指摘する人が湧いてくるが日本語しか使えない人と英語しか使えない人なら後者の方が圧倒的に使い道が多いんだよな

355 :
>>354
当たり前のこと

356 :
でも日本語の読み書き話がおかしい人がたくさんいるし
論理展開も無茶無茶な人も多い

357 :
>>354
「日本語をしっかり学べ」ってそういう話じゃねーだろ。
やっぱ日本語をしっかり学ばないとダメだな。

358 :
外国に人材流出してほしくないから、
リスニングとリーディング以外は鍛えてほしくないんだろ
社会のあり方としては正しい
でも個人でずる賢く立ち回るには英語の技能は必要・・・なんだが自分は苦手なんだよなあ、語学

359 :
そう言えばフォニックスやらないよね

360 :
>>356
英語で論理展開できてるならそれでいいだろ

361 :
>>354
母国語をなおざりにして英語やってると日本語も英語も中途半端で可哀想な事になるリスクがあるという話

362 :
>>361
それは普通のレベルの帰国子女の方にとっては特に深刻な事態だとききます
いわゆる「セミリンガル」というやつですね

363 :
高度なAI人材(トップカンファレンスに論文出した人)の数に関して
https://www.asahi.com/articles/photo/AS20190428000131.html
ここの人口10万人当たりの人数をみると英語がネイティブかどうかは重要な気がする

364 :
まぁ日本人が論文出すと、文法的なミスが多いとか査読で結構指摘されるよね

365 :
>>363
その理屈だと豪州とか加州とかは有力なはずではないかと、それに私の感覚では北欧がけっこう強いというイメージがあります

366 :
>>344
13億人コロすよりも論文チェックする方がラクやと思うで?

367 :
異常検知でオートエンコーダを使ったモデル作ってみたけどあんまりうまく行かない
正常と異常の分布が最初から完全に被ってると使えないような気がするんだけどやチューニングで何とかなるもんなの?
上司からは世の中検出出来てる実例があるんだから絶対できるだろって言われるんだけど…

368 :
転職の相談?

369 :
パワハラだね

370 :
>>358
逆でしょ
むしろ日本人&日本企業は英語習得して、積極的に海外展開していかないとジリ貧やぞ
日本企業でも外資でも両方働ける人になるのがいい
外国語苦手な人は、言葉以外のとこで頑張ればいいよ

371 :
>>367
やってみないと分からない、機械学習の怖さ
データ量が足りないか、モデルが違うのか、そもそも学習可能なのか
とかいろいろと考えられる

372 :
スタッフサービスのCMを思い出すw

373 :
このスレIQ高そう(笑)

374 :
>>370
そんなスーパーマンがわざわざ日本企業て働く意味ってないよね?
企業の将来性の点でも自分の能力向上の点でも

375 :
>>367
正常、異常のラベルはあるの?
人が見たら確実に異常と分かるようなものなのかどうかは一応の判断基準かな
人が判断できるなら特徴量の選び方を工夫する、モデルを工夫すれば何とかなる場合もある
人が判断できないなら単なるパワハラ

376 :
>>367です

>>371
>>375
ラベルに関しては正常が1万、異常が20あります
人が見ても一応異常と判断することはできます

ただ、欠けやキズではなく位置ズレなので軽微なやつは分かりにくいです
分布が正常の方が広くなっていて、異常は小さく、正常の中に被っていて閾値が引けないので
あまり水増しで画像を加工しないようにするのと対照の所を判断しやすいように画像のトリミングを行ってフォーカスさせて変化を見てみるくらいかなぁと思ってます…

アドバイス頂いた特徴量の選び方を工夫するとはどなような方法がありますか?

377 :
あぁ、実例があるって書いてあった
同業他社がすでにやっているなら原理的には可能かも知れないね
ただ世の中にはプロの囲碁棋士に勝てるAIがあるんだからお前も作れよ言われても厳しいね

あとはまぁオートエンコーダを使ってる理由によるかな
ラベルがないからと言う理由なら仕方ないが、入力が画像ならCNNをネットワークに組み込んだ方が性能が出るし、ラベルがあって特徴量が少ないならXGBoostを試すのもあり

378 :
>>376
画像から何らかの基準値が作られてそれが識別として利用できないなら基準値を変えることから始める
位置ズレを検出したい、かつ人間なら判断できると言うのであれば、結構な確率でそのようなネットワークは作れると思う

もし位置が重要であるならば、前処理として画像を2値化して白黒にしてしまうのがいい
正常と異常のバランスが悪いので、正常なデータだけを使ってVAEを組むのが良いが、オートエンコーダは検出能力が低いので、正常だけども異常と判断されるように閾値を下げる
異常と検出されたものの中から正常なものを除去するために、異常なデータを水増しして、CNNを組み込んだデータで2値分類をする
こんな感じかな?

379 :
異常値少なくね?

380 :
>>378
ありがとうございます
こちらから情報が出せないなか丁寧にありがとうございます

2値は試してみたのですが、元々の画像自体がそれほど鮮明ではなく
影などノイズも多く写り込んでいて2値化すると検出対象が特徴として捉えられませんでした…
正しい名称か分かりませんが、Convolutional AutoEncoderを使っています
ラベルに関しては元々正常しかありませんでしたが、評価用に正常をトリミングなどで加工して異常としたので元々は正常しかありません

あまり現実離れした異常を作ることは意味がありませんが試してみて変化するかとりあえず見てみます…

381 :
積率を定義するとどんな良いことがあるの?

382 :
just moment!

383 :
>>381
積率母関数(Moment Generation Function; MGF)のことでいいかな?
確率変数XのMGFが分かると、E[X^n]が簡単に求まるので係数を除けば
E[X] 平均
E[X^2] 分散
E[X^3] 歪度
E[X^4] 尖度
に使える

384 :
大学一年か二年でならう統計学の内容だけど
よほど理論的なところに関わってないと、実務で積率母関数を扱うことまずないよね

385 :
全モーメントが分かるとあーら不思議確率分布がわかっちゃうのよ

386 :
よく分からんけど便利なんだな
分かるようになるまで勉強してみるわ

387 :
確かに積率母関数を実務で使ったことない

よくある問題としては、正規分布に従う確率分布がn個(X1, ... , Xn)あり、各々二乗して全てを足したY=X1^2+...+Xn^2はどんな分布に従いますか?

答えは自由度nのカイ二乗分布になるんだけども、畳み込みを使って帰納法で解くのと、MGFを使って解くのどっちが簡単かというと、多分MGFのが簡単

388 :
>>380
二値分類問題であれば、まずは SVM を試してみるという方法もあるが

389 :
積率母関数て
タイムボカンみたいな響きだな

390 :
戦闘空母群みたいだな―と思ってたw

391 :
>>336
憤りを感じるのはもっともだが、東大PhDでも生き残りは難しいのは事実。
5年くらい前までは日本語処理とかで日本人を完全に排除することは難しかったが、
2014年以降は、ローカル固有の処理は排除し、多少、機能は劣っても共通基盤で統一する方向に進んでいる。
例えば現在のGoogle JapanのAI部門のトップは、スザンナ・イリックという強気の女性で、
AI部門の採用に関してはスタンフォード、MIT、ハーバード、バークレイ、カーネギーとかの指定大学制度を採用していて
他の大学の卒業者だと、書類選考で落とされる可能性が大(前にそれ以外は見る価値はないのようなことを言い放って一部で議論を招いた)
ただし、Googleのほかの部門に入るのであれば東大、京大、東工大であれば入社はわりかし簡単(むしろ最初は歓迎されると思う)。
あと、営業系だと、給与は他の日本企業と大して変わりはない。

392 :
んで君の学歴は?

393 :
あと、一点だけ書くと、AI以外の部門に東大卒で入るのは、やや問題がある。
なぜならば、AIとかの研究開発部門以外の部門に関しては、採用条件で大卒以上という学歴制限がないため
入社してマウンテンビューの本社に派遣されると隣の席の人は高卒ということになったりする。
高卒でGoogleに入るようなやつは大概の場合、プログラミングの天才みたいなやつが多く一般人だと勝てない。
さらに院卒と高卒だと年齢差が6年はあることになり、院卒の年齢だと完全に浮く。

394 :
>>392
コロンビア

395 :
>>393
Googleやyoutube使ってると
マジでクソなプログラムばっかりだ

天才を集めてるというが
誰が判断してるんだ?
人間は自分より知能の低い人間しか
理解できないんじゃないのか?

Googleには一部に天才的な人はいる。
それは認める。

しかし大方はクズの馬鹿だ。
六本木にいる奴なんてゴミばっか

396 :
ゴミと言われてでも1000万ほしいな。

397 :
技術職でGと同じ額出せる企業カマーン

398 :
>>395
どこがクソなのか具体的に

399 :
クレクレ受け身じゃなくサービス立ち上げたるぐらいの気概出しなよ
まぁそこが順調にいきゃ苦労しないんだけど

400 :
ネットのニュース記事に、有識者のコメントのように
自動でコメントするAIは実現可能ですか?
さすがに難しい?

401 :
むりぃ

402 :
YouTube の表示にバグがあって、報告しても、2週間以上そのまま放置される!
HTML, CSS, JavaScript, jQuery などを知らないから、修正できない

検索フィルターの条件に「今日」と入力しても、それ以前の動画も表示されてしまう。
もう直ったけど

403 :
>>400
おれは言語や翻訳の機械学習も
やってるが、
コメントの内容がありふれたものでいいなら
そんなに難しくはない。

404 :
基本的に、2ch とYouTube はテストせずに、本番用を変える。
漏れはYouTube に、何回も報告してる!

HTML, CSS, JavaScript, jQuery などが、おかしい

2ch も、IE11 では無限ループか何かで、操作できない!
UI がスタックして動かない

405 :
>>403
池上彰で頼む

406 :
( ´・∀・`)ソーナンダ

407 :
エキスパートシステムと機械学習の組み合わせでいける
参考にならないコメントしか作れないけど
ロシアが大統領選挙に介入した時のtwitterのコメントもたぶん
その技術で作られているんだと思う

408 :
google に入れる人は同業者が見ればすぐにわかるよ
格が違う

409 :
助さん角さん、やってしまいなさい

410 :
>>398
youtubeに犬の動画をUPしたら、
NHKの雲霧仁左衛門という
時代劇の著作権を侵害しているとなる。

300ほどの動画のうち20件は著作権侵害と
判定されるが全く別のもの。
機械学習がお粗末。

そして、間違い判定であると申し述べる方法がないのが問題。

411 :
>>410
twitterで中の人に文句行ったら?

412 :
大学3年生で、自分で機械学習を勉強してる者です、気になることがあるので質問させてください
機械学習の例としてよく文字認識があげられますが、文字認識自体はかなり前から実現されているように思えます(例えば電子辞書に搭載されてる、手書きの漢字を検索してくれる機能)
そういった一昔前の文字認識はどのように実現されていたんでしょうか

413 :
>>412
東芝 文字認識 pdf でggr

実社会での利用が広がる文字認識技術

414 :
ザウルスとかニュートンとかか
それもまた機械学習

415 :
>>413
ありがとうございます
こういった技術はオンライン文字認識と呼ばれるんですね、応用例も知れて面白かったです

416 :
>>415
パターン認識の教科書もちゃんと読んでね

417 :
>>404

> HTML, CSS, JavaScript, jQuery などが、おかしい
原因特定したつもりか知らんけど全く情報量ないやん

418 :
CNNってオートエンコーダよりだいぶ前に発明されてたんだな
画像認識だけならCNNだけで充分そうだけどなんでジェフリーヒントんがこんなに注目されてるの?

419 :
ヒントンの弟子がCNNつくったから

420 :
>>415 俺も検索してみたが OCRなんて手書き文字認識じゃないんだぞ。

手書き文字認識で重要な要素は書き順、画数なんだよ。 書かれた文字にはそれらの情報がない。 半世紀前に俺がやった。

421 :
>>420
画像を解析するんじゃなくて、どう風に何回書かれたかという情報をもとに認識するということですか
確かにその情報を使えば画像だけよりかなり高精度で識別出来そうですね

422 :
もはやタスクとしては一番優しいよね

423 :
>>422 昔の限られた資源で手書き文字をリアルタイムで認識するには、出来るだけ使える情報を使ったと言う事だよ。 メモリも殆どなかった時代だから。

そう言う工夫は今でも重要だぞ。

424 :
郵便番号自動読取区分機(東芝)
https://www.postalmuseum.jp/column/collection/post_27.html

これを念頭に>>413を書いた

425 :
電総研で森某がやってたな

426 :
〒は0とOの区別しなくて良いからな-

427 :
オートエンコーダが異常検知に使われてるって記事見かけるけど、微量な変化は捕らえられるのかね?
形状がダイナミックに変わるやつは検知出来そうだけどちょっとズレてますとか傾いてますとか分かるもんなのかな

428 :
試せよ

429 :
フリーでデータ分析の仕事を始めて15年になりますけど
2016年ぐらいからビッグデータバブル
という状況になりまして、
かなり高額の報酬もらえてます。
ビッグデータバブル万歳!

でも、もうすぐバブル崩壊ですね?

430 :
バブルのピークはもう過ぎたんじゃないでしょうか
ガートナーによると幻滅期に入ったそうですし

431 :
>>429
15年はすごいな。
どうやって仕事とってるの?
どんな感じの内容?

432 :
>>430 IoTの時代になるからますますデータ量は大きくなる。 分析からAIみたいな方向に移っていくだろうけど。
>>431 一度入り込めば継続的に仕事が出てくるだろ。 人手が足りないんだから。

433 :
ワイは入り込んだのかよくわからんまま、データ分析のフロントエンドやってるw

434 :
>>431
機械学習利用で25年喰っている会社もあるからね
今は、社員一人頭の売り上げが5千万円

435 :
経費が4千5百万

436 :2019/05/23
給料4千万!?
イイネー

Excel VBA 質問スレ Part53
C言語相談室(上級者専用)
日下部陽一著 作ってわかるCプログラミング(第6版)
NullPointerExceptionを「ぬるぽ」と呼ぶスレ6
Androidプログラミング質問スレ revision50
くだすれDelphi(超初心者用)その57
【初心者歓迎】C/C++室 Ver.105【環境依存OK】
Java入門・初心者質問スレ Part.9
データベースプログラミング全般スレ
お前らプログラミング言語どうやって覚えたんや?
--------------------
ゴールデンボンバー218
【ディズニーが】みつき Part1【惚れた】
【関西】おっさんおばさんオフ【最悪版】 Part.2
原油価格がマジでやばい
Elijah WoodNo.2【イライジャ・ウッド】
三菱FUSO社について語ろう8
【TOYOTA】86/BRZ★168【SUBARU】オーナー&納車待ちスレ
茨城県南の1パチ(または、2パチ)
【TESO】The Elder Scrolls Online Part149
DQ10 ドラクエ]ニコ生主晒し専用スレ★139
歯科技工士☆令和時代 第68期
里吉うたのちゃんの個人スレ無いけど何で?
【3密と】内務ゆうメイトの愚痴スレ155【壇蜜なら】
【三大政党】 自民党総裁選・民主党代表選・自治新党党首選 総合スレ 【日本最大の決戦】
【1世帯に20万〜30万円程度】現金給付は所得減少世帯に 経済対策、GDPの1割56兆円超を 3/25 18:00
【SFO・ORD】ユナイテッド航空 UA033便【IAH・EWR】
【信越】長岡と仙台、どっちが都会?【東北】
若ハゲになって人生転落した人
古本屋限定! 今日買った本! 9冊目!
日本文化チャンネル桜 スカパー板支部本スレ
TOP カテ一覧 スレ一覧 100〜終まで 2ch元 削除依頼