TOP カテ一覧 スレ一覧 100〜終まで 2ch元 削除依頼
【信者】C++の問題点【アンチ】
MFC vs .NET
【SL4】Windows Phone 7 アプリ開発スレ Part4【XNA】
インデントを強制しても綺麗なコードにはなりません
Lisp Scheme Part40
■暗号技術【ROUNDsurea】■
Excel VBA 質問スレ Part56
C++相談室 part149
Rust part8
サウンドプログラミング6
【GPGPU】くだすれCUDAスレ part8【NVIDIA】
- 1 :2016/06/15 〜 最終レス :2020/04/08
- このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。
CUDA・HomePage
ttp://developer.nvidia.com/category/zone/cuda-zone
関連スレ
GPGPU#5
http://peace.2ch.sc/test/read.cgi/tech/1281876470/
前スレ
【GPGPU】くだすれCUDAスレ【NVIDIA】
ttp://pc12.2ch.sc/test/read.cgi/tech/1206152032/
【GPGPU】くだすれCUDAスレ pert2【NVIDIA】
ttp://pc12.2ch.sc/test/read.cgi/tech/1254997777/
【GPGPU】くだすれCUDAスレ pert3【NVIDIA】
ttp://hibari.2ch.sc/test/read.cgi/tech/1271587710/
【GPGPU】くだすれCUDAスレ pert4【NVIDIA】
ttp://hibari.2ch.sc/test/read.cgi/tech/1291467433/
【GPGPU】くだすれCUDAスレ part5【NVIDIA】
http://toro.2ch.sc/test/read.cgi/tech/1314104886/
【GPGPU】くだすれCUDAスレ part6【NVIDIA】
ttp://peace.2ch.sc/test/read.cgi/tech/1348409867/
【GPGPU】くだすれCUDAスレ part7【NVIDIA】
http://echo.2ch.sc/test/read.cgi/tech/1416492886/
- 2 :
- 関連サイト
CUDA
http://www.nvidia.co.jp/object/cuda_home_new_jp.html
CUDAに触れてみる
http://chihara.naist.jp/people/STAFF/imura/computer/OpenGL/cuda1/disp_content
CUDA のインストール
http://blog.goo.ne.jp/sdpaninf/e/9533f75438b670a174af345f4a33bd51
NVIDIAの「GeForce 8800 GT(G92)」と次に控える64-bit GPUアーキテクチャ
http://pc.watch.impress.co.jp/docs/2007/1031/kaigai398.htm
CUDAを使う
http://tech.ckme.co.jp/cuda.shtml
NVIDIA CUDAを弄ってみた その2
http://dvd-r.sblo.jp/article/10422960.html
CUDAベンチ
http://wataco.air-nifty.com/syacho/2008/02/cuda_2044.html
KNOPPIX for CUDA
http://www.yasuoka.mech.keio.ac.jp/cuda/
- 3 :
- Linux* 上で CPU と GPU バッファーを共有する
http://www.isus.jp/products/c-compilers/sharing-cpu-and-gpu-buffers-on-linux/
GPUとGPGPUの歴史と特徴
http://www.cc.u-tokyo.ac.jp/support/press/news/VOL12/No1/201001gpgpu.pdf
第1回 GPUコンピューティングおよびCUDAについて
http://www.gdep.jp/page/view/248
GPUコンピューティングの歴史とCUDAの誕生
https://thinkit.co.jp/story/2010/07/02/1645
https://thinkit.co.jp/series/4792
https://thinkit.co.jp/story/2010/07/30/1678
- 4 :
- CUDAってその分野でかなり使われてるの?
Rx480買って5TFLOPSヒーハーしようと思ってんだけど、OpenCLよりCUDAの方がいいの?
- 5 :
- >1 乙
- 6 :
- ttps://ja.wikipedia.org/wiki/CUDA
デメリット
ハードウェアベンダーに依存しないOpenCLやDirectComputeと比較すると、
CUDAはNVIDIA製のGPUでしか使えないという制約がある。
このため、CUDAの機能に過度に依存したプログラムを書くと、
アプリケーションのポーティング・移植が困難になる可能性がある(ベンダーロックイン)。
また、最初からグラフィックス連携用途を想定して設計されたDirectComputeと比較すると、
(相互運用APIが用意されているとはいえ)
GPU演算結果をグラフィックス用途に直接利用する場合はオーバーヘッドが大きくなる。
- 7 :
- PyCUDA
ttps://mathema.tician.de/software/pycuda/
CUDA:「超並列コンピューティング」はじめました
ttps://codezine.jp/article/detail/8429
CUDAを使ったGPUプログラミング超入門
ttp://qiita.com/Keech/items/381495ed90e012d69f1a
CUDA で並列コンピューティング
ttp://www.nvidia.co.jp/object/cuda-parallel-computing-platform-jp.html
はじめてのCUDAプログラミング―驚異の開発環境[GPU+CUDA]を使いこなす!
ttps://www.amazon.co.jp/dp/4777514773
- 8 :
- CUDA自体は、ライブラリが結構良くできてるのが多い印象
open clは、まだまだこれからって感じかな
- 9 :
- amdがcuda採用しろ
- 10 :
- つ
http://gpuopen.com/compute-product/hip-convert-cuda-to-portable-c-code/
- 11 :
- っアー
- 12 :
- >>10
前にニュースみたけど
いつ、出来るんだろうか…?
- 13 :
- FPGAの替わりになる?
- 14 :
- ならないでしょ
- 15 :
- CUDAを使ってみたくて7.5をインストールしたんだけどSDKってどこにインストールされてるの?
- 16 :
- 2ch書いたりググったりしなくても、そのPC内で即分かる簡単なこと聞いてる時点でCUDAやらんほうがいいよw
- 17 :
- gpu computing SDK が無いってことならcode samplesがそれだよ
- 18 :
- >>16
一応2ちゃんで発表するのが礼儀
- 19 :
- 久々に来たがLink切れが多いな。
Ubuntuで勝手にデバドラがUpdateされて(CUDA非対応の最新版)しまうのを
止める呪文は何だっけ? 毎回忘れて、最初は調子良く動いてたマシンが
Updateの度に動かなくなって、Fxxk nVidia!って思う。
- 20 :
- CUDA5かなんかからメモリ空間が結合されてcudaMemcpyが必要なくなったとか言う文献をみたんだが、Memcpyいらないのマジ?
- 21 :
- もちろん
最近ミミズ見てて考えたんだが
我々って結局、管なんじゃないか?
管に管を維持するための色々な機能がついている、ような気がする
- 22 :
- >>21
単細胞時代に管はなかった
- 23 :
- イソギンチャクあたりまで管はないけどねぇ
- 24 :
- ゲームやめて()
AIしようと思ったがcaffe インスコできへんのやけど( ;´Д`)
error : identifier
- 25 :
- error : identifier "cudnnActivationDescriptor_t" is undefined
- 26 :
- エラーをまずは調べてみよう
- 27 :
- C:\Users\mypc\Documents\GitHub\DIGITS\DIGITS>python digits-devserver
Default value for torch_root "<PATHS>" invalid:
torch binary not found in PATH
Couldn't import dot_parser, loading of dot files will not be possible.
2016-09-01 01:41:59 [INFO ] Loaded 3 jobs.
___ ___ ___ ___ _____ ___
| \_ _/ __|_ _|_ _/ __|
| |) | | (_ || | | | \__ \
|___/___\___|___| |_| |___/ 4.1-dev
* Running on http://0.0.0.0:5000/
シンギュラリティー記念カキコ(*´▽`*)
- 28 :
- GPUでwebサーバー動かせる?
- 29 :
- 完全にCPUの置き換えとして用いるのは無理だろうな。
- 30 :
- GPUの中で処理が完結しないから意味がないか
- 31 :
- webサーバは動かせないけど
お湯なら沸かせそう
- 32 :
- 銭湯でも経営するか
- 33 :
- GPUは銭湯能力で優劣つけるべき
- 34 :
- >>21
生き物は円柱形 で検索
- 35 :
- http://www.newsweekjapan.jp/yukawa/2016/11/ai-4_2.php
「Universal Probability Language」って言う技術を使うと「東大君」が最近断念した
自然言語処理が出来るようになるらしいね
日本と英米だとこの分野は天地の差がある
- 36 :
- >その結果、われわれが達した結論は、「完成」の定義が人によって異なるのではないか、ということだった。
- 37 :
- >>36
なんでも完璧を目指すのではなく、ADSLやD-WAVE量子コンピューターのような
「現実解」を目指すと言う事
- 38 :
- >日本と英米だとこの分野は天地の差がある
「この分野」ってのが何を指してるのかはっきりしないけど
AI分野って意味では現状、天地の差と言えるのは予算で規定される研究規模くらいやで
まあそれが決定的な違いを産んでるって言えなくもないけど
金銭的バックアップのもとで色んな種を蒔く余裕は日本の科学技術界にないからね
あとその件の技術は記事の本文でも疑ってるけど、
所謂「中国語の部屋」の完成を目指しているものなんじゃない?
×「東大君」○「東ロボ君」の新井さんの講演聴いて懇親会で話もできたんだけど
東ロボ君プロジェクトはそもそも現状のAI技術の限界をある程度認識してて、
その上で入試問題への挑戦っていうベンチマーク的な実践実験で証拠を提示するってことをやってたよ
そもそも東ロボ君は技術的に新しいことをやるというより現状の技術の可能性と課題を洗い出すためのプロジェクトだし
その成果の一つが自然言語の意味的理解の困難さを示したってことだよ
つまり今回「断念」って報道のされ方をしたお話ね
繰り返すけど自然言語処理(中国語の部屋)とは違うお話だよ
- 39 :
- 今CUDA by Example 汎用GPUプログラミング入門を読んで勉強しているんですけど
この本のサンプルコードってもう手に入らないんでしょうか?
- 40 :
- >>39
https://developer.nvidia.com/cuda-example
ここのzipじゃいかんの?
- 41 :
- >>40 ちゃんと探せてませんでしたありがとうございます。
- 42 :
- windowsでcudaやってるんだけど
visual studio commutity消してcl.exeだけ残しておけば
コンパイル通る?
- 43 :
- リンクしなくていいのか
- 44 :
- >>43
シャンプーの後にはちゃんとリンスはしてる
- 45 :
- cl.exeだけじゃコンパイルも出来ない。
コンパイラ本体は c1.dll と c1xx.dll と c2.dll。
昔はWindowsSDKにVSのIDEなしでコマンドラインツールだけ入ってたりしたけどな。
よく解らんかったら インストールディレクトリの VC/bin/ をまるごと残しとけ。
- 46 :
- リンカだけならSDKにも入ってる
- 47 :
- 超初歩的な質問ですが、
三次元配列をGPUにメモリ確保してCPUからデータコピーってどうやればいいんでしょうか
- 48 :
- 三次元配列とは?
x,y,z頂点の一次元配列のことを言ってる?
- 49 :
- そんな感じです、C言語でいうとarray[][][]みたいな
1次元のように簡単にはできないですよね…
- 50 :
- キラッ☆
- 51 :
- GPUじゃない普通のプログラムは配列のサイズ計算してmallocするだろ?GPUでも同じだ。
- 52 :
- 三次元配列で連続したアドレスにしたいんですが、CPUはできるんですけどGPUはそのままだとエラーが出てできませんでした…
エラーはa value of type "cudaError_t" cannot be assigned to an entity of typeです
- 53 :
- そりゃ関数の使い方間違えてるんだろ
- 54 :
- >>52
alignmentかな
- 55 :
- 初歩的な質問かもしれませんが、
.cファイルから.cuファイルの関数を呼び出す際にリンカエラーが
出るのですがどうすればよいのでしょうか
- 56 :
- export
- 57 :
- >>52
四次元にしてみたら
- 58 :
- DRAMのパーティションはパーティションの数が3こあるとすると
3つおきの連続した256バイトが一つのパティーションになると
いう理解であってますか?
- 59 :
- gpuを買い替えるか迷ってるんだけどcuda使う上で参考になるベンチマーク的なものを公開してるサイトってありますか?
ちなみに現在使ってるのはgtx970です
10シリーズは機械学習に最適化していると聞いたので気になっています。
- 60 :
- うん
- 61 :
- >>59
のようなサイトがあればURLを教えてください
- 62 :
- >>59
目的から若干ずれるかもしれんが
http://qiita.com/jiny2001/items/7af1f5dbfaa6c5e4a9f2
- 63 :
- CompuBenchが定番。
- 64 :
- >>62
>>63
参考になります
compubenchでcudaのスコアを比較してみましたが1060でも970より若干スコアは良いようですね
- 65 :
- cudaコアはどういう単位なの?
cudaコアがn個あったら、n種類のcudaプログラムを同時実行できますか?
コア内でスレッド数等が足りるとして。
- 66 :
- cudaコア1個でスレッドが1個動く
- 67 :
- viennacl
実質1年ぐらい更新ない気がするんだが
使って大丈夫なのかな
- 68 :
- シンギュラリティしてるぅ?
- 69 :
- Alea GPUでええな
- 70 :
- a.exe: a.cu
nvcc -Xcompiler "/wd 4819" a.cu -o a.exe
ウインドーズでメイクファイルで上みたいにやってクダーCコンパイラーでコンパイルしたんですけど
コマンドラインにちゃんと
nvcc -Xcompiler "/wd 4819" a.cu -o a.exe
と表示されたあと
wd
4819
c1xx: fatal error C1083: ソース ファイルを開けません。'略':No such file or directory
a.cu
c1xx: fatal error C1083: ソース ファイルを開けません。'4819':No such file or directory
と出ます。たぶん"に囲まれた中の/がメタ文字じゃないのになぜか消されているとおもうんですけど
なぜエラーになるのか教えてください。
/を//あるいは-に置き換えたらちゃんとコンパイルできました
よろしくお願いします。
" /wd 4819"と"と/の間にスペースを入れても出来ました。
- 71 :
- 色々実験してみたらnmake.exeではメイクできました。
mingwのmake.exeは駄目でした。
- 72 :
- ウインドーズなんて書いてる人、この二十数年の間でも聞いたことがない。初めて見たよw
あまりに斬新過ぎてワロタ
- 73 :
- そんなことで笑えるならすごい人生楽しそう
- 74 :
- みたことあるな
新聞だったかな
- 75 :
- 空いてるメモリ目一杯floatの配列で埋めたい
メモリ容量足りなくてエラーになると遅くなるので
ちょい余裕あるぐらいでmallocする方法ない?
- 76 :
- C++に触るの自体がほぼ初めてなのですが、CUDAと併せて勉強できるいい本は有りませんか?
プログラムはFortranしか触ったことがなく、CUDA by exampleだけだと難易度が高く困ってます
- 77 :
- 詳しくはwebで検索
- 78 :
- cuspが疎行列だけじゃなくて密行列も便利だった
- 79 :
- >>76
内容古いかもしれないが
インプレスの CUDA by Example 汎用GPUプログラミング入門 とかは?
- 80 :
- >>79
あ ゴメン
c++の文法説明込みだったら 違った
- 81 :
- カーネル呼び出し含むループをOpenMPで並列化すると遅くなっちゃったんですけど、
心当たりある方居ませんか?
nvvpで見たらcudaLaunchが伸び伸びで200ms近くなってます。並列化前は数ms程度です。
各カーネル呼び出しは別個のストリームを使用してます。
LinuxでCUDA8、GTX1080です。
- 82 :
- openmpは並列処理開始前にスレッド生成、終了後に同期して後始末しているらしく、そこでそこそこ時間を食う
並列化する箇所があまり時間がかからない処理だとopenmpで遅くなることもある
- 83 :
- 多くのスレッドからCUDAを使えばそりゃ遅くなるでしょ
並列化はOpenMPかCUDAかどちらにしなさい
- 84 :
- レスありがとうございます。
>>82
本番で呼ぶカーネルは結構時間かかる処理になりますが、
今は自前の検証コードから呼ぶ短いカーネルでカーネル呼び出し部分(cudaLaunch)のみの処理時間を見てます。
>>83
Hyper-Q機能?でハードウェア的にキューを複数持てるということで、スレッド毎に別ストリームを生成すれば問題ないと思っていたのですが違うのでしょうか?
- 85 :
- >>30
hsaみたいなのにやる気ないからなあ
そもそもスケジューラー持ってないから無理
- 86 :
- vs2017で使えん
- 87 :
- 初歩的な質問なんですがcuFFTを複数同時に呼び出して並列の並列みたいなことってできるんでしょうか?
- 88 :
- 何のために?
- 89 :
- モンテカルロ内でやりたいんだろ
- 90 :
- Ubuntu Linux のNvccでコンパイルしたのをcentosで動かすことできますか?
- 91 :
- もし異なるOS で、バイナリ互換があるなら、1つのバイナリで、
すべてのLinux ディストリビューションで動くはず
でも実際には、たいていのアプリは、
Ubuntu か、CentOS 用ぐらいの、バイナリしか用意していない
兼用バイナリというのは、ない
ソースコードを異なるディストリビューションへコピーして、
コンパイルすれば動くかも知れないけど、
修正しないと動かないかも知れない
- 92 :
- DirectSoundの処理をCUDAで処理するようなライブラリないのかしら
- 93 :
- 配列の中の1要素だけ排他制御する関数って自分で作るしかない?
稀に同じ要素を読み書きするスレッドがあるんだけどthreadfenceみたいな関数だと関係ないスレッドまで止めそうで
- 94 :
- 配列要素でもatomic関数は使えるんじゃないかな。
まぁ毎回atomic関数使ってパフォーマンスはどうか知らんけど。
- 95 :
- windowsでnvccを使うとclコンパイラが使われますができればgccを使いたいと思ってます
可能でしょうか?
- 96 :
- おk
- 97 :
- 科学技術計算に使うならtitanではなくteslaでしょうか?
- 98 :
- scipy
- 99 :
- >>97
買えればな
- 100 :
- visual profilerのwindows環境での使い方を解説してるサイトって無いですか?
100〜のスレッドの続きを読む
【ActionScript3】Webツールを作ろう【GPL】
MATLABプログラミング 質問箱 その4
DarkGDK Part.4
今まで見た中で一番すげーコメント
Xamarin Part6
ほぼ初心者プログラマでするべき事がわからない
プログラミングのお題スレ Part16
HTAをもっと流行らせる計画 Part2
こんなプログラミング言語は嫌だ!
次世代言語11[Rust Swift TypeScript Dart]
--------------------
【PS4/XB1】METAL GEAR SURVIVE part86【MGV】
【その無限の先へ】 二ツ樹五輪 7 【引き籠もりヒーロー】
8【はるかぜちゃん】春名風花アンチスレッド 178
【RadioNEO】OH! MY MORNING!【79.5】
学連選抜予想
【米朝首脳会談】ヘイ、トランプ!ボクはもうシンガポールでキミが来るのを待っているよ[05/28]
新潟ビリヤード不満の穴
歴代主人公が兄弟だったらPart96
【AKB48】武藤十夢応援スレ☆102【とむとむ】
【テリトリーMの住人】南塔子9
【最南端】鹿児島市電だ桜島【600v】
【バースト】ベイブレード 総合スレ 第117世代
【就職力】中央 明治 青学 立教 法政
macOS 10.13 High Sierra - 7
【旧drop】 ナナランド応援スレ part15
香取と草なぎの2人でユニット「草香」を結成 中居と稲垣もユニット「稲中」を結成か
【携帯】乙女@イケメンシリーズ総合★37【サイバード】
【すまぬ】エアコンをつけてしまったらageるスレ
【ID板】爆撃スレへ誘導【お試し中】
【アズレン】アズールレーン Part3759
TOP カテ一覧 スレ一覧 100〜終まで 2ch元 削除依頼