TOP カテ一覧 スレ一覧 100〜終まで 2ch元 削除依頼
C++相談室 part149
推薦図書/必読書のためのスレッド 82
【C++】マイナーGUIツールキット
【統計分析】機械学習・データマイニング24
【Lua】組み込み系言語総合 その7【Squirrel】
WindowsDDK各種についてのスレ
【分散型バージョン管理】 Mercurial 2【hg】
Visual Studio IDE環境
OSSホスティング総合【SourceForge,GitHub,etc..】
Go language part 3
394 :
・レイテンシとスループット
ADDPSは多くのCPUで
レイテンシ 3〜4クロック
スループット 0.5クロック/命令
(メモリリードもL1にデータがあれば0.5)

このコードは、
前の演算結果を使うので
このままだと1回のループに3〜4クロックかかってしまう

スループットを生かすには8個並列にする

ループ {
sum0 = _mm_add_ps(sum0, data[0]);
sum1 = _mm_add_ps(sum1, data[1]);
sum2 = _mm_add_ps(sum2, data[2]);
sum3 = _mm_add_ps(sum3, data[3]);
sum4 = _mm_add_ps(sum4, data[4]);
sum5 = _mm_add_ps(sum5, data[5]);
sum6 = _mm_add_ps(sum6, data[6]);
sum7 = _mm_add_ps(sum7, data[7]);
data += 8;
}

32bitコードでもSIMDレジスタが8個あるので
コンパイラはsumをレジスタに割り当ててくれることが期待できる
(一応確認する)

CoffeeScript
mallocの後にfree不要と言うバカいるの?Part2
【超高速】C/C++に代わる低級言語を開発したい 8
ゲームプログラムなら俺に聞け33
proce55ing プログラミングアート全般
Google App Engine for java
【普通のやつらの】 Arc Language 0 【上を行け】
OpenCLプログラミング#1
自然言語処理スレッド その4
疑似乱数2
--------------------
新潟のスーパーマルイ marui 裏事情
【イエス】 豊かに人生を生きましょう 【キリスト】
キングダム セブンフラッグス [Part69]
【福岡市】地下鉄 【JR】筑肥線 【西鉄】貝塚線 68
□■2019□■F1GP総合 LAP2024□■独□■
黄色のペガサス
【バーチャル】hololiveアンチスレ#4491【youtuber】
初心者が作品を発表するスレv7。
40歳からはじめてもおかしくない趣味ってあるの?
孤男が語る新型コロナウイルス その2
ダニに困っている人シーズン20
高級炒飯器ってどうなん?ホントに美味えの?
アイヌの歴史 Part2
完全犯罪は、可能か?
【山田尚子】リズと青い鳥 第67楽章【ユーフォ】
赤ん坊が嫌い Part.4
【クソムシ】シカのふんを餌に「糞虫館」がオープン 奈良
離職率アクセンチュア激務 そのA
かんぱに☆ガールズ 5422社目
2018年夏 有力校敗退情報 報告スレ part6
TOP カテ一覧 スレ一覧 100〜終まで 2ch元 削除依頼