TOP カテ一覧 スレ一覧 100〜終まで 2ch元 削除依頼
【Raspberry Pi】ラズベリー・パイ part47【ARM】
【無料】日本でのシェアは世界の半分0.56%【Linux】
Linux Mint 15
【初心者】Ubuntu Linux 123【本スレ】
SATELLA1・サテラ1改造版 11台目
最強に頭の悪そうなコマンドを打ってください
2ch ブラウザ JD 22
ぽえりな〜驚くほどにグングン萌えた!〜
_P2P____lt;lt; BitTorrent gt;gt;____P2P_
Antergos Linux
awk ファンクラブ
- 1 :2008/07/07 〜 最終レス :2020/02/07
- おーくについて語りましょう
- 2 :
- awkは言わねえ、たった一行・・・
- 3 :
- オークは便利だオーク
- 4 :
- sedファンクラブからきました。
- 5 :
- ls -ltr | awk '{print $8}'
- 6 :
- aho
wainberg
kernihan
- 7 :
- awkでなんでもやるのって年がバレそうだなあ。ちょっと下の世代だとperlだろうし。
- 8 :
- ttp://text.world.coocan.jp/TSNET/tsc/tsc_1.1.003.pdf
- 9 :
- しばらくしたら,perlでなんでもやるのって年がバレそうだなあ。ちょっと下の世代だとpythonだろうし。ってなるんだろうな
- 10 :
- 下の世代はpythonよりrubyじゃないか?
自分の場合、全部シェルスクリプトだけどw
- 11 :
- perl->pythonときてawkの便利さに気付いた。
- 12 :
- awk, perlユーザだが次はpythonとやらをいじってみるかね
- 13 :
- awkを256倍はみなさん持ってます?ここがすべての始まりだったなあ
- 14 :
- オライリーのsed&awkがはじまりだったなあ・・・
んでもってx68kで遊んでいたw
- 15 :
- 俺はrubyとpython両方使ってる。
rubyはワンライナー〜十数行のスクリプト。
pythonは数十行〜数百行のスクリプト。
- 16 :
- そんな昔にawkとかと出会えた人が羨ましい
- 17 :
- awk gawk jgawk やっぱり魅力はデータなめさせた時のスピード感
- 18 :
- 適当なデータをSQLにして流すときとかに使ってる。
BEGIN/ENDのおかげでトランザクション使うのも簡単。
- 19 :
- >>14
「プログラミング言語AWK」が絶版になると聞いてあわてて確保したが、すぐ再版された。
- 20 :
- awk がなくなると困る・・・・・
Perlで$3 を表示しる!とかどーすんよ
awk '{print $3}'
- 21 :
- オークについて、おおくは語らねぇ
- 22 :
- >>20
perl -ane 'print $F[2], "\n"'でいいんじゃね?
- 23 :
- >>22
なんかこう、Perlってスクリプトにエレガントさを感じないんだよな。つぎはぎが多い
というか。
awkの場合、cに近いスタイルでありながらパターンマッチングとか連想配列の実装が
エレガントだからコードを見ててきれいに感じる。
- 24 :
- >>22 マジレス dd ちょっとやってみる(ヲイ
- 25 :
- perl の -n は各行に対しての処理、-e はスクリプトをファイルでなくその場でワンライナー書く為のものだが
-a オプションはやっぱり awk の名に由来するのかねぇ
- 26 :
- >>25
autosplit modeってusageに書いてあるじゃん。
- 27 :
- >26
いや名目上はそうだけどさ。
スクリプトでauto〜なんて言い出したらキリが無いワケじゃん。
ぶっちゃけ -n だって自動ループと言っちゃえばそうだし。
そこで -s や -p みたいな名前じゃなくて
わざわざ -a にしたのは、やっぱ awk の名を意識したからなのかな、と
思ったんだよ。
- 28 :
- ruby -ne 'puts split[2]'のほうが楽、と思ったけど
空行とかでの扱い考えると
ruby -ne 'puts split[2] || ""'
になるのか。やっぱawkが楽だな。
- 29 :
- sedのスレとかあったので、思わず「なんでawkを使わない?」って突っ込んでしまったけど、
実はおれも長らくsedからawkへ行けなかった。田中さん(緑のSerrow)が月刊asciiに書いた
記事を読んで使えるようになったのだった。
いまではperlも使うが、やはりawkが楽だなぁ。16進→10進変換の関数作ったり、
バイナリデータ読むためのコードをCで作ったりして無理やり使ってたころが
懐かしい。
- 30 :
- 2年くらい前からLinuxを本格的に使い始めたけど
awk(gawk)とsedには特に力を入れて勉強してる
gawkは機能が洗練されて美しいし直感的で使いやすい
リファレンスもとてもしっかりしてる
- 31 :
- おれが一番よく使うのは連想配列。
gawk '{w[$1]++;}END{for(i in w)print i,w[i];}' xxxx.txt | sort
みたいなことを何百回やったことか。
- 32 :
- わらうw
ttp://awk.info/?doc/dsl/awkplusplus.html
object_variable = class_name.new[(optional parameters)]
object_variable.method_name(parameters)
object_variable.delete
- 33 :
- みなさん教えて下さい。
一行毎に読み込み@<と@>で囲まれた部分を
ランダムなアルファベット10文字に置換し、
元々@<@>に囲まれた部分の文字列と置換したランダムな文字列の対応を
別ファイルに書き出し
っていうのをやりたいです。
awkとsedでできるの?
pythonで書くべき?
- 34 :
- できるっちゃーできるが、おすすめはしない。
BEGIN {
output = "hoge.txt"
chars = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz"
len = length(chars)
srand()
}
{
if(match($0, /@<.*@>/)){
t = substr($0, RSTART+2, RLENGTH-4)
if(!(t in m)) m[t] = rndstr(10)
$0 = substr($0, 1, RSTART+1) m[t] substr($0, RSTART+RLENGTH-2)
}
print
}
END {
for(i in m) print i, m[i] > output
}
function rndstr(n, s){
while(n--) s = s substr(chars, int(rand()*len)+1, 1)
return s
}
- 35 :
- まじぽかのUMAちゃんは最高にかわいいNE!
- 36 :
- printfと$ / $がうまく両立できない・・・
文型向け授業でわざわざlinux使わせるなよ・・・
- 37 :
- やっぱAWKいいよねー
「プログラミング言語AWK」は買い逃してたんで再販速攻で買ったよ。
Excelなんてやってられねーっつーの
- 38 :
- >>37
Excelのvlookupみたいなリレーショナルな事がやりたい場合ってどーしてる?
- 39 :
- 連想配列でいいんちゃうん?
- 40 :
- いやさ、複数のシートから引っ張ってくるような感じで、複数のテキストファイルを対象にしたい時。
- 41 :
- そんなん普通に複数ファイル処理すればいいやん。
- 42 :
- >>41
> そんなん普通に複数ファイル処理すればいいやん。
「普通に」の所kwsk
- 43 :
- getlineすりゃえーやろ
- 44 :
- awk初心者です。質問させてください。
awkでアクセスカウンタを作ろうと思い、
以下のようなスクリプトを書いたのですが、
最後のhtmlへの出力(表示)の方法がわかりません。
どうしたらいいのでしょうか?
- 45 :
- BEGIN{
#プロセスロック
lock()
#カウント数の読み込み
while (getline < count.dat > 0){
before_count = $1;
}
close(count.dat);
#カウントを1進める
new_count = before_count + 1;
#数字の置換を行う
sub(before_count, new_count, $1);
#プロセスロック解除
unlock()
}
- 46 :
- print "Context-Type: text/text";
print "\r";
END{
#表示テンプレートの読み込み
while (getline < count.txt > 0){
txt_file[++i] = $0;
}
close(count.txt);
#あらかじめセットしてあるテンプレート上の文字列を置換
gsub("<!--#count.cgi--!>", new_count, $0);
print $0;
}
- 47 :
- >>43
getline知らなかったわ。
難しそうだな・・・
- 48 :
- >>44
SSIの仕組みは理解できていますか。
ttp://httpd.apache.org/docs/2.0/ja/howto/ssi.html
- 49 :
- getline は毎回リファレンス見に行ってるなぁ
頭が劣化しとるわー
- 50 :
- こんなものが落ちてたw
ttp://mitya.pp.ru/chamberlen/assorted/OReilly%20-%20Sed%20&%20Awk%202nd%20Edition.pdf
- 51 :
- Mac OS X Leopard 10.5.8でjgawkを使いたいのです。
ターミナルでawk '{print $0}' filenameですと日本語が悲しいです。
お使いのみなさん、使用法等教えて下さい。
- 52 :
- 板違い。
- 53 :
- Mac OS XをUnixとして使ってる人の為のスレ その15
http://pc11.2ch.sc/test/read.cgi/mac/1247059597/
こっちのが詳しいかもね
- 54 :
- awk初心者です。
awkにはperlのjoinみたいの関数ありますか?
perl:
print join(":",$_);
- 55 :
- データ集計に便利
- 56 :
- >>54
BEGIN {OFS=":"}{$1=$1;print}
- 57 :
- 重複を削除するBASHスクリプトに、perlの部分はawkの連想配列で書き換えたいんですが、splitした後の処理方法が分かりません
教えて頂ければ幸いです。
-----------------------------
hoge='a:b:c:d:a:b:c:d:a'
echo -n $hoge | perl -F: -ane 'chop;foreach(@F){$s{$_}++ or push(@b,$_)}print join(":",@b)'
-----------------------------
- 58 :
- 素人なりですけど
echo -n $hoge | awk 'BEGIN{OFS=":"}{n=split($0,a,":");m=1;for(i=1;i<=n;i++){if(!(a[i]in b)){$m=a[i];b[$m]++;m++}}print}'
- 59 :
- echo -n $hoge | awk 'a[$0]++<1{printf(NR>1?RS:_)$0}' RS=:
- 60 :
- a[$0]++<1 じゃなくて
!a[$0]++ とした方が1バイト短くなるな
って、そういう趣旨じゃないか
- 61 :
- プログラミングAWK 3度目の復刊
http://www.fukkan.com/fk/CartSearchDetail?i_no=68313239&tr=t
- 62 :
- >>58,59,60
ご回答、誠に有難うございました!
まだawkの部分理解してないけど、期待通りの動作が確認できました!
- 63 :
- Linuxじゃないんですが、Gawk on Windowsだと、
gawk '{print $1;}' data.txt
ていうのは、クォーテーションはダブルにしないといけないんですね。。。
- 64 :
- うん、引数文字列をどう解釈するかは awk じゃなくてシェルだから。
cmd.exe の仕様の問題であって、awk の側では対応しようにもできない。
- 65 :
- BEGIN {
printf "256倍のコードが提供されてる\n"
printf "ttp://books.ascii.jp にアクセス\n"
printf "本には4756101623なんてのがついてるけど、本の通りに入れるとnot found\n"
}
END {
print "昔と本の内容が変わってるみたいだな"
}
- 66 :
- END {
print "まだ始まってもねーよっ!"
}
BEGIN {
printf "・・・ごめ・・・\n"
}
- 67 :
- {
if ($0 == "aka") print "red"
else print "blue"
}
の最も変態的な記法を教えて下さい。
- 68 :
- $0=/aka/?"red":"blue"
- 69 :
- END {
system("echo " + $0 + " | perl -ne 'if(/"aka"/){print \"red\";}else{print \"blue\";}'")
}
- 70 :
- awkでシェルのPATH変数をマッチさせるときにスラッシュ//を使わない方法を教えていただけませんか?
perlだと##で行けますが
- 71 :
- >>70はマルチ
- 72 :
- ごめんなさい!
マルチがだめとは知りませんでした。
- 73 :
- アルフレッド・V・恵方
- 74 :
- awk で宛名書きだそう
AWK Users JP :: OSC2011 Kagawa 特設サイト
http://gauc.no-ip.org/awk-users-jp/blis.cgi/OSC2011_Kagawa
- 75 :
- awkって今時オブジェクト指向もサポートしてねぇのか。
だせぇ・・・
とか思ってたらこんなのもあるんだな。
http://awk.info/?doc/dsl/awkplusplus.html
- 76 :
- awkの処理についてアドバイスを下さい。
スペースで区切られたテキストファイルがあります。
例(フィールド数も文字数も全部異なります)
abc efg hij http://www.example.com/index.html xyz
123 http://www.example.org/ she good love look good
4edi http://www.example.net/test/test.html
こんな感じのテキストファイルからURLだけを抽出したい
場合、どう言った処理を行うと良いでしょうか?
printなどは使えそうにないし頭を抱えています。
是非お助け下さい。
- 77 :
- >>76
{for(i=0;i<=NF;i++)if($i ~ /^http:\/\/.+$/)print $i}
- 78 :
- 自分は
match($0, /http:\/\/[^ ]+/, f)
を使う気がする。
- 79 :
- #!/bin/sh
cat 入力ファイル | tr ' \t' '\n' | awk '/^http:/'
…まで書きかけて、あれ、これawkじゃなくてgrepで良くね、と思ってしまった俺
- 80 :
- /bin/shでもやはり自分は
expr 文字列 : '.*\(http:\/\/[^ ]*\).*'
を使う気がする。
- 81 :
- うちは>>77の条件を index($i, "http:") == 1 で書くだろうなぁ
でも、処理内容がそれだけなら sed -n 's/^.*\(http:[^ ]*\).*$/\1/p' だなぁ
避けられるなら正規表現は避けたほうが速いんじゃないかと思ってる
- 82 :
- まだどうしてそういう結果になるのか…が全然解らないのですが
一つ一つひもといて自分のものにしていきたいです。
みなさん本当に色々ありがとうございます。
- 83 :
- こういうのもpythonで書くようになってしまった俺は駄目なやつですか
- 84 :
- 流石にPythonはこういうサクッとしたテキスト処理には冗長すぎないか?
awk以外でならperl、さもなくばrubyあたりまでが俺は限度だなあ
- 85 :
- BEGIN{ FS="http://"; }{ split($2, item, / /); print FS item[1]; }
とか
- 86 :
- 入力からランダムで1行表示する
awk '{ l[i++]=$0 }; END{ srand(); print l[int(i*rand())] }'
シェルスクリプトの方が短いか?
- 87 :
- こう書くと1行しかメモリに保存しないので入力行が多くとも平気です
BEGIN { srand() }
rand() * NR < 1 { x = $0 }
END { print x }
- 88 :
- >>87
それだと行数が多いと後半の表示が少なくなっちゃう
- 89 :
- >>88
2行のときは
1/1の確率で1行目が選ばれる
→1/2%の確率で2行目が選ばれる
3行のときは
1/1の確率で1行目が選ばれる
→1/2の確率で2行目が選ばれる(この時点で1行目、2行目の確率はともに1/2)
→1/3の確率で3行目が選ばれる(2/3の確率で1or2行目が残り両者1/2なので全て1/3)
のように、基本的に確率は等しいはずですが……
浮動小数点演算の精度が問題になるような行数の話でしょうか?
- 90 :
- >>87
お、これはすごい!考えたなー。ぱっと思いついた奴は、天才だ。こんな風になりたいわ。
> 浮動小数点演算の精度が問題になるような行数の話でしょうか?
これは初め見たとき思ったけど、それが問題になるなら、
私の書いた方法でもメモリが逼迫してまずい気がします。
ただ、精度やrand()の性能で、実際に統計取ったら88の言うようになるのかもしれません。
あとは、rand()が1を返す実装はないよね?gawkのマニュアル読んで書くのだけど、
関数の説明が簡単に書き過ぎていて、ちょっと不安。
- 91 :
- 不要な部分を全部削って87の方が2バイト短いか。
mawkだとsrand()を省けるから、もっと短い。エレガント!
それにしても、4ヶ月ぶりに上がったんだ。ほんと人居ない。
- 92 :
- ワタスは監視してますよ。
- 93 :
- 俺も。
- 94 :
- じゃあ、暫く書く
- 95 :
- 空行を削除する
awk 1 RS=
sedだと、
sed /^$/d
かな?同じ9文字か。
- 96 :
- >>89
rand()を全行で実行しているから、
1行目には2行目以降が x を上書きする確率が加わり、
2行目には3行目以降が x を上書きする確率が加わり、
ってことになるんじゃないのかな。
全4行の場合
1行目が表示される確率 1/1*1/2*1/3*1/4
2行目が表示される確率 1/2*1/3*1/4
3行目が表示される確率 1/3*1/4
4行目が表示される確率 1/4
って感じで、最終行が表示される確率が一番大きい気かします。
rand()をBEGINの中に入れてしまえば全部同じだけど。
- 97 :
- >>96
1/1*1/2*1/3*1/4 + 1/2*1/3*1/4 + 1/3*1/4 + 1/4 = 5/12 (≠ 1)
なので、それが誤りなのは、すぐに分かるはずですが……
それらの確率を足したら1になっていないといけません
ここは高校数学の確率統計のお話をするスレではありませんが、
以下のように考えたらお分かりでしょうか?
1行目が表示される確率は 1/1*1/2*2/3*3/4 = 1/4
(1行目が選ばれる確率 * 2行目が選ばれない確率 * 3行目が選ばれない確率 * 4行目が選ばれない確率)
2行目が表示される確率は 1/2*2/3*3/4 = 1/4
(2行目が選ばれる確率 * 3行目が選ばれない確率 * 4行目が選ばれない確率)
3行目が表示される確率は 1/3*3/4 = 1/4
(3行目が選ばれる確率 * 4行目が選ばれない確率)
4行目が表示される確率は 1/4
(4行目が選ばれる確率)
- 98 :
- >>97
そうでした。電車の中で気が付きました。
x が上書きされる確率じゃなくて、上書きされない確率を掛けないといけませんでした。
納得。
- 99 :
- なんか利点が無いように見えるので、sedじゃなくawkを使う理由を探してみた。
tar xf linux-2.6.39.1.tar.bz2 --wildcards '*.c' -O >src.txt
time cat src.txt |awk 1 RS= >/dev/null
real 0m3.172s
user 0m2.786s
sys 0m0.757s
time cat src.txt |sed /^$/d >/dev/null
real 0m32.503s
user 0m31.465s
sys 0m0.882s
※参考
time cat src.txt |cat >/dev/null
real 0m0.606s
user 0m0.036s
sys 0m0.586s
おー。sedより、ずっとはやーい
やったね、awk!
- 100 :
- うむ。grep よりも awk の方が速かった記憶がある。
- 101 :
- 複数のtimeコマンドの出力から平均を求める
awk -Fm '{ a[$1]+=$2; a[0,$1]++ }; END{ for(i in a) if(i~/^[rus]/) printf "%sm%.3fs\n",i,a[i]/a[0,i] }'
昨日の時間計測のために書いた。
いろいろ問題あり。これ以上短くかけなかった、残念だわ。
sedがすっごい遅いので全部メモリに読み込んで処理させてみた。
time cat src.txt |sed -n '1x;1!H;${x;s/\n\n\+/\n/gp}' >/dev/null
real 0m24.515s
user 0m18.584s
sys 0m2.005s
# ちなみに、昨日のも含めて3回試した結果を平均した
…やっぱ遅い。GNU sedが悪いの?スレ的に満足な結果だけど。
便利で速くてシンプルなのに、あまり使われない紹介されない、消え行くawk、カワイソス
- 102 :
- フィールドを抜き出すワンライナーはやっぱawkでしょ
perl -pae'$_=$F[8].$/'
ruby -nae'puts$F[8]'
awk 'print$9'
- 103 :
- >>95の表記初めて見た
このスレの住民にはこれくらい当たり前なのか…
- 104 :
- それってどういう構造なんだ?
1番目の引数である「1」は「パターンは常に成り立つ、アクションは指定しない(=レコードを加工せずに出力)」というawkコードだろうけど
その次の引数って入力ファイルになるはずじゃ?
- 105 :
- わかんねー。なんでこれをコマンドプロンプトに打ち込んで、うまくいくのか。
gawk 1 RS= testfile.txt
- 106 :
- RSが空だとRS=\n+として解釈されるんじゃまいか
- 107 :
- だとしても、何故にRS=\n+がコードとして実行されるの?
コードは1で終わってね?
- 108 :
- 自己解決、assignment optionsなんて仕様があったのか
- 109 :
- おー、いっぱい居るね!まだまだやれるぞ、awk!
一応説明すると、プログラム自体は>>104の解釈の通りです。
また、RS=""なら、RS="\n\n+"とほぼ同じです。
違いは、RS=""はファイルの先頭に改行が続くとき、それを無視します。
ついでに、POSIXではRSに2文字以上設定すると、結果は不定とされています。
gawkでは、正規表現を使える拡張がされていますけど。
引数ですが、ここに代入文を書くとBEGINの後に処理されます。
まあ、ああ書いたのは-vオプションを使うと3文字コマンドが増えるからなんですが、
こういう変数の設定方法もあるということで。
- 110 :
- awk /./
の7文字だけでOK
RSは初期値が入ってるんだから
- 111 :
- そうか、sed /^$/d って grep . で良かったんだな
- 112 :
- >>109
書き忘れ。
RS=""のとき、ファイルの末尾の改行も無視する。
あと、FSが"\n"に設定されているように振舞う。
元々複数行を一気に処理したい場合に使うことを想定してたのだろう。
>>110
ああ、すごい、これは短い!頭柔らかいねえ、スマートだわ。
夢の中でも考えたのに…無能過ぎワラタ
>>111
grep最強伝説はっじまっ…らないぞ。同じ方法で時間計測したら2時間半たっても終わらない。
grep捨ててawkを使おう!
- 113 :
- awkはじまったなw
- 114 :
- 改行をWindows向けに置き換える
awk '{ print $0 "\r" }'
こっちの方が速くて短いか。
awk 1 ORS='\r\n'
- 115 :
- 速くて短いし、そっちのがコードと意味が一致するかと
- 116 :
- そっかー、分かり易さは、上の方だと思ったのですよ。
下のは、awkがどう動くかを知ってないと気持ち悪い感じ。
101みたいなsedスクリプトを、初めて見たときのような。
- 117 :
- 上だと\n\rになっちゃうけど
CRLFの\r\nとは違うから
Windowsでは認識しないのでは?
- 118 :
- >>117
いや、上のコードは\rが先に出力されるからあってるよ、改行じゃなくて普通の可読文字でためしてみ
- 119 :
- Windows向けの改行をUnix向けに置き換える
awk 1 RS=\\r ORS=
改行弄ったら戻したいよね。一文字多い別解。
awk 'sub(/\r/,"")'
>>117
$0にRSは含まれない。print文での出力のときにORSが付けられる。
だから、114のような書き方ができるのです。
え?素直にnkfとかtr使うべきだって?ごめんちゃい。
tr -d \\r
nkf -d
短いねえ…そして速そう…
- 120 :
- 正規表現にマッチした部分を全て置換し、その行を表示する
awk 'gsub(/foo/,"bar")'
sedで書くとこうか。
sed -n 's/foo/bar/gp'
こういう処理はsedの方が楽に書けるのかな、うーん。
>>119
awk 'sub(/\r/,"")+1'
下はこの方が良かった。うっかりファイルの内容を消してしまいそうだ。
- 121 :
- だいたい置換はsedで書いたほうが素直に読みやすいと思う
逆にそれ以外のツールでもスクリプトでもなく、awkで書きたくなるのはフィールドを使うものかな
- 122 :
- いや、しかし最近目から鱗落ちまくりです。沢山の書き込みに感謝感謝。
- 123 :
- 中身の検索はgrep
置換はsedとかtr
結合はcatとかpaste
計算はexprとか場合によりwc
多少組み合わせる必要があるならshでシェルスクリプトwhile、for、read、shiftみたいな
大抵やりたいことに対応するコマンドがある。awkでプログラム風に書くのは人を選ぶのかもね。
このスレが太古の昔に沈んでしまったのも、そのせいか。
実際、プログラム板にもあるけど、あちらはそこそこ書き込みがある。
Linuxも既にGUI全盛、バッチ処理もGUIでという流れか、シェルスクリプト総合スレもなくなってしまったし。
板全体がほとんど動作報告中心になって、Linuxやシステム全体のコアな部分、プログラミングの話題を
話す場所が消えてしまったような気がする。気がするだけ。
- 124 :
- シェルスクリプトはUnix板で話せばいいしな
Linuxでメジャーなシェルは大概BSDとかでも使えるし
- 125 :
- HTMLファイルからタイトル(title要素の持つ文字列)を取得する
awk '/<title>/{ b=1 }; b{ s=s $0 RS }; /<\/title>/{ gsub(/.*<title>|<\/title>.*/,"",s); print s; exit }'
分かりやすさと効率を無視、短さを優先した別解。
awk '{ s=t=s $0 RS }; gsub(/.*<title>|<\/title>.*/,"",t)>1{ print t; exit }'
どっかのスレにて、出遅れ、荒れ気味なので。
改行も保存してるけど、必要ないならRSを除けばいい。
perlの無いシステムでもawkはある!はず。
いつの間にかUnix板のシェルスクリプトスレまで無くなってやがる…
- 126 :
- ホントだ、何でだろ
- 127 :
- 980超えたからだな
- 128 :
- ああ、そうだったのかー。でもまだ次スレ建ってないね。
スレ建てた事無いから分からないけど、最近建て難いようだし、そのせいかな。
112で諦めたgrepで空行を削除する処理の時間計測の結果。
time cat src.txt |grep . >/dev/null
real 342m52.646s
user 337m34.249s
sys 0m7.174s
grep -V
GNU grep 2.6.3
寝て起きたら終わっていた。余程grepを必要とするときくらいしか、使うべきじゃない。
# 一つのケースでしかないのだけどね。ただ、これほど遅いとは…
- 129 :
- >>125
それ、xgawkで書くとどんなになるの?
- 130 :
- >>129
gawk '$0=gensub("</?title>", "", "g", RT)' RS='<title>.*</title>' IGNORECASE=1
- 131 :
- >>128
待てよ…awkでもパターン検索だけなら遜色なく書けて
かつawkのが速いんじゃ、grepの存在価値って…
ああ、複数ファイルからの検索があるか
つーても、これもawkでFILENAMEとFNR明示したら書けちゃうか…
- 132 :
- >>131
まあgrepで済む物は記述が簡単なわけで。
- 133 :
- xgawkは使ってないなぁ。使ってる鳥には無いし。XHTMLが対象ならもっと短く書けるのだろうか。
>>130
おー!これはクール。
gawkは大文字小文字無視する処理書くの楽だね。流石だ。
>>131
前後の行を表示させたりが楽かも。まあ、滅多にお世話になることないけど…
rm -r *でデータ飛ばしたから、そのサルベージに役立つとは…orz
- 134 :
- コマンド`grep -C N regex'を真似する
awk 'BEGIN{ L=N; b=L+1; n=L+2; i=j=0; s=2 };
/regex/{ if (L&&s==1) print "--"; while (i!=j) { print a[i++]; if (i==b) i=0 } n=s=0 };
n>L{ a[j++]=$0; if (j==b) j=0; if (i==j) { i++; if (i==b) i=0; if (!s) s++ } next }; n++<=L'
書けた!!データ飛ばすは、アク禁に巻き込まれるは散々だった。よく見たら凄い遅レスだ…
データのサルベージに使ったgrep -Cを書いてみた。流石にワンライナーとは言い難い。
効率はもう少し良くできそうだけど、これ以上短くするのは無理だった。実力が足りない;_;
あまりに読み辛いので、pastebinに整形版を置いておきます。
ttp://pastebin.com/PJ2VfqN4
- 135 :
- 時間計測の結果を追記。
time grep -C 500 'public class\|jar cf\|javac\|\.java' <strings_a.txt >/dev/null
real 0m2.112s
user 0m1.528s
sys 0m0.311s
time awk 'BEGIN{ L=500;(略)}; /public class|jar cf|javac|\.java/{(略)}; n++<=L' <strings_a.txt >/dev/null
real 1m20.089s
user 1m15.426s
sys 0m0.389s
一回計測。約50倍くらい遅いか。ネイティブとスクリプトだから、まあこうなる、と言ったところだと思う。
短い処理なら有利な場合もあるんだろうけど。
- 136 :
- 指定された正規表現を含むファイルの名前を表示する
awk 'f!=FILENAME && /regex/{ print f=FILENAME }'
gawkならこう書ける。
awk '/regex/{ print FILENAME; nextfile }'
>>131に近い。FNRも使って検索結果を表示するスクリプトも、あまり複雑にはならなそう。
下の方が速いけど、mawkだとnextfileをサポートしてなかった。
grep -lと同じ結果で、指定する正規表現によってawkの方が速く動くこともあるよ。
- 137 :
- AwkのGNU実装、「Gawk 4.0」が登場
http://sourceforge.jp/magazine/11/07/04/0459223
- 138 :
- dgawk便利だね。
- 139 :
- md5sumコマンドの出力から重複するMD5チェックサムを持つファイルを列挙する
awk '{ i=++a[$1,0]; a[$1,i]=$0 }; END{ for (i in a) if (!k[split(i,k,SUBSEP)] && a[i]>1) for (j=1; j<=a[i]; j++) print a[k[1],j] }'
まだ短く書けそうかな?
あるディレクトリ以下を調べるなら、こんな感じでMD5チェックサムを計算する。
find sda6.photorec -type f -exec md5sum '{}' +
この出力をパイプか何かで食わせればいい。
gawkの4.0が出たか。いろんな亜種を使う機会があるから、なかなか依存したプログラムは書けないね。
よく使うのはgawkとmawkだけど、皆何をよく使ってるのだろう?使用者が少ないから余計に気になる。
デバッガって使いやすい?いまだにprintで表示してやってるなぁ。
- 140 :
- gdbやpythonデバッガやらと似てるのでとっつきやすくはあると思う。
- 141 :
- fileコマンドの出力からテキストファイル(表示可能なファイル)だけ取得する
awk '{ q=$1; $1="" }; /text/{ print q }' -F:
FSは-Fオプションを使って1文字短く書く。使い方は次のようにパイプでつなぐ。
find sda6.photorec -type f -exec file '{}' + |awk '{ q="'\''" $1 "'\''"; $1="" }; /text/{ print q }' -F: |xargs -i cp -v "{}" sda6.photorec.text/
xargsに渡すためクォートしてる。ワンラインにシングルクォーテーション入ると書きづらい。
でも、こういう処理はawkが一番楽だね。
>>140
へー、それは良いね!って思ったけど自分が書くような短いスクリプトには不要かも…
今、awkでデバッガが重宝するような長いスクリプトって、どれほど書かれてるんだろう?
- 142 :
- gawkだけでurlエンコードできますか?
- 143 :
- >>142
BEGIN{for(;i<256;++i)c[t=sprintf("%c",i)]= i==32?"+":t~/[0-9A-Za-z]/?t:"%"sprintf("%x",i)}
{for(s=i="";i++<length;s=s c[substr($0,i,1)]); print s}
マルチバイト対応してて length() とか substr() とかが
バイト数ではなく文字数を数えて動作するような小賢しい awk だと逆に動かない。
- 144 :
- Gawk4.0の新オプションはそういう時のためにある訳か。
- 145 :
- >>141
ファイル名には : も使えるから汎用じゃないね。
あとショートコードを意識してるようなのに不必要なセミコロンとカッコ内側のスペースが
あるのはスタイルとして一貫してないな。
- 146 :
- 昨日はこのスレの3周年だったのです。
- 147 :
- このスレ七夕に立ってたのか。3周年って言われると、まだ3年かと思ってしまう。
3年前といえばLLが盛り上がってた頃だから、もう少し前に立ってればここももっと盛り上がっていたかもね。
gawkは新しくなったけど、確実に他のLLに流れてるよなぁ…
- 148 :
- >>145
どこぞのOSでは使えない文字をわざわざファイル名に使わないよねって思い、楽してます。
ただパスに含まれる可能性はあるので、そういった場合は file -F; のようにして
fileコマンドの使うセパレータを(使われていない)任意の文字に設定して下さい。
スタイルに関しては全くその通りで、自分でも冗長だと思いつつ残しています。以下言い訳…
スペースは読み辛くなると思う所にだけ残すようにしています。また、ここに貼ると、
表示がプロポーショナルフォントになって、幅が狭い文字の隣から一部分コピペする操作をよくミスるため、
そういった幅の狭い文字(}とか;)の後には残しています。
ifやwhileの後、print $1 や "a" b "c" に含まれるものも省略できますが、違和感が物凄いので残しています。
セミコロンは(POSIXの仕様で)必要なものだけを残しているつもりです。
過去の互換性のために省略可能なものは、残すようにしています。
- 149 :
- >>147
他のLLに比べて、Windowsで使われる頻度が滅法低いのも一因かなあと思う
コマンドプロンプトで awk がやれることって、BEGIN{ } に何か書くぐらいしか無いのよね
だったらPerlとかでいいじゃん、って話になっちゃう
- 150 :
- awkオンリーってのがムズイので、Cygwin上でsh他外部コマンドと組み合わせて使う事が多い
- 151 :
- 結局awkはプログラミング言語というより「ちょっとややこしいことも出来るUnix系テキストツール」としての性格が強いんだと思う。
- 152 :
- そうか、Windowsでの使用率は考えたことなかったわ。そっちで今何が流行ってるのかは知らないけど、
GUI扱うライブラリを持つLLが使われてそうだ。こればかりは厳しい。そもそも、ライブラリって概念がないのが避けられてるのかな。
- 153 :
- >>152
いやGUIはほとんどVisualStudio、Java、Delphi辺りで喰われてるよ
その他のGUIツールもあるにはあるんだけど
LLの主な出番は向こうでもテキストフィルタだったりはするんだけど
Windowsにはそもそも組み合わせるような小物のコマンド群が無いから
やりたい処理の1から10まで全部を1個(もしくは一連)のスクリプトで済ませるのが主流
だからたとえLLであっても、1言語で最初から最後までを完結できる大きめの言語が好まれるのよ
awkは単品で使うより、組み合わせで威力を発揮する言語だからか、あまり使われない
- 154 :
- あ、いやテキストフィルタよりもCGIとかのWebでの出番のが多いか?
- 155 :
- cgiでawk使う事って、珍しくないの?
- 156 :
- awkでcgiも出来なくもないだろうけど、っていうかそれでblog作ろうとしてた人もいたな
- 157 :
- >>153
ホント?Delphiなんて懐かしいなぁ。GUIでなく、Webでの利用なら、もはやOSあまり関係ないような気も。よく分からん。
>>155
聞いたことはあるけど、見たことはない程度には珍しいかと。gawkはネットに対応してるから頑張ればサーバにもなれるかな?
- 158 :
- >>157
いやまあDelphiは新規としては瀕死で、過去遺産の保守で使われるのが主だけどね。
- 159 :
- やっぱawkでcgiってマイナーか。しかしblogつーか、CMS作ろうとするのは凄いなw
ちなみにgawkのhttpdって、どっかで見たなあ。
- 160 :
- httプロトコルでなく、俺プロトコル用サーバならawkスクリプトでやってる。
httpに例えるなら、ファイルか404を返すだけの簡単なやつ。
しかもgawkのソケットでなく、inetdから呼ばれるだけの低機能。
- 161 :
- 私はエンバカになっても応援してるよ!>Delphi
>>160
今更inetdって思ってて、ろくに調べてなかったけど、socatみたいな機能もあるんだね。
ポート監視→サーバ起動って機能しかないと思ってたよ。
これならネット非対応なawkでもhttpdくらい実装できる?…バイナリまともに扱えそうなのはgawkしかねー。
テキストオンリーまでなら何とかできそうだけど、画像も転送できないか。厳しい制限だ。
- 162 :
- 個人的にはawkは今まで通りシェルのお供でいいと思う
perlとかでもそりゃ書けんことは無いが
シェルのお供として使うには微妙に違和感あるんだよな〜
- 163 :
- >>134
これを使って正規表現によって grep とどれだけ実行速度に差が出るのか計ってみた。
ttp://pastebin.com/bpXZ5pg8
数字だけではよく分からないので、ユーザ時間のグラフを描いた。
ttp://i53.tinypic.com/303a4iv.jpg
赤がawk、青がgrep
こっちじゃないと見れないかも → ttp://tinypic.com/r/303a4iv/7
awk もばらつきがあるけど、grep ほどではない。
どちらも、マッチする可能性が高い正規表現は遅くなる傾向があるのかなぁ?
- 164 :
- 引数で与えられたファイルをメモリに読み込み繰り返し検索する
awk 'BEGIN{f=ARGV[1];while((getline<f)>0)a[n++]=$0;close(f);ARGV=1};{for(i=0;i<n;++i)if(a[i]~$0)print a[i]}'
最近、用途が限られているもの中心だったので使えそうなワンライナーにしてみたよ。きっと。
指摘を受けたので、スペースは削ることにしました。ちっと見づらい?
↓は大文字小文字を無視するもの。こうするとdmesgの出力を何回も検索できる。
awk 'BEGIN{f=ARGV[1];while((getline<f)>0)l[n++]=tolower(a[+n]=$0);close(f);ARGC=1};{for(i=0;i<n;++i)if(l[i]~tolower($0))print a[i]}' <(dmesg)
- 165 :
- 見にくいので、セミコロンで改行して欲しい。
- 166 :
- 凄く長くなりそう><
- 167 :
- 長過ぎるone-linerを見易く改行するone-linerを書きなさい
- 168 :
- しまったー!書き込む前にちょろっと書き換えたところがバグってました。mawkで動きません。
>>164の下のスクリプトは次に書き換えてください。
awk 'BEGIN{f=ARGV[1];while((getline<f)>0)a[n++]=$0;close(f);ARGC=1};{for(i=0;i<n;++i)if(tolower(a[i])~tolower($0))print a[i]}'
awkのシーケンスポイントってC言語と同じなのかな…痛いミス。
おまけ。使ってるやつ。エスケープシーケンスを使って見つかった文字列に色を付けた。
awk 'BEGIN{f=ARGV[1];while((getline<f)>0)a[n++]=$0;close(f);ARGC=1};
{for(i=j=0;i<n;++i)if(k=match(tolower(a[i]),tolower($0)))print C(j=!j)I(I(a[i],C(39),k+RLENGTH),C(31),k);print C()};
function C(n){return"\033["n"m"};function I(x,y,z){return substr(x,1,z-1)y substr(x,z)}'
パターンごとに改行を入れた。少し見やすいか?
>>164の上のスクリプトに色を付ける機能を追加。ずっと分かりやすいと思う。
awk 'BEGIN{f=ARGV[1];while((getline<f)>0)a[n++]=$0;close(f);ARGC=1};
{for(i=j=0;i<n;++i){l=a[i];if(sub($0,C(31)"&"C(39),l))print C(j=!j)l}print C()};
function C(n){return"\033["n"m"}'
subをgsubにするとマッチする全ての文字列に色を付けられるよ。
gawkならgensub使ってもう少し短く書けるかもしれない。IGNORECASE=1で簡単に大文字小文字無視できるし。
- 169 :
- classは使えるようになりましたか? > gawk4
- 170 :
- つ ttp://awk.info/?doc/dsl/awkplusplus.html
- 171 :
- ちゃんとご自分で読んだものを「つ」されてますか?
- 172 :
- ふるいけや "かわず とびこむ" みずのおと
といったレコードを、
field[1]=ふるいけや
field[2]=かわず とびこむ
field[3]=みずのおと
number_of_field = 3
とフィールド分割するすっりした方法を教えて下さい。
- 173 :
- " で split すればいい
- 174 :
- やはり2chでは馬鹿レスしかつかんか。
- 175 :
- >>172
それ、CSVとかでもよく語られることだけど、意外と面倒なのよ。
例えば「"」自体を文字列に入れたい場合はどうするのか、とか色々決めなきゃならんし。
- 176 :
- あれ?awkでclass使いたいって事なんでしょ?
ttp://ja.wikibooks.org/wiki/AWK%2B%2B%E3%81%AB%E3%82%88%E3%82%8B%E3%82%AA%E3%83%96%E3%82%B8%E3%82%A7%E3%82%AF%E3%83%88%E6%8C%87%E5%90%91%E5%85%A5%E9%96%80
- 177 :
- >172
素直に区切り文字を変えるしか...
ふるいけや,かわず とびこむ,みずのおと
FS=","
- 178 :
- 自己レスです。
BEGIN { FPAT = "([^" FS "]+)|(\"[^\"]+\")" }
みたいな事をしました。
- 179 :
- awk にわけわかんな機能を増やすよりも、
RFC4180 互換なフィールド分割オプションを実装すればいいのにといつも思う。
- 180 :
- 馬鹿の巣窟にわざわざ書き込むな馬鹿
- 181 :
- 見事に馬鹿の巣窟と化したねえ
- 182 :
- perl -e 'print $1 if /href="(¥d¥d¥d¥d-¥d¥d¥-¥d¥d)"/'
と同じことをawkでやろうとしているのですがわかりません。
awk -e '/href="(¥d¥d¥d¥d-¥d¥d¥-¥d¥d)"/ { print ??? }'
グルーピングしたあとにそれを取り出す方法を探したのですが、わかりませんでした。
awkまたはsedでのやり方を教えて下さい。
- 183 :
- >>181
馬鹿じゃないあなたに是非>>182の回答をしてもらおうか。
- 184 :
- >>182
perl がわからないから求めるものがよくわからないけれど、こんな感じ?
awk '/href=\"[0-9][0-9][0-9][0-9]-[0-9][0-9]-[0-9][0-9]\"/ {print $1}' input.html
awk '/href=\"\([0-9][0-9][0-9][0-9]-[0-9][0-9]-[0-9][0-9]\)\"/ {print $1}' input.html
BEGIN とか使ったほうがいいのかもしれないけれど
awk '/href=\"[0-9][0-9][0-9][0-9]-[0-9][0-9]-[0-9][0-9]\"/ {print $1} BEGIN { 何か書く }' input.html
- 185 :
- >>182
どのawk使っているか分からないし、入力の仕様も分からないけど、どこでも動くのはこんな感じ
awk -F\" '/href=/ { for (i=1; i<=NF; i++) if ($i ~ /href=$/ && $(i+1) ~ /[0-9][0-9][0-9][0-9]-[0-9][0-9]-[0-9][0-9]/) print $++i }'
gawkでも正規表現パターンのグループを保存している組み込み変数はなかった気がする
- 186 :
- gawk4.0なら
awk '{if (match($0,"href=([0-9]{4}-[0-9][0-9]-[0-9][0-9])",a)) print a[1]}'
じゃ駄目?
- 187 :
- ごめん、
awk '{if (match($0,"href=\"([0-9]{4}-[0-9][0-9]-[0-9][0-9])\"",a)) print a[1]}'
- 188 :
- >>184-186
うーん、あまりわかりやすい方法ではないですね。
メンテナンスしにくいコードになってしまうので、perlが使えるよう上司に交渉したほうがよさそうです。
回答いただいた方、ありがとうございました。
- 189 :
- >>185はともかく>>186-187の方がPerlみたいにグローバル変数にマッチ結果を入れるより分かりやすいと思うのって俺だけ?
- 190 :
- >>189
186は、単にgawk独自の拡張機能を知ってないとわかりにくいというだけであり、
マッチした結果を明示的に変数に代入するのはいいことだと思います。
なお個人的には
match(string, rexp, matched)
はmatchedがいわゆるout変数になるため分かりにくいです。
matched = match(string, rexp)
のほうがよかったです。
- 191 :
- >>190
何言っているのかちょっと分からん。言語仕様上awkは配列を返せないだろ
- 192 :
- gawk独自の実装はどうも…という話がよく出てくるけど、
gawk/mawk/true awk相互で運用する必要ってよくあるものなの?
またはbusyboxのawkで使いたいとか?
- 193 :
- gawkは最早awkと呼ぶには拡張され過ぎている感じがある
よくあるかは知らないけど、少なくとも手元の環境には3種類のawkがあって、gawkの拡張が使えない
mawkはnextfileにも対応してないし、awkは実装の差がかなり大きいと思うよ
- 194 :
- gawkが拡張されてるのは承知だが、gawk依存だとメンテが大変だから
perlというロジックが分かりにくい。
- 195 :
- gawkで
(ああ(いい((うう)(ええ))))
この行の「ああ」「いい」「うう」「ええ」を変数に入れたい時、
何か定番な書き方はありますか?
- 196 :
- 何を期待しているのか分からん
括弧を区切りにして分けたいだけならFS="[()]+"で
配列に入れたいならsplitでどう?
- 197 :
- もしかして括弧の対応をとりながら分けたいってことなら
gawkに詳しい別の誰かに期待してくれ。拡張正規表現でも無理じゃなかったか
- 198 :
- str = "(ああ(いい((うう)(ええ))))"
while (match(str,/([^()]*)/)) {
v = substr(str,RSTART+1,RLENGTH-2)
str = substr(str,1,RSTART-1) substr(str,RSTART+RLENGTH)
if (v != "") {
# 取り出した v をなんかする
}
}
とかじゃ駄目なの?
ちゃんと構文解析するなら yacc (bison) を使わないと駄目だよ
- 199 :
- _
|O\
| \ キリキリ
∧|∧ \ キリキリ
ググゥ>(;⌒ヽ \
∪ | (~)
∪∪ γ´⌒`ヽ
) ) {i:i:i:i:i:i:i:i:}
( ( ( ´・ω・)、
(O ⌒ )O
⊂_)∪
- 200 :
- しつもん
http://gauc.no-ip.org/awk-users-jp/blis.cgi/DoukakuAWK_050 のスクリプトの35行目
for (++day;;) {
の意味と動作がよくわからんです
which で等価なループを書くとどんな感じになるの? カコイイ先輩おしえてplz
- 201 :
- >>200
++day; while (1) {
- 202 :
- >>201
先輩ありがとう
++day を最初に持ってくるのはオイラも考えたんですが、break の条件式も反転して持ってくればおkかなと思って
$ diff time.awk time2.awk
34,35c34,35
<
< for (++day;;) {
---
> ++day;
> while (day >= year_days) {
49,52d48
< }
<
< if (day < year_days) {
< break;
てやったら1日ズレちゃったんだけどこれってどこがマズいんでしょうか (・ω・` )
- 203 :
- >>202
そのbreakの後にも続きの処理があるだろ。年もズレるんじゃない?
- 204 :
- >>203
day の値を追っかけてみたら元のfor、変更後のwhileともに同じ値で終了してたので頭抱えてたんですが
もう少し調べてみたら leap の値がズレてました
break の前の処理が1回分少なかったということで、落ち着いて考えれば当たり前の結論でした (;´Д`)
結局この処理の場合は元々のスクリプトや >>201 のように無限ループ使うのが一番シンプルに
書けるんだなーと確認して納得しました。先輩方ありがとう
- 205 :
- >>205
http://www.amazon.co.jp/gp/offer-listing/4756101623/
- 206 :
- たけえわ!
こういう本こそ電子版にしてくれねえかなあ
- 207 :
- レスありがとうございます
高いけどあるといえばあるんですね
どうしようかな
- 208 :
- ブックオフで先週見たぞ
- 209 :
- 持ってたけどいつの間にか捨てていた
- 210 :
- 紙質が悪くてボロボロになった
- 211 :
- Linuxも電子版出してほしいな(´・ω・`)
- 212 :
- Gawk4.1.4出てたのか。
- 213 :
- なつい
- 214 :
- 長年親しんだテキストの遊園地がなくなってて非常に悲しい
どっかにアーカイブないっすか
- 215 :
- >>214
で、それはいつできるんだ?
できたらURL貼るのを忘れんなよ
- 216 :
- https://archive.org/details/pdfy-MgN0H1joIoDVoIC7
The AWK Programming Language
- 217 :
- おばんです。
Linux環境の方にお願いします。
下記にあるblength()を試してもらえませんか?
http://www1.bbiq.jp/rem_vba/gawk_blength.html
よろしくお願いします。
- 218 :
- なぜそれを Linux で? 何を知りたい?
- 219 :
- HP製作者です。当方の環境はWindowsです。
Linux環境下で同じ実行結果を得ることができるのか、
知りたいのです。
よろしくお願いします。
- 220 :
- いい機会だからLinux入れちゃえば
- 221 :
- それもそうですね。
昔々REDHATだったか入れていました。
現在のおすすめのディストリビューションは何でしょうか?
- 222 :
- 今はMS製のcygwinみたいのがあるのでは。Windows 10 Bashナントカ
- 223 :
- Windows 10 Creators UpdateでUbuntu 16.04.1 これかな。
やってみます。ありがとうございました。
- 224 :
- jgawkをガウォークって読んでたマクロスヲタいない
- 225 :
- 誰でも簡単にパソコン1台で稼げる方法など
参考までに、
⇒ 『宮本のゴウリエセレレ』 というブログで見ることができるらしいです。
グーグル検索⇒『宮本のゴウリエセレレ』
DCQTVO9E2N
- 226 :
- 空の配列はどう作るの。
bashの declare -a var 相当。
- 227 :
- 僕の知り合いの知り合いができた副業情報ドットコム
関心がある人だけ見てください。
グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』
V09DR
- 228 :
- Linux Beep Musicに感動したのでnokia2beeps.tclを移植してみた
https://pastebin.com/hLJnpPNv
nokia2beeps.awkとか保存し下記のページのコードを鳴らすやつ
http://nokia.nigelcoldwell.co.uk/tunes.html
あと日本語の着メロも対応してる(コメント参照)
- 229 :
- awk だけど実行ファイルのフォーマットは ELF …いや、なんでもないです。
- 230 :
- 初心者ですが正規表現で半角をすべてというのはどうやるんでしたっけ
どっかで見たような気がするんですが
- 231 :
- 「半角」ってどう定義するのか難しいな
この辺読んでがんばれ
https://www.gnu.org/software/gawk/manual/gawk.html#Bracket-Expressions
- 232 :
- >>226
Awk の識別しは、最初っから空の配列だよ
いきなり使えば良い
- 233 :
- みなさんはgawk以外の処理系に移植できるか
とか、多少でも考えますか?私は気にしなくなりました。
他にも幾つか実装があるにはあるんですが、あんまり
活発じゃないし、言及もされないし、こだわりすぎると
不便でしょうがないから、気にしなくなりました。
けしからんでしょうか?
- 234 :
- GNU awkが事実上標準だからPOSIX準拠は気にしないな
- 235 :
- AWK48!!
- 236 :
- GNU AWK 5.0がリリース。8年ぶりのメジャーバージョンアップ。正規表現ライブラリが
GLIBCからGNULIBへ移行、名前空間が実装 2019年4月17日
https://www.publickey1.jp/blog/19/gnu_awk_508glibcgnulib.html
UnixやLinuxにおいてsedやgrepなどと並んでよく知られているツールの1つがawk(オーク)
です。このawkのGNUプロジェクトによる実装の最新版「GNU AWK 5.0」(gawk 5.0)の
リリースが発表されました。
2011年にリリースされたGNU AWK 4.0から8年ぶり、直前のバージョンでとして2017年10月に
リリースされた4.2.0からは約1年半ぶりとなります。
AWKはいわゆるスクリプティング言語の一種。変数や関数、制御文など基本的な構文を備え、
テキストファイルを効率的に処理できるのが特徴です。
GNU AWK 5.0の新機能としては、printfの%aおよび%Aの書式がPOSIX標準に準拠したこと、
正規表現のルーチンが、長年にわたってメンテナンスされてきたGLIBCからGNULIBに
置き換わったことなど。
また、識別子に非英語文字を使うためのドキュメント化されていなかったオプションなどは
削除され、ソースコードはC99環境が想定されるようになっています。
そして新たに名前空間が実装されています(詳細はマニュアルを参照とのこと)。
- 237 :
- 名前空間って、これまでのスクリプトが動かなくなるんだべか。
- 238 :
- さすがにそれは無かった。
$ gawk --version
GNU Awk 5.0.0, API: 2.0 (GNU MPFR 4.0.2, GNU MP 6.1.2)
:
$ gawk 'BEGIN{print awk::ARGC}'
1
$ gawk 'BEGIN{print ARGC}'
1
$
- 239 :
- ageで行こう
- 240 :
- >>226
BEGIN {
for (i in a); #空配列作成
if (isarray(a)) print "aは配列である";
else print "aは配列でない";
}
- 241 :
- gawkでキーボードから一文字入力をしたいんですが、何かいい方法ないでしょうか?
stdinをgetlineするのではなく、キーを何か一つ押したときにそのコードを即座にgawkで受け取りたいんです。
具体的に何がしたいのかというと、BEGIN内部でスクリプトの動作を設定するパラメタをキーボードで指示したいんですが、
その支持を矢印キーでメニュー選択させたいんです。
ターミナルのエスケープシーケンスはVT100環境を想定しています。
何かヒントでもいいので一文字入力の方法を教えてください〜
gawkはこれ使ってます。
GNU Awk 4.2.1, API: 2.0 (GNU MPFR 4.0.2, GNU MP 6.1.2)
- 242 :
- 追記
gawkを動かす環境はubuntu19.04で、主にWindowsからteratermでsshログインしての使用を考えています。
- 243 :
- >>241
awkじゃなきゃあかんの?
cursesでやればいいと思うけど
- 244 :
- >>243
awkでやりたいんですよ。
cursesってawk用ライブラリありましたっけ?
自分アホなりに色々調べて、"read -n 1" をうまく使えば文字コード取れそうという所までは気がついたんですが、
これをawkスクリプト中で実行させて戻り値をawk変数に取り込む方法がわかりません。
どうすれば文字コードが取れるんでしょう?
- 245 :
- 試さないで適当に書いてみるけど
一文字読みとる command 用意して
command | getline var
もしくは入力された文字を終了ステータスとして返す command で
var = system(command)
- 246 :
- 試してから書きゃいいのに。
- 247 :
- >>244
確かにそれはちゃんと機能する。しかし、矢印キーとなると話は別だ。
矢印キーは 3 バイトだから。
1 バイト読んで ESC だったらもっと読むということになる。
もちろん ESC じゃなかった場合のことも考える。
想定した処理が全部終わった後で、印字可能文字で 1 行で出力する
…というプログラムを C で書くということになるかなあ。
ところでエコーバックはどうする? 多分、こんなこともしたくなるんじゃないか。
https://qiita.com/Ki4mTaria/items/36feda5f6aa54643775a
dialog とか使った方がいいんじゃないかな。
- 248 :
- なんかすみません。
dialog & shell & awkでできるのはわかってるんですが、なんか負けたような気がしてw
なんとかshellのコマンドか標準で入っている外部コマンド & awkでできないもんかと思ったんです。
Linux ←→ Windowsのポータビリティを考えた場合、やはり1文字入力してそれを返すだけの小さなプログラムをCで作ってawkでそれを呼んで戻り値を得るのが一番手っ取り早いのかな、と思いつつあるところです。
でも、もう少し最初の路線で調べてみます。徒労に終わりそうな気はしますが。
- 249 :
- bash でも出来なくはないと思う。読むだけならいくらでも出来る。
しかし、「残さず食べる」ということを考えると read -n はちょっと…
なぜこれを考える必要があるかというと、食べ残しがあるとたとえばシェルの場合なら
それをコマンドラインだと思って読んでしまっだりする。
read -n は食べ残しが無かったら入力待ちになってしまうので適していないと思う。
他人に使わせるプログラムなら常に意識しておくべきことかもしれない。
そこで、まだ試してないならこんなことを試してみてほしい。
BEGIN {
cmd = "bash -c 'TMOUT=5 ; read -N 8 v ; echo \"$v\" ;'"
for( i = 0; i < 8; i++){
while ( 0 < ( cmd | getline)){
print "i=" i ", 0=[" $0 "]"
}
close( cmd)
}
}
得られたデータの長さが指定した長さに達していないならタイムアウトで終了した。
つまり、食べ残しは無いということになると思う。
ただし、改行の扱いがめんどくさい。
bash は read で読んだ改行をちゃんと送っているのだが getline が削除してしまう。
そして最後の改行は echo が加えたもので、read で読んだのではない。
awk の方で RS の値を変えることでめんどくささが減る可能性はある。
しかしやはり最終結果だけを 1 行で受け取るほうがいいかもしれない。
もっとも、入力元を共有しているから食べ残しが問題になるのであって
新たに端末エミュレータを起動してその上で実行するのなら問題にならない。
パイプが繋がらないから別の方法で結果を返す必要はあるが、メニューを出して
ユーザに選択させるという用途なら悪くない方法かもしれない。
- 250 :
- そもそも「リターンキーで決定」とかなら食べ残しの心配は無いかな?
- 251 :
- ありがとうございます。
-Nオプションでタイムアウト指定をするというのは目からウロコでした。
秒数を1にして、できるだけレスポンスのいい動きをさせようと思います。
矢印キーは3文字、Fnキーは5文字になるんですね。
そんなことも知りませんでした(汗
今日はawkにはpythonやperlにはあるord関数とchr関数が無いことを知って愕然としてました(笑)
文字を受け取ったはいいものの、文字コードをどうやって調べようかと悩んで行き着いた先のコードです。
笑ってやってください。
function ctblmake(ctbl) {
for (i = 0; i < 255; i++) {
ctbl = ctbl sprintf("%c", i);
}
return ctbl;
}
function ordhex(c) {
return sprintf("%02x", index(ctbl, c)-1);
}
BEGIN {
ctbl = "";
ctbl = ctblmake(ctbl);
print ordhex("?");
print ordhex("c");
print ordhex("b");
}
今日はもう寝ます
- 252 :
- perlとかでやれよ。
awkで簡単に出来ることをsed+grepで頑張る人達がクダスレ辺りに沢山いるが、それと同等だろう。
知恵の輪としては面白いけれど、成果には乏しいのでないか。
- 253 :
- それを言っちゃあおしまいよ
- 254 :
- なんか、返事するのがアホくさくなってきました。
さようなら。
- 255 :
- 頭使って面白いなら、贅沢に時間使ってAWKでできること
何でもやるべき
時間がなきゃ252みたいになる
成果?笑わせる
- 256 :
- awkはまずデータファイルありきで便利なものだしねえ。
趣味でどういう使い方しても勝手だけど。
- 257 :
- >>254
Perl を知っていながら awk でやろうってんだから、この程度のことは予想できたでしょう。
無視してりゃいいんだよ。
もっとも、真剣に取り組んでいるなら他の場所を探してもいいかもしれない。
でもここにも君を助けようとした者がいたことは覚えておいてほしい。
- 258 :
- あっ、某知恵袋はやめときなさい。あそこは知ったかぶりが多いから。
知らないなら回答しなきゃいいのにね。
- 259 :
- >>258
Linuxオタが集う外国の掲示板当たりの良いのかもな
普通のLinuxユーザーなら、awkにこだわりすぎの変な奴だになって
相手にしてはいけない・からかってやれだろうからな。
- 260 :
- >>259
海外の方が盛でしょうしね
- 261 :
- teratailというところでawkの質問・回答見てきたけど
あんまりおもしろくなかった
純粋にawkの質問というのが少ない
この板は貴重、保護するに値する
やる気をスポイルするの今度から禁止な
- 262 :
- 英語は苦手ですが海外の掲示板に以下の質問を投稿しました
題:文字列から1文字ずつ抽出
AWK:文字列の先頭から末尾まで1文字ずつ取り出す場合
こんな風に記述されたものをよく見かけます
例:
function rev1(str, i, ret) {
for (i = 1; i <= length(str); i++)
ret = substr(str, i, 1) ret;
return ret;
}
私は、length()を使う必要はないと思っています
function rev2(str, ch, i, ret) {
while (ch = substr(str, ++i, 1))
ret = ch ret;
return ret;
}
これは動作しますが、間違っていませんか? と書きました
rev1():定番パターンですが、このケースでfor+length()は、
文字列を先頭から末尾まで全部読むにも拘わらず、
文字列全体の長さをあらかじめ調べるという
「頭の悪いアルゴリズム」で成り立っています
もう少しスマートな方法があるかもしれないと考えたものがrev2()です
回答いただいた外国の方との根源的な部分の共感はやはり難しいです
英語勉強しないと
- 263 :2020/02/07
- 【日本】 コカコーラ、ラーコカコ 【イスラエル】
http://lavender.2ch.sc/test/read.cgi/min/1575174748/l50
LINUX協会会長だけど、なんか質問ある?
Devuan: Debian Without Systemd Ver.1
LINUX協会会長だけど、なんか質問ある?
KNOPPIX 24
KNOPPIX 24
Nexus 7(2012) で Ubuntu
WindowsやめてLinuxデスクトップ! 25
Linuxデスクトップ(GUI)への不満点・愚痴
LINUX協会会長だけど、なんか質問ある?
SCIM(Smart Common Input Method platform) part.2
--------------------
【NO.6】新政【亜麻猫】
グラナド エスパダ エミュ鯖スレ
フィロソフィーのダンス PART22【フィロのス】
コンピューターランド小田急相模原店
【ブレフロ2】 ブレイブフロンティア総合スレ part1200
理不尽だと思ったクイズの答え
【日の丸なし】野球U18日本代表が韓国到着 出発前には無地の白シャツで笑顔で記念撮影(画像あり)
親が占い師です
【いつかは】服を捨てよう 40着目【来ない】
ドラマを語ろう★2018/8/3〜
紀勢本線(きのくに線)総合スレ29両目 [転載禁止]©
【糞運営】アイドリッシュセブン Part65【アイナナ】
女子MMA総合スレ 22
【投稿サイト】小説家になろう3418
RIZIN堀口恭司が衝撃KO負けの真実と再戦計画を激白「大晦日にベルトを渡しすぐに返してもらう」
【2010】上海万博総合スレ2【5000万突破】
パディントン Paddington マーマレード 3瓶目
国家一般職☆北海道 Part7
【眞鍋かをり】THE YELLOW MONKEY★201【愛してる】
BOSTON RED SOX 139
TOP カテ一覧 スレ一覧 100〜終まで 2ch元 削除依頼