[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[port139ml:03179] Re: jstrings (Japanese 'strings' command)
- To: port139ml@xxxxxxxxxxxxx
- Subject: [port139ml:03179] Re: jstrings (Japanese 'strings' command)
- From: "HASEGAWA, Yosuke" <hasegawa@xxxxxxxxx>
- Date: Fri, 02 May 2003 10:45:56 +0900
はせがわといいます。
# port139 の subscribe、予想より速い…。ほんとに手動登録ですか?
>えーと もとのぶ先生が、[port139ml:03118] で紹介した はせがわさんのを
>ベースに? EUC-JP にも対応したのを公開されています。
とりあえず、もにょさん版 jstrings-0.21 を見ました。
私も同じ失敗をしていたんですが、SJIS で leadbyte - leadbyte - tailbyte
という並びになっていたときに、最初の leadbyte を見た時点で tailbyte 待
ちになってしまい、2バイト目+3バイト目の SJIS な文字がうまく認識できない
です。
ちなみに、これは --ascii でもおかしいかも。
----
G:\jstrings-0.21>dump /a test.txt
00000000 82 30 31 32 33 0D 0A ..123..
file:TEST.TXT 7bytes readed.
G:\jstrings-0.21>cat test.txt |jstrings --ascii
G:\jstrings-0.21>
----
で、はせがわ版でこれらを直したものを
http://www.alles.or.jp/~hasepyon/jstrings/jstrings-0.3.lzh
においてあります。
とりあえず時間と環境がなくて VC++ 以外はコンパイルさえ確認していません。
もにょさん版とは違う味付けにしようと思って、とりあえず実装の楽な EBCDIC
対応なども入っていたりします。
もちろん、ファイル内でのオフセット位置の表示もOKです。
ちなみに、ファイル名はオプションより前にあっても OK ですし、-i や -n に
続くスペースはなくても構いません。
C:\>jstrings -f test01.txt -iASCII -n 10 test02.txt
とか。
>email の残骸を拾えるようにぜひ JIS(ISO-2022-JP)へも対応いただけると
>嬉しいっす。
そうしたいのですが、時間が…。あと、仕様的にも
1b 24 42 24 22 00 24 22
↑ゴミが挟まってる
みたいな文字列に対して、2度目に出現した 24 42 はどう扱う? みたいな問題
もあったりします。
---
はせがわ hasegawa@xxxxxxxxx
"UNIX 4.3BSDの設計と実装" 復刊リクエスト投票募集中
http://www.fukkan.com/vote.php3?no=4316