Author Archives: admin

pythonのargparseの基本

pythonのargparseが難しいくて戸惑うので基本のもの

引数を取らないオプション

引数を1個とるオプション(デフォルト)

引数を1個とるオプション(個数指定)

0個か1個だけとるメイン(オプションのない)の引数

1個からN個とるメインの引数

nargsが+

0個からN個とるメインの引数

考察

ほかにもいろいろなことができるのだがやりすぎて使いにくくなってる感がある。基本を押さえと置けば理解もできるようになると思う。

python: 文字列はimmutableでリストはmutable

immutable

とは値を変えられないということ、というふうに言われるがpythonの場合は分かりづらい。
immutableとは変数の値が知らないところで書き換えられることがないことを示している。
文字列はimmutableと言われる。

C言語だと文字列はmutableになる。

pythonや多くの言語では上記のようなことはできず、文字列はimmutableになっている。

リストはmutable

mutableとは変数が知らないところで書き換わってしまうこと。

aとbは同じ実体を表すのでaに追加した4がbにも反映される。
しかし以下の場合は違う。

aに代入した[4,5,6]はもともとa,b両方が参照していたリストとは違うリストで新しく代入している。この場合はaとbは違うリストを参照している。
2つの変数が参照しているものが同じかどうかを調べるにはid()を使う。

文字列とリストでの関数の違い

しかし文字列でも同じid()を持つことはある。同じであってもそれが読み込みしかされていないなら問題はない。しかしそれを変更するわけにはいかないことから、このような違いは文字列とリストでの関数の違いとなって現れる。文字列の関数は常に新しい文字列を返し、自分自身を変更することはしない。リストの関数は常に自分自身を変更し、リストを返さない。

upper()は新しい文字列を返し、自分自身は変更しない。

append()は何も返さず、自分自身を変更する。

注意点

このようなふるまいからリストを使うときは注意を要することがある。

append()はリストを返さないのでlには何も入らない。以下のようにしないといけない。

pythonでcat

catコマンド

ファイルの中身を表示する

以下のようにしても動く

これは標準入力からファイルの内容を受け取りそれを出力している。

標準入力での切り分け

上記のことをpythonで実現するにはまず標準入力が普通の標準入力(キーボード)かパイプかを調べて処理を分ける。

ttyとはteleprinterのことで、昔あった手元にあるキーボードから遠くのプリンターに文字をタイプするマシンのことらしい。Linux界では接続されているキーボードをttyという概念で認識する。

ttyだった場合、引数にファイルがあればそれを表示し、なければ標準入力(キーボード)から入力を受け付ける。

ファイルの処理

パイプの処理

標準入力がキーボードで引数がない場合やパイプの場合はstdinから読み込む

これで大体動くが、catとの違いはキーボードから入力したときのエコーバックの時期が違う。catは1行ごとにエコーバックするが、このスクリプトの場合、Ctrl+D(Linux)やCtrl+Z(Windows)でEOFが送られるか、バッファがいっぱいになるまでwriteへ処理がいかない。よってこれを直す。

考察

キーボードとパイプの両方から入力を受け付けると便利なことが多い。スクリプトがjsonファイルを受け付けるとき、ユーザー側には他の形式のファイルがあってそれをjsonに変換してスクリプトの入力としたい時などパイプ入力がないといったんファイルに変換しないとならなくなる。

C++/CLIのstatic コンストラクタの呼ばれる順番

staticコンストラクタはクラスがはじめてつかわれる時に一回だけ呼ばれるコンストラクタ

テスト

上記の場合はA→Bの順で呼ばれる。

上記の場合はB→Aの順で呼ばれる。Bが使われてるところでAも呼ばれる。

考察

上記のAがライブラリのような自分で触れないコードの場合、それがいつ呼ばれるのか、すでに呼ばれているのかを知る一般的な方法はないと思う。Astaticコンストラクタでなにかのデータを初期化してる場合はBstaticコンストラクタにそのデータを書くのは危険だろう。

多重継承できるインターフェースのstaticコンストラクタは呼ばれなかった。

ソースコードにgitのhashを埋め込んでおく

ビルドの際にgitのリビジョン(sha1ハッシュ)をソースに埋め込んでおけば、デグレードが起きた際などにソースをかんたんに復元できるだろう。gitにはrev-parseというサブコマンドがあり、これでHEADの40桁のsha1を出力できるのでpythonで取得するには以下のように書けばいい。

check_outputはコマンドの出力を返してくれる(コマンドが0以外を返すと例外)。

あとはC++ヘッダーファイルなどに書き出して、ビルドすればよい。

gitおサブモジュールを使っている場合はこれで問題ないが、他のgitで管理しているソースも取り込んでいる場合には、それらのハッシュも記録しておいたほうがいいだろう。

C++/CLIでListのソート

大変

基本

これは簡単。しかし要素がクラスだと難しい

SortはインターフェースIComparerを引数にとるので、まずはこれを継承するクラスをつくりその仮想関数Compareで比較をする。

自分のクラスで

自分のクラスMyClassstatic int Compareを定義する。次にMyClassComparerも定義する。こうしないでMyClassIComparerから派生させると、Sortの際に自分のクラスを渡すことになってなんかおかしい感じになる。

ソース:https://github.com/ambiesoft/blogprogs/tree/master/6085

to_stringとto_wstring

to_stringとto_wstringはintなどを文字列にして返す標準ライブラリ関数。便利なのだが、charとwchar_tで分かれているので汎用コードを書きたいときにそのまま書きたくない。Windowsはもはやwchar_tが主流だしLinuxではcharが主流でwchar_tは4バイトになることが多い。よってこれらをそのまま使うと汎用性がなくなる。

テンプレート関数

これらの関数をテンプレート関数にしたいとき、テンプレート引数は2つになり、最初の引数はcharかwchar_t、次の引数はintやdoubleとなる。テンプレート関数は部分特殊化ができないので、これらの組み合わせすべて書くしかなくなって効率が悪い。

テンプレートクラス

テンプレートクラスは部分特殊化ができるので、これを利用して汎用関数をつくりたい。文字列クラスのデフォルトをWindowsならwchar_tとしそれ以外ならcharとして扱えば同じ関数記述にできる。

汎用テンプレートクラスの定義

これは実体化されることを想定してないので、static_assert常に失敗。
次にcharの部分特殊化

同様にwchar_t

ここまではユーザは意識しないコード。次がユーザが呼ぶ関数。

SYSTEM_CHAR_TYPEは事前にtypedefされているcharかwchar_t。

テストコード

bool追加

to_stringにはboolがなく、intとして解釈されるようなのでboolも完全特殊化で定義

ソース:https://github.com/ambiesoft/lsMisc/blob/master/stdosd/stdosd.h

考察

C++にはもともとstreamがあって、それを使えばすべて汎用関数で書けそう。しかしto_stringとかの実装はそうなってないようなのでスルー。

これとは逆の関数。文字列からintなどに変える関数は引数に文字列しか入らないので型の推論ができないのでそれぞれの型ごとに別関数にするしかないものと思われる。

1>mfcs140ud.lib(dllmodul.obj) : error LNK2005: _DllMain@12 は既に MSVCRTD.lib(dll_dllmain_stub.obj) で定義されています。


MFCDLLに普通のDLLを追加したら起きた。

解決法

MFCDLLの「追加の依存ファイル」にmfcs140u.libを追加する。

mfcs140uは強制的にリンクされるらしく、それはCRTよりも早くリンクされなければならないのにDLLを追加したらから順番がずれた?

140とかuとかは場合によって変わるかもしれない。140はVisual Studio 2019あるいはもっと前のバージョン、uはユニコード?、デバッグバージョンのものもあるかもしれないが大変なので無視

ググるといろんな解決法が提示されているけど自分の場合はこれで直った。

追記

デバッグでビルドすると警告が出るが、mfcs140ud.libにすると消える

Dicregateでページを読み込み後一部のエレメントを消す

Remove an element from the page on Dicregate

必要のないタグを見つける

  1. chromeで対象のページを開く
  2. Ctrl+Shift+Iで「開発ツール」を開く
  3. Ctrl+Shift+Cで「エレメント選択モード」に入る
  4. 消したい部分をクリックする
  5. 開発ツールにクリックしたエレメントが表示されるので右クリックして「コピー」「JS Pathをコピー」をクリック
  6. 開発ツールの上のタブから「Console」を選ぶ
  7. コンソールに「貼り付け」てから.remove()を追加してエンターを押す。
  8. 消えるかどうか確認する
  9. .remove()まで含めてコピーする

Dicregateのイベントに登録

  1. Dicregateの辞書のタブから「辞書の編集」をクリックして、編集ダイアログの「イベント」を選択する。
  2. 「ページの読み込み後Javascript実行」をチェックする
  3. コード欄に先ほどコピーしたJavascriptコードを張り付ける。
  4. 「OK」をクリックする
  5. ページで検索などしてみて消えるかどうか確認する

C++ テンプレート関数をソース・ファイルに書く

前提

まだ完全にはわからない

Tが汎用の場合

std::vector<T>などのTに何でも入れられることを前提にしてつくられているクラスはヘッダに書くしかないと思う。

Tが一部の型のみの場合

この場合はソースファイルにかける。

ここでは文字列の長さをを返す関数でchar*とwchar_t*をとるGetStringLength()を考える。

ヘッダ

最初のテンプレート関数は汎用のTを受け取る。もしテンプレート関数が実体化されたときはstatic_assertでエラーになるようにしている(sizeof(T)は決して0にならない。falseを指定してしまうと実体化しなくてもエラーになってしまう(コンパイラ依存))。char*とwchar_t*で特殊化するので、それ以外のポインタで呼ばれたときに実体化される。

次の2つは特殊化の宣言。定義はソースに書く。
次の2つは特殊化が実体化されるときの場所の指定。externでどこかにそれがあることを示している。

ソース

最初の2つは特殊化の定義。
次の2つは特殊化が定義されるときここに実体化されることを意味する。

main.cpp

今回の場合は実装がほぼないのでテンプレートにする意味があんまりないが、2つの実装がほぼ同じで、一部だけ書き換えたいときは汎用Tの方に実装を書くこともできる。その場合にこのテンプレートを使うこともできる。

Tが一部の型のみの場合(バージョン2)

ヘッダー

ソース&main.cpp

ソース:https://github.com/ambiesoft/blogprogs/tree/master/6038

考察

テンプレート関数の定義をソース・ファイルに書くと、他のソース・ファイルからは見ることができないのでリンカーでつなげることになる。よって鉤括弧なしのtemplateは実装を実体化し外部に公開して他のソース・ファイルから見えるようにしているのだと思われる。

鉤括弧ありのテンプレートはあくまでコンパイルフェーズで解決するものであり、宣言だけのテンプレートを実体化しても宣言だけになり、それがリンクされることもないのだと思われる。