Author Archives: admin

Visual Studioだけで試した。自分用に貼っておく。

char szA[32];
wchar_t szW[32];
{
	// 普通は日本語を直接こう書いてはいけない
	// 日本語環境のWindowsをつかっているとソースコードの文字コードに関わらず
	// pはcp932になる
	// 英語環境の場合はpには文字化けした文字しか入らない
	// char p[] = "あいうえお";
	// "あいうえお"のcp932での値列
	char p[] = { 0x82, 0xa0, 0x82, 0xa2, 0x82, 0xa4, 0x82, 0xa6, 0x82, 0xa8, 0x00 };
	
	// これを書かないと動かない
	// 第2引数""はユーザの環境でロケールを初期化することを意味する
	// setlocale(LC_ALL, "");  // 日本語Windowsの場合はこれでも大体動く
	setlocale(LC_ALL, ".932");  // 日本語じゃないWindowsの場合でも動く
	

	size_t converted = 0;
	int ret = mbstowcs_s(&converted, szW, p, _countof(szW) - 1);
	assert(ret == 0);
	
	// もとに戻す
	ret = wcstombs_s(&converted, szA, szW, _countof(szA) - 1);
	assert(ret == 0);
	assert(strcmp(p, szA) == 0);
}

{
	// こう書くのはセーフ
	// ただしソースコードをutf8で保存すること
	char p[] = u8"あいうえお";
	
	// これを書かないと動かない
	// 第2引数はUTF8でロケールを初期化することを意味する
	setlocale(LC_ALL, ".UTF8");
	
	size_t converted = 0;
	int ret = mbstowcs_s(&converted, szW, p, _countof(szW) - 1);
	assert(ret == 0);

	// もとに戻す
	ret = wcstombs_s(&converted, szA, szW, _countof(szA) - 1);
	assert(ret == 0);
	assert(strcmp(p, szA) == 0);
}

char szA[32];

wchar_t szW[32];

{

// 普通は日本語を直接こう書いてはいけない

// 日本語環境のWindowsをつかっているとソースコードの文字コードに関わらず

// pはcp932になる

// 英語環境の場合はpには文字化けした文字しか入らない

// char p[] = "あいうえお";

// "あいうえお"のcp932での値列

char p[] = { 0x82, 0xa0, 0x82, 0xa2, 0x82, 0xa4, 0x82, 0xa6, 0x82, 0xa8, 0x00 };

// これを書かないと動かない

// 第2引数""はユーザの環境でロケールを初期化することを意味する

// setlocale(LC_ALL, ""); // 日本語Windowsの場合はこれでも大体動く

setlocale(LC_ALL, ".932"); // 日本語じゃないWindowsの場合でも動く

size_t converted = 0;

int ret = mbstowcs_s(&converted, szW, p, _countof(szW) - 1);

assert(ret == 0);

// もとに戻す

ret = wcstombs_s(&converted, szA, szW, _countof(szA) - 1);

assert(ret == 0);

assert(strcmp(p, szA) == 0);

}

{

// こう書くのはセーフ

// ただしソースコードをutf8で保存すること

char p[] = u8"あいうえお";

// これを書かないと動かない

// 第2引数はUTF8でロケールを初期化することを意味する

setlocale(LC_ALL, ".UTF8");

size_t converted = 0;

int ret = mbstowcs_s(&converted, szW, p, _countof(szW) - 1);

assert(ret == 0);

// もとに戻す

ret = wcstombs_s(&converted, szA, szW, _countof(szA) - 1);

assert(ret == 0);

assert(strcmp(p, szA) == 0);

}

C言語とC++のlocale

2021年7月23日

admin

C++ No Comments

localeの基本

日付の表示方法は国によって違う。アメリカなら’Friday, July 23, 2021’みたいになり、日本なら’2021/7/23’みたいになる。ほかにも、数字のカンマやピリオドのつけ方や金額表示の仕方もちがう。このような違いを扱うのがlocaleという概念。

char *setlocale(
   int category,
   const char *locale
);

char *setlocale(

int category,

const char *locale

);

catergoryには時刻を扱う。LC_TIMEなどいろいろあるが、ここでは一括で扱うLC_ALLを基本的に考える。

locale文字列は国・地域・言語を表す文字列で、”en-US”などと指定するがプログラム開始時には”C”になっており、”C”は１文字１charであることを意味している。”en-US”などの場合は言語と地域を表しており、さらに追加して”en-US.UTF8″などとも書ける。localeにNULLを渡すと現在の値を取得する。localeに空文字を渡すとユーザのデフォルトの国や地域そしてコードページが指定される。

printf("Current locale is '%s'\n", setlocale(LC_ALL, NULL));
printf("Locale for empty is '%s'\b", setlocale(LC_ALL, ""));

1 2	printf("Current locale is '%s'\n", setlocale(LC_ALL, NULL)); printf("Locale for empty is '%s'\b", setlocale(LC_ALL, ""));

これを英語のWindowsで実行すると以下のように出力される。

Current locale is 'C'
Locale for empty is 'English_United States.1252'

1 2	Current locale is 'C' Locale for empty is 'English_United States.1252'

Englishが言語で、United Statesが国・地域、1252がコードページを表しこれは’en-US.1252″と同じ意味だろう。

localeに”.UTF8″とするとコードページだけ変えることができる。ここで指定したコードページはmbtowcsなどでワイド文字列に変換するときに使われる。

wchar_t szW[32];
{
    setlocale(LC_ALL, ".1252");
    char p[] = "あ";
    // 文字化け、コードページ1252(latin1)に'あ'はない
    // ここの"あ"はソースコードの文字コードがどうであろうとANSIと解釈されるはず
    // つまり英語環境のWindowsではpはそもそも文字化けしている。
    mbtowc(szW, p, strlen(p));
}
{
    setlocale(LC_ALL, ".UTF8");
    char p[] = u8"あ";
    // pはUTF8
    // ちゃんと変換できる。
    mbtowc(szW, p, strlen(p));
}

wchar_t szW[32];

{

setlocale(LC_ALL, ".1252");

char p[] = "あ";

// 文字化け、コードページ1252(latin1)に'あ'はない

// ここの"あ"はソースコードの文字コードがどうであろうとANSIと解釈されるはず

// つまり英語環境のWindowsではpはそもそも文字化けしている。

mbtowc(szW, p, strlen(p));

}

{

setlocale(LC_ALL, ".UTF8");

char p[] = u8"あ";

// pはUTF8

// ちゃんと変換できる。

mbtowc(szW, p, strlen(p));

}

C++の場合

上記の話はC言語の話だった。C言語ではlocaleは１つしかなく、グローバル設定があるだけだったが、C++ではlocaleはクラスになった。

C言語との関係

stdにもstd::setlocale()があり、これは上記と同じようにグローバルなlocaleを設定するものだろう。

localeクラス

C++ではcategoryの代わりにFacetと言うようになった。
C言語ではsetlocal()で設定した情報はグローバルでどこかに格納されそれがアプリコードからは見えないところで参照されるが、C++のストリームでは明示的にlocaleクラスを設定しなければならない

コンストラクタ―

引数のないコンストラクタstd::locale()は、グローバルlocaleクラスのコピーを作成する。

文字列を指定

std::locale("ja-JP")は”ja-JP”のlocaleクラスを作成する。作成しただけではどこにも反映されない。

std::locale::classic();

これはsetlocal(LC_ALL, "C")と同じlocaleのインスタンス参照をかえす。

グローバルに設定

staticなstd::locale::global(locale& l)を呼ぶと、locale lをグローバルに設定する。

ストリームに設定

C++方式でグローバルに設定したlocaleはC言語の関数には影響を与えるがストリームには影響しない。ストリームに反映させるにはimbue()を使って設定する。

{
    std::locale loc("en-US");
    std::wcout.imbue(loc);
    std::wcout << loc.name().c_str() << " " << d << '\n';
}
{
    std::locale loc("ja-JP");
    std::wcout.imbue(loc);
    std::wcout << loc.name().c_str() << " " << d << '\n';
}
{
    std::locale loc("de-DE");
    std::wcout.imbue(loc);
    std::wcout << loc.name().c_str() << " " << d << '\n';
}

{

std::locale loc("en-US");

std::wcout.imbue(loc);

std::wcout << loc.name().c_str() << " " << d << '\n';

}

{

std::locale loc("ja-JP");

std::wcout.imbue(loc);

std::wcout << loc.name().c_str() << " " << d << '\n';

}

{

std::locale loc("de-DE");

std::wcout.imbue(loc);

std::wcout << loc.name().c_str() << " " << d << '\n';

}

en-US 1,234.56
ja-JP 1,234.56
de-DE 1.234,56

en-US 1,234.56

ja-JP 1,234.56

de-DE 1.234,56

Facetとstd::codecvt

省略、facetはbasic_stringのtraitsのように自分で作ることができる、codecvtもfacetの一つ、これは非推奨でなおかつlocaleを使いにくい。globalなlocaleも反映されない。

式の中に出てくるtypenameやtemplate

2021年7月21日

admin

C++ No Comments

これらのキーワードは次のトークンがタイプなのかテンプレートなのかを指定する。テンプレート関数内でテンプレート引数Tに依存するトークンが出てきたとき、コンパイラはそのトークンがタイプなのかテンプレートなのか関数なのか変数なのかわからない。

T::A<0>(x);

1	T::A<0>(x);

Aが変数なら、例えば0に置き換えてみると以下のようになる。

0<0>(x);

0<0>(x);

<や>は小なりと大なりと解釈され、有効な式になる。

Aが関数の場合は<0>はテンプレート引数となりxを引数とする関数コールになる。

Aがテンプレートクラスの場合はそのクラスインスタンスxの定義になる。

テンプレートが実体化されたときにわかりそうだが、意図した動作と違う時にエラーの発見が難しくもなりそうなので、Tに依存するトークンでそれがあいまいな場合（どんな時あいまいなのかはよくわからない）はtypenameやtemplateといったキーワードをつける約束になっているようだ。この例の場合はAはintなどの基本タイプにはなれない。

このような用途で使うのがtypenameとtemplate。

typename

T::Aがタイプの場合に指定する。これはよく使う。意味不明なエラーが出た場合につけると直ることが多い。

template

カギカッコなしのtemplateは他の使い方もあるが、ここではTに依存する（Tの中にある）テンプレートクラスやテンプレート関数を指定するときにつけるようだ。テンプレートクラスの場合はタイプでもあるので、両方つけることもある。

typename T::template A<0>(x);

1	typename T::template A<0>(x);

こういうものをつけなければならないときはusingを使って別名にしておいた方がいいだろう。

実験したまとめ

Aが変数の場合

typenanmeもtemplateもつけてはいけない（つけるとエラー）

Aが関数テンプレートの場合

typenameとtemplateと両方つけるか、何もつけない（typenameだけだとエラー）

Aがクラステンプレートの場合

両方つけないとエラー

ソース

https://github.com/ambiesoft/blogprogs/tree/master/6151/templatetypename

#include <iostream>

struct S1 {
    static constexpr int A = 0;
};
struct S2 {
    template<int N>
    static void A(int) {}
};
struct S3 {
    template<int N>
    struct A {};
};

// Uncomment one of three
// #define SISS1
#define SISS2
// #define SISS3

#ifdef SISS1
template <class T>
void foo() {
    //// error C2903: 'A': symbol is neither a class template nor a function template 
    //typename T::template A<0>(x);
     
    //// error C7511: 'A': 'typename' keyword must be followed by a qualified name
    //typename A<0>(x);

    int x = 0;
    T::A<0>(x);
}

int main()
{
    foo<S1>();
}
#endif


#ifdef SISS2
template <class T>
void foo() {
    int x = 0;
    typename T::template A<0>(x);
    T::A<0>(x);

    //// error C7511: 'A': 'typename' keyword must be followed by a qualified name
    //typename A<0>(x);
}

int main()
{
    foo<S2>();
}
#endif


#ifdef SISS3
template <class T>
void foo() {
    typename T::template A<0>(x);

    //// error C7511: 'A': 'typename' keyword must be followed by a qualified name
    //typename A<0>(x);
    
    //int x = 0;
    //// error C2371: 'x': redefinition; different basic types
    //T::A<0>(x);

    //// error C3861: 'x': identifier not found
    //T::A<0>(x);
}

int main()
{
    foo<S3>();
}
#endif

#include <iostream>

struct S1 {

static constexpr int A = 0;

};

struct S2 {

template<int N>

static void A(int) {}

};

struct S3 {

template<int N>

struct A {};

};

// Uncomment one of three

// #define SISS1

#define SISS2

// #define SISS3

#ifdef SISS1

template <class T>

void foo() {

//// error C2903: 'A': symbol is neither a class template nor a function template

//typename T::template A<0>(x);

//// error C7511: 'A': 'typename' keyword must be followed by a qualified name

//typename A<0>(x);

int x = 0;

T::A<0>(x);

}

int main()

{

foo<S1>();

}

#endif

#ifdef SISS2

template <class T>

void foo() {

int x = 0;

typename T::template A<0>(x);

T::A<0>(x);

//// error C7511: 'A': 'typename' keyword must be followed by a qualified name

//typename A<0>(x);

}

int main()

{

foo<S2>();

}

#endif

#ifdef SISS3

template <class T>

void foo() {

typename T::template A<0>(x);

//// error C7511: 'A': 'typename' keyword must be followed by a qualified name

//typename A<0>(x);

//int x = 0;

//// error C2371: 'x': redefinition; different basic types

//T::A<0>(x);

//// error C3861: 'x': identifier not found

//T::A<0>(x);

}

int main()

{

foo<S3>();

}

#endif

参考にした動画

pythonのargparseの基本

2021年7月19日

admin

python No Comments

pythonのargparseが難しいくて戸惑うので基本のもの

引数を取らないオプション

parser = argparse.ArgumentParser(prog='MyPythonTest', description='Test ArgumentParser')
parser.add_argument('-f', 
                    action='store_true',
                    help='do it with force')

args = parser.parse_args()

if args.f:
  print('f is set')
else:
  print('f is not set')

parser = argparse.ArgumentParser(prog='MyPythonTest', description='Test ArgumentParser')

parser.add_argument('-f',

action='store_true',

help='do it with force')

args = parser.parse_args()

if args.f:

print('f is set')

else:

print('f is not set')

引数を１個とるオプション（デフォルト）

parser = argparse.ArgumentParser(prog='MyPythonTest', description='Test ArgumentParser')
parser.add_argument('-i',
help="The input")

args = parser.parse_args()

print('i is ',args.i)  ## args.i is string

parser = argparse.ArgumentParser(prog='MyPythonTest', description='Test ArgumentParser')

parser.add_argument('-i',

help="The input")

args = parser.parse_args()

print('i is ',args.i) ## args.i is string

引数を１個とるオプション（個数指定）

parser = argparse.ArgumentParser(prog='MyPythonTest', description='Test ArgumentParser')
parser.add_argument('-i',
                    nargs=1,
                    help="The input")

args = parser.parse_args()

if args.i:  
  print('i is ',args.i)  ## args.i is list
else:
  print('No i')

parser = argparse.ArgumentParser(prog='MyPythonTest', description='Test ArgumentParser')

parser.add_argument('-i',

nargs=1,

help="The input")

args = parser.parse_args()

if args.i:

print('i is ',args.i) ## args.i is list

else:

print('No i')

０個か１個だけとるメイン（オプションのない）の引数

parser = argparse.ArgumentParser(prog='MyPythonTest', description='Test ArgumentParser')
parser.add_argument('infile',
                    nargs='?',
                    help="The input")

args = parser.parse_args()

print(args)
if args.infile:  
  print('infile is',args.infile)  ## args.infile is string
else:
  print('No infile')

parser = argparse.ArgumentParser(prog='MyPythonTest', description='Test ArgumentParser')

parser.add_argument('infile',

nargs='?',

help="The input")

args = parser.parse_args()

print(args)

if args.infile:

print('infile is',args.infile) ## args.infile is string

else:

print('No infile')

１個からＮ個とるメインの引数

parser = argparse.ArgumentParser(prog='MyPythonTest', description='Test ArgumentParser')
parser.add_argument('infile',
                    nargs='+',
                    help="The input")

args = parser.parse_args()

print(args)
if args.infile:  
  print('infile is',args.infile)  ## args.infile is list
else:
  print('No infile')

parser = argparse.ArgumentParser(prog='MyPythonTest', description='Test ArgumentParser')

parser.add_argument('infile',

nargs='+',

help="The input")

args = parser.parse_args()

print(args)

if args.infile:

print('infile is',args.infile) ## args.infile is list

else:

print('No infile')

nargsが+

０個からＮ個とるメインの引数

parser = argparse.ArgumentParser(prog='MyPythonTest', description='Test ArgumentParser')
parser.add_argument('infile',
                    nargs='*',
                    help="The input")

args = parser.parse_args()

print(args)
if args.infile:  
  print('infile is',args.infile)  ## args.infile is list
else:
  print('No infile')

parser = argparse.ArgumentParser(prog='MyPythonTest', description='Test ArgumentParser')

parser.add_argument('infile',

nargs='*',

help="The input")

args = parser.parse_args()

print(args)

if args.infile:

print('infile is',args.infile) ## args.infile is list

else:

print('No infile')

考察

ほかにもいろいろなことができるのだがやりすぎて使いにくくなってる感がある。基本を押さえと置けば理解もできるようになると思う。

python: 文字列はimmutableでリストはmutable

2021年7月17日

admin

python No Comments

immutable

とは値を変えられないということ、というふうに言われるがpythonの場合は分かりづらい。
immutableとは変数の値が知らないところで書き換えられることがないことを示している。
文字列はimmutableと言われる。

C言語だと文字列はmutableになる。

char str[] = "abc";
char* p = str;
str[1] = 'x';  // pも変わる

char str[] = "abc";

char* p = str;

str[1] = 'x'; // pも変わる

pythonや多くの言語では上記のようなことはできず、文字列はimmutableになっている。

リストはmutable

mutableとは変数が知らないところで書き換わってしまうこと。

>>> a = [1,2,3]
>>> b = a
>>> a.append(4)
>>> b
[1, 2, 3, 4]
>>>

>>> a = [1,2,3]

>>> b = a

>>> a.append(4)

>>> b

[1, 2, 3, 4]

>>>

aとbは同じ実体を表すのでaに追加した4がbにも反映される。
しかし以下の場合は違う。

>>> a = [1,2,3]
>>> b = a
>>> a = [4,5,6]
>>> b
[1, 2, 3]
>>>

>>> a = [1,2,3]

>>> b = a

>>> a = [4,5,6]

>>> b

[1, 2, 3]

>>>

aに代入した[4,5,6]はもともとa,b両方が参照していたリストとは違うリストで新しく代入している。この場合はaとbは違うリストを参照している。
２つの変数が参照しているものが同じかどうかを調べるにはid()を使う。

>>> a = [1,2,3]
>>> b = a
>>> id(a)
8053288
>>> id(b)
8053288
>>>
>>> a = [4,5,6]
>>> id(a)
6151432
>>> id(b)
8053288
>>>
>>>

>>> a = [1,2,3]

>>> b = a

>>> id(a)

8053288

>>> id(b)

8053288

>>>

>>> a = [4,5,6]

>>> id(a)

6151432

>>> id(b)

8053288

>>>

文字列とリストでの関数の違い

しかし文字列でも同じid()を持つことはある。同じであってもそれが読み込みしかされていないなら問題はない。しかしそれを変更するわけにはいかないことから、このような違いは文字列とリストでの関数の違いとなって現れる。文字列の関数は常に新しい文字列を返し、自分自身を変更することはしない。リストの関数は常に自分自身を変更し、リストを返さない。

>>> x = 'abc'
>>> y = x
>>> id(x)
6094944
>>> id(y)
6094944
>>> x.upper()
'ABC'
>>> x
'abc'
>>> y
'abc'
>>> x = x.upper()
>>> x
'ABC'
>>> id(x)
8055104
>>> id(y)
6094944
>>>

>>> x = 'abc'

>>> y = x

>>> id(x)

6094944

>>> id(y)

6094944

>>> x.upper()

'ABC'

>>> x

'abc'

>>> y

'abc'

>>> x = x.upper()

>>> x

'ABC'

>>> id(x)

8055104

>>> id(y)

6094944

>>>

upper()は新しい文字列を返し、自分自身は変更しない。

>>> a = [1,2,3]
>>> b = a
>>> id(a)
6151432
>>> id(b)
6151432
>>> a = a.append(4)
>>> a
>>> id(a)
1583959272
>>> id(b)
6151432
>>> a
>>> b
[1, 2, 3, 4]

>>> a = [1,2,3]

>>> b = a

>>> id(a)

6151432

>>> id(b)

6151432

>>> a = a.append(4)

>>> a

>>> id(a)

1583959272

>>> id(b)

6151432

>>> a

>>> b

[1, 2, 3, 4]

append()は何も返さず、自分自身を変更する。

注意点

このようなふるまいからリストを使うときは注意を要することがある。

>>> def getlist():
...   return [1,2,3]
...
>>> l = getlist().append(4)
>>> l
>>>

>>> def getlist():

... return [1,2,3]

...

>>> l = getlist().append(4)

>>> l

>>>

append()はリストを返さないのでlには何も入らない。以下のようにしないといけない。

>>> l = getlist()
>>> l.append(4)
>>> l
[1, 2, 3, 4]
>>>

>>> l = getlist()

>>> l.append(4)

>>> l

[1, 2, 3, 4]

>>>

pythonでcat

2021年7月16日

admin

python No Comments

catコマンド

ファイルの中身を表示する

$ cat file
abc
xyz

$

$ cat file

abc

xyz

以下のようにしても動く

$ cat < file
abc
xyz

$

$ cat < file

abc

xyz

これは標準入力からファイルの内容を受け取りそれを出力している。

標準入力での切り分け

上記のことをpythonで実現するにはまず標準入力が普通の標準入力（キーボード）かパイプかを調べて処理を分ける。

import sys

if sys.stdin.isatty():
    # keyboard
    pass
else:
    # pipe
    pass

import sys

if sys.stdin.isatty():

# keyboard

pass

else:

# pipe

pass

ttyとはteleprinterのことで、昔あった手元にあるキーボードから遠くのプリンターに文字をタイプするマシンのことらしい。Linux界では接続されているキーボードをttyという概念で認識する。

ttyだった場合、引数にファイルがあればそれを表示し、なければ標準入力（キーボード）から入力を受け付ける。

ファイルの処理

import sys
import os

def docat(file=sys.stdin):
    sys.stdout.write(file.read())

if sys.stdin.isatty():
    # keyboard
    if len(sys.argv) > 1:
        file = open(sys.argv[1])
        docat(file)
        file.close()
    pass
else:
    # pipe
    pass

import sys

import os

def docat(file=sys.stdin):

sys.stdout.write(file.read())

if sys.stdin.isatty():

# keyboard

if len(sys.argv) > 1:

file = open(sys.argv[1])

docat(file)

file.close()

pass

else:

# pipe

pass

パイプの処理

標準入力がキーボードで引数がない場合やパイプの場合はstdinから読み込む

import sys
import os

def docat(file=sys.stdin):
    sys.stdout.write(file.read())

if sys.stdin.isatty():
    # keyboard
    if len(sys.argv) > 1:
        file = open(sys.argv[1])
        docat(file)
        file.close()
    else:
        docat()
else:
    # pipe
    docat()

import sys

import os

def docat(file=sys.stdin):

sys.stdout.write(file.read())

if sys.stdin.isatty():

# keyboard

if len(sys.argv) > 1:

file = open(sys.argv[1])

docat(file)

file.close()

else:

docat()

else:

# pipe

docat()

これで大体動くが、catとの違いはキーボードから入力したときのエコーバックの時期が違う。catは1行ごとにエコーバックするが、このスクリプトの場合、Ctrl+D(Linux)やCtrl+Z(Windows)でEOFが送られるか、バッファがいっぱいになるまでwriteへ処理がいかない。よってこれを直す。

import sys
import os

def docat(file=sys.stdin):
    while True:
        line = file.readline()
        if not line:
            break

        sys.stdout.write(line)

if sys.stdin.isatty():
    # keyboard
    if len(sys.argv) > 1:
        file = open(sys.argv[1])
        docat(file)
        file.close()
    else:
        docat()
else:
    # pipe
    docat()

import sys

import os

def docat(file=sys.stdin):

while True:

line = file.readline()

if not line:

break

sys.stdout.write(line)

if sys.stdin.isatty():

# keyboard

if len(sys.argv) > 1:

file = open(sys.argv[1])

docat(file)

file.close()

else:

docat()

else:

# pipe

docat()

考察

キーボードとパイプの両方から入力を受け付けると便利なことが多い。スクリプトがjsonファイルを受け付けるとき、ユーザー側には他の形式のファイルがあってそれをjsonに変換してスクリプトの入力としたい時などパイプ入力がないといったんファイルに変換しないとならなくなる。

C++/CLIのstatic コンストラクタの呼ばれる順番

2021年7月15日

admin

C++/CLI No Comments

staticコンストラクタはクラスがはじめてつかわれる時に一回だけ呼ばれるコンストラクタ

テスト

ref class A {
	static A() {
		Console::WriteLine("static A()");
	}
};
ref class B : public A {
	static B() {
		Console::WriteLine("static B()");
	}
};
int main()
{
	A a;
	B b;
}

ref class A {

static A() {

Console::WriteLine("static A()");

}

};

ref class B : public A {

static B() {

Console::WriteLine("static B()");

}

};

int main()

{

A a;

B b;

}

上記の場合はA→Bの順で呼ばれる。

int main()
{
	B b;
	A a;
}

int main()

{

B b;

A a;

}

上記の場合はB→Aの順で呼ばれる。Bが使われてるところでAも呼ばれる。

考察

上記のAがライブラリのような自分で触れないコードの場合、それがいつ呼ばれるのか、すでに呼ばれているのかを知る一般的な方法はないと思う。Aがstaticコンストラクタでなにかのデータを初期化してる場合はBのstaticコンストラクタにそのデータを書くのは危険だろう。

多重継承できるインターフェースのstaticコンストラクタは呼ばれなかった。

ソースコードにgitのhashを埋め込んでおく

2021年7月15日

admin

git No Comments

ビルドの際にgitのリビジョン（sha1ハッシュ）をソースに埋め込んでおけば、デグレードが起きた際などにソースをかんたんに復元できるだろう。gitにはrev-parseというサブコマンドがあり、これでHEADの40桁のsha1を出力できるのでpythonで取得するには以下のように書けばいい。

def getGitHash(dir, git):
    ''' get hash from dir'''

    args = [git, '-C', dir, 'rev-parse', 'HEAD']
    hash = subprocess.check_output(args).decode('utf-8').strip()
    if len(hash) != 40:
        exit('hex digits of hash is not 40')
    return hash

def getGitHash(dir, git):

''' get hash from dir'''

args = [git, '-C', dir, 'rev-parse', 'HEAD']

hash = subprocess.check_output(args).decode('utf-8').strip()

if len(hash) != 40:

exit('hex digits of hash is not 40')

return hash

check_outputはコマンドの出力を返してくれる（コマンドが０以外を返すと例外）。

あとはC++ヘッダーファイルなどに書き出して、ビルドすればよい。

gitおサブモジュールを使っている場合はこれで問題ないが、他のgitで管理しているソースも取り込んでいる場合には、それらのハッシュも記録しておいたほうがいいだろう。

C++/CLIでListのソート

2021年7月15日

admin

未分類 No Comments

大変

基本

using namespace System;
using namespace System::Collections::Generic;

int main()
{
	List<int> intlist;
	intlist.Add(2);
	intlist.Add(1);
	intlist.Add(7);
	intlist.Sort();

	// 1,2,7
	for each (int i in intlist)
		Console::WriteLine(i);

	intlist.Reverse();
	for each (int i in intlist)
		Console::WriteLine(i);

	return 0;
}

using namespace System;

using namespace System::Collections::Generic;

int main()

{

List<int> intlist;

intlist.Add(2);

intlist.Add(1);

intlist.Add(7);

intlist.Sort();

// 1,2,7

for each (int i in intlist)

Console::WriteLine(i);

intlist.Reverse();

for each (int i in intlist)

Console::WriteLine(i);

return 0;

}

これは簡単。しかし要素がクラスだと難しい

using namespace System;
using namespace System::Collections::Generic;

typedef KeyValuePair<String^, int> KVP;

ref class MyComparer : public System::Collections::Generic::IComparer<KVP>
{
public:
	enum class SORTBY {
		KEY,
		VALUE,
	};
private:
	SORTBY sortby_;
public:
	MyComparer(SORTBY sortby) : sortby_(sortby){}
	virtual int Compare(KVP kvp1, KVP kvp2)
	{
		switch (sortby_)
		{
		case SORTBY::KEY:
			return kvp1.Key->CompareTo(kvp2.Key);
		case SORTBY::VALUE:
			return kvp1.Value.CompareTo(kvp2.Value);
		}
		return 0;
	}
};

int main()
{
	List<KVP> silist;
	silist.Add(KVP("x", 1));
	silist.Add(KVP("y", 2));
	silist.Add(KVP("z", 300));
	silist.Add(KVP("a", 400));
	silist.Add(KVP("b", 500));
	silist.Add(KVP("c", 50));

	// Exception!
	// silist.Sort();

	// Sort by key
	MyComparer compByKey(MyComparer::SORTBY::KEY);
	silist.Sort(% compByKey);
	for each (KVP kvp in silist)
		Console::WriteLine(kvp.Key + "=" + kvp.Value);

	Console::WriteLine();

	// Sort by value
	MyComparer compByValue(MyComparer::SORTBY::VALUE);
	silist.Sort(% compByValue);
	for each (KVP kvp in silist)
		Console::WriteLine(kvp.Key + "=" + kvp.Value);

	return 0;
}

using namespace System;

using namespace System::Collections::Generic;

typedef KeyValuePair<String^, int> KVP;

ref class MyComparer : public System::Collections::Generic::IComparer<KVP>

{

public:

enum class SORTBY {

KEY,

VALUE,

};

private:

SORTBY sortby_;

public:

MyComparer(SORTBY sortby) : sortby_(sortby){}

virtual int Compare(KVP kvp1, KVP kvp2)

{

switch (sortby_)

{

case SORTBY::KEY:

return kvp1.Key->CompareTo(kvp2.Key);

case SORTBY::VALUE:

return kvp1.Value.CompareTo(kvp2.Value);

}

return 0;

}

};

int main()

{

List<KVP> silist;

silist.Add(KVP("x", 1));

silist.Add(KVP("y", 2));

silist.Add(KVP("z", 300));

silist.Add(KVP("a", 400));

silist.Add(KVP("b", 500));

silist.Add(KVP("c", 50));

// Exception!

// silist.Sort();

// Sort by key

MyComparer compByKey(MyComparer::SORTBY::KEY);

silist.Sort(% compByKey);

for each (KVP kvp in silist)

Console::WriteLine(kvp.Key + "=" + kvp.Value);

Console::WriteLine();

// Sort by value

MyComparer compByValue(MyComparer::SORTBY::VALUE);

silist.Sort(% compByValue);

for each (KVP kvp in silist)

Console::WriteLine(kvp.Key + "=" + kvp.Value);

return 0;

}

SortはインターフェースIComparerを引数にとるので、まずはこれを継承するクラスをつくりその仮想関数Compareで比較をする。

自分のクラスで

using namespace System;
using namespace System::Collections::Generic;


ref class MyClass 
{
private:
	String^ s1_;
public:
	MyClass(String^ s1) : s1_(s1) {}
public:
	static int Compare(MyClass^ m1, MyClass^ m2) {
		return String::Compare(m1->s1_, m2->s1_);
	}

	virtual String^ ToString() override {
		return s1_;
	}
};
ref class MyClassComparer : public System::Collections::Generic::IComparer<MyClass^>
{
public:
	virtual int Compare(MyClass^ mc1, MyClass^ mc2)
	{
		return MyClass::Compare(mc1, mc2);
	}
};

int main()
{
	List<MyClass^> mclist;
	mclist.Add(gcnew MyClass("fjwoeijf"));
	mclist.Add(gcnew MyClass("bzz32r"));
	mclist.Add(gcnew MyClass("+fwe3vv2r"));
	mclist.Add(gcnew MyClass("a32432faf"));
	mclist.Add(gcnew MyClass("3ff"));
	mclist.Add(gcnew MyClass("-fw654f"));

	// Exception!
	// mclist.Sort();

	mclist.Sort(gcnew MyClassComparer());

	// Sort by key
	for each (MyClass ^ mc in mclist)
		Console::WriteLine(mc->ToString());

	return 0;
}

using namespace System;

using namespace System::Collections::Generic;

ref class MyClass

{

private:

String^ s1_;

public:

MyClass(String^ s1) : s1_(s1) {}

public:

static int Compare(MyClass^ m1, MyClass^ m2) {

return String::Compare(m1->s1_, m2->s1_);

}

virtual String^ ToString() override {

return s1_;

}

};

ref class MyClassComparer : public System::Collections::Generic::IComparer<MyClass^>

{

public:

virtual int Compare(MyClass^ mc1, MyClass^ mc2)

{

return MyClass::Compare(mc1, mc2);

}

};

int main()

{

List<MyClass^> mclist;

mclist.Add(gcnew MyClass("fjwoeijf"));

mclist.Add(gcnew MyClass("bzz32r"));

mclist.Add(gcnew MyClass("+fwe3vv2r"));

mclist.Add(gcnew MyClass("a32432faf"));

mclist.Add(gcnew MyClass("3ff"));

mclist.Add(gcnew MyClass("-fw654f"));

// Exception!

// mclist.Sort();

mclist.Sort(gcnew MyClassComparer());

// Sort by key

for each (MyClass ^ mc in mclist)

Console::WriteLine(mc->ToString());

return 0;

}

自分のクラスMyClassにstatic int Compareを定義する。次にMyClassComparerも定義する。こうしないでMyClassをIComparerから派生させると、Sortの際に自分のクラスを渡すことになってなんかおかしい感じになる。

ソース：https://github.com/ambiesoft/blogprogs/tree/master/6085

to_stringとto_wstring

2021年7月15日

admin

C++ No Comments

to_stringとto_wstringはintなどを文字列にして返す標準ライブラリ関数。便利なのだが、charとwchar_tで分かれているので汎用コードを書きたいときにそのまま書きたくない。Windowsはもはやwchar_tが主流だしLinuxではcharが主流でwchar_tは４バイトになることが多い。よってこれらをそのまま使うと汎用性がなくなる。

テンプレート関数

これらの関数をテンプレート関数にしたいとき、テンプレート引数は２つになり、最初の引数はcharかwchar_t、次の引数はintやdoubleとなる。テンプレート関数は部分特殊化ができないので、これらの組み合わせすべて書くしかなくなって効率が悪い。

テンプレートクラス

テンプレートクラスは部分特殊化ができるので、これを利用して汎用関数をつくりたい。文字列クラスのデフォルトをWindowsならwchar_tとしそれ以外ならcharとして扱えば同じ関数記述にできる。

汎用テンプレートクラスの定義

template<typename C, typename T>
struct class_stdToString
{
	static_assert(sizeof(T) == 0, "char or wchar_t");
};

template<typename C, typename T>

struct class_stdToString

{

static_assert(sizeof(T) == 0, "char or wchar_t");

};

これは実体化されることを想定してないので、static_assert常に失敗。
次にcharの部分特殊化

template<typename T>
struct class_stdToString<char, T>
{
	static std::basic_string<char> call(const T& t)
	{
		return std::to_string(t);
	}
};

template<typename T>

struct class_stdToString<char, T>

{

static std::basic_string<char> call(const T& t)

{

return std::to_string(t);

}

};

同様にwchar_t

template<typename T>
struct class_stdToString<wchar_t, T>
{
	static std::basic_string<wchar_t> call(const T& t)
	{
		return std::to_wstring(t);
	}
};

template<typename T>

struct class_stdToString<wchar_t, T>

{

static std::basic_string<wchar_t> call(const T& t)

{

return std::to_wstring(t);

}

};

ここまではユーザは意識しないコード。次がユーザが呼ぶ関数。

template<typename C = SYSTEM_CHAR_TYPE, typename T>
std::basic_string<C> stdToString(const T& t)
{
	return class_stdToString<C, T>::call(t);
}

template<typename C = SYSTEM_CHAR_TYPE, typename T>

std::basic_string<C> stdToString(const T& t)

{

return class_stdToString<C, T>::call(t);

}

SYSTEM_CHAR_TYPEは事前にtypedefされているcharかwchar_t。

テストコード

TEST(stdosd, stdToString)
{
#ifdef _WIN32
	EXPECT_STREQ(L"1", stdToString(1).c_str());
#else
	EXPECT_STREQ("1", stdToString(1).c_str());
#endif

	EXPECT_STREQ("0", stdToString<char>(0).c_str());
	EXPECT_STREQ("-1", stdToString<char>(-1).c_str());
	EXPECT_STREQ(L"0", stdToString<wchar_t>(0).c_str());
	EXPECT_STREQ(L"-1", stdToString<wchar_t>(-1).c_str());
}

TEST(stdosd, stdToString)

{

#ifdef _WIN32

EXPECT_STREQ(L"1", stdToString(1).c_str());

#else

EXPECT_STREQ("1", stdToString(1).c_str());

#endif

EXPECT_STREQ("0", stdToString<char>(0).c_str());

EXPECT_STREQ("-1", stdToString<char>(-1).c_str());

EXPECT_STREQ(L"0", stdToString<wchar_t>(0).c_str());

EXPECT_STREQ(L"-1", stdToString<wchar_t>(-1).c_str());

}

bool追加

to_stringにはboolがなく、intとして解釈されるようなのでboolも完全特殊化で定義

template<>
struct class_stdToString<char, bool>
{
	static std::basic_string<char> call(const bool& t)
	{
		return t ? "true" : "false";
	}
};
template<>
struct class_stdToString<char, bool>
{
	static std::basic_string<char> call(const bool& t)
	{
		return t ? "true" : "false";
	}
};

template<>

struct class_stdToString<char, bool>

{

static std::basic_string<char> call(const bool& t)

{

return t ? "true" : "false";

}

};

template<>

struct class_stdToString<char, bool>

{

static std::basic_string<char> call(const bool& t)

{

return t ? "true" : "false";

}

};

ソース：https://github.com/ambiesoft/lsMisc/blob/master/stdosd/stdosd.h

考察

C＋＋にはもともとstreamがあって、それを使えばすべて汎用関数で書けそう。しかしto_stringとかの実装はそうなってないようなのでスルー。

これとは逆の関数。文字列からintなどに変える関数は引数に文字列しか入らないので型の推論ができないのでそれぞれの型ごとに別関数にするしかないものと思われる。