ひよこの外部記憶

めもおきば

日本語対応

デフォルトasciiのまま対応出来るようになる必要があるが、現状はデフォルト文字コードを変更することで対応

デフォルト文字コード変更(Windows環境)

.\Python27\Lib\site-packages
の中にsitecustomize.pyを作成、中に

import sys
sys.setdefaultencoding('mbcs')

とするとデフォルトの文字コードがasciiから変えられる

python起動時以外にデフォルト文字コード変更不可

pythonは起動が終了したら、sysモジュールからsetdefaultencoding関数を削除するため、shellに

import sys
sys.setdefaultencoding("utf-8")

としてもnoAttribute的な事を言われる

そのためsite-packageでデフォルト文字コードを指定する必要がある

decode() , encode()

pythonは内部ロジックが「unicode」なのでunicodeに戻すのがdecode、unicodeから変換するのがencodeなんだそうな

リストやディクショナリの中のunicode

残念な感じだが、リストやディクショナリに含まれているunicodeは数値変換されて出力される、どうしても正しく出力したければfor等で要素一つ一つ表示する(Python3.0では起きないらしい)

文字列置換(改行の削除)

str.replace('\n','')

で改行文字を埋められる