244 Views
April 05, 24
スライド概要
[第5回大阪sas勉強会]熊田 達哉
SAS言語を中心として,解析業務担当者・プログラマなのコミュニティを活性化したいです
文字コードの進化 (コンピュータの基礎2) R1.5.24 アルケミックス 熊田 達哉
CPUとは 参考(1) ++C++; // 未確認飛行
レジスタ in CPU レジスタとは記憶素子の集まり(レジスタも複数個存在) 変数と思って良い 素子1つずつに電圧のON・OFF状態があり、この2つの 状態を保持できる(電源がON状態の時だけ) この素子を1変数にできるサイズをCPUのビット数という 即ち、最近のCPUは64bitというが、64個の素子を1つの レジスタにできるという意味 即ち64bit CPUは1つの変数で保持できる値は2の64乗 コンピュータが使える変数はこれだけ
文字コードの必要性 CPUでは、とにかく数字しか扱えないので、文字も数字 とする必要がある ASCII: 「A」 = &H41(=65) 「1」 = &H31(=49)
文字セット(文字集合) どんな文字が使えるか決めたものを文字集合という いわゆる英数と制御符号だけのもの: ASCII 日本語を含むもの: JIS 世界中の文字を集めたもの: UNICODE
文字符号化方式(エンコーディング) 文字セットをどのように符号化するかという方式がエン コーディング Shift-JIS (対象文字セット: JIS) CP932 (Shift-JISをMicrosoftが拡張したWindows標準) UTF-16 (対象文字セット: UNICODE) UTF-8 (対象文字セット: UNICODE)
Shift-JIS 参考(2) ウナの資格一問一答
Windows メモ帳の「文字コード」? ANSI -> CP932 Unicode -> UTF-16 little endian ちなみに「 little endian 」と「big endian」は、数字の 順序が逆(上位桁からか下位桁からかの違い)
参考Webページ (1) ++C++; // 未確認飛行 https://ufcpp.net/study/computer/CPU.html (2)ウナの資格一問一答 http://una.soragoto.net/topics/13.html