Bye Bye Moore

PoCソルジャーな零細事業主が作業メモを残すブログ

uLispでUTF-8な文字を扱う

やってきたUTF-8な文字を取り扱います。

実際のところ

文字に変換

1213> (code-char 41)
#\)

1213>  (code-char 42)
#\*

1213>  (code-char #x41)
#\A

数値からUTF-8

1213> (char-code #\A)
65

制御文字の置き換えも可能。
使える文字は

Null, SOH, STX, ETX, EOT, ENQ, ACK, Bell, Backspace, Tab, Newline, VT, Page, Return, SO, SI,
DLE, DC1, DC2, DC3, DC4, NAK, SYN, ETB, CAN, EM, SUB, Escape, FS, GS, RS, US, Space

1213>  (char-code #\return)
13

1213>  (char-code #\tab)
9

1213>  (char-code #\TAB)
9

デフォのArduinoで使えないような文字はダメです。

1213> (print #\あ)
Error: Unknown character