运维排查 | SaltStack 远程命令执行中文乱码问题
哈喽大家好,我是咸鱼。
问题
我在一台服务器上写了一个简单的 Python 脚本 haha.py,内容如下:
[root@localhost ~]# cat haha.py
print("你好")
当我在本地直接运行这个脚本时,一切正常,但当我通过 SaltStack 的 cmd.run 模块,在另一台机器上远程执行这个脚本时,问题就出现了:
[root@localhost ~]# salt 192.168.149.130 cmd.run "python3 /root/haha.py"
192.168.149.130:
Traceback (most recent call last):
File "/root/haha.py", line 1, in <module>
print("\u4f60\u597d")
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)
ERROR: Minions returned with non-zero exit code

从 Minion 返回的错误可以看出,UnicodeEncodeError 指向的是字符编码问题,Python 在输出中文字符时试图使用 ASCII 编码,但遇到了无法编码的字符,导致程序报错。
这个问题只在通过 SaltStack 远程执行时出现,而在本地运行并无任何异常,因此可以初步判断是远程执行环境下的字符集设置(locale)引起的编码错误。
排查
在本地执行 locale 命令,结果如下:
[root@localhost ~]# locale
LANG=zh_CN.UTF-8
LC_CTYPE="zh_CN.UTF-8"
LC_NUMERIC="zh_CN.UTF-8"
LC_TIME="zh_CN.UTF-8"
LC_COLLATE="zh_CN.UTF-8"
LC_MONETARY="zh_CN.UTF-8"
LC_MESSAGES="zh_CN.UTF-8"
LC_PAPER="zh_CN.UTF-8"
LC_NAME="zh_CN.UTF-8"
LC_ADDRESS="zh_CN.UTF-8"
LC_TELEPHONE="zh_CN.UTF-8"
LC_MEASUREMENT="zh_CN.UTF-8"
LC_IDENTIFICATION="zh_CN.UTF-8"
LC_ALL=
但是如果通过 salt 远程执行,结果如下:
[root@localhost ~]# salt 192.168.149.130 cmd.run "locale"
192.168.149.130:
locale: Cannot set LC_CTYPE to default locale: No such file or directory
locale: Cannot set LC_ALL to default locale: No such file or directory
LANG=zh_CN.UTF-8
LC_CTYPE=c
LC_NUMERIC=c
LC_TIME=C
LC_COLLATE=C
LC_MONETARY=C
LC_MESSAGES=C
LC_PAPER=C
LC_NAME=C
LC_ADDRESS=C
LC_TELEPHONE=C
LC_MEASUREMENT=C
LC_IDENTIFICATION=C
LC_ALL=
可以看到,通过 Salt 远程执行时,locale 设置与本地环境存在明显差异,字符集从 zh_CN.UTF-8 被回退为 C。
这会导致在 Salt 进程中执行某些脚本时出现字符编码相关的问题,例如中文乱码、编码异常等。
- locale
在 CentOS(或任何 Linux 系统)中,locale 指的是本地化环境设置,即系统如何根据用户所在的地区、语言和文化习惯来展示信息。
locale 包含多个变量,常见的有:
| 变量 | 控制内容 |
|---|---|
LANG | 默认语言和编码设置(全局默认) |
LC_ALL | 一键覆盖所有其他变量(最高优先级) |
LC_CTYPE | 字符分类与编码,如大小写、字符集等 |
LC_TIME | 时间和日期格式 |
LC_NUMERIC | 小数点和数字分隔符 |
LC_MONETARY | 货币符号与格式 |
LC_MESSAGES | 系统消息语言 |
LC_COLLATE | 字符串排序规则(如按拼音或 ASCII) |
- LANG 和 LC_*
在 CentOS 或任何基于 Linux 的系统中,LANG 和 LC_* 都属于语言环境(Locale)配置变量,用于控制系统的语言、字符编码和区域设置(如时间格式、货币符号、