ngx_http_charset_module 模块

ngx_http_charset_module 模块将指定的字符集添加到 “Content-Type” 响应头字段。此外,该模块可以将数据从一种字符集转换为另一种字符集,但有如下限制:

  • 转换以一种方式执行——从服务器到客户端

  • 只能转换单字节字符集

  • 或单字节字符集到/从 UTF-8

示例配置

include        conf/koi-win;

charset        windows-1251;
source_charset koi8-r;

指令

charset 指令

语 法:charset charset | off;
默认值:charset off;
上下文:http, server, location, if in location

将指定的字符集添加到 “Content-Type” 响应头字段。如果此字符集与 source_charset 指令中指定的字符集不同,则执行转换。

如果该指令指定 off 参数,则取消向 “Content-Type” 响应头字段添加字符集。

可以使用变量定义字符集:

charset $charset;

在这种情况下,变量的所有可能值都需要以 charset_map、charset 或 source_charset 指令的形式出现在配置中至少一次。

对于 utf-8、windows-1251 和 koi8-r 字符集,在配置中包含文件 conf/koi-win、conf/koi-utf 和 conf/win-utf 就足够了。对于其他字符集,只需制作一个虚构的转换表即可,例如:

charset_map iso-8859-5 _ { }

此外,可以在 “X-Accel-Charset” 响应头字段中设置字符集。可以使用 proxy_ignore_headers、fastcgi_ignore_headers、uwsgi_ignore_headers、scgi_ignore_headers 和 grpc_ignore_headers 指令禁用此功能。

charset_map 指令

语 法:charset_map charset1 charset2 { ... }
默认值:—
上下文:http

描述从一种字符集到另一种字符集的转换表。使用相同的数据构建反向转换表。字符代码以十六进制给出。80-FF 范围内的缺失字符将替换为“?”。从 UTF-8 转换时,一字节字符集中缺少的字符将替换为 “&#XXXX;”。

示例:

charset_map koi8-r windows-1251 {
    C0 FE ; # small yu
    C1 E0 ; # small a
    C2 E1 ; # small b
    C3 F6 ; # small ts
    ...
}

将转换表描述为 UTF-8 时,应在第二列中给出 UTF-8 字符集的代码,例如:

charset_map koi8-r utf-8 {
    C0 D18E ; # small yu
    C1 D0B0 ; # small a
    C2 D0B1 ; # small b
    C3 D186 ; # small ts
    ...
}

分发文件 conf/koi-win、conf/koi-utf 和 conf/win-utf 中提供了从 koi8-r 到 windows-1251 以及从 koi8-r 和 windows-1251 到 utf-8 的完整转换表。

charset_types 指令

语 法:charset_types mime-type ...;
默认值:charset_types text/html text/xml text/plain text/vnd.wap.wml
    application/javascript application/rss+xml;
上下文:http, server, location

该指令出现在 0.7.9 版本中。

除了 “text/html” 之外,还启用具有指定 MIME 类型的响应中的模块处理。特殊值 “*” 匹配任何 MIME 类型 (0.8.29)。

在 1.5.4 版本之前,“application/x-javascript” 被用作默认 MIME 类型而不是 “application/javascript”。

override_charset 指令

语 法:override_charset on | off;
默认值:override_charset off;
上下文:http, server, location, if in location

确定当答案已经在 “Content-Type” 响应标头字段中携带字符集时,是否应对从代理服务器或 FastCGI/uwsgi/SCGI/gRPC 服务器接收的答案执行转换。如果启用了转换,则接收到的响应中指定的字符集将用作源字符集。

应该注意的是,如果在子请求中收到响应,则始终执行从响应字符集到主请求字符集的转换,无论 override_charset 指令设置如何。

source_charset 指令

语 法:source_charset charset;
默认值:—
上下文:http, server, location, if in location

定义响应的源字符集。如果此字符集与 charset 指令中指定的字符集不同,则执行转换。

说说我的看法
全部评论(
没有评论
关于
本网站专注于 Java、数据库(MySQL、Oracle)、Linux、软件架构及大数据等多领域技术知识分享。涵盖丰富的原创与精选技术文章,助力技术传播与交流。无论是技术新手渴望入门,还是资深开发者寻求进阶,这里都能为您提供深度见解与实用经验,让复杂编码变得轻松易懂,携手共赴技术提升新高度。如有侵权,请来信告知:hxstrive@outlook.com
公众号