-
Notifications
You must be signed in to change notification settings - Fork 81
Expand file tree
/
Copy pathencoding-requirements.xml
More file actions
107 lines (106 loc) · 4.3 KB
/
encoding-requirements.xml
File metadata and controls
107 lines (106 loc) · 4.3 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
<?xml version="1.0" encoding="utf-8"?>
<!-- EN-Revision: 96c9d88bad9a7d7d44bfb7f26c226df7ee9ddf26 Maintainer: tmn Status: ready -->
<!-- Reviewed: no -->
<chapter xml:id="mbstring.php4.req" xmlns="http://docbook.org/ns/docbook" xmlns:xlink="http://www.w3.org/1999/xlink">
<title>Требования, предъявляемые к кодировкам символов в PHP</title>
<para>
Типы кодировок, использование которых в PHP безопасно.
<itemizedlist>
<listitem>
<para>
Однобайтовые кодировки,
<itemizedlist>
<listitem>
<simpara>
имеющие ASCII-совместимую (совместимую с ISO646) разметку в диапазоне
с <literal>00h</literal> по <literal>7fh</literal>.
</simpara>
</listitem>
</itemizedlist>
</para>
</listitem>
<listitem>
<para>
Многобайтовые кодировки,
<itemizedlist>
<listitem>
<simpara>
имеющие ASCII-совместимую разметку в диапазоне
с <literal>00h</literal> по <literal>7fh</literal>.
</simpara>
</listitem>
<listitem>
<simpara>
не использующие escape-последовательности ISO2022.
</simpara>
</listitem>
<listitem>
<simpara>
не использующие значения в байтах с <literal>00h</literal> по
<literal>7fh</literal> по отдельности, когда эти байты
представляют один символ.
</simpara>
</listitem>
</itemizedlist>
</para>
</listitem>
</itemizedlist>
</para>
<para>
Далее приведены примеры кодировок, использование которых в PHP нежелательно.
<informalexample>
<programlisting>
<![CDATA[
JIS, SJIS, ISO-2022-JP, BIG-5
]]>
</programlisting>
</informalexample>
</para>
<para>
Даже если PHP-скрипт написан в рекомендуемой кодировке, он может оказаться
неработоспособным. Зачастую так происходит, когда кодированные строки
появляются в скрипте в качестве идентификаторов или литералов. Можно исключить
большую часть таких ситуаций путём использования функции фильтрации кодировок во
входящих HTTP-запросах (функция есть в модуле <literal>mbstring</literal>).
</para>
<note>
<para>
Крайне не рекомендуется использовать SJIS, BIG5, CP936, CP949 и GB18030 в
качестве внутренних кодировок, если вы недостаточно разбираетесь в устройстве
парсера, сканера и кодировки.
</para>
</note>
<note>
<para>
Если вы подключаетесь к базе данных средствами PHP, рекомендуется использовать
одинаковые кодировки для базы данных и в качестве
<literal>внутренней кодировки</literal>. Это облегчит разработку и повысит
быстродействие.
</para>
<para>
Если вы используете PostgreSQL, совпадение кодировок в базе данных и
используемой в PHP необязательно, так как PostgreSQL поддерживает
автоматическое преобразование кодировок между СУБД и клиентом.
</para>
</note>
</chapter>
<!-- Keep this comment at the end of the file
Local variables:
mode: sgml
sgml-omittag:t
sgml-shorttag:t
sgml-minimize-attributes:nil
sgml-always-quote-attributes:t
sgml-indent-step:1
sgml-indent-data:t
indent-tabs-mode:nil
sgml-parent-document:nil
sgml-default-dtd-file:"~/.phpdoc/manual.ced"
sgml-exposed-tags:nil
sgml-local-catalogs:nil
sgml-local-ecat-files:nil
End:
vim600: syn=xml fen fdm=syntax fdl=2 si
vim: et tw=78 syn=sgml
vi: ts=1 sw=1
-->