为什么大小是29?
procedure TForm7.SaveClick(Sender: TObject);
var
Stream: TStream;
begin
Stream := TMemoryStream.Create;
Memo1.Lines.Text := 'ABCDEFGHIJKLMNOPQRSTUVWXYZ';
Memo1.Lines.SaveToStream(Stream, TEncoding.UTF8); //把 Memo1的内容写入到流
ShowMessage(IntToStr(Stream.Size)); //29, 当前流的大小
ShowMessage(IntToStr(Stream.Position)); //29, 当前流的指针
end; 文心一言表示 UTF-8 编码的文本文件通常在开头包含一个字节顺序标记(BOM,Byte Order Mark),用于标识文件使用的编码方式,加上 UTF-8 的 BOM(3 个字节),就是 29 个字节了 Maxhaha 发表于 2024-2-5 08:55
文心一言表示 UTF-8 编码的文本文件通常在开头包含一个字节顺序标记(BOM,Byte Order Mark),用于标识 ...
再帮助我问问它。下面的各占多少?
使用这列作为编码页标识
.NET 名称
其他信息
037
IBM037
IBM EBCDIC US-Canada
437
IBM437
OEM 美国
500
IBM500
IBM EBCDIC International
708
ASMO-708
阿拉伯语(ASMO 708)
709
阿拉伯语 (ASMO-449+、BCON V4)
710
阿拉伯语 - 透明阿拉伯语
720
DOS-720
阿拉伯文 (透明 ASMO) ;阿拉伯语 (DOS)
737
ibm737
OEM 希腊 (原为 437G) ;希腊文 (DOS)
775
ibm775
OEM 波罗的海;波罗的海 (DOS)
850
ibm850
OEM 多语言拉丁语 1;西欧 (DOS)
852
ibm852
OEM 拉丁语 2;中欧 (DOS)
855
IBM855
OEM 西里尔文 (主要是俄罗斯)
857
ibm857
OEM 土耳其语;土耳其语 (DOS)
858
IBM00858
OEM 多语言拉丁语 1 + 欧元符号
860
IBM860
OEM 葡萄牙语;葡萄牙语 (DOS)
861
ibm861
OEM 冰岛语;冰岛 (DOS)
862
DOS-862
OEM 希伯来语;希伯来语 (DOS)
863
IBM863
OEM 加拿大法语;加拿大法语 (DOS)
864
IBM864
OEM 阿拉伯语;阿拉伯语 (864)
865
IBM865
OEM 北欧;北欧 (DOS)
866
cp866
OEM 俄语;西里尔文 (DOS)
869
ibm869
OEM 现代希腊文;希腊文、现代 (DOS)
870
IBM870
IBM EBCDIC 多语言/ROECE (拉丁文 2) ;IBM EBCDIC 多语言拉丁语 2
874
windows-874
泰语(Windows)
875
cp875
IBM EBCDIC Greek Modern
932
shift_jis
ANSI/OEM 日语;日语 (Shift-JIS)
936
gb2312
ANSI/OEM 简体中文 (中国、新加坡) ;简体中文 (GB2312)
949
ks_c_5601-1987 年
ANSI/OEM 朝鲜语 (统一朝鲜文代码)
950
big5
ANSI/OEM 繁体中文 (台湾;中国香港特别行政区) :中国传统 (Big5)
1026
IBM1026
IBM EBCDIC 土耳其语 (拉丁语 5)
1047
IBM01047
IBM EBCDIC Latin 1/Open System
1140
IBM01140
IBM EBCDIC US-Canada (037 + 欧元符号) ;IBM EBCDIC (美加欧)
1141
IBM01141
IBM EBCDIC Germany (20273 + 欧元符号) ;IBM EBCDIC (德国-欧元)
1142
IBM01142
IBM EBCDIC Denmark-Norway (20277 + 欧元符号) ;IBM EBCDIC (丹麦-挪威-欧元)
1143
IBM01143
IBM EBCDIC Finland-Sweden (20278 + 欧元符号) ;IBM EBCDIC (芬兰-瑞典-欧元)
1144
IBM01144
IBM EBCDIC 意大利 (20280 + 欧元符号) ;IBM EBCDIC (意大利-欧元)
1145
IBM01145
IBM EBCDIC 拉丁语America-Spain (20284 + 欧元符号) ;IBM EBCDIC (西班牙-欧元)
1146
IBM01146
IBM EBCDIC 英国 (20285 + 欧元符号) ;IBM EBCDIC (英国-欧元)
1147
IBM01147
IBM EBCDIC 法国 (20297 + 欧元符号) ;IBM EBCDIC (法欧)
1148
IBM01148
IBM EBCDIC 国际 (500 + 欧元符号) ;IBM EBCDIC (国际-欧元)
1149
IBM01149
IBM EBCDIC 冰岛 (20871 + 欧元符号) ;IBM EBCDIC (冰岛-欧元)
1200
utf-16
Unicode UTF-16,iso 10646) 的小端字节顺序 (BMP;仅适用于托管应用程序
1201
unicodeFFFE
Unicode UTF-16,big endian 字节顺序;仅适用于托管应用程序
1250
windows-1250
ANSI 中欧;中欧 (Windows)
1251
windows-1251
ANSI 西里尔文;西里尔文 (Windows)
1252
windows-1252
ANSI 拉丁语 1;西欧 (Windows)
1253
windows-1253
ANSI 希腊文;希腊文 (Windows)
1254
windows-1254
ANSI 土耳其语;土耳其语 (Windows)
1255
windows-1255
ANSI 希伯来语;希伯来语 (Windows)
1256
windows-1256
ANSI 阿拉伯语;阿拉伯语 (Windows)
1257
windows-1257
ANSI 波罗的海;波罗的海 (Windows)
1258
windows-1258
ANSI/OEM 越南语;越南语 (Windows)
1361
Johab
韩语(Johab)
10000
macintosh
MAC 罗马;西欧 (Mac)
10001
x-mac-日语
日语(Mac)
10002
x-mac-chinesetrad
MAC 繁体中文 (Big5) ;繁体中文 (Mac)
10003
x-mac-韩语
朝鲜语(Mac)
10004
x-mac-阿拉伯语
阿拉伯语(Mac)
10005
x-mac-希伯来语
希伯来语(Mac)
10006
x-mac-希腊语
希腊语(Mac)
10007
x-mac-西里尔文
西里尔语(Mac)
10008
x-mac-chinesesimp
MAC 简体中文 (GB 2312) ;简体中文 (Mac)
10010
x-mac
罗马尼亚语(Mac)
10017
x-mac-乌克兰语
乌克兰语(Mac)
10021
x-mac-泰语
泰语(Mac)
10029
x-mac-ce
MAC 拉丁语 2;中欧 (Mac)
10079
x-mac-冰岛语
冰岛语(Mac)
10081
x-mac-土耳其语
土耳其语(Mac)
10082
x-mac-克罗地亚语
克罗地亚语(Mac)
12000
utf-32
Unicode UTF-32, little endian 字节顺序;仅适用于托管应用程序
12001
32BE
Unicode UTF-32, big endian 字节顺序;仅适用于托管应用程序
20000
x-Chinese_CNS
CNS 台湾;繁体中文 (CNS)
20001
x-cp20001
TCA 台湾
20002
x_Chinese-Eten
Eten Taiwan:中国传统 (Eten)
20003
x-cp20003
IBM5550 台湾
20004
x-cp20004
TeleText 台湾
20005
x-cp20005
Wang 台湾
20105
x-IA5
IA5 (IRV 国际字母号 5,7 位) ;西欧 (IA5)
20106
x-IA5-德语
IA5 德语 (7 位)
20107
x IA5-瑞典语
IA5 Swedish (7 位)
20108
x IA5-挪威语
IA5 挪威语 (7 位)
20127
us-ascii
US-ASCII (7 位)
20261
x-cp20261
不是61
20269
x-cp20269
ISO 6937 非间距着色
20273
IBM273
IBM EBCDIC Germany
20277
IBM277
IBM EBCDIC Denmark-Norway
20278
IBM278
IBM EBCDIC Finland-Sweden
20280
IBM280
IBM EBCDIC 意大利
20284
IBM284
IBM EBCDIC 拉丁语America-Spain
20285
IBM285
IBM EBCDIC 英国
20290
IBM290
IBM EBCDIC 日语片假名扩展
20297
IBM297
IBM EBCDIC 法国
20420
IBM420
IBM EBCDIC 阿拉伯语
20423
IBM423
IBM EBCDIC(希腊文)
20424
IBM424
IBM EBCDIC 希伯来语
20833
x-EBCDIC-KoreanExtended
IBM EBCDIC 朝鲜语扩展
20838
IBM-泰语
IBM EBCDIC 泰语
20866
koi8-ru-r
俄语 (KOI8-R) ;西里尔文 (KOI8-R)
20871
IBM871
IBM EBCDIC 冰岛语
20880
IBM880
IBM EBCDIC 西里尔文俄语
20905
IBM905
IBM EBCDIC 土耳其语
20924
IBM00924
IBM EBCDIC Latin 1/Open System (1047 + Euro 符号)
20932
EUC-JP
日语(JIS 0208-1990 和0212-1990)
20936
x-cp20936
简体中文 (GB2312) ;简体中文 (GB2312-80)
20949
x-cp20949
韩语 Wansung
21025
cp1025
IBM EBCDIC 西里尔文Serbian-Bulgarian
21027
(已弃用)
21866
koi8-ru-u
乌克兰 (KOI8-U) ;西里尔文 (KOI8-U)
28591
iso-8859-1
ISO 8859-1 拉丁语 1;西欧 (ISO)
28592
iso-8859-2
ISO 8859-2 中欧;中欧 (ISO)
28593
iso-8859-3
ISO 8859-3 拉丁语 3
28594
iso-8859-4
ISO 8859-4 波罗的海
28595
iso-8859-5
ISO 8859-5 西里尔文
28596
iso-8859-6
ISO 8859-6 阿拉伯语
28597
iso-8859-7
ISO 8859-7 希腊语
28598
iso-8859-8
ISO 8859-8 希伯来语;希伯来语 (ISO-Visual)
28599
iso-8859-9
ISO 8859-9 土耳其语
28603
iso-8859-13
ISO 8859-13 爱沙尼亚语
28605
iso-8859-15
ISO 8859-15 拉丁语 9
29001
x-欧洲
欧罗巴 3
38598
iso-8859-8-i
ISO 8859-8 希伯来语;希伯来语 (ISO 逻辑)
50220
iso-2022-日本
ISO 2022 日语,无半形片假名;日语 (JIS)
50221
csISO2022JP
ISO 2022 日语与半形片假名;日语 (JIS-Allow 1 字节假名)
50222
iso-2022-日本
ISO 2022 日语 JIS X 0201-1989;日语 (JIS-Allow 1 字节假名 - SO/SI)
50225
iso-2022-kr
ISO 2022 朝鲜语
50227
x-cp50227
ISO 2022 简体中文;简体中文 (ISO 2022)
50229
ISO 2022 繁体中文
50930
EBCDIC 日语 (片假名) 扩展
50931
EBCDIC US-Canada和日语
50933
EBCDIC 朝鲜语扩展和朝鲜语
50935
EBCDIC 简体中文 扩展和简体中文
50936
EBCDIC 简体中文
50937
EBCDIC US-Canada和繁体中文
50939
EBCDIC 日语 (拉丁语) 扩展和日语
51932
euc-jp
EUC 日语
51936
EUC-CN
EUC 简体中文;简体中文 (EUC)
51949
euc-kr
EUC 朝鲜语
51950
EUC 繁体中文
52936
hz-gb-2312
HZ-GB2312 简体中文;简体中文 (HZ)
54936
GB18030
Windows XP 及更高版本: GB18030 简体中文 (4 字节) ;简体中文 (GB18030)
57002
x-iscii-de
ISCII 梵文
57003
x-iscii
ISCII 孟加拉语
57004
x-iscii-ta
ISCII 泰米尔语
57005
x-iscii-te
ISCII 泰卢固语
57006
x-iscii-as
ISCII 阿萨姆语
57007
x-iscii-或
ISCII Odia
57008
x-iscii-ka
ISCII 埃纳德文
57009
x-iscii-ma
ISCII 马拉雅拉姆语
57010
x-iscii-gu
ISCII 古吉拉特语
57011
x-iscii-pa
ISCII 旁遮普语
65000
utf-7
Unicode (UTF-7)
65001
utf-8
Unicode (UTF-8)
文心一言免费的啊,你自己去问呗{:1_904:} 说真的,我没有用过国内这些有关AI的产品,大多数时间用OPENAI,也就是传说中的CHATGPT,否则就用COPILOT!别问我为什么! ChatGPT免费的啊,你自己去问呗 冥界3大法王 发表于 2024-2-5 08:59
再帮助我问问它。下面的各占多少?
帮你问了GPT
以下是给定编码页标识的控制字符数量:
- 037 (IBM037): 0 个控制字符
- 437 (IBM437): 0 个控制字符
- 500 (IBM500): 0 个控制字符
- 708 (ASMO-708): 0 个控制字符
- 709: 没有提供信息
- 710: 没有提供信息
- 720 (DOS-720): 0 个控制字符
- 737 (ibm737): 0 个控制字符
- 775 (ibm775): 0 个控制字符
- 850 (ibm850): 0 个控制字符
- 852 (ibm852): 0 个控制字符
- 855 (IBM855): 0 个控制字符
- 857 (ibm857): 0 个控制字符
- 858 (IBM00858): 1 个控制字符 (欧元符号)
- 860 (IBM860): 0 个控制字符
- 861 (ibm861): 0 个控制字符
- 862 (DOS-862): 0 个控制字符
- 863 (IBM863): 0 个控制字符
- 864 (IBM864): 0 个控制字符
- 865 (IBM865): 0 个控制字符
- 866 (cp866): 0 个控制字符
- 869 (ibm869): 0 个控制字符
- 870 (IBM870): 0 个控制字符
- 874 (windows-874): 0 个控制字符
- 875 (cp875): 0 个控制字符
- 932 (shift_jis): 0 个控制字符
- 936 (gb2312): 0 个控制字符
- 949 (ks_c_5601-1987): 0 个控制字符
- 950 (big5): 0 个控制字符
- 1026 (IBM1026): 0 个控制字符
- 1047 (IBM01047): 1 个控制字符 (欧元符号)
- 1140 (IBM01140): 1 个控制字符 (欧元符号)
- 1141 (IBM01141): 1 个控制字符 (欧元符号)
- 1142 (IBM01142): 1 个控制字符 (欧元符号)
- 1143 (IBM01143): 1 个控制字符 (欧元符号)
- 1144 (IBM01144): 1 个控制字符 (欧元符号)
- 1145 (IBM01145): 1 个控制字符 (欧元符号)
- 1146 (IBM01146): 1 个控制字符 (欧元符号)
- 1147 (IBM01147): 1 个控制字符 (欧元符号)
- 1148 (IBM01148): 1 个控制字符 (欧元符号)
- 1149 (IBM01149): 1 个控制字符 (欧元符号)
- 1200 (utf-16): 0 个控制字符
- 1201 (unicodeFFFE): 0 个控制字符
- 1250 (windows-1250): 0 个控制字符
- 1251 (windows-1251): 0 个控制字符
- 1252 (windows-1252): 0 个控制字符
- 1253 (windows-1253): 0 个控制字符
- 1254 (windows-1254): 0 个控制字符
- 1255 (windows-1255): 0 个控制字符
- 1256 (windows-1256): 0 个控制字符
- 1257 (windows-1257): 0 个控制字符
- 1258 (windows-1258): 0 个控制字符
- 1361 (Johab): 0 个控制字符
- 10000 (macintosh): 0 个控制字符
- 10001 (x-mac-日语): 0 个控制字符
- 10002 (x-mac-chinesetrad): 0 个控制字符
- 10003 (x-mac-韩语): 0 个控制字符
- 10004 (x-mac-阿拉伯语): 0 个控制字符
- 10005 (x-mac-希伯来语): 0 个控制字符
- 10006 (x-mac-希腊语): 0 个控制字符
- 10007 (x-mac-西里尔文): 0 个控制字符
- 10008 (x-mac-chinesesimp): 0 个控制字符
- 10010 (x-mac): 0 个控制字符
- 10017 (x-mac-乌克兰语): 0 个控制字符
- 10021 (x-mac-泰语): 0 个控制字符
- 10029 (x-mac-ce): 0 个控制字符
- 10079 (x-mac-冰岛语): 0 个控制字符
- 10081 (x-mac-土耳其语): 0 个控制字符
- 10082 (x-mac-克罗地亚语): 0 个控制字符
- 12000 (utf-32): 0 个控制字符
- 12001 (32BE): 0 个控制字符
- 20000 (x-Chinese_CNS): 0 个控制字符
- 20001 (x-cp20001): 0 个控制字符
- 20002 (x_Chinese-Eten): 0 个控制字符
- 20003 (x-cp20003): 0 个控制字符
- 20004 (x-cp20004): 0 个控制字符
- 20005 (x-cp20005): 0 个控制字符
- 20105 (x-IA
5): 0 个控制字符
- 20106 (x-IA5-德语): 0 个控制字符
- 20107 (x IA5-瑞典语): 0 个控制字符
- 20108 (x IA5-挪威语): 0 个控制字符
- 20127 (us-ascii): 0 个控制字符
- 20261 (x-cp20261): 0 个控制字符
- 20269 (x-cp20269): 0 个控制字符
- 20273 (IBM273): 0 个控制字符
- 20277 (IBM277): 0 个控制字符
- 20278 (IBM278): 0 个控制字符
- 20280 (IBM280): 0 个控制字符
- 20284 (IBM284): 0 个控制字符
- 20285 (IBM285): 0 个控制字符
- 20290 (IBM290): 0 个控制字符
- 20297 (IBM297): 0 个控制字符
- 20420 (IBM420): 0 个控制字符
- 20423 (IBM423): 0 个控制字符
- 20424 (IBM424): 0 个控制字符
- 20833 (x-EBCDIC-KoreanExtended): 0 个控制字符
- 20838 (IBM-泰语): 0 个控制字符
- 20866 (koi8-ru-r): 0 个控制字符
- 20871 (IBM871): 0 个控制字符
- 20880 (IBM880): 0 个控制字符
- 20905 (IBM905): 0 个控制字符
- 20924 (IBM00924): 0 个控制字符
- 20932 (EUC-JP): 0 个控制字符
- 20936 (x-cp20936): 0 个控制字符
- 20949 (x-cp20949): 0 个控制字符
- 21025 (cp1025): 0 个控制字符
- 21027: 已弃用
- 21866 (koi8-ru-u): 0 个控制字符
- 28591 (iso-8859-1): 0 个控制字符
- 28592 (iso-8859-2): 0 个控制字符
- 28593 (iso-8859-3): 0 个控制字符
- 28594 (iso-8859-4): 0 个控制字符
- 28595 (iso-8859-5): 0 个控制字符
- 28596 (iso-8859-6): 0 个控制字符
- 28597 (iso-8859-7): 0 个控制字符
- 28598 (iso-8859-8): 0 个控制字符
- 28599 (iso-8859-9): 0 个控制字符
- 28603 (iso-8859-13): 0 个控制字符
- 28605 (iso-8859-15): 0 个控制字符
- 29001 (x-欧洲): 0 个控制字符
- 38598 (iso-8859-8-i): 0 个控制字符
- 50220 (iso-2022-日本): 0 个控制字符
- 50221 (csISO2022JP): 0 个控制字符
- 50222 (iso-2022-日本): 0 个控制字符
- 50225 (iso-2022-kr): 0 个控制字符
- 50227 (x-cp50227): 0 个控制字符
- 50229: 没有提供信息
- 50930: 没有提供信息
- 50931: 没有提供信息
- 50933: 没有提供信息
- 50935: 没有提供信息
- 50936: 没有提供信息
- 50937: 没有提供信息
- 50939: 没有提供信息
- 51932 (euc-jp): 0 个控制字符
- 51936 (EUC-CN): 0 个控制字符
- 51949 (euc-kr): 0 个控制字符
- 51950: 没有提供信息
- 52936 (hz-gb-2312): 0 个控制字符
- 54936 (GB18030): 0 个控制字符
- 57002 (x-iscii-de): 0 个控制字符
- 57003 (x-iscii): 0 个控制字符
- 57004 (x-iscii-ta): 0 个控制字符
- 57005 (x-iscii-te): 0 个控制字符
- 57006 (x-iscii-as): 0 个控制字符
- 57007 (x-iscii-或): 0 个控制字符
- 57008 (x-iscii-ka): 0 个控制字符
- 57009 (x-iscii-ma): 0 个控制字符
- 57010 (x-iscii-gu): 0 个控制字符
- 57011 (x-iscii-pa): 0 个控制字符
- 65000 (utf-7): 0 个控制字符
- 65001 (utf-8): 0 个控制字符
请注意,这些是根据提供的信息计算的估计值,可能会因具体实现而有所不同。 这AI,瞎纯瞎说八道
65001 (utf-8) 这个明显是三个 iawyxkdn8 发表于 2024-2-5 10:03
说真的,我没有用过国内这些有关AI的产品,大多数时间用OPENAI,也就是传说中的CHATGPT,否则就用COPILOT!别 ...
能用都是用最主流和最好的!
应该是Delphi的组件的UTF8文本是带BOM头的,我不记得Lazarus有没有了。
页:
[1]
2