本文目录索引 1,怎样将unicode转化成中文 2,如何把properties中的所有unicode编码转为汉字 3,python2中怎样将unicode转换成原来的中文 4,python中怎样将unicode转换成原来的中文? 5,用java如何把unicode码转成汉字? 6,Java如何将一段汉字变成unicode
本文目录索引
- 1,怎样将unicode转化成中文
- 2,如何把properties中的所有unicode编码转为汉字
- 3,python2中怎样将unicode转换成原来的中文
- 4,python中怎样将unicode转换成原来的中文?
- 5,用java如何把unicode码转成汉字?
- 6,Java如何将一段汉字变成unicode码?
- 7,在sqlserver数据库中如何将unicode编码的字符转换为中文?求高手,求算法
- 8,如何将Oracle数据库中的Unicode转换为中文
- 9,如何将unicode转换成汉字
1,怎样将unicode转化成中文
unicode编码不需要转换成汉字,因为unicode就是和字符关联的终极编码。
windows中只有unicode码可以和字符直接关联,也就是使用国际标准的unicode字符集。
中文windowsXp默认的内码是gbk(装过gb18030补丁的话也就变成gb18030),日文系统就是JIS,不同语言版本的windows都有不同的默认内码,这是每个国家的标准化管理局规定的。
然后就是页码表的概念,所谓页码表就是把一个用系统默认编码(比如gbk,gb2312)表示的字符映射到对应unicode编码,而每个unicode编码对应着唯一确定的字符。这样就完成了地域性编码到国际标准码再到字符的对应关系。
在控制面板->区域和语言选择->高级,里面可以看到window提供的所有页码表。
绝非转载,无参考内容,均为个人理解参悟内容。
2,如何把properties中的所有unicode编码转为汉字
在命令行界面用native2ascii工具
1.将汉字转为Unicode:
C:\Program Files\Java\jdk1.5.0_04\bin>native2ascii
测试
\u6d4b\u8bd5
2.将Unicode转换为汉字:
C:\Program Files\Java\jdk1.5.0_04\bin>native2ascii -reverse
\u6d4b\u8bd5
测试
java 自带的一个native2ascii.exe是一个很好的转码工具,在bin目录下。如果你的properties中有汉字,需要转成unicode . 则把含有汉字的properties拷贝到bin 目录下, 然后在cmd里面进入bin目录,输入:native2ascii -encoding utf-8 Language-ext_zh_CN.properties.native Language-ext_zh_CN.properties就ok了。Language-ext_zh_CN.properties是转码后的文件。
在做Java开发的时候,常常会出现一些乱码,或者无法正确识别或读取的文件,比如常见的validator验 证用的消息资源(properties)文件就需要进行Unicode重新编码。原因是java默认的编码方式为Unicode,而我们的计算机系统编码 常常是GBK等编码。需要将系统的编码转换为java正确识别的编码问题就解决了。
1、native2ascii简介:native2ascii 是sun java sdk提供的一个工具。用来将别的文本类文件(比如*.txt,*.ini,*.properties,*.java等等)编码转为Unicode编码。 为什么要进行转码,原因在于程序的国际化。Unicode编码的定义:Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。它为每 种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。随着计算 机工作能力的增强,Unicode也在面世以来的十多年里得到普及。(声明:Unicode编码定义来自互联网)。
2、获取native2ascii:安装了jdk后,假如你是在windows上安装,那么在jdk的安装目录下,会有一个bin目录,其中native2ascii.exe正是。
3、native2ascii的命令行的命名格式:
native2ascii -[options] [inputfile [outputfile]]
说明:
-[options]:表示命令开关,有两个选项可供选择
-reverse:将Unicode编码转为本地或者指定编码,不指定编码情况下,将转为本地编码。
-encoding encoding_name:转换为指定编码,encoding_name为编码名称。
[inputfile [outputfile]]
inputfile:表示输入文件全名。
outputfile:输出文件名。如果缺少此参数,将输出到控制台。
4、最佳实践:首先将JDK的bin目录加入系统变量path。在盘下建立一个test目录,在test目录里建立一个zh.txt文件,文件内容为:“熔岩”,打开“命令行提示符”,并进入C:\test目录下。下面就可以按照说明一步一步来操作,注意观察其中编码的变化。
A:将zh.txt转换为Unicode编码,输出文件到u.txt
native2ascii zh.txt u.txt
打开u.txt,内容为“\u7194\u5ca9”。
B:将zh.txt转换为Unicode编码,输出到控制台
C:\test>native2ascii zh.txt
\u7194\u5ca9
可以看到,控制台输出了“\u7194\u5ca9”。
C:将zh.txt转换为ISO8859-1编码,输出文件到i.txt
native2ascii -encoding ISO8859-1 zh.txt i.txt
打开i.txt文件,内容为“\u00c8\u00db\u00d1\u00d2”。
D:将u.txt转换为本地编码,输出到文件u_nv.txt
native2ascii -reverse u.txt u_nv.txt
打开u_nv.txt文件,内容为“熔岩”。
E:将u.txt转换为本地编码,输出到控制台
C:\test>native2ascii -reverse u.txt
熔岩
可以看到,控制台输出了“熔岩”。
F:将i.txt转换为本地编码,输出到i_nv.txt
native2ascii -reverse i.txt i_nv.txt
打开i_nv.txt文件,内容为“\u00c8\u00db\u00d1\u00d2”。发现转码前后完全一样的。也就是说,等于没有转,或者说思想糊涂,对命名没有理解。。
G:将i.txt转换为GBK编码,输出到i_gbk.txt
native2ascii -reverse -encoding GBK i.txt i_gbk.txt
打开i_gbk.txt文件,内容为“\u00c8\u00db\u00d1\u00d2”。发现转码前后完全一样的。也就是说,等于没有转,或者说思想糊涂,对命名没有理解。
H:将u_nv.txt转码到本地编码GBK,输出到控制台
C:\test>native2ascii -reverse -encoding ISO8859-1 i.txt
熔岩
从这个结果看,目标达到到了,编码i.txt为ISO8859-1,转为本地编码后内容为“熔岩”。从这里应该意识到,native2ascii -reverse命令中-encoding指定的编码为源文件的编码格式。而在native2ascii 命令中-encoding指定的编码为(生成的)目标文件的编码格式。这一点非常的重要!切记!!
继续探索,新建文件12a.txt,内容“12axyz”。看看纯字母数字的编码又如何。
I:将纯字母数字的文本文件12a.txt转换为Unicode编码
native2ascii 12a.txt 12a_nv.txt
打开12a_nv.txt文件,内容为“12axyz”。
继续测试,转为ISO8859-1编码看看
C:\test>native2ascii -encoding ISO8859-1 12a.txt
12axyz
结果还是没有转码。
从结果可以得出结论:对于纯数字和字母的文本类型件,转码前后的内容是一样的。
3,python2中怎样将unicode转换成原来的中文
如果: u'\u6ce8\u91ca' 真是unicode对象,你直接print 输出就是汉字了。
如果你得到的只是这样的 "u'\u6ce8\u91ca'" 字符串是不行的。
>>> s = u'\u6ce8\u91ca'
>>> s
u'\u6ce8\u91ca'
>>> print s
注释
>>> print type(s)
>>> print s.encode('gbk')
4,python中怎样将unicode转换成原来的中文?
python默认就是unicode存储。如果是从文件读取的,在open的参数中指定encoding关键字参数就行。如下: #coding=utf-8/import json /def LoadQuestion(): /f = open("test.json",'r') qas = json.load(f) question = qas['documents'] /return question/t = LoadQuestion() /print str(t).decode("unicode-escape") 拓展资料:通常python2时所有IO读写都是byte方式。也就是编码后的。java也是这样子。只有python3还有某些特定的模块才会自动将byte重新转换成unicode在python2里的确可以使用s.decode('gbk','ignore')之类的变成unicode。不过在python3里应该是这样子, s.encode('gbk','ignore')这样就变成了byte如果你喜欢 utf-8,可以s.encode(‘utf-8','ignore')和s.decode(‘utf-8','ignore')
5,用java如何把unicode码转成汉字?
java中将unicode码转换成汉字的方式是直接使用string类型,打印即可: String ascii="\u4f01\u4e1a";//这两个unicode码就是企业的System.out.println(ascii);//打印出来运行结果: 企业 Unicode只有一个字符集,中、日、韩的三种文字占用了Unicode中0x3000到0x9FFF的部分 Unicode目前普遍采用的是UCS-2,它用两个字节来编码一个字符, 比如汉字"经"的编码是0x7ECF,注意字符编码一般用十六进制来 表示,为了与十进制区分,十六进制以0x开头,0x7ECF转换成十进制 就是32463,UCS-2用两个字节来编码字符,两个字节就是16位二进制, 2的16次方等于65536,所以UCS-2最多能编码65536个字符。
6,Java如何将一段汉字变成unicode码?
public class T { public static void main(String[] args) { String s = "我爱你"; System.out.println(string2Unicode(s)); } public static String string2Unicode(String string) { StringBuffer unicode = new StringBuffer(); for (int i = 0; i < string.length(); i++) { // 取出每一个字符 char c = string.charAt(i); // 转换为unicode unicode.append("\\u" + Integer.toHexString(c)); } return unicode.toString(); }}
7,在sqlserver数据库中如何将unicode编码的字符转换为中文?求高手,求算法
1、先把数据库数据倒出来(导成.txt格式的),用软件转成unicode格式。 2、把数据库转成unicode格式。 3、把数据倒回。 说明:为了安全起见,在操作过程中一定要注意备份操作。 SqlServer SQL Server是由Microsoft开发和推广的关系数据库管理系统(DBMS),它最初是由Microsoft、Sybase和Ashton-Tate三家公司共同开发的,并于1988年推出了第一个OS/2版本。 SQL Server 关系数据库简介: SQL Server是由Microsoft开发和推广的关系数据库管理系统(DBMS),它最初是由Microsoft、Sybase和Ashton-Tate三家公司共同开发的,并于1988年推出了第一个OS/2版本。 SQL Server近年来不断更新版本,1996年,Microsoft 推出了SQL Server 6.5版本;1998年,SQL Server 7.0版本和用户见面;SQL Server 2000是Microsoft公司于2000年推出的最新版本。
8,如何将Oracle数据库中的Unicode转换为中文
过程名 : decodeUnicode2CN
功能 : 将unicode编码格式转换成中文
输入参数 :text :unicode编码内容
输出参数 :中文输出
=======================================================
FUNCTION DECODEUNICODE2CN(TEXT IN VARCHAR2) RETURN VARCHAR2 IS
V_SQL VARCHAR2(32765); --编码转换sql
TEXT_BUFFER VARCHAR2(32765); --输出中文
BEGIN
V_SQL := 'select unistr(REPLACE(''' || TEXT ||
''',''\u'',''\'')) from dual ';
EXECUTE IMMEDIATE V_SQL
INTO TEXT_BUFFER;
RETURN TEXT_BUFFER;
END;
9,如何将unicode转换成汉字
Unicode(万国码)是一个国际标准字符集,是国际上电脑行业系统字符集的标准,其版本不断更新,目前的6.2版含有7.68万以上汉字和数万个包括各国语言文字及图案的图形符号,各版本基本上是向下兼容的,因此,万国码的汉字用不着再加以转换,高版本的汉字在低版本中一般都能显示出来,除非是低版本中的缺字没法显示,但在低版本中也没法转换。
下一篇:没有了