<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>M78星云字符集</title>
	<atom:link href="http://liferar.com/tag/%e5%ad%97%e7%ac%a6%e9%9b%86/feed" rel="self" type="application/rss+xml" />
	<link>http://liferar.com</link>
	<description>愿我们的梦想，像光那样，从一颗星到另一颗星!</description>
	<lastBuildDate>Wed, 07 Dec 2011 16:07:51 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.1</generator>
		<item>
		<title>字符集编码</title>
		<link>http://liferar.com/charset_and_encoding</link>
		<comments>http://liferar.com/charset_and_encoding#comments</comments>
		<pubDate>Sat, 28 Mar 2009 19:28:49 +0000</pubDate>
		<dc:creator>CK猪</dc:creator>
				<category><![CDATA[CK猪是程序员]]></category>
		<category><![CDATA[字符集]]></category>
		<category><![CDATA[编码]]></category>

		<guid isPermaLink="false">http://www.liferar.com/?p=24</guid>
		<description><![CDATA[一、什么是字符集？什么是编码？ 字符（Charcter）是文字与符号的总称，包括文字、图形符号、数学符号等。 一组抽象字符的集合就是字符集（Charset）。字符集常常和一种具体的语言文字对应起来，该文字中的所有字符或者大部分常用字符就构成了该文字的字符集，比如英文字符集。一组有共同特征的字符也可以组成字符集，比如繁体汉字字符集、日文汉字字符集。字符集的子集也是字符集。 计算机要处理各种字符，就需要将字符和二进制内码对应起来，这种对应关系就是字符编码（Encoding）。制定编码首先要确定字符集，并将字符集内的字符排序，然后和二进制数字对应起来。根据字符集内字符的多少，会确定用几个字节来编码。每种编码都限定了一个明确的字符集合，叫做被编码过的字符集（Coded Character Set），这是字符集的另外一个含义。通常所说的字符集大多是这个含义。 因为制定编码的同时往往也制定了字符集，所以经常把字符集和编码混为一谈，具体区分细节不用细究。  二、通用字元集（Universal Character Set，UCS） 通用字元集（Universal Character Set，UCS）是由ISO制定的ISO10646（或称ISO/IEC 10646）标准所定义的字元编码方式，采用4字节编码。又称Universal Multiple-Octet Coded Character Set，大陆译为通用多八位编码字符集，臺湾译为广用多八位元编码字元集。  表示一个UCS或Unicode值的十六进位数通常在前面加上「U+」，例如「U+0041」代表字元「A」。 通用字元集是所有包括了其他字元集。它保证了与其他字元集的双向相容，即，如果你将任何文本字元串翻译到UCS格式，然後再翻译回原编码，你不会丢失任何信息。  三、unicode Unicode（统一码、万国码、单一码）是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码，以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发，1994年正式公布。随着计算机工作能力的增强，Unicode也在面世以来的十多年里得到普及。 2006年6月的最新版本的 Unicode 是 2005年3月31日推出的Unicode 4.1.0 。另外，5.0 Beta已于2005年12月12日推出，以供各会员评价。 Unicode 的编码和实现 大概来说，Unicode 编码系统可分为编码方式和实现方式两个层次。  1.编码方式 Unicode 的编码方式与 ISO 10646 的通用字元集(亦称[通用字符集])（Universal Character Set，UCS）概念相对应，目前的用于实用的 Unicode 版本对应于 UCS-2，使用16位的编码空间。也就是每个字符占用2个字节。  2.实现方式 Unicode 的实现方式不同于编码方式。一个字符的 Unicode 编码是确定的。但是在实际传输过程中，由于不同系统平台的设计不一定一致，以及出于节省空间的目的，对 Unicode 编码的实现方式有所不同。Unicode 的实现方式称为Unicode转换格式（Unicode/UCS Transformation Format，简称为 UTF）。 [...]]]></description>
			<content:encoded><![CDATA[<div class="blog_content">
<p><span style="color: #0000ff; font-size: medium;"><strong>一、什么是字符集？什么是编码？</strong></span></p>
<div><span><span>字符（Charcter）是文字与符号的总称，包括文字、图形符号、数学符号等。</span></span></div>
<p><span><span>一组抽象字符的集合就是字符集（Charset）。字符集常常和一种具体的语言文字对应起来，该文字中的所有字符或者大部分常用字符就构成了该文字的字符集，比如英文字符集。一组有共同特征的字符也可以组成字符集，比如繁体汉字字符集、日文汉字字符集。字符集的子集也是字符集。</span></p>
<p><span>计算机要处理各种字符，就需要将字符和二进制内码对应起来，这种对应关系就是字符编码（Encoding）。制定编码首先要确定字符集，并将字符集内的字符排序，然后和二进制数字对应起来。根据字符集内字符的多少，会确定用几个字节来编码。每种编码都限定了一个明确的字符集合，叫做被编码过的字符集（Coded Character Set），这是字符集的另外一个含义。通常所说的字符集大多是这个含义。</span></p>
<p><span>因为制定编码的同时往往也制定了字符集，所以经常把字符集和编码混为一谈，具体区分细节不用细究。</span></p>
<div><span><span style="color: #0000ff; font-size: medium;"><strong> 二、通用字元集（Universal Character Set，UCS）</strong></span></span></div>
<div><span><strong>通用字元集</strong>（Universal Character Set，UCS）是由ISO制定的ISO10646（或称ISO/IEC 10646）标准所定义的字元编码方式，采用4<a href="http://bk.baidu.com/view/60408.htm" target="_blank"><span style="color: #108ac6;">字节</span></a>编码。又称Universal Multiple-Octet Coded Character Set，大陆译为通用多八位编码字符集，臺湾译为广用多八位元编码字元集。</span></div>
<p></span><span> 表示一个UCS或<a href="http://bk.baidu.com/view/40801.htm" target="_blank"><span style="color: #108ac6;">Unicode</span></a>值的十六进位数通常在前面加上「U+」，例如「U+0041」代表字元「A」。<br />
通用字元集是所有包括了其他字元集。它保证了与其他字元集的双向相容，即，如果你将任何文本字元串翻译到UCS格式，然後再翻译回原编码，你不会丢失任何信息。</p>
<p><strong> <span style="color: #0000ff; font-size: medium;">三、unicode</span></strong></p>
<p><strong>Unicode</strong>（<strong>统一码</strong>、<strong>万国码</strong>、<strong>单一码</strong>）是一种在<a href="http://bk.baidu.com/view/3314.htm" target="_blank"><span style="color: #108ac6;">计算机</span></a>上使用的<a href="http://bk.baidu.com/view/263416.htm" target="_blank"><span style="color: #108ac6;">字符</span></a>编码。它为每种<a href="http://bk.baidu.com/view/9793.htm" target="_blank"><span style="color: #108ac6;">语言</span></a>中的每个字符设定了统一并且唯一的<a href="http://bk.baidu.com/view/18536.htm" target="_blank"><span style="color: #108ac6;">二进制</span></a>编码，以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发，1994年正式公布。随着计算机工作能力的增强，Unicode也在面世以来的十多年里得到普及。</p>
<p>2006年6月的最新版本的 Unicode 是 2005年3月31日推出的Unicode 4.1.0 。另外，5.0 Beta已于2005年12月12日推出，以供各会员评价。</p>
<p><strong>Unicode 的编码和实现</strong></p>
<p>大概来说，Unicode 编码系统可分为编码方式和实现方式两个层次。</p>
<p> 1.<strong>编码方式</strong></p>
<p>Unicode 的编码方式与 ISO 10646 的<a href="http://bk.baidu.com/view/354447.htm" target="_blank"><span style="color: #108ac6;">通用字元集</span></a>(亦称[通用字符集])（Universal Character Set，UCS）概念相对应，目前的用于实用的 Unicode 版本对应于 UCS-2，使用16位的编码空间。也就是每个字符占用2个<a href="http://bk.baidu.com/view/60408.htm" target="_blank"><span style="color: #108ac6;">字节</span></a>。</p>
<p> 2.<strong>实现方式</strong></p>
<p>Unicode 的实现方式不同于编码方式。一个字符的 Unicode 编码是确定的。但是在实际传输过程中，由于不同系统平台的设计不一定一致，以及出于节省空间的目的，对 Unicode 编码的实现方式有所不同。Unicode 的实现方式称为Unicode转换格式（Unicode/UCS Transformation Format，简称为 UTF）。</p>
<p>Unicode 的实现方式还包括 UTF-7、Punycode、CESU-8、SCSU、UTF-32等，这些实现方式有些仅在一定的国家和地区使用，有些则属于未来的规划方式。目前通用的实现方式是 UTF-16小尾序（BOM）、UTF-16大尾序（BOM）和 UTF-8。</p>
<p> <span style="color: #ff0000; font-size: medium;"><strong>UCS 和 Unicode 只是分配整数给字符的编码表，UTF-8、UTF-16、CESU-8等则指定了如何存储！</strong></span></p>
<div><strong><span style="color: #ff0000; font-size: medium;"><strong><span style="color: #ff0000; font-size: medium;"><strong><span style="color: #ff0000; font-size: medium;"><strong><span style="color: #ff0000; font-size: medium;"> </span></strong></span></strong></span></strong></span></strong></div>
<p><strong><span style="color: #ff0000; font-size: medium;"><strong><span style="color: #ff0000; font-size: medium;"><strong><span style="color: #ff0000; font-size: medium;"><strong><span style="color: #ff0000; font-size: medium;"> </p>
<p>参考文献：</p>
<p><span><a href="http://bk.baidu.com/view/40801.htm"><span style="color: #108ac6;">http://bk.baidu.com/view/40801.htm</span></a>   unicode参考</span></p>
<p><span><a href="http://bk.baidu.com/view/354447.htm"><span style="color: #108ac6;">http://bk.baidu.com/view/354447.htm</span></a>  UCS参考</span></p>
<p><span><a href="http://bk.baidu.com/view/25412.html"><span style="color: #108ac6;">http://bk.baidu.com/view/25412.html</span></a>  UTF-8参考</span></p>
<div><span><span style="color: #ff0000; font-size: medium;"><span style="color: #ff0000; font-size: medium;"><span style="color: #ff0000; font-size: medium;"><span style="color: #ff0000; font-size: medium;"> </span></span></span></span></span></div>
<p><span><span style="color: #ff0000; font-size: medium;"><span style="color: #ff0000; font-size: medium;"><span style="color: #ff0000; font-size: medium;"><span style="color: #ff0000; font-size: medium;"> </p>
<p></span></span></span></span></span></span></strong></p>
<div><span><span style="color: #ff0000; font-size: medium;"><span style="color: #ff0000; font-size: medium;"><span style="color: #ff0000; font-size: medium;"> </span></span></span></span></div>
<p><span><span style="color: #ff0000; font-size: medium;"><span style="color: #ff0000; font-size: medium;"><span style="color: #ff0000; font-size: medium;"> </p>
<p></span></span></span></span></span></strong></p>
<div><span><span style="color: #ff0000; font-size: medium;"><span style="color: #ff0000; font-size: medium;"> </span></span></span></div>
<p><span><span style="color: #ff0000; font-size: medium;"><span style="color: #ff0000; font-size: medium;"> </p>
<p></span></span></span></span></strong></p>
<div><span><span style="color: #ff0000; font-size: medium;"> </span></span></div>
<p><span><span style="color: #ff0000; font-size: medium;"> </p>
<p></span></span></span></strong></p>
<div><span> </span></div>
<p><span> </p>
<p></span></span></div>
<h3>相关文章</h3>
<ul class="related_posts">
<li>没有找到.</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://liferar.com/charset_and_encoding/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

