中国IT动力,最新最全的IT技术教程
最新100篇 | 推荐100篇 | 专题100篇 | 排行榜 | 搜索 | 在线API文档 | 网通镜像
首 页 | 程序开发 | 操作系统 | 软件应用 | 图形图象 | 网络应用 | 精文荟萃 | 教育认证 | 硬件维护 | 未整理篇 | 站长教程
ASP JS PHP工程 ASP.NET 网站建设 UML J2EESUN .NET VC VB VFP 网络维护 数据库 DB2 SQL2000 Oracle Mysql
服务器 Win2000 Office C DreamWeaver FireWorks Flash PhotoShop 上网宝典 CorelDraw 协议大全 网络安全 微软认证
硬件维护  CPU  主板  硬盘  内存  显卡  显示器  键盘鼠标  声卡音箱  打印机  机箱电源  BIOS  网卡  C#  Java  Delphi  vs.net2005
  当前位置:> 程序开发 > 编程语言 > Java > 基础 > Java语言基础
从Java编码中截取给定宽度中英文字符串
作者:dxaw 时间:2007-06-13 13:27 出处:ccidnet.com 责编:月夜寒箫
              摘要:从Java编码中截取给定宽度中英文字符串

Java内核是unicode的,就连class文件也是,但是很多媒体,包括文件/流的保存方式是使用字节流的。

 

因此Java要对这些字节流经行转化。

 

char是unicode的,而byte是字节。我们在写JSP页面时可能没注意到JSP作为回显终端,也是byte的,所以在从JSP页面中读取表单和写入数据

 

(Javabean)时要注意页面的编码.

一个传统的解决方案是所有的应用包括页面编码设置\数据库编码设置都设定一致,比如gbk(gbk是gb2312的扩展集,支持的字符要多些).

现在又有个问题了,既然Java内核是unicode的编码,那么字符串String lml="我爱金信桥tbs,tbs金信桥爱我"的长度应该是中文字符和英文字符的个数和,即lml.length()==17.

好了,如果我们想截取长度为14的字符串,那么应该:lml.substring(0,13);返回“我爱金信桥tbs,tbs金”.

这没问题吧?

但如果是应用中要求我们截取"固定回显长度"的字符串回显到JSP页面,那应该怎么办呢?所谓“固定回显长度”是指一个区域纯英文能显示x个,纯中文能显示x/2个.假设一个JSP页面中,有个表格,其中一列宽度为13个纯英文字符,我们想显示主题,主题可以为中文或英文.如果我们简单地设定了取前13个字符,那么在英文情况下是没问题的,能正确显示截取的前13个.

但汉字呢?一个汉字要占两个英文的宽度的.所以取了13个汉字就超过了列的宽度,破坏了布局.

那取6个字符好了!

恩,这到是没破坏布局,但你不觉得英文的情况下浪费了一般的宽度么?

哦,那就不好办了,中英文混合的串确实麻烦...

 

我在做mail系统时,在邮件列表中有一列加上了正文的内容提示(前50个字符,有点类似gmail),内容是可以有中文和英文混合的,所以为了尽量提示多些,不能采

 

用笨方法:直接取25个字符,保证中文没问题,英文浪费去吧~~~

后来仔细研究了一下,可以这样解决:从字符串转换成byte,然后判断汉字的个数,是汉字就取占两个空,不是汉字就占一个空.这就是为什么一开

 

始我要提提Java中的byte<---->char,o(∩_∩)o...哈哈

注意到这里有个trick,就是如果最后截取的是半个汉字,要丢弃掉!!否则,最后可能出现一个?号.

 

用法:

string str=MyUtil.substring(lml,14);

System.out.println(str);

输出:

我爱金信桥tbs,

 

核心代码如下:

 

 

/**
            * 判断一个字符是Ascill字符还是其它字符(如汉,日,韩文字符)
            *
            * @param char
            *            c, 需要判断的字符
            * @return boolean, 返回true,Ascill字符
            */
            public static boolean isLetter(char c) {
            int k = 0x80;
            return c / k == 0 ? true : false;
            }
            /**
            * 得到一个字符串的长度,显示的长度,一个汉字或日韩文长度为2,英文字符长度为1
            *
            * @param String
            *            s ,需要得到长度的字符串
            * @return int, 得到的字符串长度
            */
            public static int length(String s) {
            if (s == null)
            return 0;
            char[] c = s.toCharArray();
            int len = 0;
            for (int i = 0; i < c.length; i++) {
            len++;
            if (!isLetter(c[i])) {
            len++;
            }
            }
            return len;
            }
            /**
            * 截取一段字符的长度,不区分中英文,如果数字不正好,则少取一个字符位
            *
            * @author patriotlml
            * @param String
            *            origin, 原始字符串
            * @param int
            *            len, 截取长度(一个汉字长度按2算的)
            * @return String, 返回的字符串
            */
            public static String substring(String origin, int len) {
            if (origin == null || origin.equals("")||len<1)
            return "";
            byte[] strByte = new byte[len];
            if (len > MyUtil.length(origin)){
            return origin;}
            System.arraycopy(origin.getBytes(), 0, strByte, 0, len);
            int count = 0;
            for (int i = 0; i < len; i++) {
            int value = (int) strByte[i];
            if (value < 0) {
            count++;
            }
            }
            if (count % 2 != 0) {
            len = (len == 1) ? ++len : --len;
            }
            return new String(strByte, 0, len);
            }
关闭本页
 
首页 | 投资与合作 | 服务条款 | 隐私政策 | 收藏本站 | 设为首页 | 新用户注册 | 免责声明 | 使用帮助
Copyright ©2005-2008 chinaitpower.com All rights reserved. www.chinaitpower.com 版权所有