连续字符自动换行的解决方案

文本的排版依据语言的不同会有一些格式上的要求,比如简体中文中类似逗号、分号等标点符号不会出现在一行的开头,对于英文来讲就是一个完整单词不会在两行显示,浏览器会依据类似这样的原则来显示文本。但是由于网页有宽度限制的,连续的超长的字母、数字或标点符号超出其所在区域宽度的限制而导致影响页面视觉,如例1所示。这个问题在显示用户输入信息时尤为突出,这里就是要说如何解决这个问题。

CSS3草案中,对文本的处理新增了两个新属性word-wrapword-break来解决这个问题:

  1. {word-wrap:break-word;} :依照亚洲语言和非亚洲语言的文本规则,允许在字内换行,且允许非亚洲语言文本行的任意字内断开
  2. {word-break:break-all;} : 内容将在边界内换行,如需要则词内换行(word-break)也行发生

下面是常见浏览器的支持情况:

IE6/7/8[1] Firefox2/3[2] Firefox3.5 Opera9+ Safari9.5+/Chrome
{word-wrap:break-word;} td元素需设置其宽度
例4例5
不支持 不支持td元素
例4例5
不支持 不支持td元素
例4例5
{word-break:break-all;} 不支持连续的符号
例3
不支持 不支持连续的符号
例3
不支持 支持
  • [1] 在MSDN的CSS Compatibility and Internet Explorer中可以看出,IE8会像IE6和IE7一样支持word-wrap和word-break这两个属性,但我在IE8beta2上测试来看却不支持这两项,由于IE8还处于beta阶段,且我相信IE8最终会支持的,所以在页头声明<meta content="IE=7" http-equiv="X-UA-Compatible" />使IE8按照IE7来解释页面是一个不错的办法。IE8正式版支持
  • [2] Firefox3.1将会支持word-wrap属性Firefox3.5beta4已经支持

由于{word-break:break-all;}导致英文和数字可读性严重下降且无法使连续符号换行,所以{word-wrap:break-word;}是一个相对较好的选择。需要注意的是各个浏览器中word-wrap在td上实现不一致,所以避免直接在td上使用。

但面对浏览器的如此糟糕支持,所以不能不借助JavaScript来解决这个问题,即当浏览器不支持CSS解决方案时,在连续字符串的适当位置插入&#8203;字符(当然还可以用<wbr />和&shy;,这三个字符在浏览器中的支持情况请看ppk的《The wbr tag》),这些字符写在浏览器中不会显示,却使长字符串换行。&#8203;和&shy;都会导致复制用其处理过的文本时有大量不可打印的字符,导致字符数急剧增大,更严重的是导致复制的链接字符串不可用,所以用<wbr />是比较好的方案,虽然<wbr />在IE8中不被支持且在Safari中有bug,但这些浏览器可以直接用CSS{word-wrap:break-word}来实现无需用<wbr />处理。Opera下要兼容<wbr />,需要设置CSS:wbr:after { content: "\00200B" }

2009.05.28重写了实现方法,尽可能减少对浏览器探测的依赖,同时考虑对同一个页面多次执行该方法的效率,同时为了偷懒直接基于YUI。请看DEMO

具体实现代码如下:

function fnBreakWordAll(o){
var o = o || {},
  iWord = o.word || 13,
  iRe = o.re || '[a-zA-Z0-9]',
  bAll = o.all || false,
  sClassName = o.className || 'word-break-all',
  aEls = o.els || (function(){
    var aEls = [],
      aAllEls = document.getElementsByTagName('*'),
      re = new RegExp('(?:^|\\s+)' + sClassName + '(?:\\s+|$)');
    for(var i =0,iLen = aAllEls.length; i < iLen ; ++i){
      if(re.test(aAllEls[i].className)){
        aEls[aEls.length] = aAllEls[i];
      }
    }
    return aEls;
  })() || [],
  fnBreakWord = function(oEl){
    // 基于http://www.hedgerwow.com/360/dhtml/css-word-break.html修改
    if(!oEl || oEl.nodeType !== 1){
      return false;
    }else if(oEl.currentStyle && typeof oEl.currentStyle.wordWrap==='string'){
      breakWord = function(oEl){
        oEl.runtimeStyle.wordWrap = 'break-word';
        return true;
      }
      return breakWord(oEl);
    }else if(document.createTreeWalker){
      var trim = function  (str) {
        str = str.replace(/^\s\s*/, '');
        var ws = /\s/,
        i = str.length;
        while (ws.test(str.charAt(--i)));
        return str.slice(0, i + 1);
      }
      breakWord = function(oEl){
        var dWalker=document.createTreeWalker(oEl,NodeFilter.SHOW_TEXT,null,false);
        var node,s,c = String.fromCharCode('8203'),
          //re = /([a-zA-Z0-9]{0,13})/;
          re = new RegExp('('+ iRe +'{0,' + iWord + '})');
        while (dWalker.nextNode()){
          node = dWalker.currentNode;
          s = trim(node.nodeValue).split(re).join(c);
          node.nodeValue = s;
        }
        return true;
      }
      return breakWord(oEl);
    }
  };
for(var i=0,n=aEls.length; i<n; ++i){
  var sUa = navigator.userAgent,
    sTn = aEls[i].tagName.toLowerCase() ;
  if((/Opera/).test(sUa) || (/Firefox/).test(sUa) || ((/KHTML/).test(sUa) &&
  (sTn === 'td' || sTn === 'th')) || bAll){
    fnBreakWord(aEls[i]);
  }
}
}

具体应用请看演示实例

fnWordBreakAll函数提供一些定制参数,使用方法和参数含义如下:

fnWordBreakAll({word:15,re:'[\\w]',all:true});
参数 说明
word 正整数,默认是13 在这个字数内的单词不会被插入\u8203,印象中超过13个字母的单词不多,这可以保证绝大部分单词不会被打碎
re 正则表达式,默认[a-zA-Z0-9] 单词的正则表达式,用以确定一个单词是哪些字符组成,注意\的转义
all 布尔值,默认false 确定是否在所有的浏览器中执行,默认在Opera和Firefox,以及当class应用在th或td的Safari上执行,这个主要用在.word-break-all没有定义时,会对IE加上样式
className 合法class名,默认word-break-all 执行函数的元素对应属性名

这个函数的核心部分修改自Hedger Wang 整理了一个JavaScript解决方案《Cross Browser Word Breaker》,其利用document.createTreeWalker和split方法给非IE浏览器的每个字符间加入了&#8203;,它用在纯中文文本基本上没有什么问题,但是如果你仔细观察他给出的例子就会发现文本中有英文或数字时,虽然解决了换行问题,但是使文本难以阅读,且增大了字符间的间距,所以我在此基础上做了上面的改进。

标签:, , , , , ,

作者:秦歌,时间:2008-12-04 0:16,归纳于:HTML & CSS, Javascript & DOM & AJAX,订阅:RSS 2.0,引用:Trackback

有评论 14 条,发表一条新评论 »

peter说:2008-12-04 3:10 #1

Firefox这个实在是比较麻烦

柠檬园主说:2008-12-04 9:06 #2

性….能….如何?

小马说:2008-12-04 9:56 #3

Firfox 3.1 支持 word-break 了

怿飞说:2008-12-04 12:42 #4

Safari支持word-break:break-all;属性倒是没测试过。很早之前看过Hedger的文章也发过一篇:http://www.planabc.net/2008/07/03/cross_browser_word_breaker/ 不过使用XBL bindings 方式来解决这个问题,我感觉更推荐一点。

秦歌说:2008-12-04 12:53 #5

呵呵,你那篇文章,我看过了,XBL Bindings是不错,但是Firefox独有技术,解决原理其实也和JavaScript大同小异,所以JavaScript是一个更好的选择。

胡戈戈说:2008-12-04 13:00 #6

目前暂时我觉得采用overflow:hidden;的方法比较好,虽然会隐藏掉那些看不到的,但比其它方法要好一些

ytzong说:2008-12-04 14:45 #7

XBL bindings也有缺点:
1,文字不能选择
2,XML文件加载不进来时该段文字无法显示

我de艾蜜莉说:2008-12-04 18:13 #8

个人觉得对于这种连续的字符,完全可以overflow:hidden掉,都是无意义的嘛。任何有意义的字符应该word-break:break-all和word-wrap:break-word;都可以解决的。

匿名说:2008-12-04 18:48 #9

这个方法IE8不支持啊

Sutra说:2008-12-04 21:37 #10

wbr 怎么好像没有结束符?

秦歌说:2008-12-04 23:21 #11

To 柠檬:我用了一下,没有发现什么异常,不过我也没有进行过严格测试。回头可以测试看看。

To 小马:呵呵,这是一个好消息,以前还真没有怎么注意。

To 胡戈戈 & 我de艾蜜莉:{overflow:hidden;}是一个常见的解决方案,但是很多时候并不友好,比如用户输入一个URL时,隐藏起来会严重损害用户的感受,虽然Firefox3已经在这方面只有很少的改进。把用户输入的内容完全显示出来才是我们应该做的。

To #9 匿名:在MSDN的CSS Compatibility and Internet Explorer中可以看出,IE8会像IE6和IE7一样支持word-wrap和word-break这两个属性,但我在IE8beta2上测试来看却不支持这两项,由于IE8还处于beta阶段,且我相信IE8最终会支持的,所以在页头声明<meta content=”IE=7″ http-equiv=”X-UA-Compatible” />使IE8按照IE7来解释页面是一个不错的办法。本文中的例子都已经做了相应的修改。

To Sutra:你说的很对,在这里我遵循的XHTML标准,所以应该写成<wbr />,但是如果要是遵循HTML标准,就应该用<wbr>了

连续字符自动换行的解决方案 @ 随网之舞 - 岁月如歌说:2009-02-10 18:07 #12

[...] via 连续字符自动换行的解决方案 @ 随网之舞. [...]

moondy说:2009-06-15 10:17 #13

这一直是个困扰的问题,总觉得这应该是个很基本的问题却要用JS来解决有些大动干戈。老外应该比我们更容易碰到连续字符的问题,为什么在开发浏览器或定标准的时候没先把它给解决呢

mage说:2009-07-17 15:43 #14

这个问题也一直困扰着我

发表一条评论

您可以在下面评论内容中使用下列XHTML标签:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>


回到页眉