月蝎研究: 2008

Friday, December 05, 2008

Google Friend Connect 开放注册

前天 Google 官方 Blog 报道，发布了其 SNS 项目 Google Friend Connect，大笨熊的 blog 也提到这条消息。今天收到了 woainiuniu 的邀请，在这里谢过了。现在似乎已经开发注册了。

Google Friend Connect 可以让网站管理员在他们的网站增加一些社会性的功能，允许访客注册并加入到网站，显示自己的头像图标，查看其他已经加入的访客以及他们在 Friend Connect 上的活动。全部工作只需要简单复制粘贴几段代码即可，不需要复杂的编程技术。网站应用了 Friend Connect 以后，可以给网站添加各种 Widgets 实现评论、留言、投票等功能，这种类似的小工具也在不断的增加中。

本站已经注册并添加了 Friend Connect 功能，左边栏较下方的“Friends”便是，欢迎各位朋友加入本站。如果您自己也有一个 blog 或者网站的话，也可以加上这个简单易用的 Friend 功能。

在左边栏较下方的“Friends”区域点击 'Join This Site' 按钮即可通过 Google Friend Connect 加入本站

在左边栏较下方的“Friends”区域点击 'Join This Site' 按钮即可通过 Friend Connect 加入本站

Blogger 用户如何安装 Friend Connect？

如果你用的刚好是 Google 的 Blogger 而且是 Blogspot 或者 Custom Domain 用户，那要如何安装 Friend Connect 呢？这看起来是不可能的。因为安装过程要求用户上传两个 html 文件到网站根目录下，而我们显然不可能直接上传文件到 blogspot 服务器。

但事实比我们想象的简单，会有这个疑问是因为 Friend Connect 那个安装界面解释的不够清楚。事实上，当你在注册并安装 Friend Connect 时，如果提供的网站地址是一个 BlogSpot 网站，或者其 Custom Domain 的网站，那么这两个文件就会被自动上传。也就是说你可以直接跳过这一步，什么都不用做，在 finalize 的时候直接就通过验证了。

什么？你问这么隐秘的事情我是怎么发现的？呵呵，好吧，其实我是 Google 到了这篇文章：How to install Google Friend Connect on Blogger。

Saturday, November 15, 2008

你博客的 ping 列表真的全在工作吗？

我们知道在博客发表文章时，可以利用 XML-RPC 技术将更新通知到各种 Blog 的服务商、搜索引擎等，好让它们主动来抓取，从而提高博客文章被收录的速度和范围。

Google 的 Blogger 不像 WordPress，后者提供了一个方便的 Update Service，只要将 Blog 服务商公布的 XML-RPC 接口地址填进去就可以方便的在发布的时候 ping 这些地址。Blogger 只是在 Settings » Basic 有一个“Add your blog to our listings?”的选项，解释说选择了“Yes”，Google Blog Search 以及 Weblogs.com 就会来收录，除此之外并没有一个可以设置 ping 接口地址列表的地方。

我强烈怀疑 Blogger 这个选项的作用，因为曾经有很长一段时间 Google Blog Search 都没有收录我的文章，后来为了确保收录效果，每次发布文章后我都手工 ping，于是通常 5 分钟内文章就会被收录，而 10 分钟左右，Google 的网页搜索也会收录这篇文章（观察到的最快纪录为 8 分钟）。但是每次都要手工去 ping 确实很麻烦，于是今天就琢磨着自己用 PHP 写一个简单的 XML-RPC 客户端来做这个工作，顺便还可以把其它主流的 ping 服务地址加进去，批量执行。

结果是不试不要紧，一试吓一跳。我参考 Weblogs.com 和 Google Blog Search 提供的标准 ping 操作 API 文档写了一个 XML-RPC 的客户端，测试了一下主流的 ping 服务地址列表，发现其中有很大一部分都不能正常工作。

http://blogsearch.google.com/ping/RPC2 http://rpc.pingomatic.com/ http://api.my.yahoo.com/RPC2 http://api.moreover.com/RPC2 http://rpc.newsgator.com/ http://rpc.weblogs.com/RPC2 http://www.feedsky.com/api/RPC2 http://ping.feedburner.com/ http://rpc.technorati.com/rpc/ping http://ping.blog.qikoo.com/rpc2.php http://blog.iask.com/RPC2 http://www.xianguo.com/xmlrpc/ping.php http://www.zhuaxia.com/rpc/server.php

以下就来一一看一下 ping 这些地址得到的具体结果。

以上这些地址中，能够完全按照标准 API 正常工作的有：

http://blogsearch.google.com/ping/RPC2 http://api.my.yahoo.com/RPC2 http://api.moreover.com/RPC2 http://rpc.weblogs.com/RPC2 http://rpc.technorati.com/rpc/ping

以下是其它有问题的 ping 接口的具体情况。

http://rpc.pingomatic.com/

这是一个十分有名，被博客界所有人争相 ping 之的地址，但是，真的有人见过它返回正确的结果吗？我试了很多次，无论是请求 weblogUpdates.extendedPing 方法，还是weblogUpdates.ping 方法，无论是提供两个参数还是三个、四个参数，它返回的 HTTP 头永远只会是“501 Not Implemented”，正文部分没有任何内容。我另外还试了 http://rpc.pingomatic.com/RPC2 和 http://pingomatic.com/ 两个地址，得到的结果一样。

http://rpc.newsgator.com/

这个地址存在大家的列表中，我感到非常诧异，因为这个域名都已经不存在了，我换了很多个 DNS 服务器都不能解析出它的 IP 地址。后来发现了 NewsGator 的另一个 ping 接口：

http://services.newsgator.com/ngws/xmlrpcping.aspx

经过测试，这个是可以正常工作的。

http://ping.feedburner.com/

起先 FeedBurner 的接口很长时间都不返回，纳闷了很久；细查之下，发现 ping.feedburner.com 这个域名做成了 feeds.feedburner.com 的 CNAME 纪录，而众所周知后者已经被墙，所以实际上这个 ping 接口是没有办法直接通知到的，除非发起 ping 动作的客户端在国外运行。

http://www.feedsky.com/api/RPC2

Feedsky 趁着 FeedBurner 被封在国内很是火了一把，可是做事情的态度和质量还是和人家有差距。首先是没有实现 weblogUpdates.extendedPing 方法，而在请求 weblogUpdates.ping 方法时，返回的结果也很不稳定。有时是正常的结果，有时会以错误码 304 将整个 Feed 的内容放在 message 字段中返回，有时又干脆什么都不返回。

http://ping.blog.qikoo.com/rpc2.php

这个似乎是奇虎官方给出的地址，而几乎网上搜到的所有 ping 列表中都有它。奇怪的是，这个地址根本打不开，HTTP 状态码为 404。我曾经猜测是不是大家在传抄过程中不小心弄错了大小写，于是也试了 RPC2.php, RPC.php, rpc.php，结果都是 404。

http://blog.iask.com/RPC2

新浪这个表面看起来很不错，相应速度很快，返回的 XML 格式也很标准。可是无论怎么提交，返回结果都是 flerror: 1; message: sorry,failing。以至于让我怀疑，这个接口背后的后台程序真的有在运作吗？

http://www.xianguo.com/xmlrpc/ping.php

发出请求大约 5 秒钟后，返回如下内容：

Fatal error: Call to undefined function xmlrpc_server_create() in /opt/lamp/code/common/rssreader-common-2008-11-12-14-31-18/topgene/feed/xmlrpc/server.php on line 15

怎么？PHP 的扩展库都还没配置好就当公共运营的服务器了？而且还直接把错误信息输出到页面上，服务器路径信息一览无余。鲜果啊鲜果，让我说你什么好哇！

http://www.zhuaxia.com/rpc/server.php

抓虾比鲜果好点，至少还返回了，只不过不知道返回的是啥。返回结果如下：

<?xml version="1.0" encoding="utf-8"?>
<methodResponse>
<params>
 <param>
  <value>
   <boolean>0</boolean>
  </value>
 </param>
</params>
</methodResponse>

如果说你看不懂 Weblogs.com 的英文文档倒也情有可原，但是照着 Google 的中文文档依葫芦画瓢总会吧？自己想当然的随便弄一下就完事了？

由以上可以看出，大公司终究还是大公司。令人深思的是，这些不能正常工作的接口中，几乎全是国内的服务商，其中有些暴露出来的问题，更是令人汗颜。

Friday, November 07, 2008

Google 手机地图 2.2.1.5 发布

最近几天在国内的 IT 媒体纷纷报道 Google 手机地图发布了最新版本。原本还在纳闷九月底的新闻怎么现在大家才反应过来，后来看到 Google 黑板报消息，Google 手机地图 2.2.1.5 发布了。和之前发布的 2.2.0 版本相比，除了已经有的“我的位置”、“行车路线”和“公交换乘”功能意外，显著的改动就是增加了“实时路况”功能，可惜目前只支持北京和上海两个城市，希望支持的城市能够逐渐多起来。

在自己的手机上试装了一下 Symbian S60 v3 版本，中文版安装时显示的系统版本号为 2.02(1)，之前版本为 2.02(0)；安装完毕后“关于”界面显示版本号为 2.2.1.5。测试地点和上次一样，而这次利用 GPRS 基站信号定位的地点比上次更接近于实际位置，相差大约为 20 米，可能是因为所处位置并不在道路上。上次定位于实际相差至少 100 米，不知道这次版本升级对“我的位置”定位是否也做了改进。

由于“实时路况”功能尚不支持成都，开启后显示“正在加载路况信息……”不久显示“无此处的路况信息可用”。待以后支持成都市地图后再行测试。

另外顺便也安装了一下英文版，版本号为 2.02(0)，仍然和上次一样，安装后 About 页面显示版本号 2.2.0.13，但功能上也多出了“Traffic Info”选项，开启后出现的情况和中文版一致。

Tuesday, October 28, 2008

向微软 Live Search 提交 Sitemap

作为 Webmaster，您一定知道 sitemap；您应该也知道使用 Google 的网站管理员工具来提交 sitemap 让 Google 收录您的网页；您或许还知道 Yahoo! 具有同样的站长工具（及其英文版）。

最近发现微软还在 beta 测试中的 Live Search 也推出了这样方便站长的工具 Webmaster Center。

微软 Live Search 的 Webmaster Center

和 Google 及 Yahoo! 的类似，以上 Webmaster Center 工具会让您提供网站的入口地址和 sitemap 地址，然后 Live Search 会提示您下载一个 LiveSearchSiteAuth.xml （文件名真是个微软特色十足啊）文件，其中含有和网站对应的校验码。上传至您网站的根目录，使其能够用

http://www.mysite.com/LiveSearchSiteAuth.xml

这样的形式访问到即可。过一段时间 Webmaster Center 就会自动处理您提交的 sitemap 了。

对于已经录入过的网站，可以在 Site List 页面上的站点列表中点击网站地址的链接进入每个网站查看具体信息，包括摘要、属性、抓取问题、反向链接、链出链接、关键字和网站地图等信息。当网站地图发生改变时，可以通过 Ping 地址

http://webmaster.live.com/webmaster/ping.aspx?siteMap=[your sitemap web address]

来主动通知 MSNBot。

相信有了这个工具后，我们的网站就更容易被 MSN 和 Live Search 收录了。如果您的网站有 sitemap 而还没有提交给 MSN，不妨试一下这个办法。

Friday, October 24, 2008

挑战 XHTML 的 Strict 标准

我的 Blog 网页在 Doctype 声明上一直使用的是 XHTML 的 Strict 标准，当初在模板制作完成时是校验过的，可是随着后来无数次的修改、内容添加，现在已经不能通过 W3C 的语法校验了，加上 Google Blogger 在发布页面的时候似乎也并没有考虑目标模板的 Doctype 标准，也部分导致校验的失败。

经过一个下午的努力，终于基本上解决了所有 XHTML 的语法问题，总结如下。

<a> 标签没有 target 属性

在 Strict DTD 里面，超链接 <a> 标签没有 target 属性，因此不能利用 target="_blank" 这样的代码来达到新开页面打开链接的目的。为了实现同样的功能，通常的办法是用 rel="external" 来替代 target="_blank"，然后用如下 JavaScript 代码来处理链接：

function externalLinks() {
  var linkArray = document.getElementsByTagName('a');
  for (var i = 0; i < linkArray.length; i++) {
    var link = linkArray[i];
    if (link.getAttribute('rel') == 'external') {
      link.target = '_blank';
    }
  }
}

然后将该 externalLinks() 函数添加到页面的 onLoad 事件中。如：

<body onload="externalLinks();">

<img> 标签必须添加 alt 属性

对于 <img> 标签来讲，alt 属性是必须的。给图片添加 alt，一方面当图片因为各种原因无法显示的时候，能给访问者以提示；另一方面也便于搜索引擎判断图片的内容，以及更准确的建立索引。

<img> 标签没有 border 属性

<img> 标签是没有 border 这个属性的。我们通常会加上 border="0"，主要是因为把图片放在链接标签 <a> 里时，浏览器会加上一个链接默认颜色的边框，而这通常是多余的。在 Strict 标准中，不能用 border 属性来去掉边框，而只能使用 CSS 控制。同样 align 属性也是不存在的，要实现 absmiddle 这样的目的，也只能用 CSS 代替。

<blockquote> 标签内必须使用 block 级别的标签

<blockquote> 标签用来在页面上表示引用的内容，例如，最常见的，引用代码。我通常习惯将代码的内容放在 <code> 标签中，而这个标签是 inline 级的，不符合 Strict DTD 的要求。<strong>、<b> 等同样会导致问题。符合要求的 block 级标签包括：<address>, <blockquote>, <del>, <div>, <dl>, <fieldset>, <form>, <h>, <h2>, <h4>, <h5>, <h6>, <hr>, <ins>, <noscript>, <ol>, <p>, <pre>, <script>, <table>, <ul>。

不能使用 <embed> 标签

这个问题最容易出现在引用外部媒体文件时，例如 MP3 音乐、视频等。很多资料推荐同时使用 <object> 和 <embed> 来增强媒体引用元素的浏览器兼容性，但是很不幸的，Strict DTD 并未定义 <embed>。其实我们完全可以不使用 <embed> 一样能够兼容浏览器。例如 Youtube 给的代码一般是这样的：

<object width="425" height="344">
  <param name="movie" 
         value="http://www.youtube.com/v/uhsjNTEJD3c"></param>
  <param name="allowFullScreen" value="true"></param>
  <embed src="http://www.youtube.com/v/uhsjNTEJD3c" 
         type="application/x-shockwave-flash" 
         allowfullscreen="true" 
         width="425" height="344"></embed>
</object>

这样无法通过校验。我们可以改成：

<object type="application/x-shockwave-flash"
        width="425" height="344">
  <param name="movie" 
         value="http://www.youtube.com/v/uhsjNTEJD3c"/>
  <param name="allowFullScreen" value="true"/>
</object>

实体用法问题

在 XML 中，实体的写法是 &entity;，以一个 & 符号开头，一个分号结束。因此，Strict 标准的 XHTML 里面不允许出现任何单独的 & 符号，即使是在 URL 中用来分隔查询参数。需要用到这个符号的时候，要用 & 来表示。通常一个实体用法的错误会同时导致 5 个校验时的错误，当解决以后，这 5 个错误会同时消失。由于 Blogger 在发布页面时 URL 直接使用了 & 符号，因此会直接导致 Strict 标准的 XHTML 校验失败。

重复的 id 值

对于 XHTML 标签来讲，id 属性的值必须唯一，如果一个文档中出项重复的 id 就会导致问题。出现这种问题，通常是把 id 属性放在了 Blogger 模板会循环输出的部分。

另外，Blogger 提供的模板中，backlinks 那一部分会导致 4 个不同类别的问题。凭心而论，Blogger 模板在 backlinks 这一块的代码实在写的很烂，用了三个不同的 js 文件，用 JavaScript 输出 CSS，不但使得不同模板之间难以更改这一部分显示的样式，也导致了很多 XHTML 的语法校验问题。例如 Blogger 自己的 Buzz，打开任一个文章的独立页面的源代码，Doctype 声明赫然是 XHTML 1.0 Strict，然而 backlink 那一块的代码不用校验也能看出漏洞百出。

Blogger 目前版本的网站出自著名设计师 Douglas Bowman 之手，其本人对 XHTML 以及 CSS 有着非常深刻的研究。在设计之初，Blogger 还没有 Backlinks 的功能，显然这个蹩脚的 Backlinks 是后来由其他人加上去的。不知道 Bowman 先生在看到这一幕后会做何感想。

Google 黑板报用的是同样的 backlink 代码，不过比 Buzz 知趣的是它的模板干脆去掉了 Doctype 声明。只不过作为 Google 旗下的网站，页面连 Doctype 声明都没有，也是一件汗颜的事情。

言归正传，以下列出 backlink 这部分代码导致的问题以及解决方法。

<div> 和 <dl> 之间的嵌套问题: 在 Blogger 给出的默认模板代码中，是用 <dl> 来实现反向链接列表的；可问题在于，他们将 <BlogItemBacklinks> 放在了 <dl> 之内，而在生成页面时，会将 <BlogItemBacklinks> 这一对模板标签替换成一对 <div> 标签，从而导致 <div> 被嵌套在 <dl> 内。在 Strict DTD 里，<dl> 标签内只允许出现 <dt> 和 <dd> 两个子标签。解决办法是把 <BlogItemBacklinks> 放到 <dl> 外面，当然这样虽然让 XHTML 语法通过校验，但实际的运行结果，会导致每个反向链接条目会占用一个 <dl> 块，而不是预期的放在循环的若干个 <dt> 和 <dd> 中。通过 CSS 可以解决条目之间间距的问题。如果要完美解决这个问题的话，就只有自己重写 Blogger 提供的 JavaScript 函数来改变这一行为了。
<script> 标签的 defer 属性: 在 Blogger 用模板生成页面时，除了将 <BlogItemBacklinks> 替换成一对 <div> 以外，还会在开标签的 <div> 之前加上一个 <script;> 用来引入相关的 JavaScript，同时给出了一个 defer="true" 属性，然而，根据 Strict DTD，defer 属性只能有一个值，只能是 defer="defer"。
<noscript> 内只能用 block 级别标签: 在生成以上 <script> 标签的同时，Blogger 给出了一个 <noscript>，用来当浏览器不支持脚本的时候显示一个 Blog Search 的链接。可是 <noscript> 标签内只能用 block 级别的标签，直接用 <a> 这样的 inline 标签是不行的。
模板占位符问题: 在模板中这段关于 backlink 的代码中，Blogger 用了一些模板标签作为占位符。通常模板标签会在生成具体网页时替换掉，但这里的占位符不会，它们要在实际生成 backlink 条目时被 JavaScript 程序换掉。但是在做 XHTML 语法校验时，这些占位符以 HTML 标签的形式存在于代码中，而又显然不属于 XHTML 定义的范围，从而导致校验失败。解决办法是将它们的尖括号转移，写成诸如 <$BlogBacklinkTitle$> 的形式，这样既能够被 JavaScript 成功识别，保证功能正常，又能通过 Strict 语法校验。要特别注意，其中 <$BlogBacklinkDeleteIcon$> 不要转义，这个模板标签是在页面生成时被替换的，而不是 JavaScript 的数据占位符。

最后，Google 黑板报最近也发布了一篇关于互联网标准性的文章，这篇文章也提供了很多关于改进网站 HTML 代码的参考信息。

Friday, October 17, 2008

Blogger 的相关文章和热门文章

看到很多别人的 Blog 在文章页面下方都有“相关文章”和“热门文章”的列表，无疑能够增加访问者继续阅读文章的兴趣。可是 Google 的 Blogger 没有这样的功能，于是自己想办法也添加了一个。

由于 Blogger 并没有提供相关的模板标签(Tags)来支持这样的功能，因此自己只好用 PHP 和 MySQL 建立了一个简单的数据维护和查询系统，然后用 AJAX 的方式在页面上显示出来。具体来讲有以下内容：

利用 Google Blogger 的 Feed 接口将文章的 ID、标题、标签、URL、发布及修改时间等内容用程序导入到数据库。
将 Google Analytics 的页面浏览数统计（统计报告 » 内容 » 最常见内容）数据导出成文本文件，再通过程序导入到数据库。
用 PHP 建立一个“相关文章”的查询接口。输入参数为文章的 ID，输出为指定数量的相关文章列表。具体算法上，先用 ID 查出基准文章的标签，然后在数据库中文章中比对标签匹配的数量，按照标签匹配数量从多到少找出相关的文章。
对于热门文章，有两种计算方法。一种是按有史以来所有文章的浏览量来排序，但是用这种方法得到的结果，基本上都是 2005 年很老的文章，而很多有意义的新文章却很难出现。于是我采用了另一种算法，即按照每日平均浏览量来排序，这样比较新的浏览量比较大的文章也能出现了。

修改好模板以后，将整个 Blog 重新发布，现在这些功能已经调试好并上线了。顺便抱怨一下，对于用 FTP 发布的 Blogger 来讲，帖子多了以后，整站重新发布，真是一个漫长的过程啊。

在修改模板的同时，也顺便改了一下首页上提示阅读全文的方式，将原来的“点击这里阅读全文”的文字链接改成了图标，希望这样看起来更醒目一些，在我另一个非技术的 Blog 上可以看到效果。

另外，最初做的模板的 PSD 文件找不到了，也忘了当时在标题部分用的哪种字体。这给后面添加新的标题带来很多麻烦。于是趁这次修改模板，一并将标题的图片都修改了。找了很多字体，也研究了很久，挑了 10 种非衬线(Sans Serif)字体出来，最后选中的竟然是 Windows XP 自带的 Lucida Sans Unicode。

Friday, October 10, 2008

MIDlet 在索爱手机上安装失败

最近在工作中，发现一部分索爱 (SonyEricsson) 手机，在安装 MIDlet 时发生“Downloading failed”错误。具体情况发生在手机通过 OTA 安装 MIDlet，Jar 文件下载完毕并开始安装后，系统询问是否允许应用程序自动启动，以及是否允许应用程序收发短信，接下来就出现“Downloading failed”。

在出现此问题时，使用的是 Orange France 的 SIM 卡，考虑到 GPRS 漫游可能会带来的问题，我们改用中国移动的 SIM 卡，则安装正常。看来和 SIM 卡有关系。但同时，在索爱手机上无法安装的 Orange France 的 SIM 卡，在其它一些索爱手机以及所有 NOKIA 手机上都能正确安装，所以并不是由 SIM 卡本身 GPRS 漫游引起的。

几个星期以来，一直被这个问题困扰，百思不得其解。今天修改一个关于 PushRegistry 的 bug，突然想起来可能和 PushRegistry 有关，又重新 Google 了一番，发现了索爱官方论坛上的这个帖子：

https://developer.sonyericsson.com/thread/17306

帖子的作者遇到和我们完全一致的问题，而最终的解决办法，由索爱的技术人员给出了答案。

这个无法安装的错误，确实和 PushRegistry 有关系。如果把 JAD 中“MIDlet-Push-*”的属性去掉，则可以正常安装。但导致出问题的最终原因，是手机短信选项设置中存在没有值得空选项，如“Service center”、“Message type”、“Validity period”。SIM 卡通常都会为这些选项自动设置，但如果某一个选项没有设置，成为空值，则会导致上述情况。

我仔细查看了我们有问题的手机，所有手机上的“Validity period”都为空。设置成“Network maximum”后，MIDlet 安装和 PushRegistry 注册就完全正常了。

另外，我们发现有问题的手机包括 K700、K500、W800、S700、K600 等，多为 JP-3、JP-5 平台的手机。

Thursday, October 09, 2008

用微软正黑代替新明细

之前说到过在 Windows XP 系统下使用 Vista 的新中文字体“微软雅黑”，而对应繁体中文，Vista 同样有一款字体——“微软正黑”。（点击这里下载）

繁体中文 Google 下使用“微软正黑”的截图

可能是由于繁体中文汉字笔划相对较多，这款“微软正黑”和雅黑比起来要淡一些。除此之外其它的使用方法都类似：需要打开 ClearType，粗细浅淡的使用习惯也可以通过 ClearType Tuner 的 Windows XP PowerToy 来调节。总体来说，和雅黑还是有着同样的水准，和以前的“新明细”体比起来，也更遵行当前平面设计审美需求的潮流吧。

另外，据说 Windows Vista 下日文和韩文也有类似的字体，有需要的朋友也可以找一下，同样可以用在 XP 下。

Thursday, October 02, 2008

宋体-PUA

最近发现系统里多了个新的字体——宋体-PUA，Google 了一番，才知道是随着 Windows XP SP3 更新新增的字体。

仔细研究了一下，和通常宋体最大的区别在于，这个“宋体-PUA”在西文部分（半角 ASC-II 字符）使用了和 Times New Roman 一样的字体，而不再是以往难看凌乱的样子。以下列出了四种字体的对照图：

可以看出，在将字体设置成“宋体-PUA”时，显示出来的效果和“Times New Roman”一致。“Times New Roman”是西文字体，显然不会带有汉字的字体，这是因为系统默认的汉字字体是“宋体”。

我以前有文章提到过以前的宋体自带西文字体很难看，字体比较小时，粗体的字母 M 会缩成一团，而大篇幅排版时，整个版面显得非常凌乱，因此我会在任何场合都避免使用宋体的默认西文字体。

而现在微软终于意识到了这个问题，将其默认字体换成了西文系统（至少是英文系统）中衬线字体的默认字体“Times New Roman”，和同是衬线字体的宋体搭配起来，可谓相得益彰。

第四行相信大家都不陌生了，是 Windows Vista 系统默认的“微软雅黑”字体（看另文介绍），与宋体不同的是，微软雅黑是黑体的一种，属于非衬线字体。

通常来讲，大篇幅的正文部分排版应该用衬线字体，如宋体，Times New Roman 等，然而中文较英文来说笔划较多，在字体比较小的时候，显示起来有很大的困难，如果再加上衬线部分，可能会更难。而非衬线的字体在这种情况下，反而显得清晰整洁，可能这也是为什么在追求界面视觉效果的今天，微软的 Vista 和 Macs 系统都选择的黑体的原因吧。

Sunday, September 28, 2008

让 Google Blog Search 收录文章

Google 除了网页搜索外，还有个专门搜索博客文章的引擎，叫做 Blogsearch。基于 Google Blogger 构建的博客里面，反向链接的数据就来源于此。每次打开 Blogger 文章页面，实际上都会通过 JavaScript 作一次 Blogsearch 搜索，并把返回结果作为反向链接显示。

你可能觉得既然 Google 网页搜索都收录了，那同是一家的 Blogsearch 一定也收录了。事实并非如此。

通过 Google 的 Webmaster 管理工具向 Google 提交自己的 Sitemap，有利于让 Google 在第一时间收录网站更新的页面，但是，这仅限于网页搜索。

最近发现 Blogsearch 似乎没有收录我的文章，仔细查看发现居然已经有两个月之久了，而这些文章通常在发布后快则数小时慢则最多一天内就被网页搜索收录，很是诧异。Google 了一把，找到这篇文章分析原因，说是因为 Blogsearch 和 Feedsky 的自定义域名不兼容有关。

我确实是在 FeedBurner 被封后改在页面上使用 Feedsky 的服务，但对于 Google 的 Blogsearch，向来是由 FeedBurner 自动去 Ping 的，就算 FeedBurner 被封但这个机制应该是仍然在工作的。而且要出问题早该出了，也不至于是在最近这两个月发生吧。百思不得其解，打开 FeedBurner 仔细查看了一下设置，发现设置中“Publicize » PingShot » Google Blog Search Pinging Service”前面的复选框没有勾上！难怪 Blogsearch 不收录文章了，都没人通知它了啊…… 至于为什么 FeedBurner 上这个选项是关闭就不得而知了。如果你也使用 FeedBurner 的服务，也发现 Blogsearch 收录有问题，那么最好也去检查一下。

把这个选项打开后，为了以防万一，又到 Blogsearch 的网址提交页面重新提交了一下网站的 feed 地址。大约过了一小时后，最近两个月没有被收录的文章就立即能够被搜索到了。注意这是一次性的通知服务，如果没有自动 Ping 的机制，则每次网站更新后都要手动执行这个操作。

如果使用其它支持自动 Ping 的 BSP 的话，可以添加 Blogsearch 的 Ping 服务 API 地址：

http://blogsearch.google.com/ping/RPC2

如使用 WordPress 的话，在 Update Services 里面添加这个地址就可以了。更多详细内容可以参考 Blogsearch 的常见问题和 API 接口文档。

Updated on 2008/10/29:

实践证明，使用 Google Blog Search 对 Google 文章的收录是有显著成效的。如下图，在文章发布后，立即 Ping 了 Google Blog Search，不多久就被收录；9 分钟后，Google 的网页搜索便也收录了这篇文章。

Wednesday, September 24, 2008

Google 手机地图 2.2.0 版

Google 黑板报消息称 Google 的手机地图升级到了 2.2 版本，和之前的版本相比，多了“我的位置”、“行车路线”和“公交换乘”功能。

这些功能在以往的 Google 地图英文版是有的，只是先前的英文版本中没有国内的地图信息，于是就造成了中文版有地图不能使用 GPS 辅助，英文版有 GPS 辅助没有国内地图数据的尴尬境地。

我使用的是 Symbian S60 v3 的版本。这次升级时，手机上中英文版本显示的版本号都是 2.02(0)。简单的试用了一下，在没有 GPS 功能的情况下，也能通过 GPRS 基站数据获得大概的当前位置，只不过精度范围 2500 米至 5000 米，似乎实用性并不大。行车路线和公交换乘倒是比较方便，只是后者的公交数据仍然相对滞后。例如搜索从“成都市游乐园”到“成都市九眼桥”，会显示出 60 路，而这条线路已经在几个月前就取消了。

比较奇怪的是，在仅安装 2.2 中文版的情况下，程序中并没有找到“GPS 辅助”的选项，而 2.2 的英文版中却有“Use GPS”的选项。匪夷所思的是，英文版安装好后，中文版的“GPS 辅助”选项又神秘的出现了。在 Nokia N95 8G（自带 GPS）和 Nokia N73（蓝牙连接外置 GPS）上测试，情况一样。

另外，在英文版中，国内的行车路线和公交换乘功能似乎不可用。所以，看来比较理想的解决办法，就是同时安装中文版和英文版，这样才能在中文版中使用所有的功能……

最后，SISX 文件的下载地址：中文版、英文版。

Tuesday, September 23, 2008

MIDlet 在 NOKIA 手机上安装失败

这两天发现一个奇怪的问题，就是 MIDlet 在 NOKIA 6680 上无法安装。在 Jar 下载完成后，会显示“Unable to install. Not enough memory!”而安装之前手机刚刚执行过出厂复位操作，机身空余存储空间约 7MB，因此，安装失败不可能是装不下 MIDlet 的内容而导致的。

经过反复研究，终于发现问题出在 Jad 文件属性 MIDlet-Data-Size 上。这个属性是 MIDlet 用来告诉手机，该应用程序将需要多少 RMS 存储空间。由于 NOKIA 6680 的 RMS 容量，实测有 7128 KB，和机身的空余存储空间相等，也就是说理论上手机能装多少，MIDlet 的 RMS 就能装多少，因此应用程序的 Jad 里头，MIDlet-Data-Size 设置的值是 133072，也就是 128KB。

经过反复修改 Jad 文件里 MIDlet-Data-Size 的值，发现允许的最大值为 65536，也就是 64KB。任何超过这个值的应用程序，在安装时手机都会拒绝。

同样的问题在 NOKIA 6131 上也同样存在。如果有其它手机也有类似问题，以后会随时更新。

Friday, September 05, 2008

测试手机的 User-Agent

由于最近工作中需要得到一些手机的 User-Agent 以及 X-Wap-Profile 两个 HTTP 头的值，于是写了个简单的 PHP 程序，检测 HTTP 头，输出到 Response，然后放到网站上，让手机用 WAP 浏览器打开查看。

开始这个程序只是简单的输出纯文本，结果是 NOKIA、Sony Ericsson 以及 Samsung 手机都能正确读出，而 Motorola 却不行（实际测试过程中用的是 Motorola RAZR V3i），仅显示白页。

后来把程序改成输出标准 WML 页面，HTTP 头的 Content-Type 设置成 application/vnd.wap.xhtml+xml，NOKIA、Sony Ericsson 以及 Samsung 仍然能够正确显示而 Motorola 还是不合作。

最后找到答案，Content-Type 要设置成“text/vnd.wap.wml”，这下 Motorola 终于老实了…… 可是结果中只有 User-Agent，没有 X-Wap-Profile。

另外，在用中国移动的 SIM 卡测试的时候，发现 HTTP 请求中并没有 User-Agent 和 X-Wap-Profile 这两个头，而有个奇怪的

VIA: HTTP/1.1 SCCD-PS-WAP-GW02 (infoX-WISG, Huawei Technologies)

开始以为是手机的问题，但看到“Huawei”字样，觉得很蹊跷，后来换成 Orange France 的 SIM 卡，则一切正常了。

看来拦截 HTTP 请求是中国运营商的“优良传统”啊！

Update 2009/08/03:

最近发现中国移动这个问题只存在于 cmwap，用 cmnet 则正常。

Wednesday, September 03, 2008

试用 Google Chrome 浏览器

Google 昨天发布了一款开源的浏览器，已经可以下载。目前还只有 Windows 的版本，据说以后还会推出 Linux 和 Mac 的版本。

和目前主流的 Internet Explorer 和 FireFox 比起来，Chrome 的特点就是简洁轻便，Installer 的大小约为 22.8M，和通常的 Windows 应用程序相比，Chrome 窗口没有标题栏和菜单栏，也没有状态栏，界面上除了标签栏、按钮/地址栏和书签栏三行以外，剩下的空间全部留给打开的网页。在地址栏后面有连个按钮，分别是针对当前页面的操作菜单和浏览器的设置菜单，因此操作起来也比较简单，这算是秉承了 Google 一贯的风格。值得一提的是，在地址栏中，URL 的域名以外的部分会显示成灰色，而域名是黑色，这样使得域名看起来更加突出。

虽然界面简洁，操作简单，但功能上该有的也一点都不含糊。支持多页面浏览、内置多款搜索引擎、支持字体缩放。可以从 Internet Explorer 或者 FireFox 导入书签、搜索引擎设置、已经保存的密码以及浏览历史记录。另外，还有下载管理、密码保存、界面默认字体和编码设置、代理服务器、内容和弹出窗口过滤、网络欺诈和恶意软件保护、SSL 证书管理等，可谓应有尽有。同时浏览器以及预置了包含简体中文和繁体中文在内的 42 种界面语言以及拼写检查。从安装目录的文件夹设置上看，应该也支持第三方插件和换肤功能，只是在浏览器界面上还没有体现出来。

对于网页开发人员来讲，Chrome 也体贴的预先内置了源代码查看器（带语法高亮）以及 DOM 查看器以及 JavaScript 调试功能。 IE 和 Firefox 则需要安装第三方插件实现这一功能。

经过测试发现 Chrome 在我机器上的 User Agent 值为：

Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/525.13 (KHTML, like Gecko) Chrome/0.2.149.27 Safari/525.13

用的可能是 Safari 内核。目前的版本为 0.2.149.27，还只是处在测试阶段，相信以后会更加完善。

Tuesday, September 02, 2008

修改 IE 默认 HTML 查看器

众所周知在 Internet Explorer 打开的网页中，点鼠标右键，选“查看源代码”，即可查看所打开的网页的HTML 源代码，但通常系统会用 Notepad 打开，如果要仔细查看源代码内容，Notepad 可能显得不那么方便。修改一下注册表键值，即可用自己顺手的文本编辑器打开。

[HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Internet Explorer\View Source Editor\Editor Name]

将 (default) 的值改成编辑器的路径即可，例如用 UltraeEdit，可以写：

"C:\Program Files\UltraEdit\uedit32.exe"

如果没有这个键，按照路径创建即可。

我一直用 EditPlus，要将 EditPlus 关联到 IE，可以直接在设置里打开这个选项。具体的：

Tools / Preference... / General / Use EditPlus in Internet Explorer 5

这个方法应该适用于 Windows 所有的版本，已知在 Windows 98 / Me / 2000 / XP 上有效。

Monday, September 01, 2008

用 Cobertura 测量测试覆盖率

单元测试相信大家都不陌生，测试先行编程（Test-First Programming）和测试驱动也不是什么新概念了。测试改进了代码质量，但这也只是针对实际测试到的那部分代码而言的。您需要有一个工具告诉您程序的哪些部分没有测试到，这样就可以针对这些部分编写测试代码并找出更多 bug。

现在，有 Cobertura （cobertura 在西班牙语是“覆盖”的意思）这个免费的 GPL 工具在 Java 领域来完成这个任务。Cobertura 通过在执行测试时，用额外的语句记录哪些行被测试到、哪些行没有被测试到，通过这种方式来度量字节码，以便对测试进行监视。然后它生成一个 HTML 或者 XML 格式的报告，指出代码中的哪些包、哪些类、哪些方法和哪些行没有测试到。可以针对这些特定的区域编写更多的测试代码，以发现所有隐藏的 bug。

先来看看生成报告的样子吧：

可以看到报告列出了每个包的行覆盖率、分支覆盖率以及复杂度。点击进去，可以看到针对这个包里头每个类的报告，进而每行代码的测试情况，以及被测试到的次数。这里是 Cobertura 官方网站上给出的一个报告的 Sample。

在使用上，Cobertura 支持命令行操作，也可以结合到 Ant 任务。当然首先要定义任务：

<property name="cobertura.dir" value="C:/javastuff/cobertura" />

<path id="cobertura.classpath">
    <fileset dir="${cobertura.dir}">
        <include name="cobertura.jar" />
        <include name="lib/**/*.jar" />
    </fileset>
</path>

<taskdef classpathref="cobertura.classpath" resource="tasks.properties" />

然后，就可以用 cobertura-instrument 任务来统计测试目标：

<delete file="cobertura.ser" />

<cobertura-instrument todir="${instrumented.dir}">
    <ignore regex="org.apache.log4j.*" />
    <fileset dir="${classes.dir}">
        <include name="**/*.class" />
        <exclude name="**/*Test.class" />
    </fileset>
    <fileset dir="${guiclasses.dir}">
        <include name="**/*.class" />
        <exclude name="**/*Test.class" />
    </fileset>
    <fileset dir="${jars.dir}">
        <include name="my-simple-plugin.jar" />
    </fileset>
</cobertura-instrument>

之后，运行 Junit 测试（重要的部分用蓝色标出）：

<junit fork="yes" dir="${basedir}" failureProperty="test.failed">
 <!--
                指定覆盖率统计的数据文件名，以下为默认值
 -->
 <sysproperty key="net.sourceforge.cobertura.datafile"
  file="${basedir}/cobertura.ser" />

 <!--
  注意 classpath 的顺序：被处理过的 class 路径在为处理的 
                  class 路径之前。这很重要！
 -->
 <classpath location="${instrumented.dir}" />
 <classpath location="${classes.dir}" />

 <!--
                被处理过的 class 会在 Cobertura 运行时引用 Cobertura 
                的类库，因此这些类也必须在我们的 classpath 中。
 -->
 <classpath refid="cobertura_classpath" />

 <formatter type="xml" />
 <test name="${testcase}" todir="${reports.xml.dir}" if="testcase" />
 <batchtest todir="${reports.xml.dir}" unless="testcase">
  <fileset dir="${src.dir}">
   <include name="**/*Test.java" />
  </fileset>
 </batchtest>
</junit>

最后，我们可以用 cobertura-report 任务来输出 HTML 格式或者 XML 格式的报告：

<cobertura-report format="html" destdir="${coveragereport.dir}" srcdir="${src.dir}" />

也可以有更复杂的要求：

<cobertura-report format="html" destdir="${coveragereport.dir}" >
    <fileset dir="${src.dir}">
        <include name="**/*.java" />
        <exclude name="**/*Stub.java" />
    </fileset>
    <fileset dir="${guisrc.dir}">
        <include name="**/*.java" />
        <exclude name="**/*RB.java" />
    </fileset>
</cobertura-report>

另外，还可以用 cobertura-check 任务来检查统计出来的覆盖率是否达到预先的期望，如果没有达到则使得整个 Ant 任务失败；以及 cobertura-merge 任务用来合并多个测试的统计数据文件。

要特别注意的是，在这个 Ant 任务中，一定要保证数据文件 cobertura.ser 每次都被更新，并且在 instrument 的任务和后面做 Junit 的过程中，两者的路径一致，否则可能导致在输出的报告中，所有的测试结果都是 100% 或者 0%。

参考资料

Thursday, August 28, 2008

Blogger Feed 地址被封？

之前用 Blogger Feed 的 JSON 回调功能实现了侧边栏的“最近评论列表”，后来在把页内评论表单改成 AJAX 方式的时候，也顺便把文章下方的评论改用 AJAX 异步获取了，这样在提交评论后可以立即显示出来，而不用等待 Blogger 通过 FTP 发布重建页面。

可是最近一段时间，发现这两处的评论列表都出现了问题，显示时好时坏，到后来就直接停止工作了（一直显示 Loading Comments...）。而且，在访问了我的 blog 地址的一段时间内，无法打开 www.blogger.com 域名下任何页面。但是如果使用代理，则以上问题都不存在。所以我想大概是 Blogger 的 Feed 地址被封了。

Google 了很久也没看到有类似的案例，因为作为 Blogger 的用户，BlogSpot 和自定义域名的 blog 上，feed 是可以正常访问的。但是对于本站这种 FTP 发布的来说，就只能依赖 http://www.blogger.com/feeds/... 这个地址了。估计是国内用 Blogger FTP 发布的 Blog 并不多，也很少有依赖 feed 地址来实现功能的，所以也就没太关注这个问题吧。通过 Google 找到另一个用 Blogger FTP 发布的例子，mixfog，细研究下发现博主完全摒弃了 Blogger 的评论系统，自己实现了一套评论，可以自动获取并显示评论者留下的 URL 的 favicon，还可以回复评论，真是有心啊……

为了解决这个问题，我寻思了好久都没有找到办法。因为打开评论的 feed 地址是在 JavaScript 调用的，因此要求所有的访问者都能访问这个地址才行。我试过写一个中转的 PHP 程序在服务器上来获取内容再直接返回，可在服务器上实验时直接返回了 404，看来在国内是没办法访问到的了。

今天突然想起来如果能够在国外的网站上做这样一个中转，就可以解决了，于是问了下朋友 liuming，把中转的 PHP 页面放到他的 DreamHost 主机上，于是问题就解决了…… 在此深表谢意！郁闷了好久的问题终于解决了。

顺便说句题外话，DreamHost 上 500G 空间、可开无数独立站、每月流量限制 5T 的虚拟空间，一年才 119 美元，看样子比我在国内租的合租服务器划算多了啊…… -_-bb

Saturday, May 31, 2008

Google 的新 Favicon

刚刚发现，Google 似乎更换了网站的 favicon：

和以前旧的纯色边框比起来，现在的浅色渐变和四周的圆角显得更时尚！如果你看到的还是旧的图标，可能是因为缓存的原因。打开 http://www.google.com/favicon.ico 应该可以看到新的图标。另外，Gmail 和 Blogger 的图标还暂时没有发现有变化。

Thursday, May 29, 2008

用 AJAX 实现 Blogger 页内评论

之前服务器上有 Java 环境时，一直用一个自己写的 Servlet 作为中间代理来向 Blogger 的评论页面 POST 表单数据，实现页面内的评论操作，后来转挂在朋友的 IIS 服务器下，由于对 ASP 不熟，这一功能就一度取消了。现在购买了新的 Linux PHP 服务器，因此用 PHP 重新写了一个同样功能的中间代理来实现这一功能，并且实现成了 AJAX 的模式。评论内容的读取也一样通过 Blogger Feed 的 JSON 模式读取，因此提交评论后可以立即显示出来，而不用再等待 Blogger 重新生成 HTML 页面并通过 FTP 上传这一漫长的过程。（虽然实际上后台它还是不可避免的执行了这个过程。）

经过多次测试，应该可以用了。关于 Spam 的问题，以前的验证码是直接读取的 Blogger 页面的 Captcha 图片，现在 Google 改变了表单结构以至于程序已经无法自动做这个动作。所以我取消了 Blogger 自己的 Captcha 验证，自己写了个简单的加减法验证，虽然仍然不能完全杜绝 Spam，但已经比几天前测试时裸奔的情况好多了。当时夸张到一个下午一张帖子被贴了 50 多条 Spam 评论。毕竟传说 Google 的 Captcha 也已经被破解了么，同样不能完全杜绝 Spam。 ;-)

另外，Backlink 不显示的问题也修正了。不过，经过前端时间页面恶意代码事件的影响，目前似乎已经没什么 Backlink 了…… :-(

Wednesday, May 28, 2008

更换服务器

前段时间 blog 一直挂在朋友公司的服务器那里，不知道怎么可能中了病毒，会给网站内的网页和 JavaScript 脚本加尾巴以传播恶意软件，连 Google 也给这个域名下的搜索结果加上了“传播恶意软件”的警告信息。虽然一再通知朋友，但是似乎病毒很顽固，即使手工把“尾巴”去掉了，每次更新又会被加上。这段时间给大家造成了困扰，在这里表示诚挚的歉意。

在网上了解到现在有服务器合租这种服务器的租赁模式，5-30 人共享一台服务器，费用比自己租赁托管服务器要便宜很多，贷款和资源又比虚拟空间模式更能得到保障。有些比较好的合租服务商还有良好的服务器控制面板，可以自行控制域名绑定、FTP / 数据库帐号、网络邮局等，因此特地选了一个基于 Linux 的 64 位 PHP 服务器，并且已经开通了常用的 PHP 扩展库，6G 的空间，一共可以开 4 个独立的站点，非常的方便。关键是有专业的队伍维护，至少不会再有病毒干扰了。目前已经通过 Google 的 Webmaster 工具提交 Google 重新审核过，Google 已经去掉了“传播恶意软件”的警告，朋友们以后可以放心访问这个 blog。 ;-)

另外，目前自己只用得到 1-2 个独立站，还可以开 2 个，如果有朋友有需要用 PHP + MySQL 空间，可以联系我，大家充分利用资源！

Tuesday, January 22, 2008

微软将强制将浏览器升级到 IE7

在 Solidot 上看到，InfoWorld 的报道称，微软将在 2 月 12 日通 Windows Server Update Services 把所有 Windows 系统的浏览器强制升级到 IE7，不会像以前那样要经过用户的许可。微软给出的理由是“安全原因”。

Solidot 上还调侃说，对 WEB 开发者来说这是个好消息；对以前只支持 IE6 的网站来说，这是场灾难。

此话不假。以前做 WEB 界面，在所有为浏览器兼容性付出的工作中，50% 的时间花在让 IE 和 FireFox 兼容，另外 50% 的时间花在让 IE 的不同版本之间兼容。作为同一个公司推出的同一系列产品，对一种有标准的文档的理解会有如此大的差异，真的可以说是一件让人费解的事情。不过现在微软终于醒悟了，既然事实已经造成，那就让糟糕的过去都消失掉吧……