9/30/2006

国内EI核心杂志名单 截至2006.9.2(zz)

EI收录分为:核心(Compendex)和非核心(Page One)两种,虽然两者都有EI收录编号,
一般重点大学认为只有核心收录才算作EI收录,Page One不算数。另外,会议论文如果被
EI收录一般都进入Compendex数据库。具体内容和差别如下:

1. Compendex 数据和Page One 数据的主要区别在于:数据中是否有分类码(Ei classi
fication codes)和主题词(Ei main heading);有这两项内容的数据是Compendex 数据
,反之是 Page One 数据。


2 被EI核心收录的国内杂志如下:

ISSN 期 刊 名 相关链接
0567-7718 Acta Mechanica Sinica/Lixue Xuebao
1006-7191 Acta Metallurgica Sinica (English Letters)
0253-4827 Applied Mathematics and Mechanics (English Edition)
1004-5341 China Welding (English Edition)
1004-9541 Chinese Journal of Chemical Engineering
1022-4653 Chinese Journal of Electronics
1000-9345 Chinese Journal of Mechanical Engineering (English Edition)
1671-7694 Chinese Optics Letters 学报网站
1006-6748 High Technology Letters
1004-0579 Journal of Beijing Institute of Technology (English Edition) 北理工学
报编辑部
1005-9784 Journal of Central South University of Technology (English Edition)
1553-9105 Journal of Computational Information Systems Editor Information
1000-1484 Journal of Dong Hua University (English Edition)
1005-9113 Journal of Harbin Institute of Technology (New Series)
1001-6058 Journal of Hydrodynamics
1548-7741 Journal of Information and Computational Science Editor Information
1005-0302 Journal of Materials Science and Technology
1002-0721 Journal of Rare Earths
1003-7985 Journal of Southeast University (English Edition)
1004-4132 Journal of Systems Engineering and Electronics
1003-2169 Journal of Thermal Science
1005-8850 Journal of University of Science and Technology Beijing: Mineral Met
allurgy Materials (Eng Ed)
1009-3095 Journal of Zhejiang University: Science
1001-0521 Rare Metals
1006-9291 Science in China, Series B: Chemistry
1005-8885 The Journal of China Universities of Posts and Telecommunications
1003-6326 Transactions of Nonferrous Metals Society of China (English Edition)
1006-4982 Transactions of Tianjin University
1007-0214 Tsinghua Science and Technology Editor Information
0253-4177 半导体学报 学报编辑部
1001-1455 爆炸与冲击
0254-0037 北京工业大学学报
1001-5965 北京航空航天大学学报 北航学报编辑部
1001-053X 北京科技大学学报 北科大学学报编辑部
1001-0645 北京理工大学学报 北理工学报编辑部
1000-1522 北京林业大学学报
1007-5321 北京邮电大学学报 学报编辑部
1000-1093 兵工学报
1005-0299 材料科学与工艺
1009-6264 材料热处理学报
1005-3093 材料研究学报
1001-1595 测绘学报
1007-7294 船舶力学
1000-8608 大连理工大学学报
1000-2383 地球科学 - 中国地质大学学报 地球科学在线网站
1005-0388 电波科学学报
1000-6753 电工技术学报
1000-1026 电力系统自动化
1006-6047 电力自动化设备
0372-2112 电子学报
1009-5896 电子与信息学报
1005-3026 东北大学学报 (自然科学版)
1001-0505 东南大学学报 (自然科学版)
1000-3851 复合材料学报
1000-7555 高分子材料科学与工程
1003-9015 高校化学工程学报
1000-5773 高压物理学报
1000-4750 工程力学
1001-9731 功能材料
1000-3819 固体电子学研究与进展
1006-2793 固体火箭技术
1005-0086 光电子.激光
1004-924X 光学精密工程 学报网站
0253-2239 光学学报 学报网站
0454-5648 硅酸盐学报
1006-7043 哈尔滨工程大学学报 学报网站
0367-6234 哈尔滨工业大学学报
0253-360X 焊接学报
1005-5053 航空材料学报
1000-8055 航空动力学报
1000-6893 航空学报
0258-0926 核动力工程
1001-9014 红外与毫米波学报
1000-2472 湖南大学学报 (自然科学版)
1000-565X 华南理工大学学报(自然科学版)
1671-4512 华中科技大学学报(自然科学版)
0438-1157 化工学报
0577-6686 机械工程学报
1671-5497 吉林大学学报(工学版) 吉大学报编辑部
1006-5911 计算机集成制造系统
0254-4164 计算机学报
1000-1239 计算机研究与发展
1007-4708 计算力学学报
1001-246X 计算物理
1671-7775 江苏大学学报(自然科学版)
0412-1961 金属学报
0258-1825 空气动力学学报
1000-8152 控制理论与应用
1001-0920 控制与决策
1004-0595 摩擦学学报
1005-2615 南京航空航天大学学报
1005-1120 南京航天航空大学学报(英文版)
1005-9830 南京理工大学学报 (自然科学版)
1000-0925 内燃机工程
1000-0909 内燃机学报
1001-4322 强激光与粒子束 编辑部
1000-0054 清华大学学报 (自然科学版)
1006-8740 燃烧科学与技术
1000-9825 软件学报 软件学报编辑部
0254-0150 润滑与密封
1006-2467 上海交通大学学报
1007-1172 上海交通大学学报(英文版)
1000-2618 深圳大学学报(理工版)
1671-2021 沈阳建筑大学学报(自然科学版)
0371-0025 声学学报
0253-2697 石油学报
1001-8719 石油学报:石油加工
1009-3087 四川大学学报(工程科学版) 川大学报编辑部
0254-0096 太阳能学报 编辑部
0493-2137 天津大学学报 天大学报编辑部
1001-8360 铁道学报
1000-436X 通信学报
0253-374X 同济大学学报 (自然科学版)
1000-131X 土木工程学报
1001-4055 推进技术
1000-324X 无机材料学报
1001-2400 西安电子科技大学学报
0253-987X 西安交通大学学报
1000-2758 西北工业大学学报
0258-2724 西南交通大学学报 学报网站
1007-8827 新型 炭材料
1000-6915 岩石力学与工程学报 学报网站
1000-7598 岩土力学 岩土力学编辑部
1005-0930 应用基础与工程科学学报 学报网站
1000-1328 宇航学报
1000-6931 原子能科学技术
1008-973X 浙江大学学报 (工学版)
0253-9748 真空科学与技术学报
1004-4523 振动工程学报
1000-3835 振动与冲击
0258-8013 中国电机工程学报
1022-0666 中国航空太空学会 学刊
0258-7025 中国激光 学报网站
1000-1964 中国矿业大学学报
1006-1266 中国矿业大学学报(英文版)
1001-4632 中国铁道科学
1004-0609 中国有色金属学报
0254-508X 中国造纸
1672-7207 中南大学学报(自然科学版)
0529-6579 中山大学学报(自然科学版)
0254-4156 自动化学报 学报网站

3 被EI Page One收录的国内杂志如下:

1000-9116 Acta Seismologica Sinica English Edition
1561-8625 Asian Journal of Control
1005-9040 Chemical Research in Chinese Universities
0890-5487 China Ocean Engineering
1001-6279 International Journal of Sediment Research
0254-9409 Journal of Computational Mathematics
1007-6417 Journal of Shanghai University
1000-2413 Journal of Wuhan University of Technology -Materials Science Edition
0257-9731 Journal of the Chinese Society of Mechanical Engineers, Transactions
of the Chinese Institute of Eng
1001-8042 Nuclear Science and Techniques/Hewuli
1002-0071 Progress in Natural Science
1006-9283 Science in China (Series A: Mathematics)
1007-1202 Wuhan University Journal of Natural Sciences
1001-5868 半导体光电
1000-1506 北方交通大学学报
0479-8023 北京大学学报(自然科学版) 北大学报编辑部
1007-2640 北京化工大学学报 (自然科学版)
1001-4381 材料工程
1007-4112 长安大学学报
1004-499X 弹道学报
1001-0548 电子科技大学学报
1005-9490 电子器件
1000-6761 动力工程
1001-3784 粉末冶金技术
1000-3436 辐射研究与辐射工艺学报
1000-3231 感光科学与光化学
0449-749X 钢铁
0251-0790 高等学校化学学报
1003-6520 高电压技术
1002-0470 高技术通讯
0254-3052 高能物理与核物理
1001-1609 高压电器
0253-231X 工程热物理学报
1007-4252 功能材料与器件学报 学报编辑部
1003-501X 光电工程
1000-0593 光谱学与光谱分析
1002-1582 光学技术
1004-4213 光子学报 光子学报编辑部
1001-2486 国防科技大学学报
1009-606X 过程工程学报
1006-9941 含能材料 《含能材料》编辑部
1002-0837 航天医学与医学工程
0258-0934 核电子学与探测技术
0253-9950 核化学与放射化学
0253-3219 核技术
0254-6086 核聚变与等离子体物理
1002-1396 合成树脂及塑料
1672-9102 湖南科技大学学报
1006-5431 华北工学院学报
1006-3080 华东理工大学学报 (自然科学版)
1000-3932 化工自动化及仪表
1001-7631 化学反应工程与工艺
1005-9954 化学工程 化学工程编辑部
0250-3301 环境科学
1002-0446 机器人 学报网站
1001-9669 机械强度
1000-1158 计量学报
1003-9775 计算机辅助设计与图形学学报
1000-3428 计算机工程 学报网站
1007-9629 建筑材料学报
1000-6869 建筑结构学报
1006-852X 金刚石与磨料磨具工程
0254-6051 金属热处理 学报网站
1001-5493 离子交换与吸附
1008-0562 辽宁工程技术大学学报 (自然科学版)
0253-2417 林产化学与工业
1007-3124 流体力学实验与测量 编辑部邮箱
0253-9993 煤炭学报
1003-6059 模式识别与人工智能
1001-1935 耐火材料
1000-1972 南京邮电学院学报
1002-6819 农业工程学报
1000-1298 农业机械学报 学报编辑部
0253-2409 燃料化学学报
1001-2060 热能动力工程
1000-985X 人工晶体学报
1007-6735 上海理工大学学报
1000-5870 石油大学学报 (自然科学版)
1000-7210 石油地球物理勘探
1000-8144 石油化工
1006-396X 石油化工高等学校学报 学报网站
1000-0747 石油勘探与开发
1004-9037 数据采集与处理
1001-6791 水科学进展
0559-9350 水利学报 水利学报编辑部
1003-1243 水力发电学报
1007-2012 塑性工程学报
1001-2249 特种铸造及有色合金
1003-8213 微细加工技术
1671-8860 武汉大学学报(信息科学版)
1671-4431 武汉理工大学学报 学报编辑部
1006-2823 武汉理工大学学报 (交通科学与工程版)
1000-3290 物理学报
1006-7930 西安建筑科技大学学报
1001-5361 西安石油 大学学报(自然科学版)
1000-2634 西南石油学院学报 (自然科学版)
1002-185X 稀有金属材料与工程
1004-731X 系统仿真学报
1000-6788 系统工程理论与实践
1001-506X 系统工程与电子技术
0253-4320 现代化工 现代化工编辑部
1004-2474 压电与声光
1000-4548 岩土工程学报
1000-7571 冶金分析
0254-3087 仪器仪表学报
1000-4939 应用力学学报
1008-9209 浙江大学学报(农业与生命科学版)
1004-6801 振动测试与诊断
1001-7372 中国公路学报
1000-6923 中国环境科学
1004-132X 中国机械工程 机械工程杂志社
1000-6842 中国造纸学报
1006-7329 重庆建筑大学学报
1001-4977 铸造
1000-8365 铸造技术

blogger beta技巧两则

1. 隐藏导航栏

使用模版编辑器,添加一个HTML/JavaScript页面元素,内容如下(须将全角尖括号改为半角尖括号):
<style type="text/css">
#navbar-iframe {
height: 0px;
visibility: hidden;
display: none
}
</style>
隐藏后的缺点是,不能直接由blogger beta页面登录帐号。

2. 添加评论栏

仍然使用模版编辑器,添加一个Feed页面元素,地址如下:
http://beta.blogger.com/feeds/[blogID]/comments/full
其中,在blogger控制台里,鼠标滑至blog地址栏,右键可查询得到blogID。

此外,还有一个问题需要解决,如何在blogger beta上添加haloscan的trackback功能呢?

slashdot和digg对比(zz)

来自: http://www.e47.cn/forum_view.asp?forum_id=12&view_id=2428
作者: young@江津在线e47.cn

slashdotdigg都是科技类新闻社区,但事实上却代表着两种不同机制,或者说,两种不同文化的争鸣。具体而言,slashdot采用的是管理员驱动(moderator driven)的机制:用户提交新闻,管理员审阅后决定这些提交的新闻是否出现在slashdot的主页上;而digg采取的是用户驱动(user&nbspdriven)的机制,它设置了一个新闻源的缓冲,用户提交的新闻首先进入这个缓冲,如果认同这一新闻的读者足够(digg通过一种类似民主投票的方式来表示对新闻的支持和认可,这一过程叫做digg),就会从缓冲中脱颖而出,出现在digg页面上,否则就逐渐被挤出新闻源缓冲。说的直观一点,slashdot由管理员控制,而digg则将权力下放给用户。

这两种不同的新闻提交机制,衍生出不同的社区文化。由于用户的高度自主性,以及和blog、website的有效集成,digg对最新的网络资讯反应非常迅速,例如,某个新出现的网络服务开始发放邀请了,某个网络服务有了重要的更新,某种新产品登场了等等。任何人都可以将任何有趣的资讯提交到digg(资讯的输入),任何人都可以对这些资讯进行评论或投票(资讯的处理),任何人都可以将这些资讯通过digg发布到自己的blog或者website(资讯的输出)。由于大量用户通过digg的服务进行新闻资讯的输入、处理和输出,在短短几个月内,digg的用户和网页流量呈爆炸式增长,并逐渐压倒 slashdot。而随着digg的壮大,挑战slashdot的声音逐渐响起。

和digg不同,任何提交到slashdot的新闻都必须通过技术人员的审核,因此slashdot对新事物的反应比较滞后,而由于审核人员的观点和普通读者的观点可能有很大的差异,因此一些有趣的新闻可能会被过滤或忽略。两下一比较,看起来似乎digg更“进步”一些,但digg在带来用户自主性的同时,也出现了不少难以解决的问题,比如经常会有一些无聊的文章,或者重复的文章得到“认可”并出现在主页上,某些评论错误百出,甚至不少是技术方面的常识性错误,而这都是因为digg的门槛太低,以及用户群的知识层次有限所致。

相反,slashdot就很少出现类似的情况,原因在于其读者群整体素质非常高,其中大量充斥着geek和 hacker,以及一些专门在大学或其它学术单位做研究的教授及专业人士。尽管技术人员的审核有些缓慢,但却保证了新闻的质量,经过多年的沉淀, slashdot逐渐积累了一大批高品位的读者,这些是digg这个短期暴发户所不能具备的。

Linus Torvalds在评论slashdotter时说到:他们不管懂还是不懂,总能发表一些所谓的精辟言论。为了免遭slashdotter的敲打,他补充到,其实他自己也一直是slashdot的读者。

尽管这些不过是Linus的一些戏言,但却从另外一个角度反应了slashdot为什么吸引人。事实上,留言一直是slashdot的最大特点。 slashdotter们围绕着最新的互联网科技、开源社区、unix/linux的发展、版权的纷争等话题热烈讨论,其容纳的资讯远远超过了新闻主题本身,里面除了会出现一些和主题相关的重要补充和精彩发挥外,还不时地会出现一些给人启发的想法,让人获益匪浅。相比较而言,digg显得比较浅薄,除了一些可有可无的口水外,你实在很难从中找出有意义的言论,而且,由于digg的读者绝大部分都是windows用户,因此对unix/linux非常排斥,甚至一度出现过逐出linux新闻的言论,而这些都在一定程度上对digg产生不利的影响。

因此,尽管有不少狂热分子在吵着如何挑战 slashdot,但事实上digg很难在实质意义上撼动slashdot的地位,更确切一点说,digg今后的发展路线很难和slashdot产生交集,slashdot依旧走它自己的geek路线,而digg则会吸收越来越多的追求最新资讯的网民,并形成自己所特有的平民文化。

Digg vs. Slashdot: A Comparison(zz)

来自: http://www.blogcadre.com/blog/noogz/digg_vs_slashdot_a_comparison_2005_09_10_21_55_47

For some eight years, Slashdot has been the most well known provider of News for Nerds. I doubt that anyone would disagree with me if I said it wasn't well deserved. The editors of Slashdot know well their target audience, and (for some strange reason), they know which articles tend to fit into the site well and which ones don't. Digg (pushed heavily by Kevin Rose, formerly of TechTV), is a newcomer to the world, but has still managed to become a formidable force in terms of the number of visitors it is able to pull to the sites it promotes. I recall hearing on an episode of TWiT that Kevin hoped to outdo Slashdot at some point in time. So, it makes sense that they should be compared.

Let me begin by saying that I use both Digg and Slashdot on a regular basis. The news that each of them puts up tends to be very different, but still valuable. But neither of them can replace the other. Due to the editorial nature of the sites, Digg and Slashdot attract a very different nature of story. To demonstrate my claim, I will use my two previous blog posts to show off which articles tend to do better on which sites, and in doing so, I will determine the core differences in target audience of the two sites.

The first article I wrote, a quick rundown of the features in Deer Park (Firefox 1.5), became front page Digg material. The second article, an introduction to Competitive Programming got Slashdotted (but as of yet, not Dugg). Firstly, I believe that neither of them had a particularly good quality of writing, although they still got their points across well enough, so I will not seek to compare the two based on quality of writing (i.e. They will accept articles, provided they get their key points across).

For the purposes of this article, the comparison of the articles they will accept can be broken down into these categories:

  • Content
  • Possibility for Discussion
  • Content

    As I mentioned before, Slashdot and Digg are radically different in the way that they go about promoting stories: Slashdot being controlled by a handfull of editors, and Digg being controlled by the people browsing the site. This tends to match the audience of the respective sites - Slashdot attracts programmers and Linux Hackers, whereas Digg tends to attract the tech enthusiast and Blogger culture. The types of articles that get accepted tend to reflect the people who go on these sites.

    Digg generally prefers shorter, articles that are easy to digest, and the article needs to focus on things that fit into "mass market" computing. This is why the Firefox article did well in Digg - the content in it was concise, and focused on something that the "average" tech user would find interesting.

    Slashdot, on the other hand seems to prefer longer articles, and these articles have to fit the niche market that Slashdot holds: the Programmer/Linux Hacker group will generally look to articles that are more suited to the Open Source/Free Software mindset and/or Programming culture, and articles that look into experience in these areas are often the ones that are looked at more favourably.

    In conclusion, articles covering broader computing topics are better suited to Digg, but if your article falls into the Slashdot Niche, then submit there.

    Possibilty for Conversation

    A key thing that sets Slashdot and Digg apart is what happens to articles after they reach the front page of their respective sites. While both sites value the information that they put on their front page, Slashdot tends to value the discussion made by its members more than Digg. Whilst you may get quite a few comments to an article on Digg, generally, there is a lot less in the way of coherent conversation - the comments may just be a quick addition to the article being Dugg, but there is no interaction between the commentary.

    Slashdot, on the other hand, has a far more defined sense of community. This, once again is where the personal experience side of the stories you write comes into play. If a Slashdotter has some experience relating to the article that has been written, then there is more chance of him commenting on the article. It can be said that the discussion following an article on Slashdot can often be more important than the article itself - thus articles generally need to be open to commentary more than other articles covering the same subject matter. This is where the Competitive Programming article really succeeded. As an article, it was fairly imcomplete in terms of what it could have said, however, drawing on the experiences of the Slashdot community, it gathered the experiences of a wide-ranging community, and they all joined together to form a large discussion of the subject.

    In conclusion, for an article to succeed on Slashdot, it needs to suit discussion more than it does for Digg.

    Conclusion

    It really doesn't need to be said that Digg is first and foremost a news aggregator, and articles that succeed there only succeed because the material they cover is of interest to a broader audience - this is not anything against Digg - in fact, they herald it as one of their strong points. So do I. But because of this fact, they don't have as defined a sense of community as Slashdot does. Whilst Digg is a good place to put news articles, and even the occasional random blog post, the best place to put things that are of interest to Slashdot's audience is (amazingly) Slashdot.

    So, it is highly unlikely that
    Digg will ever replace Slashdot as the source of choice for those people who currently read Slashdot, but it will still remain a force for news in its current form.


    Digg.com:投票的动力因素分析(zz)

    来自: http://www.donews.com/Content/200608/4d3830b03f944a35919f69fc8b8bb6e1.shtm

    学子论文:Digg.com:投票的动力因素分析
    ――一个公共选择的视角

      中国人民大学 新闻学院 易正林

      摘要:一般而言,在公共事务领域,人们都存在“搭便车”的习惯心态,而对投票采取冷漠和理性的“无知”态度。但digg.com这个网站似乎打破了这样的特性,总有大量的用户进行投票。本文从唐斯的投票“收益-成本”模型入手,分析digg网站用户投票活动的背后驱动因素。认为它在总体范围内降低了成本,而由于投票效果的可叠加性和diggspy的直观性,投票的收益预期大大提高,而获利概率也得到了提升,由此,用户获得了投票的动力。当然,文章也从用户的团体策略方面分析了负向的制约因素。

      关键词:digg.com 公共选择理论 唐斯投票模型

      说到digg.com这个网站,很多人都会惊叹它的成长速度。2004年10月,digg开始设计、开发,创始人Kevin Rose。2004年10月,发布第一个测试版本。2004年的11月5日,正式发布。而11月17日,有关它的新闻就登上了老牌技术类新闻社区 slashdot的主页。2006年4月,Alexa数据显示Digg的流量已逼近并超过了同类网站Slashdot (详见文末图表),甚至有人就此预言slashdot将会逐渐走向没落。

      一个网站为什么能够这么迅速地窜红呢?作为新兴起的网站,Digg有一些自己鲜明的特点,我们先从它的特点进行分析。它的个性特征主要表现在以下几个方面:

      1、会员发布主题,由其它会员进行投票,得票多的可以进入主页,否则只能在队列中等待直至最后被淹没,但文章不会被删除。在Digg网站中,主页会显示部分文章,这些文章是获得了较多支持(对一主题的支持方式是为其投票,即“Digg”某个主题,网站把投票称为“Digg”,相反的过程时“bury story”,即埋葬主题)才能到主页的,而其他文章则在“队列”中,如果有足够多的支持,它的位置就会向前,否则也只能在大量的文章中被淹没。当然,以给文章即使被淹没了也不会被删除,它依旧可以被搜索到。

      一般认为digg的做法是一个用户驱动(user driven)的模式,而老牌的科技类新闻社区slashdot则被认为是管理员(moderator driven)驱动[1]。

      2、基于账户的管理。在digg中,投票并不完全是随意的,只有注册后的会员才可以投票,当然,这种注册并不完全是没有作用的,注册后,所有用户 digg的内容都会出现在自己的账户中,也就是说,digg过程也是一个收藏的过程。在整理收藏内容的过程中,可以结合社会书签进行分类,也可以便于他人进行检索。

      3、blog,rss,bookmarking三者结合。

      投票来决定首页内容并不是digg的创新(如大众点评网和imdb),但最彻底的投票决定选题的是digg,同时结合了社会书签、blog等功能的也是它。

      在digg中,用户完全可以通过一个主题找到所有digg或者dugg了这一主题的所有人,dugg是一个和digg相反的过程,即在digg一个主题后,如果觉得该主题没有意思或者没有作用,可以用dugg将其从自己的收藏中删除。同时,也可以找到所有把这一主题放到自己博客的所用用户。而从一个用户出发,也可以知道他digg或者dugg过的所有的主题。当然,任何用户也可以把某一个主题放到自己的博客或者发邮件给朋友。这样,就形成了主体和用户为中心的横纵社交网络,并且通过RSS互链,可以预社区外的博客以及其它网络形式形成更大范围的互链互通。

      从上面分析可以看出来,digg最大的特点在于它的投票机制。即使是他的社会书签、RSS等也是和投票紧密相关的,所以本文的目的就是分析为什么digg通过这样一种投票机制能吸引到那么多的访问者。先来看看digg投票的基本情况:

      首先,只有注册后的会员才享有投票资格,在投票方式上实行直接投票制,每个人所投的票都是等值的。因此,是一种多数同意规则:digg者越多,文章越有可能出现在网站首页,否则会停留在队列(queue)中。

      其次,在同一时间内,同一用户可以就多个主题进行投票,每一个主题都进行digg或者bury story的判断。

      第三,投票结果是被记录的,会直接形成个人收藏页面,并且这种收藏是开放的,其他网民可以随时通过用户名检索到他收藏(投票)的所有内容。

      第四,Diggspy实时直观地显示投票结果,在这个页面,用户可以动态地看到每一个主题在被别人投票时暂时蹦到最前面时的场景。

      最后,Digg某一主题后可以有一个相反的dugg过程,即如果认为该主题没有意义,可以用这个方式删掉它。

      公共选择理论[2]有这样的假设:“人都是自利的、理性的效用最大化者;……政治领域中,个人也同样扮演者经济人的角色,个人的行为和决策同样是在理性地进行成本分析和收益分析后,才作出的选择或决定,同样也是在追求某种最大化效应。[3]”既然个人是自利的,那么,个人投票行为也应该是在成本和效益分析后,自利和理性的投票者做出的决策。

      Digg网站是一个科技类新闻社区,因此,公共性非常强,而就公共性主题进行投票的时候,根据公共选择理论,积极性是不高的。有人称之为投票过程中的“无知”和“冷漠”现象[4]。在公共领域,任何一件物品和每个个体都相关,但相关并不明显,相关度也不同,因为多数决定原则下,一个人的投票是不会对自己有实质性的和即刻性的效果的,故投票积极性不高。而在公共物品的选择过程中,个人投票对于结果也可能没有明显的可以预期的后果,因此,投票者会采取冷漠的态度。由于成本付出后可能弄不清楚该选择哪个结果,也可能投票后得不到符合意愿的投票结果,从而,理性的投票者可能采取理性的“无知”策略,根本不去了解或者装作不了解而逃避责任。

      问题是,为什么digg的用户们没有采取“冷漠”和“无知”的策略呢?在成本和收益之间,是什么收益吸引了他们?

      在投票的成本和收益分析方面,美国学者唐斯提供了一个投票行为的函数模型[5]――R=BP-C+D 。在这个公式中,理性投票者的投票行为可以通过其投票预期收益和选民投票时的个人偏好两个方面来说明。其中:

      R=投票者行动(投票、搜集信息)R=0则表示投票者将弃权;如果R>0,则表示投票者将参与投票。而且对于候选人来说,谁出的R大,也即谁许诺的收益更大,并能为选民接受,一般选票就会流向他这一方。

      B=投票者行动的潜在收益

      P=投票者进行该项行动时这些收益产生的概率

      C=投票者行动的成本

      D=作为投票者行动补充的私人收益(投票获收集信息活动产生的额外收益,如与人接触、沟通的愉悦或其他心理上的收益等)

      一般而言,由于投票结果是公共物品,就会有人想尽可能不参与投票而享受收益,这种“搭便车”行为的结果是B与P处于反向变化之中,BP的乘积可能很小,这意味着投票参与带来的享受价值D和成本C支配着投票行为[6]。但在digg中的收益和成本分析结果会如何呢?即唐斯公式中的B、P、D、C各项如何呢?

      1)投票成本。digg的投票成本组成如下:注册/登陆成本;信息成本(了解网站和了解具体文章);机会成本;页面等待造成的时间成本等等。可以发现,这些成本在日常的网页浏览中都是很难避免的,也就是说,在成本上,digg的成本并没有特别高也没有特别地低。但它在成本的支付和计算上有一些很鲜明的特征:

      在首次使用上,digg的成本偏高,因为digg是一种全新的社区类型,很多人在初次接触是很难理解其运行原理和机制,因此需要一定的时间进行熟悉和了解。但是,如果熟悉了之后,和其他注册网站比,并没有更多的成本需要付出,尤其在采用了firefox插件以及熟练程度提高后,投票成本递减,可以说,成本和收益的比值随着参与程度的深化而缩小。

      收藏功能结合web2.0的标签功能,使得到投票后得到收藏的主题有更好的组织,整体上降低了成本。参与投票的过程其实就是一个自己选择自己喜欢内容进行收藏和分类的过程,因此,从总体上来说,成本在更大范围内被冲淡了,而收益则增加了,因为收藏网页和投票的活动二而一了。可以说,digg的经营过程中,已经突破了投票这一活动,而是把投票和其他网络活动连接起来

      在digg中,投票成本和正常的博客浏览等行为已经实现了无缝对接,除了上面所说的和收藏主题结合外,对积极分子而言,社交网络的留言功能和RSS等功能都让用户在更大的范围内支付成本,可以把主题链接到自己的博客,减轻自己博客写作成本,也通过digg最新的资讯增强博客的可看性,如国内比较出名的博客如“keso(洪波)的博客”、“幻灭的麦克风”[7]中有大量文章直接来自或受启发于digg,digg直到现在还是他们重要的信息来源;此外,同时可以通过主题寻找其他和自己兴趣相投的用户,比如可以寻找和自己digg内容相近的人作为好友等等。

      总之,成本的支付通过与其它网络活动的无缝连接而在更大范围内进行支付,针对digg的成本支付自然就小多了,比如,用户本来要收藏一个网页也需要成本,而digg本身就是收藏的过程,这样,两个成本就合一了,成本支付感自然也就变弱了。

      2)个人收益分析。Digg首先具备了普通媒体的效用,例如监测环境、提供娱乐等等;其次提供了一个社交环境,可以找到和自己去为相投的好友,好友可以根据主题的选择进行组合,而也可以通过好友对主题进行组合;第三,在digg过程中,通过投票和发布自己的主题,可以让自我品味与价值观经受大众的检验;第四,可以通过收藏存档材料;最后,对于网站、博客而言,可以通过它进行宣传,让很多的人在短期内了解到自己的网站并带来相当可观的流量[8]。等等。但 digg中投票活动的收益获取有自己的一些鲜明特点。

      digg的投票过程中自我体验更强些,和同类网站slashdot也有很大区别。 slashdot往往把社区讨论作为自身特点,而digg则尽管也具备社区性特征,而且社区功能也很强大,但更多是个人中心的,而不是公共论坛性质的社区,无论是交友的连接方式还是文章发布以及digg行为,都充分地体现了个人利益的选择,因此,个人收益占的比重比较大,从而也对公共事务投票行为的冷漠态度起了一定的制约作用。个人收益和公共的潜在收益重合后,促进了投票行为的发生机率。

      3)潜在收益*收益产生概率分析。潜在收益和个人收益最大区别在于潜在收益是一种公共收益,不具有排他性。它主要体现在作为信息发布公共平台这一功能上,能提供最新、最前沿的资讯。例如一个很有意义的主题被digg到了主页,投票者的贡献是不容置疑的,但其他所有人也能够同时看到。正因为公共产品的非排他性,参与这就有了“搭便车”的想法,同时由于多数决定的原则,潜在收益和收益发生概率的乘积往往很小,以致在很多人的分析过程中是忽略不记的[9]。但在digg中,潜在收益和收益发生概率的乘积似乎也不小:

      首先,单个投票者可以在短时期内就大量主题进行投票,由此个人收益可以进行叠加和放大。一般认为,在多数决定的投票行为中,投票者倾向于认定自己的投票对结果是没有明显效果的,从而对投票采取冷漠的态度。而在digg投票中,尽管但次投票都只是一个是否“digg”的判断,但由于可以多次投票,投票的挫败感会更微弱些,总有部分投票可以反映自己的偏好,因此,投票的获利概率在多次投票中得到了叠加,获利的预期也更大。

      其次,由于多次投票可以让个人偏好得到最大程度的实现,投票时面临的交错压力更小[10],所以,无形中也更容易提升对预期获利的期待。

      此外,由于diggspy的作用:直接、实时显示投票结果,可以同时增大投票者对收益发生概率的认识,同时,如前文所述,直观的、跳动的投票结果本身就显示了投票的暂时效用,尽管个人的投票未必能决定最终的走向。

      最后,digg.com作为信息发布平台,其潜在收益就是一般媒体的消息发布等功能,因此,潜在收益和个人收益之间重叠度较高,如传统媒体监测环境、传播知识的功能等等,其实也是个人的收益。二者重合后,冲淡了参与者搭便车的心理。同时,多次投票也可以冲淡潜在收益的遥远感或距离感。  

      总之,通过一些技术手段,digg.com实现了成本和预期收益比值的最小化。从而吸引了大量的投票者。此外,结合了主题收藏功能、会员制、web2.0的社会书签等功能,digg.com在更大范围内降低了投票成本,也提高了用户对网站的粘着力。

      当然,digg先行的投票机制也不是总是存在着正面的动力,负向的动力也是存在的,它们制约着用户的投票热情。

      负向动力主要体现在以下几个方面:

      1)团体策略:在digg的用户群中形成更小的团体,进行不正常的群体投票。如:4月19日,Forevergeek.com 的 Jacob Gower 发现,Digg 上两条新闻的最初投票人16人完全相同,也就是说,同一帮人对刚刚出现的两条新闻都投了票,这显然不是巧合。更奇怪的是,网站创始人Kevin Rose 也出现在其中。Jacob Gower 在他的博客中记录了这个发现,当有人把这个链接提交到 digg 时,总遭到拒收。Jacob Gower 本人在 Digg 上的帐号随即被封。这件事情在4月27日的 Guardian Unlimited 上得到了报道。这一事件出现后,一些用户就在这个帖子后面跟帖表示要退出digg [11]。

      2)选票交换:选票交换也属于团体策略之一。交换在有的时候对总体福利有增益,但本质上会腐败投票过程。因为交换过程可能为利益集团所控制,而且,即使是对总体有利,它对合作外的其它个体还是有损害的 [12]。

      3)作弊式的digg行为:从slashdot时代开始,只要一篇文章在主页上出现,文章所在网站的流量都能够在短期内飙升,前面已经提到过,往往可能因为一篇文章上了首页可能带来导致服务器瘫痪的流量。因此,处于推广网站的目的,作弊投票在所难免,而这也是digg的技术人员需要进行解决的问题。

      通过以上的分析,我们可以看出digg.com的成功在于以下投票方面的因素:投票成本的降低(实际的和感觉上的);大量投票对个人偏好的照顾;diggspy的实录式投票结果展示。当然,面临的反作弊、反垃圾、控制小团体行为等方面还有多困难。

      附录:

      digg在2006年赶超slashdot的材料,包括页面访问量、流量、访问人数三个项目。数据来自Alexa 。[13]

      注释:

      [1]Ithink’s blog就持这样的看法:“slashdot采用的是管理员驱动的机制:用户提交新闻,管理员审阅后决定这些提交的新闻是否出现在slashdot的主页上;而digg采取的是用户驱动的机制,它设置了一个新闻源的缓冲,用户提交的新闻首先进入这个缓冲,如果认同这一新闻的读者足够,就会从缓冲中脱颖而出,出现在digg页面上,否则就逐渐被挤出新闻源缓冲。说的直观一点, slashdot由管理员控制,而digg则将权力下放给用户。”详见http: //yackol.com/blog/2005/11/digg.html

      [2]布坎南认为“公共选择是政治上的观点,它从经济学家的工具和方法大量运用于集体或非市场决策而产生”(详见陈光金中译《同意的计算――立宪民主的逻辑基础》中国社会科学出版社,1999年 P16)。一般认为,公共选择包含两层含义:一是集体性。单个人自己的决策不在考虑范围之内,但凡是有人群的地方集体决策就不可避免,因而公共选择成为必需的;二是规则性。决策就是指定规则,在人与人之间存在偏好差异的情况下,必须决定规则以使人们的行为协调起来,因此,人们必须进行决策以选择那些能够反映和满足一般人偏好的规则。

      [3]杨先保《选民投票的政治心理分析》,《武汉理工大学学报》2006年第4期

      [4]高建富《公共选择中投票者“无知”和“冷漠”现象及其克服》,《三明高等专科学校学报》2001年第12期

      [5]丹尼斯·缪勒著,杨春学译《公共选择理论》,中国社会科学出版社1999年 P425

      [6]对于这一点,即“搭便车”的心态和行为,奥尔森“集体行动理论”有过非常经典的解释。详见赵鼎新《集体行动、搭便车理论与形式社会学方法》,《社会学研究》2006年第1期

      [7] 网站地址分别为 http://blog.donews.com/kesohttp://www.kenwong.cn/

      [8] 这一点在slashdot上也存在,曾有因文章出现在slashdot而服务器崩溃的情况,digg在11月17日上了slashdot就被视为成功的转折点之一。比较而言,digg可自行将文章作为主题粘贴,不需要管理员审核,但也能带来巨大的访问量。有人统计,有网站曾在一天内接受到digg带来的 38450 位独立访问者, 295388次页面查看和100万左右的点击。见http: //www.portableplaylist.com/blog/2006/04/surviving-digg-effect.html

      [9] 如林清伏、王伊景在《人大代表投票行为的制度经济学分析》一文中就指出二者可能朝相反方向发展,从而二者的乘积会非常小。见http: //www.npcnews.com.cn/gb/paper8/7/class000800001/hwz182283.htm。而这“意味着投票参与带来的享受价值D和成本C支配着投票行为。”

      [10] “交错压力”为人所熟知是从拉扎斯菲尔德的《人民的选择》开始的。指这样一种状况:“(1)选民具有众多角色,这些角色可能在一些问题上彼此互相冲突,(2)选民具有众多偏好,这些偏好通常不能通过仅仅选择可选择的方案之一而得到满足”,也被用来解释“为什么一些投票团体选举参与率较低”。详见拉斯?斯沃桑《关于影响和投票的交错压力架设》,载斯坦因?U?拉尔森主编 任晓中译《社会科学理论与方法》,上海人民出版社,2002年,P263-264

      [11]记录地址http://forevergeek.com/news/digg_corrupted_editors_playground_not_userdriven_website.php

      [12] 帕特里克·敦利威著 张庆东中译《民主、官僚制与公共选择――政治科学中的经济学阐释》,中国青年出版社,2004年,P42-50

      [13] Alexa 排名是目前常引用的用来评价某一网站访问量的一个指标。事实上,Alexa 排名是根据对用户下载并安装了 Alexa Tools Bar 嵌入到 IE 等浏览器,从而监控其访问的网站数据进行统计的,因此,其排名数据并不具有绝对的权威性。但由于其提供了包括综合排名、到访量排名、页面访问量排名等多个评价指标信息,且目前尚没有而且也很难有更科学、合理的评价参考,大多数人还是把它当作当前较为权威的网站访问量评价指标。

    9/29/2006

    CvtCNKI v2.0.1(B1) 更新

    对原先开发的这个文献管理软件的辅助软件进行了更新;进行了必要简化,适当增强了功能,欢迎使用。

    ■ 中国期刊网(http://www.cnki.net)改版后,热心网友为 EndNote 制作的 CNKI 过滤器(Filter)大都已失效。CvtCNKI 解决了这个问题。

    ■ CvtCNKI可将CNKI,万方,中国互动网等站点的检索输出转换为标准格式(EndNote与RiS两种格式),以导入到EndNote, Biblioscape, NoteExpress等文献管理软件中。

    ■ CvtCNKI 代替过滤器,更为简单易用;开放关键词配置,可自行扩展;开放源代码。

    ■ 本程序 0.* 系列为 console 版本,已停止开发;1+ 系列为 Windows 版本。

    ■ CvtCNKI 遵循 GNU 通用公共许可证(GPL) 开放源码,任何人均可自由使用。依照GPL对软件进行复制、修改和重新发布是允许的,但其作者(JiangZhanyong)不为衍生版本承担任何责任。

    2006.09.29 CvtCNKI v2.0.1(B1)发布:
    ◇ 修改程序框架,改成了基于对话框的程序。
    ◇ 改进关键词格式。
    ◇ 增加了文献格式类型。
    ◇ 增加了页码、注释、数据库等用户自定义项。
    ◇ 增加用户自定义输出文件夹功能。
    ◇ 增加文字编码格式,支持gb2312和utf-8两种编码的题录。
    ◇ 增加识别作者等项是否包含英文;若含有英文则不进行分词。
    ◇ 增加了预设的关键词格式,共包括中国期刊网(四种),万方硕博论文库,中国互动网,第二书店,方正图书,超星图书等。

    ★━━━━━━━━━━━━━━━━━━━━━━━━━━┓
    ┃ CvtCNKI v2.0.1(Beta1) ┃
    ┣━━━━━━━━━━━━━━━━━━━━━━━━━━┫
    ┃项目主页: http://gf.cs.hit.edu.cn/projects/cvtcnki/
    ┃下载地址: http://gf.cs.hit.edu.cn/frs/?group_id=38
    ┃网络支持: http://www.jiangzhanyong.com
    ┗━━━━━━━━━━━━━━━━━━━━━━━━━━┛

    9/28/2006

    字符,字节和编码(zz)

    出处: http://www.regexlab.com/zh/encoding.htm

    作者排版比较复杂,只留链接好了。

    程序员趣味读物:谈谈Unicode编码(zz)

    作者: fmddlmyy@csdn
    出处: http://www.pconline.com.cn/pcedu/empolder/gj/other/0505/616631.html

    这是一篇程序员写给程序员的趣味读物。所谓趣味是指可以比较轻松地了解一些原来不清楚的概念,增进知识,类似于打RPG游戏的升级。整理这篇文章的动机是两个问题:

    问题一:

    使用Windows记事本的“另存为”,可以在GBK、Unicode、Unicode big endian和UTF-8这几种编码方式间相互转换。同样是txt文件,Windows是怎样识别编码方式的呢?

    我很早前就发现Unicode、Unicode big endian和UTF-8编码的txt文件的开头会多出几个字节,分别是FF、FE(Unicode),FE、FF(Unicode big endian),EF、BB、BF(UTF-8)。但这些标记是基于什么标准呢?

    问题二:

    最近在网上看到一个ConvertUTF.c,实现了UTF-32、UTF-16和UTF-8这三种编码方式的相互转换。对于Unicode(UCS2)、GBK、UTF-8这些编码方式,我原来就了解。但这个程序让我有些糊涂,想不起来UTF-16和UCS2有什么关系。

    查了查相关资料,总算将这些问题弄清楚了,顺带也了解了一些Unicode的细节。写成一篇文章,送给有过类似疑问的朋友。本文在写作时尽量做到通俗易懂,但要求读者知道什么是字节,什么是十六进制。

    0、big endian和little endian

    big endian和little endian是CPU处理多字节数的不同方式。例如“汉”字的Unicode编码是6C49。那么写到文件里时,究竟是将6C写在前面,还是将49写在前面?如果将6C写在前面,就是big endian。还是将49写在前面,就是little endian。

    “endian”这个词出自《格列佛游记》。小人国的内战就源于吃鸡蛋时是究竟从大头(Big-Endian)敲开还是从小头(Little-Endian)敲开,由此曾发生过六次叛乱,其中一个皇帝送了命,另一个丢了王位。

    我们一般将endian翻译成“字节序”,将big endian和little endian称作“大尾”和“小尾”。

    1、字符编码、内码,顺带介绍汉字编码

    字符必须编码后才能被计算机处理。计算机使用的缺省编码方式就是计算机的内码。早期的计算机使用7位的ASCII编码,为了处理汉字,程序员设计了用于简体中文的GB2312和用于繁体中文的big5。

    GB2312(1980年)一共收录了7445个字符,包括6763个汉字和682个其它符号。汉字区的内码范围高字节从B0-F7,低字节从A1-FE,占用的码位是72*94=6768。其中有5个空位是D7FA-D7FE。

    GB2312支持的汉字太少。1995年的汉字扩展规范GBK1.0收录了21886个符号,它分为汉字区和图形符号区。汉字区包括21003个字符。2000年的GB18030是取代GBK1.0的正式国家标准。该标准收录了27484个汉字,同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字。现在的PC平台必须支持GB18030,对嵌入式产品暂不作要求。所以手机、MP3一般只支持GB2312。

    从ASCII、GB2312、GBK到GB18030,这些编码方法是向下兼容的,即同一个字符在这些方案中总是有相同的编码,后面的标准支持更多的字符。在这些编码中,英文和中文可以统一地处理。区分中文编码的方法是高字节的最高位不为0。按照程序员的称呼,GB2312、GBK到GB18030都属于双字节字符集 (DBCS)。

    有的中文Windows的缺省内码还是GBK,可以通过GB18030升级包升级到GB18030。不过GB18030相对GBK增加的字符,普通人是很难用到的,通常我们还是用GBK指代中文Windows内码。

    这里还有一些细节:

    GB2312的原文还是区位码,从区位码到内码,需要在高字节和低字节上分别加上A0。

    在DBCS中,GB内码的存储格式始终是big endian,即高位在前。

    GB2312的两个字节的最高位都是1。但符合这个条件的码位只有128*128=16384个。所以GBK和GB18030的低字节最高位都可能不是1。不过这不影响DBCS字符流的解析:在读取DBCS字符流时,只要遇到高位为1的字节,就可以将下两个字节作为一个双字节编码,而不用管低字节的高位是什么。

    2、Unicode、UCS和UTF

    前面提到从ASCII、GB2312、GBK到GB18030的编码方法是向下兼容的。而Unicode只与ASCII兼容(更准确地说,是与ISO-8859-1兼容),与GB码不兼容。例如“汉”字的Unicode编码是6C49,而GB码是BABA。

    Unicode也是一种字符编码方法,不过它是由国际组织设计,可以容纳全世界所有语言文字的编码方案。Unicode的学名是"Universal Multiple-Octet Coded Character Set",简称为UCS。UCS可以看作是"Unicode Character Set"的缩写。

    根据维基百科全书(http://zh.wikipedia.org/wiki/)的记载:历史上存在两个试图独立设计Unicode的组织,即国际标准化组织(ISO)和一个软件制造商的协会(unicode.org)。ISO开发了ISO 10646项目,Unicode协会开发了Unicode项目。

    在1991年前后,双方都认识到世界不需要两个不兼容的字符集。于是它们开始合并双方的工作成果,并为创立一个单一编码表而协同工作。从Unicode2.0开始,Unicode项目采用了与ISO 10646-1相同的字库和字码。

    目前两个项目仍都存在,并独立地公布各自的标准。Unicode协会现在的最新版本是2005年的Unicode 4.1.0。ISO的最新标准是10646-3:2003。

    UCS规定了怎么用多个字节表示各种文字。怎样传输这些编码,是由UTF(UCS Transformation Format)规范规定的,常见的UTF规范包括UTF-8、UTF-7、UTF-16。

    IETF的RFC2781和RFC3629以RFC的一贯风格,清晰、明快又不失严谨地描述了UTF-16和UTF-8的编码方法。我总是记不得IETF是Internet Engineering Task Force的缩写。但IETF负责维护的RFC是Internet上一切规范的基础。

    3、UCS-2、UCS-4、BMP

    UCS有两种格式:UCS-2和UCS-4。顾名思义,UCS-2就是用两个字节编码,UCS-4就是用4个字节(实际上只用了31位,最高位必须为0)编码。下面让我们做一些简单的数学游戏:

    UCS-2有2^16=65536个码位,UCS-4有2^31=2147483648个码位。

    UCS-4根据最高位为0的最高字节分成2^7=128个group。每个group再根据次高字节分为256个plane。每个plane根据第3个字节分为256行 (rows),每行包含256个cells。当然同一行的cells只是最后一个字节不同,其余都相同。

    group 0的plane 0被称作Basic Multilingual Plane, 即BMP。或者说UCS-4中,高两个字节为0的码位被称作BMP。

    将UCS-4的BMP去掉前面的两个零字节就得到了UCS-2。在UCS-2的两个字节前加上两个零字节,就得到了UCS-4的BMP。而目前的UCS-4规范中还没有任何字符被分配在BMP之外。

    4、UTF编码

    UTF-8就是以8位为单元对UCS进行编码。从UCS-2到UTF-8的编码方式如下:

    UCS-2编码(16进制) UTF-8 字节流(二进制)
    0000 - 007F 0xxxxxxx
    0080 - 07FF 110xxxxx 10xxxxxx
    0800 - FFFF 1110xxxx 10xxxxxx 10xxxxxx


    例如“汉”字的Unicode编码是6C49。6C49在0800- FFFF之间,所以肯定要用3字节模板了:1110xxxx 10xxxxxx 10xxxxxx。将6C49写成二进制是:0110 110001 001001, 用这个比特流依次代替模板中的x,得到:11100110 10110001 10001001,即E6 B1 89。

    读者可以用记事本测试一下我们的编码是否正确。

    UTF-16以16位为单元对UCS进行编码。对于小于0x10000的UCS码,UTF-16编码就等于UCS码对应的16位无符号整数。对于不小于0x10000的UCS码,定义了一个算法。不过由于实际使用的UCS2,或者UCS4的BMP必然小于0x10000,所以就目前而言,可以认为UTF-16和UCS-2基本相同。但UCS-2只是一个编码方案,UTF-16却要用于实际的传输,所以就不得不考虑字节序的问题。

    5、UTF的字节序和BOM

    UTF-8以字节为编码单元,没有字节序的问题。UTF-16以两个字节为编码单元,在解释一个UTF-16文本前,首先要弄清楚每个编码单元的字节序。例如收到一个“奎”的Unicode编码是594E,“乙”的Unicode编码是4E59。如果我们收到UTF-16字节流“594E”,那么这是“奎”还是“乙”?

    Unicode规范中推荐的标记字节顺序的方法是BOM。BOM不是“Bill Of Material”的BOM表,而是Byte Order Mark。BOM是一个有点小聪明的想法:

    在UCS编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符,它的编码是FEFF。而FFFE在UCS中是不存在的字符,所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前,先传输字符"ZERO WIDTH NO-BREAK SPACE"。

    这样如果接收者收到FEFF,就表明这个字节流是Big-Endian的;如果收到FFFE,就表明这个字节流是Little-Endian的。因此字符"ZERO WIDTH NO-BREAK SPACE"又被称作BOM。

    UTF-8不需要BOM来表明字节顺序,但可以用BOM来表明编码方式。字符"ZERO WIDTH NO-BREAK SPACE"的UTF-8编码是EF BB BF(读者可以用我们前面介绍的编码方法验证一下)。所以如果接收者收到以EF BB BF开头的字节流,就知道这是UTF-8编码了。

    Windows就是使用BOM来标记文本文件的编码方式的。

    6、进一步的参考资料

    本文主要参考的资料是 "Short overview of ISO-IEC 10646 and Unicode" (http://www.nada.kth.se/i18n/ucs/unicode-iso10646-oview.html)。

    我还找了两篇看上去不错的资料,不过因为我开始的疑问都找到了答案,所以就没有看:

    "Understanding Unicode A general introduction to the Unicode Standard" (http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&item_id=IWS-Chapter04a)
    "Character set encoding basics Understanding character set encodings and legacy encodings" (http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&item_id=IWS-Chapter03)

    我写过UTF-8、UCS-2、GBK相互转换的软件包,包括使用Windows API和不使用Windows API的版本。以后有时间的话,我会整理一下放到我的个人主页上(http://fmddlmyy.home4u.china.com)。

    我是想清楚所有问题后才开始写这篇文章的,原以为一会儿就能写好。没想到考虑措辞和查证细节花费了很长时间,竟然从下午1:30写到9:00。希望有读者能从中受益。

    9/26/2006

    SCI 和 JCR(zz)

    SCI(《科学引文索引》,英文全称为Science Citation Index)是美国科学情报研究所(Institute for Scientific Information,简称ISI,网址:http://www.isinet.com)出版的一部世界著名的期刊文献检索工具,其出版形式包括印刷版期刊和光盘版及联机数据库,现在还发行了互联网上Web版数据库。

    SCI收录全世界出版的数、理、化、农、林、医、生命科学、天文、地理、环境、材料、工程技术等自然科学各学科的核心期刊约3500种。ISI通过它严格的选刊标准和评估程序挑选刊源,而且每年略有增减,从而做到SCI收录的文献能全面覆盖全世界最重要和最有影响力的研究成果。

    ISI所谓最有影响力的研究成果,指的是报道这些成果的文献大量地被其它文献引用。为此,作为一部检索工具,SCI一反其它检索工具通过主题或分类途径检索文献的常规做法,而设置了独特的"引文索引"(CitationIndex)。

    即通过先期的文献被当前文献的引用,来说明文献之间的相关性及先前文献对当前文献的影响力。

    SCI以上做法上的特点,使得SCI不仅作为一部文献检索工具使用,而且成为科研评价和的一种依据。科研机构被SCI收录的论文总量,反映整个机构的科研、尤其是基础研究的水平;个人的论文被SCI收录的数量及被引用次数,反映他的研究能力与学术水平。

    此外,ISI每年还出版JCR(《期刊引用报告》,全称Journal Citation Reports)。JCR对包括SCI收录的3500种期刊在内的4700种期刊之间的引用和被引用数据进行统计、运算,并针对每种期刊定义了影响因子(Impact Factor)等指数加以报道。一种期刊的影响因子,指的是该刊前二年发表的文献在当前年的平均被引用次数。一种刊物的影响因子越高,也即其刊载的文献被引用率越高,一方面说明这些文献报道的研究成果影响力大,另一方面也反映该刊物的学术水平高。因此,JCR以其大量的期刊统计数据及计算的影响因子等指数,而成为一种期刊评价工具。图书馆可根据JCR提供的数据制定期刊引进政策;论文作者可根据期刊的影响因子排名决定投稿方向。

    9/25/2006

    the Mayfield Handbook of Technical and Scientific Writing

    科技文献写作指南,要是做成pdf文档就好了:

    http://www.imoat.net/handbook/toc.htm

    还包括英语非母语者常见的问题:

    http://www.imoat.net/handbook/esl-link.htm

    9/24/2006

    实用网络资源(整理)

    以下网络资源纯粹为个人方便,随意排列,并将持续增加。

    web 2.0相关

    slashdot站点 http://slashdot.org

    digg站点 http://digg.com

    haloscan站点 http://haloscan.com

    coComment站点 http://coComment.com

    Most Frequent Blogger Questions http://20stickyposts.blogspot.com

    在线资源

    实用在线程序列表: http://list.wappblog.com

    TVU在线电视(包含部分境外电视台): http://www.tvunetworks.com/index.htm

    Wikipedia中文站点(加密协议) https://secure.wikimedia.org/wikipedia/zh/wiki/%E9%A6%96%E9%A1%B5

    TiddlyWiki相关


    TiddlyWiki站点 http://www.tiddlywiki.com

    TiddlyWiki.org站点 http://www.tiddlywiki.org

    TiddlyWiki文档 http://doc.tiddlywiki.org

    Tiddlyspot站点 http://tiddlyspot.com

    TiddlyForge站点 http://www.tiddlyforge.net

    Tiddlytools站点 http://www.tiddlytools.com

    ZiddlyWiki站点 http://www.ziddlywiki.com

    zope站点 http://zope.org

    freezope站点 http://freezope.org

    中文Zope/plone用户组 http://czug.org

    PrinceTiddlyWiki站点 http://ptw.sourceforge.net/ptwe.html

    ccTiddly站点 http://cctiddly.sourceforge.net

    BidiXTW站点 http://tiddlywiki.bidix.info

    TiddlyWiki论坛 http://groups.google.com/group/TiddlyWiki

    TiddlyWiki开发论坛 http://groups.google.com/group/TiddlyWikiDev

    TiddlyWiki(繁体)中文论坛 http://groups.google.com/group/PrinceTiddlyWiki

    TiddlyWiki使用教学(繁体)中文版 http://web.nlhs.tyc.edu.tw/~lss/wiki/TiddlyWikiTutorialTW.html

    TiddlyWiki(简体中文)入门 http://jiangzhanyong.googlepages.com/tiddlywiki.html

    Wordpress相关

    Wordpress站点 http://wordpress.com/

    Wordpress.org站点 http://wordpress.org/

    Wordpress中文论坛 http://wordpress.org.cn/forums/index.php

    个人站点

    Bjarne Stroustrup站点 http://www.research.att.com/~bs/homepage.html

    Alexander A. Stepanov站点 http://www.stepanovpapers.com

    Charles Petzold站点 http://www.charlespetzold.com

    Herb Sutter站点 http://www.gotw.ca

    Herb Sutter中文博客 http://blog.csdn.net/hsutter

    Scott Meyers站点 http://www.aristeia.com

    Jeffrey Zeldman站点 http://www.zeldman.com

    Bruce Excel站点 http://mindview.net http://www.bruceexcel.com

    侯捷网站 http://www.jjhou.com

    孟岩博客 http://blog.csdn.net/myan

    lxpbuaa博客 http://blog.csdn.net/lxpbuaa

    Alex的博客 http://alexclark.itpub.net

    方舟博客 http://blog.csdn.net/kingofark

    fatalerror99博客 http://blog.csdn.net/fatalerror99

    C++技术站点

    C++ Source http://www.artima.com/cppsource

    技术站点


    CSDN.net http://www.csdn.net

    文献管理软件

    EndNote http://www.endnote.com

    ReferenceManager http://www.referencemanager.com

    Biblioscape http://www.Biblioscape.com

    NoteExpress http://www.scinote.com

    医学文献王 http://www.roboword.com.cn

    Jabref http://sourceforge.net/projects/jabref

    Bibus http://sourceforge.net/projects/bibus-biblio

    在线书店

    中国互动网 http://www.china-pub.com

    Google Adsense相关

    广告发布者 http://google.adsenser.org

    9/23/2006

    历史强文:请看苏修的一种新行业(zz)

    请看苏修的一种新行业

    阳戈
    (《红旗》一九七五年十一期)

    近年来,在苏修社会里,出现了一种新的行业。这种新行业,虽然没有被苏修叛徒集团列入他们“巨大成就”的栏目内,但倒真的搞得不坏,正在以很快的速度“发达”起来。这里,且举这种行业的几个小例子,使读者开开眼界。

    先看“私人授课”业。此业现在盛行苏联全国,据说是专门为中学生进入大学而设立的。私人授课每小时可得五至十个卢布,相当于普通工人一天半以上的工资。在莫斯科街头,“圆柱上”、“墙壁上”,“大门道里”,到处是这种花花绿绿的广告,简直让人眼花缭乱。

    再看“代人考试”业。据《莫斯科晚报》载,有一种“代人考试组织”,专门代人投考大专学校。这种组织业务繁忙,应接不暇。有一个成员上午到食品工业专门学校代人考试,下午又到纺织工业大学代考,第二天又到莫斯科大学代人投考经济系。考取后,每位收取代考费五百卢布。

    其次看“论文出售”业。《共青团真理报》载,罗斯托夫铁路运输工程学院里有一种“联合组织”,专门“帮人做毕业设计、学习论文、测验作业、实验室作业”。一份设计,售价九十卢布,有的一百五十卢布。

    再其次看“毕业证书制造”业。《消息报》介绍的一个“毕业证书制造所”,一张毕业证书售价一千卢布,两年中他们就销售了五十六张这样的毕业证书。

    若问这种行业为什么如此兴隆,那就要看看苏修的教育制度了。随着资本主义的全面复辟,苏修的教育,特别是高等教育,早已成为进入特权阶级的阶梯。苏修总头目勃列日涅夫说:“国家主要是从经过高等学校培养的专家中吸收从事经济工作、党的工作、国家工作、外交工作、军事工作和从事一切社会活动的干部。”许多材料证明,大学文凭是选拔干部的决定性标准。有此文凭,即使是个白痴,也能捞个一官半职;无此文凭,即使你是“共产主义劳动突击手”,“从战争年代起”就做某项工作,并且“有这方面的专业知识”,但最后是“被裁掉”!勃列日涅夫的话以及无数事实告诉人们:只要一进了高等学校,或者干脆只要设法捞到一张大学文凭,那就能够得到高官厚禄,就有飞黄腾达的时机。要是进不去呢,那就对不起,只能“永远”当一个被人看不起的“执行者”。许多人为了达到“高升”的目的,当然就只有八仙过海,各显神通。于是各种稀奇古怪的行业都应运而生了。

    可不能小看这种新行业。特权阶级要把自己的爵位和俸禄传给他们的子女,一个重要的办法就是通过教育一途。而这样做,没有上述行业的帮助,就有点儿难处。你说考试吧,“中学课程”并不完全包括大学“考试中应考的所有材料”,一般中学毕业生怎么去考?有了上述行业,苏联的资产阶级新贵们就不怕。他们有的是钱,可以雇请“家庭教师”,或使子女进各种学费昂贵的私人 “补习班”之类。这样把子女塞进高等学府以后,总算放心了吧?可是还不行,有些公子小姐们一向吃喝玩乐,谁愿去死啃书本?不能毕业怎么办?还得依靠上述行业。在“教育市场”上,只要不惜重金,什么毕业论文、毕业文凭,甚至“副博士”之类的头衔都可以买到。有了这些玩艺儿,就可以骑在劳动人民头上作威作福了。不难看出,苏修教育领域的新行业,完全是适应特权阶级对劳动人民实行资产阶级文化专制的需要而产生的。

    “有钱,就可以进入高等学校”,这是苏修一家不大不小的官方报纸吐出来的一句很难得的真话。当然,苏修统治者“标准的提法”可不是这样。因为这么说,他们那个冒牌的“社会主义” 不就露了底?你听,苏修《国民教育立法原则》说得多么堂皇:苏联全体公民不分财产和社会地位,“在受教育方面一律平等”。但事实呢?在苏修叛徒集团的统治下,劳动人民既没有那么多的钱去雇请“私人教师”,又没有那么高的地位来得到同僚们的“照顾”。他们的子女,无论在分数面前,还是在其他什么面前,怎么能同那些公子小姐们“一律平等”呢?且以他们自己对新西伯利亚所作的调查为例,那里有近百分之九十的农民子女被排斥在大学门外,而城市知识分子(不要忘记,其中也包括官僚)的子女却有近百分之九十都钻进了高等学校。按照苏修的“立法原则”,或者可以这样说吧,百分之九十和百分之九十还不是“一律平等”么?其实,什么抽象的“自由”、“平等”,从来就是资产阶级的谎言。列宁曾说过:“只要阶级还没有消灭,任何关于一般自由和平等的谈论都是欺骗自己,或者是欺骗工人,欺骗全体劳动者和受资本剥削的人,无论如何,也是维护资产阶级的利益。”列宁的话,这样无情地揭露了一切关于一般自由、平等言论的虚伪性。可是,以 “列宁主义者”自命的勃列日涅夫们,在明明不平等的事实面前,还在那儿高谈着“一律平等”之类的神话,这难道不正是为了欺骗苏联劳动人民吗!

    学校商业化,知识商品化,这完全是苏修全面复辟资本主义给教育带来的必然结果。苏修统治者通过校内教育和校外宣传,公然要青年人树立“合理的利己主义” 世界观,并且毫不隐讳地对他们说,“学习、掌握知识”是一本万利的买卖,“这是一个将能产生高额利钱的贮钱匣”。既然“知识”、“文凭”、“学衔”都可以用金钱买来,那么,这些东西一旦到手,当然就要立即投入“周转”,以谋取更大的利润。亏本的生意谁会去做?这种腐朽透顶的“教育”,是一个黑色染缸,别说特权阶级的子女,就是少数劳动人民的子女进校后,也必然要受到腐蚀和毒害。它只能培养那种以赚钱赢利为人生哲学的新资产阶级分子,即培养特权阶级的接班人。

    苏修教育领域这种新行业,闹得乌烟瘴气,引起了劳动人民的愤怒,于是苏修报纸也不得不说上几句对此表示不满的话。这当然只是装装样子、骗骗群众而已。他们心里明白,擦掉主人身上一点儿浮油,根本不可能触伤老爷们那肥胖的躯体。那些真正敢于揭露这种丑恶现象的社会根源的,不仅文章登不出,恐怕连作者都早已被关进了“疯人院”。而经过精心筛选后登出的那些不疼不痒、避而不谈问题实质的文章,简直无异于莫斯科街头的广告,对这种行业只能起到提倡、鼓励以至“介绍经验”的作用。很显然,要彻底解决这些问题,那就意味着推翻苏修现存的社会制度,这是苏修统治者连想都不敢想的。然而,统治者不敢想的,苏联人民却要想,并且终究有一天还要行动起来,再一次扫除这些秽物。

    美国学界的潜规则(zz)

    近年来,“潜规则”已经成了一个非常热门的词汇,官场有之,股市有之,娱乐圈有之。现在好了,在刚刚出来的一本小说《诺贝尔的囚徒》封面上,竟赫然标着“刻画中外皆然的学界潜规则”的字样。吃惊之下,赶紧买了一本。

    看了作者杰拉西教授的简介,才知此人非同凡响,因为他不但是学界中人,而且是位顶尖高手,有着“人工避孕药之父”的头衔,赢得过无数科学荣誉。由他来讲述学界的内幕,自然应该是栩栩如生、惟妙惟肖了。

    果不其然。请看书中描述的几条潜规则:

    潜规则之一:著名教授只管申请经费,几乎从不亲自动手做实验。

    书中写道,在当今科学界,实验室的规模急剧扩大。哈佛、麻省理工学院或伯克利的许多研究小组,其人员多达三十人以上。但是,就像金字塔一样,实验室中有着森严的等级,大多数人都在从事一些具体、琐碎的工作,他们“只是被当作有手的工具而已”。而实验室的领导——那些地位显赫的“超级明星”,其主要任务则是募集研究经费,以及在重大科学会议上报告他们的成果,“他们自己当然是不会亲自动手做实验的”。

    好一个“当然”!这明明白白地显示出,它就是一条不成文的规矩——潜规则。根据这条潜规则,作为一个刚入门的学生,你得先像奴隶一样听命于你的教授,甚至要“不分白天黑夜地工作,一个星期七天”,而所有的希望就是“多年媳妇熬成婆”,到时候你就同样可以享受“科学明星”的待遇了。事实上,大家都承认这条潜规则,所以书中的康托偶然亲自动动手,就赢得了其学生的无限敬仰:“像他这种地位的人谁还在做实验?”

    潜规则之二:教授要在学生完成的论文上署名,甚至被看作主要作者。

    在《诺贝尔的囚徒》中,一段关于这条潜规则的对话极为精彩。当正在攻读文学批评博士学位的莉亚对这条潜规则提出异议时,女化学教授阿德利提出了自己的反驳:“这个课题是我提出来的……我用我的研究经费提供了设备和学生的奖学金……向国家卫生研究院提出经费申请的报告是我写的……我们一起讨论工作进度……我建议采用某种技术……提醒她注意重要的参考资料……”所以,她的结论是:“一般认为,教授作为作者之一是很正当的事情。事实上,这个领域里的人都认为我是主要作者。”

    阿德利的话自有其一定的道理。不过,它也让我们看清了一个事实:在这些教授眼里,他们才是学术课题的真正完成者,而学生们只是“有手的工具”,在能够让学生们在论文上署名,已经是天大的恩赐了。所以,当小说的主人公之一斯塔福和他的导师一起联名在著名的《自然》杂志上发表论文时,他就十分满足于自己没有像大多数科学合作者那样被忽视,被列在所有称呼中最常见的“等等之中。“能够逃脱在参考书目中被列为‘无名氏’的遭遇,总归是件值得庆幸的事情。”

    潜规则之三:女性在学术界很难得到晋升。

    渴望成为母亲是每一个女性的天性。但在学术界,想把事业和母亲的身份结合在一起可是一道天大的难题。为了获得一个在学校里永久任职的终身教授资格,“在化学或者大多数实验科学里,在你当助理教授的六年时间里,你不可能既做一位母亲又获得终身职位”。在大学里,大多数手握职称评审大权的评审委员都是年纪很大的老头子,“虽然接受过关于禁止性别歧视的法制教育,却根本不了解实际情况”。这就难怪在美国主要的大学里面,没有一所大学的化学系主任是女的。虽然招进来的研究生几乎有四分之一是女性,但在一流大学里只有很少数女性获得化学方面的终身职位——“哈佛大学没有,普林斯顿大学没有,耶鲁大学没有,斯坦福大学有一位。”

    即使她们终于如愿以偿,成了终身教授,她们就真的会获得平等的对待吗?
    答案仍旧是否定的。以著名的华裔女物理学家吴健雄教授为例,她一生成就卓著,
    是美国国家科学院院士,还担任过美国物理学会第一任女性会长,却依然被视为
    异类。“他们平常称呼她‘吴夫人’而不是‘教授’,这难道不可笑吗?就好像
    她是个管家婆似的。”

    潜规则之四:如非迫不得已,千万不要在申请课题时把一切想法都说出来。

    众所周知,现在的科研需要花很多钱,于是,你一定得申请课题经费。可是你知道,这其中也有许多玄机吗?书中借主人公康托之口这样说道:“人们从事评审这种耗费时间的工作并不完全是出于崇高的责任心,是尽义务,或者说是某种善举。实际上,总有一些利己的成分在里面,其中最重要的是,可以最早接触到最新进展,获悉最新消息。你会忍不住记下你所看到的东西,然后,过了一段时间,比方说几个月甚至几个星期之后,你会忘记自己最初在哪里看到过它,渐渐地你认为它就是你自己的想法……”

    原来如此!作为一位有着六十年学术阅历的科学家,杰拉西自然对此深有体会:“那些行家不会把一切都说出来,他们在申请中主要谈论自己已经完成但尚未发表的东西。只有初次申请的人,他们以前没有获得过经费,只好把所有的牌都亮在桌面上。他们别无他法。这就是这个行业的规矩:那些已经……”

    “这个行业的规矩”,原来,这就是潜规则!可怜的新手,要是没人指点,
    他们还一直蒙在鼓里呢,只能乖乖地成为别人的猎物了。

    潜规则之五:为了发表论文,要设法恭维评审人。

    我们都知道,发表科学论文是很困难的事。在中国,一篇SCI 上的文章就能让你身价倍增。可是,论文评审者却大多是很挑剔的。为了使你的论文能够顺利发表,你就要设法使评审人符合自己的口味。那么,该怎么办呢?

    下面的方法就是一条黄金法则——“在你论文的参考书目里不断地引用另外一位科学家的作品”,因为这很可能会引导编辑挑选那个人作为一个特别合适的评审人。要是你还想更保险一点,那你就要再费一点工夫,“把那位潜在的评审人的著作归类为‘一流’、‘发人深省’,或干脆就说‘精辟’,他在评审你的稿件时心情就会比较舒畅”。因为,“好话人人爱听,恭维永远有用。”

    对于初露头角的学者,书中给出了谆谆教诲:“永远不要在书面反驳意见中侮辱评审人,无论他的评论多么愚蠢。”因为,这是一条潜规则!

    ……

    9/19/2006

    在EndNote与BibTeX之间转换(zz)

    作者: Rob MacLeod (macleod@cvrti.utah.edu)
    来自: http://www.cvrti.utah.edu/~macleod/litbase/endnote.html

    Using EndNote with LATEX/BibTEX

    Rob MacLeod (macleod@cvrti.utah.edu)


    * 1 EndNote to BibTEX
    o 1.1 Setting Key Names
    * 2 BibTEX to EndNote
    * 3 Using EndNote files directly with BibTEX
    * 4 Additional links
    * About this document ...

    EndNote is a nice program on PCs and Macs for managing a database of literature references. There are ways to move records in and out of EndNote so that we sane people who use LATEX and BibTEX can benefit from the user friendly entry of EndNote references. Here I describe what I have learned so far about this topic.

    A good place to look for more information is the EndNote web cite at www.endnote.com/ and for technical support and downloads at www.endnote.com/support/ensupport.asp.

    1 EndNote to BibTEX

    To extract EndNote references into a BibTEX format, you can simply create or use an existing output format from within EndNote and the result should be something BibTEX can handle. There is a section in the Support and Services section about downloading style files and here you can find a style file for BibTEX format called bibtex_export.ens. Note that this link from the EndNote web site actually goes to ftp://support.isiresearchsoft.com/pub/bibtex/ (thanks to Jak Carr for that tip). Insert this file into wherever you keep styles on your Mac/PC and then you can use this style to create an output file that BibTEX should read.

    The instructions for exporting the references are as follows:

    1. Select the library containing the references to be exported.
    2. Select the references you want to export, then choose Show Selected References from the References menu (if you want to export the entire contents of the library, choose Show All References from the References menu).
    3. If you want to change the order of the references, choose Sort References from the References menu.
    4. Select the desired bibliographic style. Select a style from the list of favorites on the toolbar, or use the Output Styles sub-menu from the Edit menu. For more information about selecting styles, see About Bibliographic Styles.
    5. From the File menu, choose Export.
    6. Select the file type for the exported file, choose text only.
    7. Provide a name for the export file, and select the desired drive and folder-EndNote appends .txt to any filename you provide.
    8. Choose Save.

    1.1 Setting Key Names

    These are not all steps needed to get a usable BibTEX file though. As it comes from EndNote, the file will not have any keys assigned so BibTEX will not know how to refer to any entry in the file. Of course, you can enter the keys manually and it will take some time. To automate the process, I have written an awk script that parses the file and generates keys, then writes out a new .bib file.

    This awk program assumes a structure for keys to references and bases the key on the first author's last name and the year of publication along with a set of initials that ensure a unique name, or at least a name that belongs to you. For more background on this standard key system look here

    The file that EndNote generates may also be in a format you do not wish to use. On the Mac/OSX, for example, the file comes out in DOS format and also has several strange characters at the start of the file. I usually have to clean with an editor like emacs and also convert the file to Unix format.

    If you decide to generate the keys automatically, here are the steps to getting and using the awk program I wrote:

    1. Download the awk file by right mouse clicking (control-click) on this link and save the file to your local machine.
    2. In line 6 of the file
    prefix = "ADM:"
    Replace ``ADM'' with whatever prefix is appropriate. Again, this is the prefix we use to make keys unique to a particular owner (and his/her BibTEX file).
    3. Then run the awk script on the bibliography file as follows:
    awk -f endnotebib.awk filename.txt > filename.bib
    4. The result will be a file called output.bib that will be in the same directory and have the proper BibTEX format. To be sure about its integrity, pass bibclean over it and clean up any remnant problems.

    2 BibTEX to EndNote

    We often want to share references with our unfortunate colleagues who have to use a Mac/PC based WYSIWYG text processing program (aka MS Word). To do this, there is a BibTEX style file that creates output that EndNote can import. The steps are as follows:

    1. Make sure you have a copy someplace where BibTEX can find it of the style file called refer.bst. You can download this from EndNote's ftp cite at ftp.endnote.com/pub/bibtex/. If you are on CVRTI machines, we have it already. On the SCI machines, you can find the file at ~macleod/tex/bibtex/refer.bst.
    2. Make up a LATEX file with citations for all the references you want to export. If you include the command nocite* in the document, it will actually extract every reference from your BibTEX file so this is an easy way to export an entire file.
    3. In the LATEX file, include the usual {\bibliographystyle} command, but as an argument, provide ``refer'', so the command looks like this

    \bibliographystyle{refer}

    4. Run LATEX on the file.
    5. Run BibTEX on the file.
    6. The result of these two steps will be a file with the extension .bbl that contains the desired bibliography records in a format that EndNote can import. It is the standard ASCII format for EndNote.
    7. Copy the file to your Mac/PC (use ftp or something that converts the file from Unix to Mac or PC format).
    8. Open EndNote and then select ``Import'' and the Import Option called ``Refer/BibIX'' and then EndNote should be able to import it into an existing or new endnote database file.

    Now to actually replace \cite commands with the required tags in EndNote, you will have to do some manual work. It should be possible to write an awk/perl script that will make a good attempt at guessing at tags, but this will probably not work completely as the EndNote tags seem to include things that only EndNote can know, such as the reference # of the entry in the EndNote database. At present then, you will have to manually hunt for references and replace them with the ones from the EndNote database. If you have used a sensible naming scheme for the keys in your BibTEX database (e.g., the one I made up!), then this will not be so bad. EndNote uses the first author's last name and the publication year as parts of the key so if that matches in some way the naming scheme in BibTEX, then searching is at least facilitated. When in doubt about a match, note that there is a field called ``Label'' in the EndNote database that should contain the key field from the original BibTEX entry.

    3 Using EndNote files directly with BibTEX

    There are some programs out there that will allow you to read EndNote files directly and use them with BibTEX. I have not tested any of them and so cannot say anything useful about them other than supply the pointer to the EndNote ftp site (ftp.endnote.com/pub/bibtex/). Have fun and let me know what you learn.

    4 Additional links

    * EndNote web site
    * SCI Institute BibTEX support
    * General BibTEX support
    * LaTeX support
    * Searching and managing literature

    About this document ...
    Using EndNote with LATEX/BibTEX

    This document was generated using the LaTeX2HTML translator Version 2002-2-1 (1.70)

    Copyright © 1993, 1994, 1995, 1996, Nikos Drakos, Computer Based Learning Unit, University of Leeds.
    Copyright © 1997, 1998, 1999, Ross Moore, Mathematics Department, Macquarie University, Sydney.

    The command line arguments were:
    latex2html -split 3 -no_white -link 3 -no_navigation -no_math -html_version 3.2,math -show_section_numbers -local_icons endnote

    The translation was initiated by Rob Macleod on 2005-07-08
    Rob Macleod 2005-07-08

    9/17/2006

    大量学术搜索汇总,值得推荐(zz)

    来自: http://www.sciei.com/seek/

    推荐搜索 Google学术搜索[814]

    Google 学术搜索提供可广泛搜索学术文献的简便方法。您可以从一个位置搜索众多学科和资料来源:来自学术著作出版商、专业性社团、预印本、各大学及其他学术组织的 经同行评论的文章、论文、图书、摘要和文章。Google 学术搜索可帮助您在整个学术领域中确定相关性最强的研究。

    普通搜索 百度文档搜索[455]
    百 度文档搜索帮助您轻松查找各类研究报告、论文、课件等各类型文件。很多有价值的资料,在互联网上并非是普通的网页,而是以Word、 PowerPoint、PDF等格式存在。百度支持对Office文档(包括Word、Excel、Powerpoint)、Adobe PDF文档、RTF文档进行了全文搜索。要搜索这类文档,很简单,在普通的查询词后面,加一个“filetype:”文档类型限定。 “Filetype:”后可以跟以下文件格式:DOC、XLS、PPT、PDF、RTF、ALL。其中,ALL表示搜索所有这些文件类型。例如,查找张五 常关于交易费用方面的经济学论文。“交易费用 张五常 filetype:doc”,点击结果标题,直接下载该文档,也可以点击标题后的“HTML版”快速查看该文档的网页格式内容。

    普通搜索 Google书籍搜索[392]
    “Search the full text of books to find ones that interest you and learn where to buy or borrow them.“

    普通搜索 ScienceDirect电子期刊数据库[281]
    ScienceDirect 公司是Elsevier公司的一员,提供1800多种来自Elsevier的杂志,通过ScienceDirect,用户可以浏览文献标题的众多学科领 域,其中包括:农业和生物学、艺术和人文学科、生物化学,遗传学和分子生物学、商业,管理和会计、化学工程学、化学、计算机科学、决策科学、地球和行星 学、经济学,经济计量学和金融、能源工程学、环境科学、免疫学和微生物学、材料科学、数学、医学和牙科学、神经学、看护和健康职业、药理学,毒物学和制药 学、物理学和天文学、心理学、社会科学、兽医学和兽医药学。

    普通搜索 中国科学文献服务系统[268]
    中 国科学文献数据库服务系统( Science China)是国家科学数字图书馆(China Science Digital Library,简称CSDL)资助的项目, 建设目标是建立中文科技期刊的基于 web的科技文献文摘、引文、联合目录馆藏的科技知识服务体系,面向广大机构和个人用户提供中文科技期刊文献资源的有效发现和评价服务。并结合对全文数据 库的开放链接,建立基于核心科技期刊的知识发现、评价和推介服务体系,同时无缝集成中国科技文献中心NSTL和国家科学数字图书馆(CSDL)的相关数据 库服务和馆际互借服务。

    普通搜索 NetLibrary电子图书搜索[228]
    NetLibrary 是世界上eBook的主要提供商之一,创建于1999年,90%是1990年后出版的,每月均增加2,000多种。覆盖学科:科学,技术,医学,生命科 学,计算机科学,经济,工商,文学,历史,艺术,社会与行为科学,哲学,教育学等。NetLibrary的eBook使用浏览器技术,可通过专线阅读,没 有时间和地点的限制,且不需增添任何软、硬件。同一时间一个图书馆或集团的eBook读者数不限,但一本书同时只能供一位读者阅读。因此,通常的作法是找 到所要的信息后打印出来,阅读打印件,不化太多的时间在计算机的屏幕上阅读。NetLibrary的eBook具有全检索功能,书中的每个词都可用来检 索,因此,读者可很快找到所需的信息。

    普通搜索 Google 论坛搜索[210]
    Google 网上论坛是一项免费的网上社区和论坛服务,能够提供 Web 上最全面的新闻组帖子存档(超过十亿条帖子)。当您搜索、浏览论坛并找到感兴趣的论坛时,您可能需要从数以百计的主题中进行选择。现在,您可以更方便地直 达所需的主题。通过浏览新帖子内容,您可以先阅读几个主题简例,然后再打开其中的一个,这样您就能更方便地浏览论坛,更快速地找到具体主题。

    普通搜索 读秀:图书搜索[175]
    可 以在读秀上搜索图书和文章,特别是图书。能够找到最新图书的介绍,已经有相关图书销售的网络书店。读秀为您提供免费试读,当您点击所搜书的封面图片或其他 与试读相关的链接,可以直接浏览图书的目录页、前言页、封面页、版权页、封底页,以及正文前17页内容;文章可以免费向后翻两页试读。

    普通搜索 scirus 科研搜索[173]
    Scirus is the most comprehensive science-specific search engine on the Internet. Driven by the latest search engine technology, Scirus searches over 250 million science-specific Web pages, enabling you to quickly:• Pinpoint scientific, scholarly, technical and medical data on the Web. • Find the latest reports, peer-reviewed articles, patents, pre prints and journals that other search

    普通搜索 Answers.com[美国各个大学信息速查网站][146]
    多 功能搜索。(1)输入任何大学的名称,就把这个大学的各项信息,包括学校历史,学院划分,甚至学校校徽,吉祥物都在一个网页内列出来了!PS:链接里面输 入“U Minnesota”作为演示!(2)输入我们国家领导人都有详细介绍。(3)还有movie, 动物介绍,电影明星,单词解释,发音,基本上能想要的都有了。(4)输入beijing,你都能看到北京的天气预报和时间。

    普通搜索 OJOSE scientific search[100]
    OJOSE (Online JOurnal Search Engine) is a free powerful scientific search engine enabling you to make search-queries in different databases by using only 1 search field. With OJOSE you can find, download or buy scientific publications (journals, articles, research reports, books, etc.) in up to 60 different databases.

    普通搜索 CiteSeer[97]
    CiteSeer is a scientific literature digital library and search engine that focuses primarily on the literature in computer and information science. CiteSeer aims to improve the dissemination and feedback of the scientific literature and to provide improvements in functionality, usability, availability, cost, comprehensiveness, efficiency, and timeliness in the access of scientific and scholarly kn

    普通搜索 OSTI:各学科英文全文文献搜索下载[86]
    在OSTI,你可以找到关于能源、科学和技术研发的一些有价值的信息。此网站收集了很多对科学家,学者和工程师有帮助的资料。

    普通搜索 CCTV 视频搜索[71]
    央视国际的视频搜索,针对视频进行搜索。[科研中国SciEI.com]

    推荐搜索 Cblinkx Video Search专业中文视频搜索引擎[46]
    在Cblinkx.tv 中,您会看到一些从未见过的功能,我们相信,在经过试用和熟悉后,您一定会感到惊喜和实用。我们将不断为你奉献更多具有创意的、实用的功能和服务。同时, 我们也会在推出新闻搜索、音频搜索、播客搜索和网页搜索后,推出更多内容的搜索服务和客户端软件服务。

    普通搜索 SciSeek:科学搜索引擎与目录[31]
    SciSeek专注于科学搜索引擎与目录,还包括一些科学杂志以及其他的工具等。

    普通搜索 Scopus:摘要和索引搜索[22]
    Scopus是最大的研究文献摘要和索引网络数据库。

    普通搜索 Medspace:医学搜索[18]
    The MEDSPACE project is aimed at medical professionals. The MEDSPACE project is developing research technology for semantic federation of community repositories and deploying that technology in a large-scale testbed for clinical medicine. The sources will be medical literature, both bibliographic abstracts and online full-text. The users will be practicing physicians and biomedical researchers at

    普通搜索 Search4science[15]
    The Norwegian company search4science is launching an intelligent database which is helping researchers from all over the world to express themselves correctly. In close collaboration with the founders, some 20 people from Cell Network, Oslo, have developed and designed a scientific reference work which grows more comprehensive as it is used.

    推荐搜索 酷讯:中国最大的生活信息搜索引擎[9]
    与 网页搜索引擎搜索不同,酷讯是一款以即时的生活信息为检索对象的专业搜索引擎。公司第一款产品——火车票搜索于2006年1月1日率先上线。同月10日至 25日间又先后推出房屋出租、人才招聘、打折和展会等信息搜索的测试版。截至2006年2月底,酷讯已经拥有十余款产品,形成了丰富的产品线,涵盖衣、 食、住、行和工作、交友、购物等生活各方面。[科研中国SciEI.com]

    普通搜索 维客[8]
    维客(wiki),即本站(www.wiki.cn)于2006年05月08日起开始测试。[科研中国SciEI.com]

    普通搜索 MathSearch:数学搜索[英文][7]
    To search a collection of over 200,000 documents on English-language mathematics and statistics servers across the Web, enter one or more phrases, then start the search.[科研中国SciEI.com]

    推荐搜索 Cambridge Scientific Abstracts[1]
    CSA 是剑桥科学文摘(Cambridge Scientific Abstracts)的简称。它由美国一家著名的私人信息公司编辑出版,该公司出版科学技术研究文献的文摘和索引工具已有30多年的历史。目前,CSA通 过因特网可提供70多个数据库的检索服务。内容范围包括:农业科学、生命科学、生物学与医学、环境与水科学、计算机科学、材料科学与工程、航空航天以及人 文社会科学等。CSA剑桥科学文摘数据库包括我校专业常用的三个数据库:金属文摘数据库(Material Science with METADEX)、航空航天与高技术数据库(Aerospace & High Tech Databases)、美国政府报告数据库(NTIS)。西工大网络:http: //csa.tsinghua.edu.cn/htbin/dbrng.cgi?username=npu&access=npu12。[科研中 国SciEI.com]

    普通搜索 万方数据搜索[0]
    是 万方数据股份有限公司针对互联网用户需求建立的专业学术知识服务网站,隶属于万方数据资源系统,对外服务数据由万方数据资源系统统一部署提供。 iLib是Google Scholar最重要的合作伙伴之一,目前,它是Google Scholar的第三大中文内容提供者。[科研中国SciEI.com]

    文献检索网站总结(zz)

    作者: boyang
    注: 以下只是部分站点,如果有其他好的同类站点,欢迎推荐。

    目前bbs上有人求文献,但大家也都很忙,有时不能很快的解决,所以提供一些文献求助的网站,大同小异,都有文献求助版面,按照相应的规则发贴就可以求助了。

    http://www.dxy.cn/bbs/
    丁香园,现在已经转型成医学类学术论坛,但仍然有文献互助版面

    http://emuch.net/bbs/
    小木虫,不错,但经常遭受挫折,目前已经基本没有检索,但文献互助

    http://www.hjcz.org/bbs
    红军长征,技术上比较强劲的论坛

    http://www.readfree.net/bbs
    读书园地,对书籍的研究是相当专业的

    http://forum.e2002.com
    鸭绿江,还行

    http://www.ifstar.net/bbs/index.php
    星荧,不太了解

    http://www.soudoc.com/bbs
    零点,听说那里的中级版考核比较变态

    http://bbs.bioon.com/
    生命科学论坛,比较早了

    9/15/2006

    两款开源文献管理软件(整理)

    上次整理出四款常用文献管理软件后,朋友告诉我还有两款开源的文献管理软件,使用者比较多。特地补充如下:

    1.JabRef

    Jabref截屏图

    最新版本: JabRef 2.1(2006.08.10)
    采用Java开发的跨平台文献管理软件,支持多平台。 这款软件专门针对BibTeX,同时支持导入导出多种文献题录格式。一般使用emacs+TeX写论文的较多用到这个软件。

    JabRef遵守GPL协议开放源代码,因此可以自由使用而没有版权限制。

    项目地址: http://sourceforge.net/projects/jabref/

    2.Bibus
    Bibus截屏图

    最新版本: 1.2.1(2006.08.29)
    Bibus采用python开发,支持多平台。采用MySQL或SQLLite数据库来保存文献,支持直接在OpenOffice Writer和MS Office Word中插入文献题录。

    Bibus遵守GPL开放源代码协议,同样没有版权限制。水木社区新软件介绍版有网友做了汉化。

    项目地址: http://sourceforge.net/projects/bibus-biblio/

    9/14/2006

    TiddlyWiki:由外部档案载入plugins的好处(zz)

    作者: 密爾希弗拉雪
    email: robertus0617@gmail.com
    来自: 中文版TiddlyWiki论坛
    使用MS Word 2003进行繁简字体转换。

    之一
    问题:如果想要加载的plugins很大,而无法完全加载。

    这个问题会发生在现有版本的ccT(0.5.5)与 TW (2.0.11 on Opera)。

    实例:BigThemePack

    解决:改以外部加载的方式,可简单地避开此问题。

    先将BigThemePack存成BigThemePack.js檔。

    TiddlyWiki
    1.LoadExtPlugin

    新增Tiddler (tagged with "ExtList")加入内容
    /YourPathTo/BigThemePack.js

    2.在MarkupPreBody中加入
    〈script type="text/javascript" src="/YourPathTo/BigThemePack.js"〉〈/script〉

    ccT
    1.LoadExtPlugin
    2.参考这个Bram的ccT改版:
    〈http://prdownloads.sourceforge.net/ptw/cctiddly055b-tw210beta-060624.zip?download〉

    当然也可以自行手动编辑.html或index.php,在适当位置加入:
    〈script type="text/javascript" src="/YourPathTo/BigThemePack.js"〉〈/script〉


    之二
    只要安装一个以上的plugins,即可能遇到*兼容*的问题。其实,有时只是plugins加载的先后顺序所造成的,通常此类plugins可能hijack相同的内建functions。

    使用外部加载的方式,可以精准的指定plugins被加载的顺序,轻易的避开这些小问题。
    〈script .... src="MyPlugin" ....〉〈/script〉
    〈script .... src="Another" ....〉〈/script〉
    ....

    以systemConfig的方式启用plugins,则可透过tiddlers命名的小技巧。例如,
    "1.MyPlugin"
    "2.AnotherPlugin"
    ....
    也可以依指定顺序加载plugins。

    备注:
    TiddlyWiki是依ascii顺序加载plugins。


    之三
    我刚想到一个好处,虽然可能不是对owner本身:

    就是TiddlyWiki因为原本把plugin和CSS都存在tiddler中,也就是HTML的div当中,所以搜寻引擎的机器人在做索引的时候,常常会把一大篇一大篇这些Javascript和CSS的内容都加进去,结果当人们使用搜寻引擎时,常常搜到的只是TiddlyWiki plugin的程序代码而已,本身数据价值不太大(当然,对于目的就是要搜寻TiddlyWiki plugin全文的人反而很方便)。如果plugin由外部档案加载的话,或许那些个机器人就不用浪费那么多时间在做plugin的索引上,而可以快一点把真正重要的tiddler内文做到索引里去。

    浅见:p

    9/12/2006

    如何查询论文全文(整理)

    根据紫丁香站 boyang 网友几篇帖子整理。

    现在各个每篇文章基本都有doi号码
    对于不熟悉杂志,利用doi,可以直接锁定文章所在数据库的位置
    通过这个网站来查询 http://dx.doi.org 输入号码即可

    再说一下怎么来找全文连接
    一般,如果不知道一篇文献所属期刊的数据库,可以通过以下方法查找
    1.http://journalseek.net/
    输入杂志名即可,如果最终显示not available online,则说明无电子版(多数情况准确,有时也会有错)

    2.google
    直接输入杂志全名即可.一般在搜索结果的第一页中都会有结果.所以,有人求文献时只copy杂志简写,有时会浪费应助者很多时间.

    3.pubmed,医学为主,一般我不用

    4.各个大学图书馆的电子资源导航,lmm老师曾经讲过,清华,北大,厦门大学的作的不错,可以从他们图书馆主业中找到
    http://dlib.lib.tsinghua.edu.cn/journal/
    http://162.105.138.23/reference/reference.asp
    缺点是:大学图书馆只是把自己学校购买的资源做一个连接,为学生和老师服务,但没有一所学校购买的全.所以不是万能的,当然你也可以找一些资源购买的比较多的学校的电子资源导航,例如yale,等米国的学校.总之,没有一所学校可以购买所有的资源

    再说一下,找到全文连接后,发现不能下载,没有权限,那么如何来确定哪些大学购买了自己所要的杂志,一般google就可以了,米国的大学购买的很多,一般都可以找到,个别杂志很恶劣,基本没有学校买电子版,这至少说明了一点,购买率低,相应的影响因子也低,看不看也就那么回事.

    搜索的关键词为;
    "physics review letters(杂志全名)" ejournals | e-journals (site:edu | inurl:.ac.)

    这里解释一下,一般学校都会把其购买的杂志做成列表,列表的名字多为ejournals或者e-journals
    学校嘛,多为edu,例如yale.edu,princeton.edu,monash.edu.au,tsinghua.edu.cn等等.此外其他国家学校的网址多为.ac.,例如.tokyo.ac.jp,cam.ac.uk, auckland.ac.nz等等,当然即使这样也不能涵盖世界所有的学校,例如一些加拿大,法国,荷兰等学校,高校的网址都没有特殊的结构,不过这个检索词基本上足够找出有权限的学校了

    最后说明一下求文献为什么要找到和提供全文连接或doi号码.

    1.找到全文连接后,看是否提供pdf或html格式的全文下载,如果提供,那么说明此文章网上有电子版,至于能否下载只是权限的问题.否则,由于文章太早,或者杂志就不提供电子版下载,而求助者又不提供全文连接,这样应助者花了很长时间,最后发现无电子版,那不是要气死,没有电子版还在网上求什么?! 所以没有电子版的时候,求助时就直接说明求助馆藏,看那个图书馆有,想办法复印一类

    2.提供全文连接后,应助者可以在ie中简单的更换代理,即可通过求助者所给出的全文连接或doi号码,直接找到文章并下载.一般来说,拥有一个好学校的代理就是如此,例如yale,berkeley等等,因为他们购买的资源多,所以操作很方面,基本不需要浪费应助者时间.

    ok,就这么多,望以后的求助者遵守规则!毕竟搞科研,检索技术对你也是有帮助的.

    数字化资源命名寻址的利器-DOI(zz)

    原文发表在中原大学张静愚纪念馆馆讯2002年冬季刊上,作者郑阳明。
    本文采用MS Word 2003进行繁简转换。
    原文链接: http://www.lib.cycu.edu.tw/lib_pub/news129.html

    数字化资源命名寻址的利器-DOI

    壹、前言
      在浏览网页的时候出现「HTTP v1.0/1.1 Error404」讯息时,表示所点选欲连结的资源已经被移除,以致于无法利用,遇到这种状况通常令人无奈,尤其是在撰写报告需要参考文献时,更会急得跳脚。这时难免会想,网络资源是不是能像图书馆的图书索书号一样,每一个资源都给一个具有永久性(persistent)且唯一的(unique)辨识号码?当读者查询馆藏目录,可依图书索书号至书架上取书,不会有因馆藏移架造成馆员要重新编索书号或读者需另记索书号的困扰。

      在图书馆各种类型的馆藏中,期刊因内容新颖、出版快速,报导最新学术发展动态及发表研究成果,一向受到读者的高度重视与广泛使用。在学术图书馆中,更 将购书经费的70%以上用于订购学术期刊。由于因特网的普及化,不少科学、科技、医学类学术性刊物出版商,意识到要想长久生存,取决于出版刊物必须增加 销售管道,因此纷纷在因特网上建立网页,开始将大部分纸本印刷出版品再以电子形式出版,有的甚至只出版电子版形式供订购阅览。

      近来,电子书大量崛起,可以说是出版商另外开发的一块大饼。对出版商而言,电子出版可以将文字、声音、影像、动画等各种媒体的数据,加以数字处理,增 加纸本书刊所无的边际效益,但是,若是仅止于此并无法保证增加出版商的销售量,一方面必须要提供像图书ISBN、期刊ISSN、录音录像数据ISRC等让使用者很容易检索的辨识码(identifier),另一方面还要防止被轻而易举地非法复制盗拷,这种盗版的现象在软件和音乐作品中已屡见不鲜。出版商必须在保障提供稳定来源的数据与保护智能版权二者之间加以努力,以获取最大利益。

    贰、DOI系统介绍
      由于上述这些原因,美国出版商协会(The Association of American Publishers,简称AAP)于1994年建立了「技术授权委员会」(Enabling Technologies Committee),进行设计一种既能保护智慧产权且能保障版权所有者商业利益的系统。第一个步骤是先引进一种出版业标准的电子出版内容识别码以支持出版商与用户之间各种系统的相互转换,为版权与使用权之间的协调管理提供基础。该系统以美国全国研究创新联合会(The Corporation for National Research Initiatives,简称CNRI)研发的「处理系统」(The Handle System)作为技术平台,用来对数字化出版物提供持久和可靠的识别码。网络资源大都采用直接寻址方式,其最大优点是简单便捷,但当资源有异动时,则需要通知并修改相关联之数据,否则就会出现像本篇文章一开头所提到的讯息了。为了避免这问题,网络资源可改采间接寻址 (相对地址),透过一台记载文件名与网址对照的主机,若网址更改,只要通知该主机即可,这种处理主机一般称为 Handle System。

      这一系统在1997年法兰克福图书博览会首次亮相,名称为The Digital Object Identifier,简称DOI 正式成为数字化资源命名的一项标准,1998年在法兰克福并成立一个宣称非营利性之国际DOI基金会 (International DOI Foundation, 简称IDF) 负责政策制定、技术支持、注册及缴纳规费、维护在线的使用指南等业务。这个基金会由一个董事会监管,会员成员包括(1)大型音乐、平面影像、广播、在线新闻、软件、其它内容产业的出版商(2)上述产业的技术供货商(3)上述产业的协会代表(4)因特网科技公司(5)代表作家、画家、图书馆、使用者的组织(6)政府相关部门(7)其它网络上政治、经济或社会人文重要机构。会员分为四个等级:
    (一)、 第一级是创始会员(Charter Members),成员有Association of American Publishers* 、Elsevier Science* 、International Publishers Association* 、John Wiley & Sons* 、McGraw-Hill, Educational and Professional Publishing Group* 、Springer Verlag* (*代表也是IDF的董事会成员)。
    (二)、 第二级是签约会员(Registration Agencies Members),有ContentDirections, Inc.* 、CrossRef* 、Enpia Systems Co., Ltd. 、Learning Objects Network Inc.* 、Copyright Agency Limited*等。
    (三)、 第三级是一般会员(General Members),较知名的有American Chemical Society、Cambridge University Press、Copyright Clearance Center*、Hewlett-Packard Company*、IEEE、Microsoft Corporation*、Joel Baron Associates*、OCLC Online Computer Library Center Inc.、Publishers Licensing Society、Wolters Kluwer International Health & Science等。
    (四)、 第四级是附属会员(Affiliates),有Adobe Systems Inc.,此种会员不具投票权。
    目前有超过二百个公司使用DOI系统,注册四百万笔以上DOI数据,注册中心(Registrant Agency)有两个,分别为IDF和 CrossRef。IDF于2001年2月提出 The DOI Handbook v.1.0.0 供全球使用(至2002年11月为 v.2.5.0),内容收集DOI的技术、建置、管理方式,为有意加入者提供一入门手册。2000年9月,CrossRef 成为第一个由国际DOI基金会所授权的官方DOI注册代办机关,负责分发DOI前引、注册DOI,并提供基础建设让使用者能公告及维护元数据(Metadata)。[1]

      DOI主要功用就是对网络上的内容能作唯一的命名与辨识,藉以保护智慧财产。DOI译成「数字对象辨识码」,是一组由数字、字母或其它符号组成的字符串。包括前缀(Prefix)和后缀(Suffix)两部分,中间用一道斜线区分。前缀由辨识码管理机构指定,后缀由出版机构自行分配。前缀又由两部分组成,中间用一个圆点分开。第一部分<DIR>有两个字符,代表该DOI由哪个注册中心分配,目前都是以10两个数字代表。以后可能会有多家注册中心,例如一个国家一个,或一个行业一个(如出版、摄影、音乐、软件等行业)。前缀的第二部分<REG>代表被分配使用该DOI前缀的出版机构,或在辨识码注册中心进行登记的任何版权所有者。后缀由出版商或版权所有者自行给号,是一组唯一的字符串,用来代表特定的数字化资料。许多出版商选用已有的识别符号作为后缀,如ISBN、ISSN等。
    DOI 命名的语法主要是遵照 ANSI/NISO Z39.84 标准,其编码规则如下:
    ...语 法......................................备 注
    <DOI> = <DIR>.<REG>/<DSS>.....Character set is Unicode 2.0
    <DIR>=10..............................前缀(Prefix)
    <REG>Registrant's Code.....<REG>码是由注册中心发给各要注册单位
    <DSS>DOI Suffix String......后缀(Suffix) <DSS> 的起始字符不能为*/
    例一:10.1000/1....................是DOI系统在Web上的首页识码 前缀是10.1000,后缀是1
    例二:10.1016/SO921877797000232......是Elsevier 出版社一篇期刊文章的DOI辨识码后缀是直接引用Publisher Item Identifier(PII)

    DOI系统的实际运作目前是采用Handle System技术,浏览器所需要内嵌(embed)软件及系统运作软件可从http://www.handle.net网址下载。

    参、DOI系统运作与应用
    ISBN、ISSN等现有的标识码用于印刷型出版物中,而DOI系统是专门用于标识数字数据的。简单地说,其原理是:
    1. 每个会员出版商为其所出版的每一数字数据(可能是一本书其中一个章节或是某一篇期刊文章,更甚或是某一个图片文件),编制一个含有出版社本身DOI前缀的DOI,并将其附加到文献元资料(Metadata)和URL上,如此DOI成为数字数据的一部份,始终与该数字数据共存。
    2. 每个DOI记录与该数字数据的URL 信息一起被送往DOI注册中心数据库,得到登记、进行存贮。这种被集中存贮起来的数据形成了一个数据辨识库。利用特殊的软件,这一数据辨识库可以连接、或分辨某个DOI,使与其有关的数字数据的位置联系起来。(参见图一)
    3. 当用户寻找一个数字数据、或有关这一数据的相关信息,DOI查询需求就会被传送到DOI注册中心数据库主机。
    4. 该数据库主机寻找到DOI的记录及与其相关的信息地址,将二者连接起来,将其URL送回给用户浏览器并将结果显示给用户,其过程与寻找URL一样快捷。(参见图二)
    5. 当出版商将其产品版权转让或出售时,即某一数字数据的位置发生了变化,该出版商应将这一数据改变的信息送到DOI服务器,该服务器将自动更新,中心服务器将会保持数据的完整。


    图一:建立DOI数据


    图二:检索并回复DOI数据


      以CrossRef为例,CrossRef 是一个系统处理过程,它的功能就像是种智能型数字式总机。每个会员出版商为其所出版的每一篇期刊文献,编制DOI后将其附加到文献元资料(Metadata)和URL上。这些纪录会以XML为基础的DTD格式,批次提供给 CrossRef 元数据数据库(MDDB:Metadata DataBase),CrossRef再将每一篇文献的DOI和URL注册在一个统一的DOI名录中。另一方面,出版商也将每篇文献中所节选的参考数据引文(Reference Citation)提供给参考书目转化器(Reference Resolver),此一转化器的功用是用来检索DOI群,为MDDB的主要部分。出版商能把CrossRef连结加进所有本文已在CrossRef系统中注册的文献内引述文中。整个索引连结流程图示于图三。[2]

    图三:索引连结流程图



      举本馆订购的WILEY InterScience数据库为例,经由点选电子期刊文章,除了可以观看全文外,也可以经由参考资料引文的连结,透过CrossRef的功能,连结到其它出版社的文章。



    肆、DOI系统的评价
      DOI对所有形式的知识内容都适用,因此对文章、图书、课堂实验、影像图片、音乐等各种数据都可进行连结、检索,由于DOI系统这种持续追踪文献目前地址的能力,可以让使用者直接从某家出版商的产品如书目数据库(Bibliographic database)或引用文献(Article citation)连结到其它出版商的数字化产品,如摘要(Abstract)或全文(Full-text)。其识别码系统可以使得传统的数字产品具有进一步的延伸能力,意即从识别码可以指引到资源本身,不再是静态的表现,这是DOI编码系统最有价值之处。

      在变化万端的电子出版世界中,由于数据版权所有者的更迭、电子文件的存放位置变化频繁,尤其在使用那些在各主机之间来回转换的文件、新版的软件、不同文件 案格式的数字化音乐作品、或经过更新内容的科学文章中特别需要一种技术,以保证虽然被连结的版权所有者的出版时间和地点有了变化,仍能正确无误地连结,DOI正好可以达成这个需求,这是它的另一项优点。DOI系统为出版商提供了一个既能用于出版物电子版权的内部管理机制,又能进行电子商务的工具。它对文件检索、票据交换、出版许可等电子出版日常的交易程序提供了自动化管理的工作基础,这也是美国出版者协会 (AAP) 之所以对它青睐的主要原因。

      就学术界的观点而言,DOI 虽具有上列的特点级优越性,但Lloyd A. Davidson and Kimberly Douglas在文章中提到[3],DOI系统主要是为了迎合出版者的需求而制定的,缺乏图书馆学会及大学在基金会主体内运作,在这样的环境下发展出来的系统,虽然出版者的需求和图书馆界的需求会有重迭,但是还是难以涵盖图书馆界之需求。此外它还有下列待解决的问题:
    1. 在编码规则上DOI系统可以长达128个字符,扣除前缀的8个字符,后缀的120字符可以定出1.8*10192个DOI识别码(因每一字符可以是字母、数字或符号等至少40种可能),这个天文数字使得设计显得不切实际,且这种命名长度太长不易记忆因而难以应用,以Publisher Item Identifier(PII)为例,只有17个字符的长度,就足以识别出版品。根据Norman Paskin估计约用10 11个对象就足以完成每一项出版品的唯一识别码[4],目前DOI的命名法对系统内存而言是相当浪费的。
    2. 因为DOI系统需要经过注册及付费,并非免费使用的系统,且不允许个人注册,因此并不是任何人都可使用。为了同时兼顾商业往来及智慧产权的保护,这些出版商也不会把所有的产品都在因特网释出。另外,在DOI系统问世之前,其实也有其它的控制方式存在,如由因特网协会(IETF)1993年3月所提出的一致性资源命名(Uniform Resource Names,简称URN)计划,这使得DOI系统对出版商的约束力变小。再者,IDF对参与成员的审核标准也相当严格,因此也使得小型出版商不愿再付费加入DOI系统。造成DOI系统对大出版商很有帮助,可以支持他们在网上的商业性交往、保护他们的知识版权。但这些出版商生产的产品只占网上能够获得的所有数据的一部分。此外,在DOI系统引入之前,大出版商的数据已经相对比较稳定。实际上,URL的不稳定和因特网上的出版物缺乏持久性的最大问题来自这些没有直接参与DOI系统的其它出版者,因此网络上出版的混乱局面仍将无法得到有效的控制。
    3. 如果太多的非正规的出版机构也被允许加入到DOI系统中,系统有可能因为积累大量不存在的对象的识别码而导致崩溃。但从另一个角度看,如果不允许那些非正规出版机构参与到DOI系统中,他们有可能被迫建立一个类似的系统,具有同样的功能,自己对这些系统进行管理以保证质量。但并不是各种类型的出版商都能花得起时间、金钱来经营像DOI这样一个复杂的、需要不断进行讯息更新的系统的。
    4. DOI为出版商创造了一个系统,一方便可以保护出版商免遭使用者滥用数字数据而蒙受严重的经济损失,又可以让公益性政策如公平使用原则和馆际互借等制度延续下去。但是DOI有可能妨碍用户对出版物的公开获取,因为读者对DOI的查询,除非获得授权检索,大多数得到的可能只是各种出版物的清单,而非直接连结至被查询的出版物本身。如果终端用户发现DOI反而成为获取信息的障碍,他们就有可能倾向于去寻找那些非正式的文献来源,如目前出现的越来越多的预行刊物档(preprint archives)(关于preprint archives的介绍,请参照本馆馆刊124期," 学术研究的宠儿:Preprints及E-prints"一文)。甚且如ARL(The Association of Research Libraries)的SPARC(The Scholarly Publishing and Academic Resources Coalition)计划(http://arl.cni.org/sparc/),它们自行结合大学、学术图书馆与学术组织成立联盟,不再受商业出版的期刊出版者牵制,自己管理学术文章的出版与发行。所以对DOI会员出版商而言,其实它们最佳的策略应该是和它的客户--例如图书馆界-积极地合作,重新订定DOI系统的政策,如:入会条件、开放程度、编码格式、检索权限等。

    伍、 结语
    网络资源命名寻址工作是一项复杂的议题,网络资源永久名称的指定,将是网络资源管理重要的一环,目前较有名的对象编码命名方式有DOI、URN((Uniform Resource Names)、SICI Code(Serial Item and Contribution Identifier Code)、BICI Code(Book Item and Contribution Identifier),各有其特色与限制,对于图书馆界而言,在发展数字典藏工作时,对于档案的命名就要考虑到要先确认它编码命名的方式,是否组织类似IDF的 机构?或是加入类似之组织?加入后组织编码的设计等。在采访选择电子期刊或电子书时,除了内容的质量外,对于出版商或代理商提供的文章章节电子文件存取方式 及是否提供跨出版商间之连结等服务也应该有所评鉴。对读者而言,出版商与资源中介单位如图书馆等的通力合作,提供稳定且多元的网络资源服务,才是他们所在 乎的。
    (作者为本馆采编组组长)


    参考数据:
    1. DOI Handbook
    http://www.doi.org/handbook_2000/index.html

    2. 刘淑德、曾宇薇,"CrossRef电子期刊文献正文引文跨越连接共通规范",
    http://www.ncl.edu.tw/pub/c_news/89/04.html

    3. Lloyd A.Davidson and Kimberly Douglas,"Promise and Problems for Scholarly Publishing",
    http://www.press.umich.edu/jep/04-02/davidson.html

    4. Paskin,Norman,"Information Identifiers," Learned Publishing vol.10,no.2,pp.135-156 (April 1997). http://www.elsevier.com/inca/homepage/about/infoident/Menu.shtml

    9/11/2006

    常用文献管理软件简单比较

    简单比较一下常用的文献管理软件:

    EndNote
    http://www.endnote.com
    最新版本: EndNote X
    毫无疑问,EndNote是文献管理软件中的老大,大名鼎鼎的ISI出品。界面简单,搜索查询方便,与Word无缝链接,支持Z39.50标准,可以检索所有支持此标准的数据库,支持gb2312和utf-8编码,中文支持良好。缺点是不能建立子目录,无法分类。
    【更新.2006.10.25】我发现,很难说不分类就是缺点。有强大的搜索功能,很多时候并不需要分类。

    ReferenceManager
    http://www.referencemanager.com
    最新版本: ReferenceManager 11.0.1
    ReferenceManager也很不错,不过看起来和EndNote功能差不多,被ISI公司收购后,更新并不积极。不支持中文,所以用的也不多。

    Biblioscape
    http://www.biblioscape.com
    最新版本: Biblioscape 6.6
    Biblioscape并不能简单地归入到文献管理软件中来,因为它的功能实在太强大了,它不仅是文献管理工具,还包括文献分析工具;另外Biblioscape版本众多,适合不同研究者需要。Biblioscape对中文支持的比较早,不过到现在仅支持gb2312编码,不支持utf-8。另一个较严重的缺点是对Word的支持不如前两者好。7.0 beta将在秋季推出,不知道新版本对将有多少改进。

    NoteExpress
    http://www.scinote.com
    最新版本: NoteExpress 1.7.2.150
    NoteExpress是国内开发的较为优秀的一款文献管理软件。功能较EndNote丰富,且符合中国人使用习惯,中文支持良好,并且与Word支持的比较好。软件历史较短,细节之处不太完美,稳定性有待进一步确认。新版本2.0最近将发布。

    其他国内常用的文献管理软件还有一些。比如在医学杂志领域表现不俗的医学文献王;国外一些软件如ProCite因中文支持不好,国内鲜有使用。另外开源社区也有许多优秀的文献管理软件,有兴趣者可以登录http://sf.net查询。

    Francesco Dell'Orso热中于对不同的文献管理工具软件的优劣进行比较,2006年7月他发布的第13版比较结果,被列入评比范围的软件包括: Biblioscape, Bookends, Library Master, ProCite, EndNote, Reference Manager, Papyrus等。有兴趣的话可以点击链接查看评比结果: http://www.burioni.it/forum/ors-bfs/text/index.html

    【更新.2006.10.25】
    除了NoteExpress医学文献王,今天在网上又发现一款国产商业文献管理软件,PowerRef。免费版本可以输出30条文献记录(10条参考文献列表索引,10条脚注,10条尾注),有兴趣可以试一下。

    此外,我这里还介绍了两款开源的文献管理软件,有兴趣的可以看看:
    http://jiangzhanyong.blogspot.com/2006/09/blog-post_15.html

    9/10/2006

    七个小细节能毁掉你的身体(zz)

    科研工作人员经常不注意生活,不注重保养。以下这篇文章供所有的研究生和科研工作者参考。
    来自: http://blog.sina.com.cn/u/476fb2bf010006j3

      有些人很注意养生保健,但在生活习惯上却存在一些误区,像下面这些“亡羊补牢”的做法,不是尤未为晚而是为时已晚了,这已经对身体健康造成了影响。

      饿了才吃:

      生活中许多人不是按时就餐,且有相当一部分人不吃早餐,其理由之一就是“不饿”。其实,食物在胃内仅停留4-5小时,感到饥饿时胃早已排空。胃黏膜这时会被胃液“自我消化”,引起胃炎或消化性溃疡。饮食规律、营养均衡是养生保健必不可少的物质基础。

      渴了才喝:

      平时不喝水、口渴时才饮水的人相当多,尤其是青少年和“大忙人”。他们不了解渴了是体内缺水的反应,这时再补充水分为时已晚。水对人体代谢比食物还重要,生理学家告诉我们,每个成年人每天需饮水1500毫升左右。晨间或餐前一小时喝一杯水大有益处,既可洗涤胃肠,又有助于消化,促进食欲。据调查研究,有经常饮水习惯的人,便秘、尿路结石的患病率明显低于不常饮水的人。

      累了才歇:

      许多人误以为累了是应该休息的信号,其实是身体相当疲劳的“自我感觉”,这时才休息已为时过晚。过度疲劳容易积劳成疾,降低人体免疫力,使疾病乘虚而入。不论是脑力还是体力劳动者,在连续工作一段时间后,都要适当的休息或调整。

      困了才睡:

      困倦是大脑相当疲劳的表现,不应该等到这时才去睡觉。按时就寝不仅可以保护大脑,还能提高睡眠质量,减少失眠。人的一生约有1/3时间是在睡眠中度过的,睡眠是新陈代谢活动中重要的生理过程。只有养成定时睡觉的习惯,保证每天睡眠时间不少于7小时,才能维持睡眠中枢生物钟的正常运转。

      急了才排:

      很多人只在便意明显时才去厕所,甚至有便不解,宁愿憋着,这样对健康极为不利。大小便在体内停留过久,容易引起便秘或膀胱过度充盈,粪便和尿液内的有毒物质被人体重吸收,可导致“自身中毒”。因此,应养成按时排便的习惯,尤以晨间为好,以减少痔疮、便秘、大肠癌的发病机会。

      胖了才减:

      随着生活水平的提高,肥胖患者日逐增加。导致肥胖的原因主要是进食过量,营养过剩,缺乏运动。而这几种诱因完全可以在体重超标之前加以预防,如控制饮食,防止暴饮暴食,调整饮食,加强体育锻炼。目前市场上还没有理想的减肥药,因此,减肥不如防止肥胖。

      病了才治:

      疾病应该以防为主,等疾病上身,已经对身体造成危害。疾病到来时都是有信号的,比如人们常说的亚健康状态就是疾病的前奏。平时应该加强锻炼,提高自身抵御疾病的能力,感到身体的亚健康,就要引起注意,要把疾病消灭在萌芽状态。

    SVN FAQ(zz)

    出处: http://blog.sina.com.cn/u/5595d514010005o2

    要谢谢dongyu同学的整理 :)
    SVNFAQ:
    1. Q:SVN服务启动的方法?
    A:svnd或者apache(HTTP)
    2. Q:SVN怎么创建版本库?
    A:svnadmin create /path/to/repos
    3. Q:SVN版本库的存储方式有什么?
    A:一种是使用Berkeley DB,一种是使用本地文件系统(FSFS)
    4. Q:我们可以对SVN的那些部分进行开发?
    A:client端,hook,repository tools(如svnlook)
    5. Q:本地的文件于服务器上文件的区别是什么?
    A:在本地只储存文件的某个具体版本,而服务器上储存了整个的版本树(服务器上FSFS通过写入与上一个版本比较的变化来记录新版)
    6. Q:SVN版本库的目录结构是什么?
    A:包含有conf/ dav/ db/ format hooks/ locks/ README.txt,具体的见附1
    7. Q:svnadmin的主要参数都有什么?
    A:create等,具体见附2
    8. Q:svnlook的主要参数都有什么?
    A:cat等,具体见附3
    9. Q:hook的中种类有哪些?
    A:目前Subversion有已实现了五种钩子(start-commit,pre-commit,post-commit,pre-revprop-change,post-revprop-change),具体见附4
    10.Q:svn commit有哪些参数?
    A:svn commit [PATH...]
    --message (-m) TEXT
    --file (-F) FILE
    --quiet (-q)
    --non-recursive (-N)
    --targets FILENAME
    --force-log
    --username USER
    --password PASS
    --no-auth-cache
    --non-interactive
    --encoding ENC
    --config-dir DIR
    11.svn中是怎么调用hook的?
    A:把hook当成可执行的文件或者脚本,利用system.exec(shell)调用


    附1:
    SVN版本库的目录结构:
    conf
    一个存储版本库配置文件的目录。
    dav
    提供给Apache和mod_dav_svn的目录,让它们存储自己的数据。
    db
    你所有的受版本控制数据的所在之处。这个目录或者是个Berkeley DB环境(满是数据表和其他东西),或者是一个包含修订版本文件的FSFS环境。
    format
    包含了用来表示版本库布局版本号的整数。
    hooks
    一个存储钩子脚本模版的目录(还有钩子脚本本身, 如果你安装了的话)。
    locks
    一个存储Subversion版本库锁定数据的目录,被用来追踪对版本库的访问。
    README.txt
    这个文件只是用来告诉它的阅读者,他现在看的是 Subversion 的版本库。

    附2:
    svnadmin命令列表:
    create
    创建一个新的Subversion版本库。
    deltify
    在指定的修订版本范围内,对其中修改过的路径做增量化操作。如果没有指定修订版本,这条命令会修改HEAD修订版本。
    dump
    导出版本库修订一定版本范围内的内容,使用可移植转储格式。
    hotcopy
    对版本库做热拷贝,用这个方法你能任何时候安全的备份版本库而无需考虑是否正在使用。
    list-dblogs
    (Berkeley DB版本库专有)列出Berkeley DB中与版本库有关的日志文件清单。这个清单包括所有的日志文件—仍然被版本库使用的和不再使用的。
    list-unused-dblogs
    (Berkeley DB版本库专有)列出Berkeley DB版本库有关的不在使用日志文件路径清单。你能安全的从版本库中删除那些日志文件,也可以将它们存档以用来在灾难事件后版本库的恢复。
    load
    导入由dump子命令导出的可移植转储格式的一组修订版本。
    lstxns
    列出刚刚在版本库的没有提交的Subversion事务清单。
    recover
    恢复版本库,通常在版本库发生了致命错误的时候,例如阻碍进程干净的关闭同版本库的连接的错误。
    rmtxns
    从版本库中清除Subversion事务(通过加工lstxns子命令的输出即可)。
    setlog
    替换给定修订版本的svn:log(提交日志信息)属性值。
    verify
    验证版本库的内容,包括校验比较本地版本化数据和版本库。

    附3:
    svnlook命令参数列表:
    author
    显示该树的作者。
    cat
    显示树中某文件的内容。
    changed
    显示树中修改过的所有文件和目录。
    date
    显示该树的时间戳。
    diff
    使用统一区别格式显示被修改的文件。
    dirs-changed
    显示树中本身被修改或者其中文件被修改的目录。
    history
    显示受到版本控制的路径(更改和复制发生过的地方)中重要的历史点。
    info
    显示树的作者、时间戳、日志大小和日志信息。
    log
    显示树的日志信息。
    propget
    显示树中路径的属性值。
    proplist
    显示树中属性集合的名字与值。
    tree
    显示树列表,可选的显示与路径有关的文件系统节点的修订版本号。
    uuid
    显示版本库的UUID—全局唯一标示。
    youngest
    显示最年轻的修订版本号。

    附4:
    目前Subversion有实现的五种钩子:

    start-commit
    它在提交事务产生前已运行,通常用来判定一个用户是否有权提交。版本库传给该程序两个参数:到版本库的路径,和要进行提交的用户名。如果程序返回一个非零值,会在事务产生前停止该提交操作。如果钩子程序要在stderr中写入数据,它将排队送至客户端。

    pre-commit
    在事务完成提交之前运行,通常这个钩子是用来保护因为内容或位置(例如,你要求所有到一个特定分支的提交必须包括一个bug追踪的ticket号,或者是 要求日志信息不为空)而不允许的提交。版本库传递两个参数到程序:版本库的路径和正在提交的事务名称,如果程序返回非零值,提交会失败,事务也会删除。如 果钩子程序在stderr中写入了数据,也会传递到客户端。
    Subversion的分发版本包括了一些访问控制脚本(在Subversion源文件目录树的tools/hook-scripts目录),可以用来被 pre-commit调用来实现精密的写访问控制。另一个选择是使用Apache的httpd模块mod_authz_svn,可以对单个目录进行读写访 问控制(见“每目录访问控制”一节)。在未来的Subversion版本中,我们计划直接在文件系统中实现访问控制列表(ACLs)。

    post-commit
    它在事务完成后运行,创建一个新的修订版本。大多数人用这个钩子来发送关于提交的描述性电子邮件,或者作为版本库的备份。版本库传给程序两个参数:到版本库的路径和被创建的新的修订版本号。退出程序会被忽略。
    Subversion分发版本中包括mailer.py和commit-email.pl脚本(存于Subversion源代码树中的 tools/hook-scripts/目录中)可以用来发送描述给定提交的email(并且或只是追加到一个日志文件),这个mail包含变化的路径清 单,提交的日志信息、日期和作者以及修改文件的GNU区别样式输出。
    Subversion提供的另一个有用的工具是hot-backup.py脚本(在Subversion源代码树中的tools/backup/目录 中)。这个脚本可以为Subversion版本库进行热备份(Berkeley DB数据库后端支持的一种特性),可以制作版本库每次提交的快照作为归档和紧急情况的备份。

    pre-revprop-change
    因为Subversion的修订版本属性不是版本化的,对这类属性的修改(例如提交日志属性svn:log)将会永久覆盖以前的属性值。因为数据在此可能 丢失,所以Subversion提供了这种钩子(及与之对应的post-revprop-change),因此版本库管理员可用一些外部方法记录变化。作 为对丢失未版本化属性数据的防范,Subversion客户端不能远程修改修订版本属性,除非为你的版本库实现这个钩子。
    这个钩子在对版本库进行这种修改时才会运行,版本库给钩子传递四个参数:到版本库的路径,要修改属性的修订版本,经过认证的用户名和属性自身的名字。

    post-revprop-change
    我们在前面提到过,这个钩子与pre-revprop-change对应。事实上,因为多疑的原因,只有存在pre-revprop-change时这个 脚本才会执行。当这两个钩子都存在时,post-revprop-change在修订版本属性被改变之后运行,通常用来发送包含新属性的email。版本 库传递四个参数给该钩子:到版本库的路径,属性存在的修订版本,经过校验的产生变化的用户名,和属性自身的名字。
    Subversion分发版本中包含propchange-email.pl脚本(在Subversion源代码树中的tools/hook- scripts/目录中),可以用来发送修订版本属性修改细节的email(并且或只是追加到一个日志文件)。这个email包含修订版本和发生变化的属 性名,作出修改的用户和新属性值。

    9/09/2006

    TiddlyWiki插件: NewCollapseTiddlersPlugin

    名称: NewCollapseTiddlersPlugin
    作者: BJ Backitis
    网址: http://www.tampageek.com/newcollapse.html
    版本: 0.6
    描述: 能够让你的tiddlywiki中tidder自动收缩到标题。
    本站下载: http://jiangzhanyong.googlepages.com/NewCollapseTiddlersPlugin.0.6.js

    TiddlyWiki插件: CalendarPlugin

    名称: Calendar plugin
    作者: SteveRumsby
    网址: http://www.rumsby.org/yatwa/#CalendarPlugin
    版本: 0.2.0
    描述: 生成当前或者指定时间的日历。周末和节假日高亮显示。
    本站下载: http://jiangzhanyong.googlepages.com/CalendarPlugin.0.2.0.js

    9/06/2006

    读博的一些技巧(转载)

    JiangZhanyong注:本文转载自两全其美BBS站Paper(论文)版精华区,作者fallenLeaf。

    1.先看综述,后看论著
    看综述搞清概念,看论著掌握方法
    2.早动手
    在师兄师姐离开之前学会关键技术
    3.多数文章看摘要,少数文章看全文
    掌握了一点查全文的技巧,往往会以搞到全文为乐,以至于没有时间看文章的内容,更不屑于看摘要。真正有用的全文并不多,过分追求全文是浪费,不可走极端。当然只看摘要也是不对的。
    4.集中时间看文献
    看过总会遗忘。看文献的时间越分散,浪费时间越多。集中时间看更容易联系起来,形成整体印象。
    5.做好记录和标记
    复印或打印的文献,直接用笔标记或批注。pdf 或html 格式的文献,可以用编辑器标亮或改变文字颜色。这是避免时间浪费的又一重要手段。否则等于没看。
    6.准备引用的文章要亲自看过。
    转引造成的以讹传讹不胜枚举。
    7.注意文章的参考价值。
    刊物的影响因子、文章的被引次数能反映文章的参考价值。但要注意引用这篇文章的其它文章是如何评价这篇文章的:支持还是反对,补充还是纠错。
    8.交流是最好的老师
    做实验遇到困难是家常便饭。你的第一反应是什么?反复尝试?放弃?看书?这些做法都有道理,但首先应该想到的是交流。对有身份的人,私下的请教体现你对他的尊重;对同年资的人,公开的讨论可以使大家畅所欲言,而且出言谨慎。千万不能闭门造车。一个实验折腾半年,后来别人告诉你那是死路,岂不冤大头?
    9.最高层次的能力是表达能力
    再好的工作最终都要靠别人认可。表达能力,体现为写和说的能力,是需要长期培养的素质。比如发现一个罕见病例,写好了发一篇论著;写不好只能发一个病例报道。比如做一个课题,写好了发一篇或数篇论著;写不好只能发一个论著摘要或被枪毙。一张图,一张表,无不是表达能力的体现。寥寥几百上千字的标书,可以赢得大笔基金;虽然关系很重要,但写得太差也不行。有人说,我不学PCR,不学spss,只要学会ppt(powerpoint)就可以了。此话有一点道理,实验室的boss 们表面上就是靠一串串ppt 行走江湖的。经常有研究生因思维敏捷条例清楚而令人肃然起敬。也经常有研究生不理解“为什么我做了大部分工作而老板却让另一个没怎么干活的人写了文章?让他去大会发言?”你没有看到人家有张口就来的本事吗?
    10.学好英语,不学二外。
    如今不论去日本还是欧洲,学术交流早已是英语的天下。你不必为看不懂一篇法语的文章而遗憾,写那篇文章的人正在为没学好英语而犯愁。如果英文尚未精通,暂且不要去学二外。


    我不知道科研对造假能够容忍到什么程度,科研和造假是不是一对双胞胎。 但台上的人都在说-决不造假。
    1. 适当造假:无关痛痒,偏差不大。
    论文中做了年龄、性别匹配的正常成人DNA 对照,实际用脐血DNA 做对照;论文中正常对照做了200 例,实际做了150 例;论文中有显著性差异,实际也有显著性差异,但均值的差别没有论文中那么大;论文中随机分组,实际上随意分组;论文中给动物行无菌手术操作,实际是只把部分器械在消毒剂里泡了泡。
    2. 被动造假:忍辱负重,有苦难言。
    师兄的论文发表了,导师让伊接着做,伊没有重复出来,但伊不能说师兄的论文有问题,伊在隐瞒事实的基础上做了更“深入”的研究;导师想要什么结果,伊就能做出什么结果;毕业前的几个月很多人的实验变得异常顺利,该出来的都出来了。
    3. 客观造假:无意而为,缺乏常识。
    论文中报道一个新的缺失突变,据说伊只挑了一个克隆测序;一个本该重复数次的实验没有重复就拿去发文章了。
    4. 主动造假:急功近利,风雨无阻。
    论文中的一张电泳照片来不及重做,借别人的一张差不多的照片顶替;酶切的时候,有一条带应当完全切掉,但总切不干净,伊用PHOTOSHOP 把它涂掉了;论文中的PCR 工作量很大,但PCR 仪使用登记本上只有一次记录;论文中p=0.041,实际p=0.055,把对照组中的一例阳性观察去掉就得到0.041 了。
    5. 积极造假:追逐名利,几近疯狂
    伊在一年中发表第一署名的论文50 篇;先有论文后有实验记录。

    英文文章写作
    1. 阅读10 篇文献,总结100 个常用句型和常用短语。经常复习。注意,文献作者必须是以英文为母语者,文献内容要与你的专业有关。这属于平时看文献的副产品。
    2. 找3-5 篇技术路线和统计方法与你的课题接近的文章,精读。
    写出论文的草稿。要按照标题、作者、摘要、背景、目的、材料、方法、结果、讨论、致谢、参考文献、图例、图、表、照片和说明的统一格式来写。这样做的好处是从它可以方便地改成任何杂志的格式。
    3. 针对论文的每一部分,尤其是某种具体方法、要讨论的某一具体方面,各找5-8 篇文献阅读,充实完善。 这里讨论的只涉及英文表达,也只推荐给缺乏英文写作经验的人。
    4. 找到你想投的杂志的稿约,再找2-3 篇该杂志的article,按它的格式改写。注意,每次改写都要先另存为不同的文件名,以免出了问题不能恢复。
    5. 找英文高手改。找不到合适的人,就去找提供英语论文编辑服务(English correction and improvement,not translation)的公司 ,在此向有钱没时间的人强烈推荐。

    文献管理
    1. 下载电子版文献时(caj,pdf,html),把文章题目粘贴为文件名。
    注意,文件名不能有特殊符号,要把 \ / : * ? < > | 以及 换行符 删掉。 每次按照同样的习惯设置文件名,可以防止重复下载。
    2. 不同主题存入不同文件夹。文件夹的题目要简短,如:PD,LTP,PKC,NO。
    3. 看过的文献归入子文件夹,最起码要把有用的和没用的分开。
    4. 重要文献根据重要程度在文件名前加001,002,003 编号,然后按名称排列图标,最重要的文献就排在最前了。
    5. 复印或打印的文献,用打孔器(¥10-15)打孔,装入硬质文件夹(¥10-20/个)。


    我们经常会在参考文献的引用上耍一些小聪明,殊不知这些都会降低论文质量。
    1. 知而不引
    明明借鉴了同行的类似工作,却故意不引用同行的类似工作,使自己工作看上去“新颖”“领先”。实际上审稿的可能就是同行。
    2. 断章取义
    故意截取作者试图否定的部分来烘托自己的观点。
    3. 引而不确
    没有认真看原文,引文错漏。
    4. 来源不实
    某些字句来源不可靠(比如非正式的或非学术的出版物),且不注明来源。常见于一些统计数字。
    5. 盲目自引
    不是为了说明自己的工作与前期工作之间的关系,而是单纯为提高自己文章被引用次数而自引。


    国内文章水平不高的几个原因:
    1. 审稿人知识陈旧
    年纪大的审稿人查文献和和上网的能力相当有限,无法核实该研究是否有意义,创新点在那里,方法是否可靠,结果是否可信。但匪夷所思的是他们经常提的审稿意见是“参考文献不够新”。
    2. 选错审稿人
    虽然一般指定两名审稿人,但编辑部经常让不懂分子生物学的人审分子生物学的文章,让不懂统计的人审统计处理比较复杂的文章。出于爱面子,很少有人提出“我不适合审这篇文章”。
    3. 关系文章
    有了关系,什么都简单了。
    4. 不承认阴性结果
    诚实的阴性结果被认为无意义。怪不得有人大声疾呼“我要办一本阴性杂志”。
    5. 造假
    任何人都不愿意成为制度的牺牲品。出不来预期结果就没法交差。为生存计,为按期毕业计,造吧。


    动态的科研
    1. 科研靠积累。
    象伦琴发现X 射线那样凭借一次简单观察就得诺贝尔奖的机会越来越少。更多的科研成果来自于实验室长期积累。最终实至名归。做科研不要指望一步登天。设计课题不要好高骛远。基金评审也是这样。没有前期积累,获得资助的可能性小。选导师要想好:你是要白手起家,还是要为人作嫁?
    2. 文献要追踪。
    开题时通过查文献了解的情况,到结题的时候可能有很大不同。实验过程中要注意追踪。运气好,你可以得到更多的线索;运气不好,发现别人抢先了。据此修正你的实验。写论文之前一定要重新查一遍文献。
    3. 记录要复习。
    前面的实验记录要经常复习。随着经验的增加和认识的提高,你会发现最初的判断未必正确。

    我曾经向一些比我有经验的人请教“什么是科研”,他们没有正面回答我,只是给我打了五个比方。
    1. 科研是流行歌曲
    什么流行用什么,什么流行做什么。张口生物芯片,闭口纳米技术。老板是追星一族,流行的就是最好的。
    2. 科研是移花接木
    设计课题?课题怎么是设计出来的呢?是拼出来的。A 的材料,B 的方法,C 的指标,D 的意义。
    3. 科研是傻瓜相机
    原理搞不懂?恕我老朽,没时间看原理了。我能折腾,多折腾几次就出来了。为什么要做这一步?老板心里明白就行了!他每周安排的活儿我还干不完呢。
    4. 科研是照葫芦画瓢
    综述不会写?抄啊。论文不会写?套啊。反正不会有人追究。无知者无畏!
    5. 科研是垃圾
    实验完成了,论文发表了,答辩通过了。老板语重心长地说:“你们走后,这些都是垃圾”。
    晕!倒!挣扎!再倒!
    他们没有骗我,实用主义自有它的道理。但我从此不再随便批判国内的科研水平了,因为在某些时候我也重复着同样的故事。


    写毕业论文
    1. 先列提纲
    不列提纲,上来就写,是坏习惯。几百字没问题,几千字勉强,几万字就难了。必须列出写作提纲,再充实完善,以保证思路的连贯和字数的均衡。
    2. 平时多写
    及时总结阶段性的工作,多写文章多投稿。到最后阶段,把这些文字有机地组合起来,就是一篇很好的毕业论文。
    3. 不要罗列所有数据
    为了保证毕业论文的分量,研究生往往会观测较多的指标。但毕业论文并非数据越多越好。一定要舍弃那些与主旨关系不大的数据。否则,要么显得累赘松散,要么成为破绽。
    4. 打印修改
    在电脑上直接修改,会遗漏很多错误。要尽可能地减少任何错误,一定要打印出来修改。
    5. 让别人指出错误
    自己修改,仍然受个人习惯的局限。错误摆在那里,却熟视无睹。让别人给你指出错误吧,不管他与你是不是同一专业。


    怎样读文献
    1. 目标:
    漫无目的则毫无效率,抓不住重点才效率低下。选题之前可能会有一段时间处于迷茫状态,不知从哪入手。胡乱看了大量文献,却不知所以然。在导师的指导下,在同行的启发下,有些人可以迅速明确目标,有的放矢,入门就从这里开始。即使导师不导,没有定题,自己也要先设定一个具体的问题看文献。不管你将来做不做这些东西,总比没有目标好得多,保证有收获。科研的一般法则是共通的。

    2. 层次:
    对于一个具体的课题来说,相关文献分属于三个层次:研究方向、研究领域、研究课题。例如有人研究干细胞定向分化治疗帕金森病,对他来说,研究方向就是帕金森病,研究领域是帕金森病的干细胞治疗,研究课题是某种物质诱导干细胞定向分化为分泌多巴胺的神经细胞。看文献时要分清手上的文献是属于那个层次,这决定你对它要掌握到什么程度。
    研究方向层次的文献:一般涉及,基础知识,学科水准,了解当前重大进展与趋势,达到专业人员水平;
    研究领域层次的文献:了解焦点与热点,已/正/将进行的课题,达到专家水平;
    研究课题层次的文献:要全面,了解历史、现状、展望、主要方法、手段,达到No1专家水平。
    正确分辨文章的层次,才能把精力用到点子上。

    3. 形式:
    广义的文献包括可以阅读的所有出版形式。教科书、专著、会议摘要汇编、期刊、网页、甚至ppt文件。比如要了解免疫应答的基本形式,最好是看教科书;要参考大鼠脑立体定位图谱,最好是看专著;要知道最新进展,最好是查阅期刊;要了解别人的研究动向,最好是参会或看会议论文汇编。不要找错信息源。

    4. 程度:
    对文献的熟悉程度不同,阅读文献的方式大不相同。新手学习式阅读,逐字逐句,搞清细节,掌握最基本的知识点。最初的十几、几十篇要精读,精华的几篇甚至要背诵。老手搜索式阅读,已熟悉各种研究的常见模式和一般套路,能够迅速提取关键信息,把握思路, 经常不按常规顺序阅读。有人看图说话,有人辨数识字。高手批判式阅读,一针见血,直指问题所在。实际上没有一篇论文是无懈可击的。新手要稳,老手要准,高手要狠。新手、老手、高手的代表人物分别是研究生、导师和审稿人,但认真钻研的研究生完全可以在3年中实现从新手到高手的嬗变。对自己有清醒的定位,才能选择正确的阅读方式。

    5. 矛盾:
    文献读的多了,脑子里塞满了信息。公说公有理,婆说婆有理,反而无所适从?为了解决这个问题,循证医学划分临床试验证据的等级;同理,我们看文献也要重视实验证据的强度。发现矛盾,是第一步;找出异同,是第二步;思考解决,是第三步。从相互矛盾的结论推导中发现矛盾的根源,此时如能跳出圈外,不走思维定势,从原始的科学问题出发,“无招胜有招”,真正是到达另外一种境界了。何必翻译外国人的综述谎称自己的综述?何必重复别人做过的实验谎称自己的思路?