这2天在搭建wikipedia的镜像,依然是试验备用机器。 1.当然是先去wikimedia下载最新的中文包。英文就算了,太大。中文比较合适,大小300M不到。 http://download.wikimedia.org/zhwiki/latest/zhwiki-latest-pages-articles.xml.bz2 一般选择 pages-articles.xml 下载就行了。它是bz2文件,用bzip2 -d “文件名” 打开,最后会得到个 “.xml”。 其它有兴趣的自己看 http://download.…