Thursday, 7 June 2007

dictionary evening

I have spent the evening searching interesting things in the wikipedia:

davy Jone's locker
golden rectangle
Lagrange's four-square theorem

Fermat's theorem on sums of two squares
Gaus clock calculators and the encrptation with prime numbers
tajima D (found also in a blog for evolgen and added to the google-reader)



Saturday, 2 June 2007

¿¿ARAÑA DE PLASTICO??

Cuando vi la foto de esta araña pensé que era de 'coña' tuve que ir al platnick y buscar en internet si de verdad existía. Pues sí! existe y vive en Laos, suerte que no en todos laos, por que son unos dos centímetros sin patas y si una argiope puede asustar yo creo que ésta mas ;-).




Fiche insecte : Platythomisus octomaculatus photo JEDQ -


ref : 15210

Platythomisus octomaculatus (?) photographie taille réelle : 500x375 142,8 Ko

Auteur de la photo : JEDQ
Ordre : Araneae
Famille : Thomisidae
Genre espèce :
Platythomisus octomaculatus (?)
Pays : Laos
Commentaires :
Pas de commentaires
taille : 18 mm sans les pattes
Commune : Réserve Naturelle Nationale du Xe Pian
Département : 00
Déterminateur : Greg/S. Déjean
Date de la détermination : novembre 2006
Date de la prise de vue : 25/1/2004

La détermination a été jugée très probable par un administrateur de la galerie

Friday, 1 June 2007

dumping wikipedia

Finally I have found how to dump all my mediawiki pages and process them with a perl script!!
(you can even do that with the wikipedia if you will)

After dumping all with


./maintenance/dumpBackup.ph


I have found a CPAN module for process the XML file:

http://en.wikipedia.org/wiki/Wikipedia:Computer_help_desk/ParseMediaWikiDump

The latest version of Parse::MediaWikiDump is available at http://www.cpan.org/modules/by-authors/id/T/TR/TRIDDLE/

Examples

Find uncategorized articles in the main name space


#!/usr/bin/perl -w

use strict;
use Parse::MediaWikiDump;

my $file = shift(@ARGV) or die "must specify a Mediawiki dump file";
my $pages = Parse::MediaWikiDump::Pages->new($file);
my $page;

while(defined($page = $pages->page)) {
#main namespace only
next unless $page->namespace eq '';

print $page->title, "\n" unless defined($page->categories);