Base de données
Généralité
La base de données est générée en langage Perl qui doit être capable d'adresser la base Sqlite.
La base si elle est générée sur un poste Linux, n'a pas besoin d'être générée sur Mac ou Windows sachant qu'elle est identique dans les trois environnements.
Par contre sa génération prend plusieurs jours.
Le répertoire fabricationbase comprend trois répertoires :
- bin : contient getfile.pl et makebase.pl
- Datas : contient un répertoire volatiles où seront rangés les données récupérées du net, le fichier Pays.txt et villesberligue.txt sont statiques et font partis du répertoire SVN
- perlmodule : contient le module de phonémisation écrit en perl
Préparation de l'environnement
Installation des modules
Il faudra installer soit par votre installateur de programme soit par une commande
perl -MCPAN -e shell
install LWP::Simple
install LWP::Simple
LWP::Simple étant donné à titre d'exemple.
Il faut donc s'assurer qu'en plus d'un interpréteur Perl on dispose des modules suivants :
- LWP::Simple
- Archive::Extract
- DBI::Sqlite
- Term::ProgressBar
- Unicode::String
- Benchmarck
- Linga::FR Phonemise est fourni dans le svn et doit être installé.
Il faut également que soit installé à partir de la version 1.3 le logiciel verbiste avec la commande french-conjugator
Lancement de getfile.pl
Avant lde lancer getfile.pl, il faut se connecter à chacune des URL données en début de fichier et vérifier qu'il n'existe pas de nouvelle version, dans quel cas, il faut mettre à jour le fichier getfile.pl
Une fois ces variables mises à jour, getfile.pl va aller chercher toutes les données et les ranger dans le répertoire volatile.
Lancement de makebase.pl
Une fois les fichiers récupérés par getfile.pl, on peut lancer makebase.pl qui tourne sur un dual core pendant plusieurs journées pour générer le fichier dicorime-test.db
Une fois achevé, on pourra copier dicorime-test.db dans le répertoire ../base après l'avoir testé avec le logiciel dicorime.
Il est conseillé sous système Unix de générer la base au moyen d'une commande nice permettant d'affecter au processus un priorité basse permettant d'utiliser son système
nice -n 19 makebase.pl