Package outils

Class HyphenationToolkit

java.lang.Object
outils.HyphenationToolkit

public class HyphenationToolkit extends Object
Classe permettant de mettre en place et de configurer la coupure littéraire à partir de dictionnaires de patterns de coupure (basé sur l'algo de Liang)
  • Constructor Details

    • HyphenationToolkit

      public HyphenationToolkit()
  • Method Details

    • fabriqueDico

      public static boolean fabriqueDico(String dico, String dicoNat, String encodage)
      Construit le dictionnaire de coupure (en xsl) à partir d'un dictionnaire existant au format .dic (Tex)

      Adapte les patterns pour les expressions régulières en xsl:

      • remplacement des . du début par ^
      • remplacement des . de fin par $
      • doublement des apostrophes

      Fabrique le fichier hyphenation.xsl contenant les patterns de coupure

      Parameters:
      dico - l'adresse du dictionnaire existant au format .dic
      dicoNat - adresse de la feuille xsl de coupure
      encodage - encodage du dictionnaire dico
      Returns:
      true si le dictionnaire a été créé correctement, false sinon
      Since:
      2.0
    • fabriqueDicoNat

      public static boolean fabriqueDicoNat(String dico, String dicoNat, String encodage)
      Construit le dictionnaire de coupure de nat (en xsl) à partir d'un dictionnaire existant au format .dic (Tex)

      Adapte les patterns pour les expressions régulières en xsl:

      • remplacement des . du début par ^
      • remplacement des . de fin par $
      • doublement des apostrophes

      Fabrique le fichier hyphen.xsl contenant les patterns de coupure

      Parameters:
      dico - l'adresse du dictionnaire existant au format .dic
      dicoNat - adresse de la feuille xsl de coupure
      encodage - encodage du dictionnaire dico
      Returns:
      true si le dictionnaire a été créé correctement, false sinon
      Since:
      2.0
    • getRulesOrdered

      @Deprecated public static ArrayList<ArrayList<String>> getRulesOrdered(String dicoNat)
      Deprecated.
      a priori ne sert plus car le critère de longueur de règle ne sert pas dans les règles de coupures
      Renvoie une liste double contenant les règles de coupures de nat regroupées par longueur de règle

      La liste renvoyée contient des sous-listes dont les règles sont de même longueur pour chaque sous-liste

      Parameters:
      dicoNat - l'adresse du dictionnaire de coupure
      Returns:
      la double liste conteannt les règles de coupure
      Since:
      1.5
    • getRules

      public static ArrayList<String> getRules(String dico)
      Renvoie une liste contenant les règles de coupures de nat

      La liste renvoyée est ordonnée telle que dans le fichier de règle

      Adapte les patterns pour les expressions régulières en xsl:

      • remplacement des . du début par ^
      • remplacement des . de fin par $
      • doublement des apostrophes

      utilise l'encodage par défaut (encodageDefaut)SAUF si un encodage est précisé dans le fichier de règles

      Parameters:
      dico - l'adresse du dictionnaire utilisé, au format compatible avec l'algorithme de Liang(Tex)
      Returns:
      la liste contenant les règles de coupure
      Since:
      2.0
      See Also:
    • getRules

      public static ArrayList<String> getRules(String dico, String encodage)
      Renvoie une liste contenant les règles de coupures de nat

      La liste renvoyée est ordonnée telle que dans le fichier de règles.

      Adapte les patterns pour les expressions régulières en xsl:

      • remplacement des . du début par ^
      • remplacement des . de fin par $
      • doublement des apostrophes

      utilise l'encodage spécifié par encodage ou encodageDefaut si encodage vaut null SAUF si un encodage est précisé dans le fichier de règles à la première ligne

      Parameters:
      dico - l'adresse du dictionnaire utilisé, au format compatible avec l'algorithme de Liang(Tex)
      encodage - l'encodage du fichier de règle. Si null, utilisation de l'encodage par défaut (encodageDefaut)
      Returns:
      la liste contenant les règles de coupure
      Since:
      2.0
    • writeRules

      public static boolean writeRules(ArrayList<String> rules, String dico)
      Ecrit les règles contenus dans rules dans le fichier dico en utilisant l'encodage encodageDefaut.

      Les règles sont sous la forme de regex compatibles avec xsl. Cette fonction remplace:

      • les ^ du début par .
      • les $ de fin par .
      • les apostrophes doublées par une apostrophe.
      Parameters:
      rules - ArrayList des règles au format xsl-compatible
      dico - L'adresse du fichier dictionnaire
      Returns:
      true si l'écriture dans dico s'est bien déroulée
      Since:
      2.0
      See Also:
    • writeRules

      public static boolean writeRules(ArrayList<String> rules, String dico, String encodage)
      Ecrit les règles contenus dans rules dans le fichier dico en utilisant l'encodage encodage.

      Les règles sont sous la forme de regex compatibles avec xsl. Cette fonction remplace:

      • les ^ du début par .
      • les $ de fin par .
      • les apostrophes doublées par une apostrophe.
      Parameters:
      dico - ArrayList des règles au format xsl-compatible
      encodage - Encodage du fichier dico
      rules - L'adresse du fichier dictionnaire
      Returns:
      true si l'écriture dans dico s'est bien déroulée
      Since:
      2.0
    • main

      public static void main(String[] a)
      méthode de test
      Parameters:
      a - unused