gendict(1): Skillnad mellan sidversioner

Från Wiki.linux.se
Hoppa till navigering Hoppa till sök
(Skapade sidan med '= gendict(1) = == NAMN == '''gendict''' – kompilera en ordlista till ett ICU-strängträd (trie) == SYNOPS == '''gendict''' [ '''--uchars''' | '''--bytes --transform''' ''omvandling'' ]      [ '''-h''', '''-?''', '''--help''' ]      [ '''-V''', '''--version''' ]      [ '''-c''', '''--copyright''' ]      [ '''-v''', '''--verbose''' ]      [ '''-i''', '''--icudatadir''' ''katalog'' ]      ''indatafi...')
 
(Ingen skillnad)

Nuvarande version från 31 mars 2025 kl. 07.54

gendict(1)

NAMN

gendict – kompilera en ordlista till ett ICU-strängträd (trie)

SYNOPS

gendict [ --uchars | --bytes --transform omvandling ]      [ -h, -?, --help ]      [ -V, --version ]      [ -c, --copyright ]      [ -v, --verbose ]      [ -i, --icudatadir katalog ]      indatafil utdatafil

BESKRIVNING

gendict läser en ordlista från indatafil och skapar en strängträd-fil (trie). Denna datafil får normalt filtillägget .dict.

Ord börjar vid början av en rad och avslutas vid första blanktecknet. Rader som börjar med blanktecken ignoreras.

FLAGGOR

-h, -?, --help   Visa hjälp och avsluta.

-V, --version   Visa versionsnummer och avsluta.

-c, --copyright   Lägg till standardupphovsrättstext från ICU i utdatafilen.

-v, --verbose   Visa extra information under körning.

-i, --icudatadir katalog   Sök efter nödvändiga ICU-datafiler i angiven katalog.   Till exempel kräver vissa installationer av ICU filen pnames.icu.   Standardkatalogen anges av miljövariabeln ICU_DATA.

--uchars   Sätt utdatans trie-typ till UChar. Kan inte kombineras med --bytes.

--bytes   Sätt utdatans trie-typ till Byte. Kan inte kombineras med --uchars.

--transform omvandling   Använd omvandlingstyp. Måste anges tillsammans med --bytes.   Stödda omvandlingar: offset-<hexvärde> – subtraherar en offset från alla tecken.   Denna omvandling mappar också U+200D till 0xFF och U+200C till 0xFE för språkkompatibilitet.   Omvandlingen måste producera bytevärden mellan 0x00 och 0xFF för icke-värdetecken i indatafilen.

indatafil   Filen som innehåller ordlistan att läsa in.

utdatafil   Filen där det kompilerade lexikonet skrivs ut.

VARNINGAR

indatafil antas vara kodad i UTF-8. Heltal i filen ska bestå av ASCII-siffror och kan anges som hex (med prefix 0x) eller som decimaltal. Antingen --bytes eller --uchars måste anges.

MILJÖVARIABLER

ICU_DATA   Anger sökvägen till ICU:s datakatalog. Standard är ${prefix}/share/icu/76.0.1/.   Vissa ICU-verktyg kräver att sökvägen avslutas med ett snedstreck.

FÖRFATTARE

Maxime Serrano

VERSION

1.0

UPPHOVSRÄTT

Copyright © 2012 International Business Machines Corporation och andra.

SE ÄVEN

http://www.icu-project.org/userguide/boundaryAnalysis.html

COLOPHON

Denna manual är en del av projektet ICU (International Components for Unicode). Mer information finns på <http://site.icu-project.org/home>. Felrapporter för denna manualsida skickas till <http://site.icu-project.org/bugs>.

Sidan hämtades från projektets Git-repository <https://github.com/unicode-org/icu> den 2 februari 2025 (senaste commit då var 31 januari 2025). För återgivningsfel i denna HTML-version, eller förbättringar, kontakta: man-pages@man7.org

Sidslut

Orginalhemsidan på Engelska https://man7.org/linux/man-pages/man1/gendict.1.html


Det här är en maskinöversättning av Linux man sidor till svenska. Om du hittar fel är vi tacksamma om du rapporterar dem via formuläret som finns på https://www.linux.se/kontaka-linux-se/

Tack till Datorhjälp Bromma som har sponsrat Linux.se med webbhotell.