Nuvarande version från 31 mars 2025 kl. 07.54

gendict(1)

NAMN

gendict – kompilera en ordlista till ett ICU-strängträd (trie)

SYNOPS

gendict [ --uchars | --bytes --transform omvandling ] [ -h, -?, --help ] [ -V, --version ] [ -c, --copyright ] [ -v, --verbose ] [ -i, --icudatadir katalog ] indatafil utdatafil

BESKRIVNING

gendict läser en ordlista från indatafil och skapar en strängträd-fil (trie). Denna datafil får normalt filtillägget .dict.

Ord börjar vid början av en rad och avslutas vid första blanktecknet. Rader som börjar med blanktecken ignoreras.

FLAGGOR

-h, -?, --help Visa hjälp och avsluta.

-V, --version Visa versionsnummer och avsluta.

-c, --copyright Lägg till standardupphovsrättstext från ICU i utdatafilen.

-v, --verbose Visa extra information under körning.

-i, --icudatadir katalog Sök efter nödvändiga ICU-datafiler i angiven katalog. Till exempel kräver vissa installationer av ICU filen pnames.icu. Standardkatalogen anges av miljövariabeln ICU_DATA.

--uchars Sätt utdatans trie-typ till UChar. Kan inte kombineras med --bytes.

--bytes Sätt utdatans trie-typ till Byte. Kan inte kombineras med --uchars.

--transform omvandling Använd omvandlingstyp. Måste anges tillsammans med --bytes. Stödda omvandlingar: offset-<hexvärde> – subtraherar en offset från alla tecken. Denna omvandling mappar också U+200D till 0xFF och U+200C till 0xFE för språkkompatibilitet. Omvandlingen måste producera bytevärden mellan 0x00 och 0xFF för icke-värdetecken i indatafilen.

indatafil Filen som innehåller ordlistan att läsa in.

utdatafil Filen där det kompilerade lexikonet skrivs ut.

VARNINGAR

indatafil antas vara kodad i UTF-8. Heltal i filen ska bestå av ASCII-siffror och kan anges som hex (med prefix 0x) eller som decimaltal. Antingen --bytes eller --uchars måste anges.

MILJÖVARIABLER

ICU_DATA Anger sökvägen till ICU:s datakatalog. Standard är ${prefix}/share/icu/76.0.1/. Vissa ICU-verktyg kräver att sökvägen avslutas med ett snedstreck.

FÖRFATTARE

Maxime Serrano

VERSION

1.0

UPPHOVSRÄTT

SE ÄVEN

http://www.icu-project.org/userguide/boundaryAnalysis.html

COLOPHON

Denna manual är en del av projektet ICU (International Components for Unicode). Mer information finns på <http://site.icu-project.org/home>. Felrapporter för denna manualsida skickas till <http://site.icu-project.org/bugs>.

Sidan hämtades från projektets Git-repository <https://github.com/unicode-org/icu> den 2 februari 2025 (senaste commit då var 31 januari 2025). För återgivningsfel i denna HTML-version, eller förbättringar, kontakta: man-pages@man7.org

Sidslut

Orginalhemsidan på Engelska https://man7.org/linux/man-pages/man1/gendict.1.html

Det här är en maskinöversättning av Linux man sidor till svenska. Om du hittar fel är vi tacksamma om du rapporterar dem via formuläret som finns på https://www.linux.se/kontaka-linux-se/

Tack till Datorhjälp Bromma som har sponsrat Linux.se med webbhotell.

gendict(1): Skillnad mellan sidversioner