gendict(1): Skillnad mellan sidversioner
Admin (diskussion | bidrag) (Skapade sidan med '= gendict(1) = == NAMN == '''gendict''' – kompilera en ordlista till ett ICU-strängträd (trie) == SYNOPS == '''gendict''' [ '''--uchars''' | '''--bytes --transform''' ''omvandling'' ] [ '''-h''', '''-?''', '''--help''' ] [ '''-V''', '''--version''' ] [ '''-c''', '''--copyright''' ] [ '''-v''', '''--verbose''' ] [ '''-i''', '''--icudatadir''' ''katalog'' ] ''indatafi...') |
(Ingen skillnad)
|
Nuvarande version från 31 mars 2025 kl. 07.54
gendict(1)
NAMN
gendict – kompilera en ordlista till ett ICU-strängträd (trie)
SYNOPS
gendict [ --uchars | --bytes --transform omvandling ] [ -h, -?, --help ] [ -V, --version ] [ -c, --copyright ] [ -v, --verbose ] [ -i, --icudatadir katalog ] indatafil utdatafil
BESKRIVNING
gendict läser en ordlista från indatafil och skapar en strängträd-fil (trie). Denna datafil får normalt filtillägget .dict.
Ord börjar vid början av en rad och avslutas vid första blanktecknet. Rader som börjar med blanktecken ignoreras.
FLAGGOR
-h, -?, --help Visa hjälp och avsluta.
-V, --version Visa versionsnummer och avsluta.
-c, --copyright Lägg till standardupphovsrättstext från ICU i utdatafilen.
-v, --verbose Visa extra information under körning.
-i, --icudatadir katalog Sök efter nödvändiga ICU-datafiler i angiven katalog. Till exempel kräver vissa installationer av ICU filen pnames.icu. Standardkatalogen anges av miljövariabeln ICU_DATA.
--uchars Sätt utdatans trie-typ till UChar. Kan inte kombineras med --bytes.
--bytes Sätt utdatans trie-typ till Byte. Kan inte kombineras med --uchars.
--transform omvandling Använd omvandlingstyp. Måste anges tillsammans med --bytes. Stödda omvandlingar: offset-<hexvärde> – subtraherar en offset från alla tecken. Denna omvandling mappar också U+200D till 0xFF och U+200C till 0xFE för språkkompatibilitet. Omvandlingen måste producera bytevärden mellan 0x00 och 0xFF för icke-värdetecken i indatafilen.
indatafil Filen som innehåller ordlistan att läsa in.
utdatafil Filen där det kompilerade lexikonet skrivs ut.
VARNINGAR
indatafil antas vara kodad i UTF-8. Heltal i filen ska bestå av ASCII-siffror och kan anges som hex (med prefix 0x) eller som decimaltal. Antingen --bytes eller --uchars måste anges.
MILJÖVARIABLER
ICU_DATA Anger sökvägen till ICU:s datakatalog. Standard är ${prefix}/share/icu/76.0.1/. Vissa ICU-verktyg kräver att sökvägen avslutas med ett snedstreck.
FÖRFATTARE
Maxime Serrano
VERSION
1.0
UPPHOVSRÄTT
Copyright © 2012 International Business Machines Corporation och andra.
SE ÄVEN
http://www.icu-project.org/userguide/boundaryAnalysis.html
COLOPHON
Denna manual är en del av projektet ICU (International Components for Unicode). Mer information finns på <http://site.icu-project.org/home>. Felrapporter för denna manualsida skickas till <http://site.icu-project.org/bugs>.
Sidan hämtades från projektets Git-repository <https://github.com/unicode-org/icu> den 2 februari 2025 (senaste commit då var 31 januari 2025). För återgivningsfel i denna HTML-version, eller förbättringar, kontakta: man-pages@man7.org
Sidslut
Orginalhemsidan på Engelska https://man7.org/linux/man-pages/man1/gendict.1.html
Det här är en maskinöversättning av Linux man sidor till svenska. Om du hittar fel är vi tacksamma om du rapporterar dem via formuläret som finns på
https://www.linux.se/kontaka-linux-se/
Tack till Datorhjälp Bromma som har sponsrat Linux.se med webbhotell.