Ĉinaj literoj en komputil-programado

La japana lingvo uzas kanaojn (fonetika skribo) kaj ĉinajn literojn (ideografia skribo). La kanaoj konsistas el ĉ. cent signoj kaj la ĉinaj literoj konsistas el pli ol ses mil signoj (lastatempe pli ol dek mil). Kiam ni traktas la japanan tekston per komputilo, ofte ni spertas problemon, kiun kaŭzis kodigo de ĉinaj literoj. Ekzistas pluraj normoj por kodigo. Komputiloj estas ekipitaj per malsamaj normoj laŭ mastrumaj sistemoj (OS). Ju pli nova estas mastruma sistemo, des pli ampleksan aron de ĉinaj literoj ĝi povas trakti. Sed programistoj devas funkciigi sian programon sur diversaj komputiloj kaj renkontas multajn problemojn.
Hodiaŭ mi faris programeton per Perl, kiu traktas simplan tekston de la japana lingvo. Traktante donitan tekston, la programo eligis erarmesaĝon, indikante lininumerojn en la programo kaj la donita teksto. Unue mi suspektis mian programeton, sed ĝi estas tre simpla por kaŭzi ian eraron. Sekve mi suspektis la donitan tekston, sed mi ne vidis ian malbonaĵon ĉirkaŭ la indikita linio.
Post pluraj provoj kaj eraroj mi fine trovis, ke en la teksto miksiĝis unu ĉina litero el la tria nivelo, kiu estas traktebla per plej novaj sistemoj. Kiam mi forigis la ĉinan literon el la teksto, mia programeto senprobleme funkciis.

Respondi

Retpoŝtadreso ne estos publikigita. Devigaj kampoj estas markitaj *