Kodowanie polskich liter – Wytyczne Polskiej Społeczności Internetu

Wytyczne Polskiej Społeczności Internetu 1996-1997

Polska Społeczność Internetu – Polish Internet Society
Do Wszystkich Kogo dotyczy
Polska Społeczność Internetu, mając na uwadze przezwyciężenie głównych niedogodności w przesyłaniu tekstów z polskimi znakami diakrycznymi, w celu poprawy funkcjonalności i operacyjności Internetu zaleca następujace trzy cele użytkownikom Internetu oraz producentom programów komunikacyjnych:

Cel główny: Wprowadzenie przemapowywania zestawów znaków dla celów komunikacji z zestawem znaków ISO 10464 do wszystkich systemów operacyjnych i/lub do programów użytkowych produkowanych dla oraz używanych na polskim rynku do końca roku 2000.

I rozwiązanie przejściowe: Zastosowanie, przez agentów użytkownika i dostawców oprogramowania komunikacyjnego, zestawu znaków wg PN-93 T-42118 (która jest rozwinięciem standardu ISO 8859-2) do końca roku 1998, a zestawu znaków ISO 10646 do końca roku 2000. W szczególności oznacza to:

  • stosowanie w tekstach z polskimi znakami diakrytycznymi, przesyłanych przez Internet w poczcie elektronicznej i newsach, standardu MIME z zestawem znaków ISO 8859-2 (RFC1345) oraz ISO 10646
  • używanie na serwerach WWW i gopher zawierających teksty w języku polskim kodowania w standardzie ISO 8859-2 oraz ISO 10646

II cel przejściowy: Zastąpienie oprogramowania emitującego do sieci komunikacyjnej polskie znaki diaktryczne kodowane niezgodnie z PN – oprogramowaniem kodującym zgodnie z ISO 8859-2 do końca roku 2000 oraz ISO 10646 do końca roku 2002.

Wyjaśnienie

Polska Społecznośc Internetu przyłącza się do społeczności międzynarodowej w chwili gdy podstawowe sposoby kodowania polskich znaków zostały międzynarodowo ustalone ale znaczna część dostarczanego na rynek oprogramowania nie spełnia ustalonych
wymagań. PSI dostrzega silną potrzebę włączenia się swoich członków w prace rozwojowe nad opracowaniem przyszłych narzędzi komunikacji wymaganych przez polski rynek. W szczególnosci pełna wsteczna renumeracja znaczenia litery na jej postaci cyfrowe musi być zapewniona. Obecnie jest wiele postaci cyfrowych poszczególnych liter zależnie od konkurencyjności poszczególnych dostawców oprogramowania i sprzętu.
Dopóki nie zostanie powszechnie zastosowany standard ISO 10464 powyższa sytucja bedzie hamować poprawę komunikacji zarówno lokalnie jak i międzynarodowo.

Dostrzegamy, że jednolite standardy sprzętowe są trudniejsze do negocjowania i wprowadzenia ze względu na dłuższy czas zwrotu dla sprzętu. Jednakże w przypadku oprogramowania, jego głównš cechš jest wymienialność i konfiguratywność. Dlatego stosowanie w tym przypadku jednolitych międzynarodowych standardów jest niezbędne w celu kompensacji niepełnej kompatybilności sprzętu.

W nowych, wzrastających gospodarkach (Polski PNB per capita jest ponad 10 razy niższy niż w przodujacych gospodarkach świata) jest także niekiedy celowe przyjęcie tańszych rozwiązań pośredniczących, które mogą skutecznie kompensować brak pełnej zgodności oprogramowania ze standardami oraz brak zbyt kosztownego częstego uaktualniania
tego oprogramowania. Do takich zalicza sie używanie konwencji EDI do przesyłania tekstów z polskimi znakami diakrycznymi; w przypadku e-mail w postaci plików dołączonych (załączników Word, WP) oraz w przypadku WWW w postaci włączonych plików w formacie PDF.

Docelowym rozwiązaniem jest jednak umieszczanie w standardowy sposób w nagłowkach przesyłanych dokumentów głównych informacji o użytym zestawie znaków i typie przesyłki. Tylko bowiem takie postępowanie daje odbiorcy szanse na automatyczne przekodowanie otrzymanago dokumentu do lokalnego standardu wyświetlania na wybór
najlepszej aplikacji do jej obejrzenia.

Warszawa-Sztokholm-Kraków 1996-1998

Ref:

1.CEN/TC304/PT01.User requirements study and programming for standardization in the field of Character Set Technology or: Standards for providing multi-cultural functionality in IT-systems,
2.RFC 1521; MIME (Multipurpose Internet Mail Extensions) Part One: Mechanisms for Specifying and Describing the Format of Internet Message Bodies,
3.STD 11, RFC 822; STANDARD FOR THE FORMAT OF ARPA INTERNET TEXT  MESSAGES,
4.Jürgen Bettels and F. Avery Bishop UNICODE: A UNIVERSAL CHARACTER CODE,
5.Draf-ietf-http-i18n-07; Hypertext Transfer Protocol — HTTP/1.1,
6.RFC 1945. Informational, Hypertext Transfer Protocol — HTTP/1.0,
7.Draft-ietf-html-i18n-05.Internationalization of the Hypertext Markup Language