Tản Mạn Về Unicode chữ Quốc Ngữ

greenspun.com : LUSENET : Vietnamese American Society : One Thread

Tản Mạn Về Unicode chữ Quốc Ngữ

GS Huỳnh Chiếu Đẳng
8 thng 10 năm 2004

Ti nhận được nhiều email hỏi về chuyện bỏ dấu tiếng Việt trong computer, thay v trả lời ring từng người ti xin được trả lời chung như sau. Ti khng vo chi tiết nhiều, như vậy bi di qu, nhưng đưa cho qi bạn niệm, từ đ qi bạn tự giải quyết theo nhu cầu. . Nếu qu bạn muốn thực hnh đnh v đọc chữ c dấu xin đọc bi kế tiếp tn l Unicode v email chữ quốc ngữ.

Xin qi bạn nh nghề tha lỗi, ti khng dng chữ nghĩa nh trường để trnh by m dng ngn bnh thường hng ngy cho b con dể hiểu. Ti nghĩ tới đu viết tới đ, c khi luợm thuộm cũng xin bỏ qua lun. Vậy mời b con nh nghề lnh mặt gim cht xu nghe.

1. Quốc ngữ l chữ nước ta c ci kh cho người dng computer l bỏ dấu. Mấy tay lm software ty phương khng thấy được điều nầy vo buổi ban đầu, do vậy cc nước viết chữ kiểu con trng b , kiểu g bới như Trung Hoa, Nhật Bản, Ấn Độ... đều kẹt cứng.

2. Từ ngy c ci IBM XT, cch nay hơn 20 chăm th chuyện đnh dấu tiếng Việt trn computer l đ được mơ tưởng đến. C lẽ người đầu tin tạo ra cch bỏ dấu trn PC l anh Hồ Thnh Việt (người sng lập ra cng ty VNI, tiếc l anh vừa mn phần khi cn kh trẻ). Lc đ display CGA (CGA khng phải VGA đu) khng c font dấu tiếng Việt, nn VNI phải chế ra ci board nhỏ gắn thm vo để display được dấu, v ti cũng l một trong những người đầu tin mua board nầy (lc đ mắc lắm qi bạn ơi).

3. C board đnh display được dấu nhưng muốn in ra giấy c dấu th phải c laser printer, đu mua nổi, mắc lắm, chừng $500 tới $1000. Dng software VNI (lc đ chạy trong DOS) để đnh dấu.

4. Sau nầy khi Windows NT, Windows 2000 (hay XP qun mất) ra đời, c tay VN no đ lm việc cho hng Microsoft nhy theo VNI đem bỏ vo Windows. Anh Việt kin Microsoft về chuyện vi phạm tc quyền. Microsoft bảo đ l public domain. Anh hỏi ti thấy sao, ti ni "chu chấu đ voi" kiện chơi chớ thắng Microsoft sao nỗi.

5. Nhưng m anh Việt thắng Microsoft đ qi bạn ơi, hn chớ khng phải hay. L do l lc đ chnh phủ thấy Microsoft mạnh qu, nn muốn tề bớt thế lực đi. Nhiều tiểu bang cng nộp đơn kiện Microsoft (chuyện nầy ni di nất th giờ qi bằng hữu)... Để tập trung vo việc đi ph với nh nước Mỹ, Microsoft "x bm bum" cho anh Việt một số tiền nhỏ (nhỏ với Microsoft, nhưng lớn, kh lớn, rất lớn đối với VNI). Tiếc thay được tiền khng bao lu th anh Việt mất. Mấy hng nầy cũng để tường niệm v ghi ơn người đ c cng gip phổ biến chữ quốc ngữ trong truyền thng, in ấn v Internet

6. Sau khi anh Việt lm ra VNI th ti thấy c nhiều người programmer khc lm ra cc software bỏ dấu khc như VNU, như VPS, VISCII, VIQR rồi Vietware-X, Vietware-F sau nầy Bch Khoa Hồ Ch Minh 1, Bch Khoa Hồ Ch Minh 2 rồi by giờ trong nước sang qua VietKeys. Nn ni thm, VIQR l kiểu đnh chữ bỏ dấu của sinh vin Việt (tại Mỹ) 15 năm trước khi chat với nhau qua modem Tm tnh với đo với kp m viết khng bỏ dấu dễ giận nhau lắm, lc đ muốn bỏ dấu v truyền đi qua modem trt lọt l phải dng VIQR, n chĩ sữ dụng Low ASCII, giống như text file tiếng Mỹ..

7. Tnh tới nay c chừng 20 kiểu bỏ dấu tiếng Việt trn computer PC. Kiểu bỏ dấu thng dụng mươi năm trườc l VNI. VNI dng cch đnh chữ c dấu trn my đnh chữ trong nước khoảng 1950 đến sau 1975. Ngy nay dầu dng keybpoard driver no đi nửa, thường kiểu bỏ dấu cũng như hồi thời nẫm, tức l số 1 l dấu sắc, số 2 l dấu quyền, số 3 l dấu hỏi. Đy khng phải l bản quyền của VNI m l kiều bỏ dấu theo my đnh chữ (thợ VN thm thắc vo ở thời nẫm).

8. Hiện ti thch xi nhất l software VPSkeys của Hội Chuyn Gia Việt Nam , kế đ l VietUni. L do VPSKeys được tạo ra cho tất cả người Việt no cần đến v biếu khng. Kế nửa l dễ dng, c macro rất mạnh, giống như VNI, c khi mạnh hơnn lại khng tự động thay đổi dấu ngoi muốn của người xữ dụng.

9. Tất cả những software dng bỏ dấu được coi như l keyboard driver, nghĩa l khi run n rồi th qi bạn đnh chữ a rồi số 1 tiếp liền theo, thi qu bạn được chữ .Dầu l dng VNI, VPSkeys, ViệtKeys, VietUni hay g đi nửa, qi bạn vẫn set cho n bỏ dấu kiểu nầy đều được hết. Nhớ mỗi lần chỉ được load (run) một keyboard driver m thi. Nếu qi bạn load VNI (tự động khi mở my computer) rồi lại install thm VPSKeys (cũng tự động khi mở my) th chắc chắn keyboard của qi bạn rối loạn, đnh chữ chi cũng sai hết.

10. Khi đ load (run) keyboard driver rồi th nhớ hết sứ cẩn thận khi dng password. Th dụ password của qi bạn l ba1lap1, c keyboard driver sẽ trở thnh blp (nếu dng VNI). Lần sau khng c keyboard driver đang run th PASSWORD của qi bạn sẽ khng được chấp nhận đu, v sai.

11. Khi run keyboard driver rồi th qi bạn c thể bỏ dấu bất cứ trong wordprocessing no như notepad, như wordpad, như MicrosoftWord, như Juno mail, Outlook, Yahoo mail, Hotmail mail.Đnh trực tiếp khng phải l copy v paste vo đu. Trừ Outlook dng MsWord lm word processing, cn cc email software khc đều rất yếu nếu dng edit email kh di, đề nghị qu vị dng MsWord đnh email, sau đ copy rồi paste vo v gởi đi.

12. Xin qu vị chớ lầm l dng VNI chĩ đnh được encoding VNI m thi, n c thể đnh được bi encoding theo mọi kiểu thng dụng. Th dụ dng VNI c thể đnh trực tiếp thnh bi Unicode. Cũng như vậy, qu vị dng VPS (cho download free) cũng đnh được bi encoding theo VNI, theo VPS, theo Unicode tuỳ qu vị set.

Th dụ dng VPSkeys m đnh bi ra l VNI, hay ngược lại dng keyboard driver l VNI vẫn đnh được bi encoding theo Unicode. Xin lưu l nếu qu vị chỉ được load (run) một keyboard driver thi, nếu cng lc run VPS lẫn VNI th khng thể bỏ dấu được, keyboard rối loạn.14. Cc font kể trn l của Windows, my PC no cũng c, nn bi gởi đi ai cũng đọc được. Nếu qi bạn dng font VPS hay VNI để đnh chữ th c khi bi gởi đi th c khi người nhận email khng đọc được. L do l c nhiều my computer chưa c những font nầy.

15. Qi bạn c thể dng font chữ lạ lng m my người nhận mail khng hề biết tới để gởi mail. Muốn vậy khi save dưới dạng DOC qi bạn nhớ embeded thm vo đ font chữ qi bạn dng. My người nhận đọc v in khng hề gặp trở ngại. Về cch gởi km theo font trong MsWord xin đọc bi Unicode v email chữ quốc ngữ.

16. Nhiều khi qi bạn đnh Unicode, đọc v in ra đng trn my mnh, nhưng gởi đi người nhận thấy ton l chữ bu, đ khng phải l lỗi ở qu bạn, hay lỗi ở người nhận email, m v hai ci software email gởi v nhận khng cộng tc với nhau. Th dụ Juno mail gởi bi Unicode cho Yahoo hay OAL mail thường hay trục trặcTrong trường hợp nầy qi bạn nn dng Microsoft Word m đnh mail, save dưới dạng DOC, attached theo l xong.

17. Ring ti c cch gởi mail chữ c dấu m bất cứ bạn no dng bất cứ hệ điều hnh no như Mac, như Linux, như Windows 75, Windows 3.1, ngay như dng DOS trơn vẫn dọc được như thường. Lu lu qi bạn c nhận từ ti một email như vậy.

18. Microsoft Windows thao tng thế giới, nn nhiều quốc gia, nhất l vng Đng Nam , c khuynh hướng dng operating system bỏ ngỏ l Linux để trnh sự khống chế của Windows. Ti thấy điều nầy rất hay. Linux free v bỏ ngỏ l diều thật đng qi. Ngy nay người ta thch dng Unicode để thay dần dần cc kiểu encode chữ Việt khc, ngay cả trong nước cũng bỏ BKHCM m qua Unicode rồi.

19. Cuối cng nhưng chưa hết, l hiện nay qi bạn vo tiệm mua ci PC chạy Windows Install sẳn Windows XP, qi bạn tưởng ci Windows XP Home Edition nầy l free. Khng đu Microsoft tnh qi vị trn $100 đ, cộng vo gi my. Thường khi một bộ PC (chưa c monitor) kh tốt bn ở Frys Electronic l $179 load operating system l Linux. (my kh nhanh chạy tới speed 1.6 GHtz). Nếu một my y như vậy load Windows th gi sẽ trn $300. Cc bạn cứ mua my Linux đi, đem về format hard drive rồi Install lại Windows XP chm m xi. Muốn chm software th vo cc webpage ngoại quốc như của người Trung Hoa v của cc quốc gia Lin S củ. Software no cũng c cả. Cứ vo lấy về xi. Ngay như trước ngy Windows XP chnh thức pht hnh, ti đ xi Beta version cả 6 thng trước.

Đọc rồi bỏ nghe qi bằng hữu, đứng ni ti xu nghe. Cc hng software muốn kiện th nn kiện đằng gốc tức l chũ nhn cc webpage hay cc quốc gia chứa cc site nầy.

20. Cc chữ sai chnh tả hay sai v l l do keyboard driver dốt khng phải tại ti dốt đu. (m dốt thật, ti qun nhiều chữ khng biết bỏ dấu hỏi hay ng).-- Kẻ Sĩ Bắc H (ke_si_bac_ha@yahoo.com), October 13, 2004

Answers

Chu giao su Chieu-dang va chu Ke-si, cac chu lam chuyen hoi-nach !

Anh dang design kieu chu Viet deo can bo-dau , cac chu nen vinh-danh anh ! Bo-khi 80 trieu nguoi VN doc duoc hay doan duoc la anh vui roi,dua nao doan khong duoc thi la con cho an cut, who care ?

-- chi-bua (mingo@netscape.net), October 13, 2004.


Thằng ch ba chỉ l đứa 'tự vẽ ba' đeo !!! ci chuyện khng bỏ dấu cả bao nhiu người Việt tại hải ngoại ny đ lm cả mấy chục năm nay trước khi c cc loại fonts được tạo ra do VPS, VNI-times, Unicode,v.v...

Cj ba l thằng cướp cạn, đch c g l mới mẻ khi dng chữ Việt khng bỏ dấu cả !? Thế m la tong ln l 'new idea' với design ! Nghe pht thi !!!

,...n ch ba sao khng về VN m tranh ci quyền design cầu c tra với CS miền bắc đi cha nụi, hốt khối tiền để lm 'trade mark' ? Hằng ngy c triệu ...triệu người dn đang lm cng tc ị....ln ci 'trade mark' của ch ba !!!

Ch ba l 'ch ga' chỉ viết giữ phần 'lương kh'.

-- Độc Ẩm Cũng Th !? (lairaibasoi@yahoo.com), October 13, 2004.


Hey KSBH, cái nhà anh cũng thuộc loại cao thủ vỏ lâm kỳ cựu trong giới giang hồ vi tính. Trong này tôi có biết anh CTHN cũng có nhiều năm lăn lộn với máy PC, từ thời tiền internet, thời của BBS, nhiều hôm thức trắng đêm sưu tầm ba cái nhu liệu khi chạy thì máy chết cứng, chỉ có nước tắt máy. Tôi vẩn còn nhớ có thời thức sáng đêm ngồi edit mấy cái font để in được chử Việt trên máy laser, với cái program Fontographer thì phải. Trong DOS, tôi có viết một cái program để poke cái character chữ Việt vào trong phần video của bộ nhớ memory, việc này chỉ để học hỏi thôi, vì thời đó tài liệu về cách cấu tạo chữ Việt rất hiếm.

Nói về các nhu liệu đánh chữ Việt VNI, VPS, UniKey ... mỗi cái có một problem riêng biệt. Khi có thì giờ tôi sẽ viết một bài về vấn đề này. VPS có một cái khó chịu là khi copy một đoạn nào (vào trong clipboard) để paste khi cần tới, lở đánh một dấu Việt thì clipboard bị xoá đi vì VPS giử những chữ vừa đánh vào khu memory này. Đó là chưa nói đến sự compatible với mấy cái software khác như Photoshop, CorelDraw, v.v... Tôi hiện chỉ xử dụng VCatKey (anh ToSuCS có post cái link trong forum này), không bị problem với clipboard, compatible với hầu hết các software tôi đang dùng, không cần phải install, chỉ có một cái khó chịu nho nhỏ là không dùng keyboard turn off được, phải click lên taskbar để turn off nó.

Tôi cũng muốn nói thêm là, cũng là người xử dụng VNI trong thế hệ version đầu tiên, tôi quen dùng kiểu đánh dấu bằng các con số. Kiểu đánh này quá cực, tay phải luôn dời bỏ vị trí để nhấn vào những con số, nên có rất nhiều người không thích đánh chữ Việt. Dạo sau này tôi học lối đánh Telex mà các cụ ngày xưa trong nghành bưu điện hay dùng, nghĩa là dùng những chữ W, R, S, F, J, X thay cho các dấu, ví dụ: ă = aw; ư = uw; ơ = ow; đ = dd; sắc = s ; huyền = f; hỏi = r; ngã = x; nặng = j. Phương pháp này ngón tay ít bị nhầm chổ, nhưng có cái bất tiện khác là khi đánh chữ Tây Mỹ thì phải tắt nhu liệu tiếng Việt, hoặc phải đánh double (too trở thành tô, đánh tooo thì thành too).

Vài lời góp ý thêm với anh KSBH. Bài viết của anh khá đầy đủ, có ích cho những người chưa rành chữ Việt và Unicode.

-- _Đỉnh Ngu Trí Tệ CS (NgàyTànCS@KhátMáu.hn.vn), October 13, 2004.

***

Trong Internet, Unicode chỉ OK với cc Server no cho php nhận Unicode v người đọc th cần ci Mail Server/reader chịu nhận Unicode, AOL của ti từ AOL-8 về trước th O OK nhưng AOL-9 nay th OK mỗi khi ti Email từ AOL mail server

Cũng giống như post JPEG ln V, ngy xưa dng imgr th OK bỗng dưng sau ny phả dng tabel command của HTML v như anh VAS đ ni, USENET server của VAS bỏ

ci priviledge no đ nn O dng imgr được nữa

Một người nhn 1 ngy nắng trời xanh th bảo l đẹp yu đời, cn người lao động thợ hồ th bảo l lại thm 1 ngy nắng chy da :)))))

-- Only Chibua my son is still bitching his own Vietnamese ABC :) (ChuyenTriHOINACH@aol.com), October 13, 2004.


lairai tui thấy hầu hết người Việt hay sai dấu chnh tả l dấu hỏi v ng. Phần lớn l do cch ph1t m m thi !!! Th dụ : Tnh Cũ (mới, cũ ...) nhưng nếu qu vị no m đọc l Tnh Củ th đ trật rồi, cho nn viết trật l điều tự nhiện, v Củ đy l củ khoai, củ thu biu, củ cải,v.v...

Chưa chắc người miền bắc đ pht m đng, Lairai tui c một số bạn người bắc ở vng no đ gần Nam Định pht m dấu hỏi ra 'dấu hi' nghe hơi ngộ nhưng đ l thổ m địa phương ! MỘt điều nữa l khi tui dng bộ g VNI (bỏ dấu nằng số), trong khi đnh nhanh, hay g nhầm số 3 (dấu hỏi) v 4 (dấu ng). V i điều gp thm kiến cho điểm 20 của KSBH hay ng Gs Huỳnh Chiếu Đẳng !

-- Độc Ẩm Cũng Th !? (lairaibasoi@yahoo.com), October 13, 2004.Thu kieu chu

UNICODE

Trời chiều bảng lảng bóng hoàng hôn

Tiếng ốc xa đưa vẳng trống dồn

VNI-WIN

Trôøi chieàu baûng laûng boùng hoaøng hoân

Tieáng oác xa ñöa vaúng troáng doàn

VISCII

Tr¶i chi«u bäng läng bóng hoàng hôn

Tiªng ¯c xa ðßa vÆng tr¯ng d°n

VPS-Win Tr©i chiŠu bäng läng bóng hoàng hôn

Ti‰ng Óc xa ÇÜa v£ng trÓng dÒn-- trbapi (trbapi@yahoo.de), October 29, 2004.


Thu UNICODE so Trời chiều bảng lảng bng hong hn

Tiếng ốc xa đưa vẳng trống dồn-- trbapi (trbapi@yahoo.de), October 29, 2004.


Warum funktioniert es nicht wie gewuenscht ?

Trời chiều bảng lảng bóng hoàng hôn

Tiếng ốc xa đưa vẳng trống dồn

Gác mái ngư ông về viễn phố

Gỏ sừng mục tử lại cô thôn

Ngàn mai gió cuốn chim bay mỏi

Dặm liễu xương sa khách bước dồn

Kẻ chốn chương đài, người lữ thứ < p> Lấy ai mà kể nỗi hàn ôn-- trbapi (trbapi@yahoo.de), November 01, 2004.


Trời chiều bảng lảng bóng hoàng hôn Tiếng ốc xa đưa vẳng trống dồn Gác mái ngư ông về viễn phố Gỏ sừng mục tử lại cô thôn Ngàn mai gió cuốn chim bay mỏi Dặm liễu xương sa khách bước dồn Kẻ chốn chương đài, người lữ thứ Lấy ai mà kể nỗi hàn ôn

-- trbapi (trbapi@yahoo.de), November 01, 2004.

Moderation questions? read the FAQ