blog: To USE or Not to USE for Lao Tham
thep.blogspot.com/2025/04/to-u…
ตอนต่อจาก blog ที่แล้ว ว่าด้วยฟอนต์อักษรธรรมลาว/อีสาน
blog: To USE or Not to USE for Lao Tham
thep.blogspot.com/2025/04/to-u…
ตอนต่อจาก blog ที่แล้ว ว่าด้วยฟอนต์อักษรธรรมลาว/อีสาน
thep
in reply to thep • • •จากแนวโน้มผู้สนใจอักษรธรรมที่ผ่านมา คิดว่าคนไทยหรือคนอีสานเองคงมีน้อยที่จะสนใจอ่าน blog นี้ (คนอ่านจารึกก็ขี้เกียจอ่านเรื่องเทคนิค คนที่เข้าใจเทคนิคก็ไม่สนใจอักษรธรรม) แต่ฝรั่งที่ทำงานเรื่องนี้อาจมาส่องผ่าน google translate เลยลองดูคำแปลเสียหน่อย
thep-blogspot-com.translate.go…
มันก็แปลใช้ได้เลยแหละ แม้จะมีมั่วบางจุด
เลยมานึกอีกที ทำไมผมไม่เขียนเป็นภาษาอังกฤษแต่แรกไปเลยวะ? เอาน่ะ มีเวลาค่อยว่ากัน ตัว blog ก็ทำหน้าที่ช่วยเป็นกระดาษทดระหว่างคิด ก็บรรลุจุดประสงค์แล้วน่ะ
Theppitak's blog: To USE or Not to USE for Lao Tham
thep-blogspot-com.translate.googป่าน
in reply to thep • • •สุดท้ายฟอนต์ก็ต้องเลี่ยง USE อยู่ดีเนาะครับ
ฝั่งฟอนต์ธรรมล้านนากับเขินเอง ก็เลี่ยงกันหมด ใช้ลำดับตามใจตัวเองด้วยเท่าที่เห็น
(ประมาณ
C
M(เฉพาะระโวง)?
Vp?
(M? <SKOT C>?) ซ้ำไปเรื่อยๆ
Vb?... (เช่น อ ล่าง กับ ไม้ออย รวมกัน)
Va?...
T?
Vs?
แล้วก็กลับไปซ้ำที่ M? )
(ลื้อในจีนบางส่วนใช้ผสมกับ PUA เลย เพราะซอฟต์แวร์ส่วนใหญ่ไม่รองรับ opentype อะไรขนาดนั้น
มีเป็นเว็บข่าว แต่ตอนนี้เข้าถึงจากนอกจีนไม่ได้แล้ว บล็อกIPต่างประเทศหมด tai๑๒ดอตคอม กับdw๑๒ดอตคอม)
ฟอนต์ที่ผมทำเอง ส่วน skot ก็ยัดทั้ง rlig liga blwm ไปหมด ใช้บน firefox ไม่ได้มีปัญหาอะไร แต่เหมือนจะไปมีกับ chromium app บางตัว กับบนแอปของแอปเปิ้ล (ไม่รู้สาเหตุเหมือนกัน เพราะคนอื่นแคปหน้าจอให้ผมดู แต่ถ้าตามบล็อกท่าน ก็น่าจะปัญหาไม่รองรับความซับซ้อน)
(ส่วนของ Noto Thai Tham ก็ยังเละเทะอยู่ดี ขนาดมีฟอนต์และพระมหาแสงแดงแนะ
ไม่รู้ฝรั่งกลุ่มนั้น(ไม่นับคุณริชาร์ด)ถือดีอะไรปานนั้น)
=============
ส่วนเรื่องลำดับการพิมพ์ให้เหมือนที่ใช้กับอักษรไทย แล้วสลับลำดับ encoding ให้นี่
เท่าที่ผมทราบ
คีย์บอร์ดที่พอทำได้คือ key curry ของ unifont (คุณ Edward ที่ทำฟอนต์ Haripunchai)
unifont.org/keycurry/
ส่วนอันนี้ที่ผมทำ (ขอเกาะโฆษณาหน่อย 555; แต่ไม่ได้แนบฟอนต์)
syydai.gitlab.io/ime/
แต่ด้วยความที่ N3207R (Revised proposal for encoding the Lanna script in the BMP of the UCS unicode.org/L2/L2007/07007r-n3… )
มันดูมั่วซั่วไปหมด
ทั้งของ Key Curry กับผมเอง จะสลับแค่สระหน้ากับระโวงพอ ให้พิมพ์ซ้ายไปขวาตามอักษรไทย จากกลางลงล่างเรื่อยๆ แล้วค่อยขึ้นบนเรื่อยๆ ตามที่กล่าวข้างบน
SyyDai Input Method Editor
syydai.gitlab.iothep
in reply to ป่าน • • •@hiohlan อยากมีปุ่ม Love บน mastodon เลยครับ ดีใจที่เจอคอเดียวกัน ว่าแต่มีความเกี่ยวข้องกับเพจ SyyDai ของ อ.ประพันธ์ เอี่ยมวิริยะกุล ที่ FB หรือเปล่าครับ?
ฟอนต์ธรรมดูเหมือนต้องเลือกอย่างใดอย่างหนึ่งครับ จะรองรับ USE และเลี่ยง USE พร้อมกันไม่ได้ แต่ไม่ว่ายังไง Harfbuzz ก็รับได้หมด มีแต่ MS Word แหละครับที่เรื่องมาก ส่วน Apple ผมไม่มีให้ลองครับ
thep
in reply to thep • • •@hiohlan N3207R ที่เสนออักษรธรรมตอนแรกนั้น ผมว่า Martin Hosken เขาวิจัยมาดี และพยายามใช้กฎเกณฑ์ของ Unicode เต็มที่ แต่จะมีสวนทางกับอักษรไทยบ้าง เช่น สระอัว ต้องใส่ ว ห้อย มาก่อนไม้กง สระอำต้องพิมพ์สระอาตามด้วยไม้กั๋ง แต่โดยรวมผมว่าโอเค
ดีเลยครับที่มี SyyDai IME ให้เลือกใช้นอกเหนือจาก key curry อีก จะได้แนะนำผู้ใช้ได้ครับ IME ของผมรันผ่าน iBus บนลินุกซ์ จะตอบผู้ใช้ Windows/Mac ก็ไม่รู้จะตอบยังไง
github.com/thep/lanxang/
แต่ของผมสลับเฉพาะสระหน้า ไม่สลับระวงนะครับ พยายามเรียงการสะกดตามอักษรไทยจริงๆ
GitHub - thep/lanxang: Lao/Esaan Tham scipt input method
GitHubป่าน
in reply to thep • • •ฝั่งนี้ หลายคนก็ไม่ชอบตัว N3207R(รวมถึงตัวล่าสุดด้วย) มันทะเยอทะยานเกินไปจนพัง
กฎตัวยูนิโค้ดมันได้แค่โครงสร้างพื้นๆ อะท่าน
แต่ตัวธรรมเรานี่ มันหวันมันซ้อนเกินจนไม่เข้าเกณฑ์อะไรเลย แล้วที่แกออกแบบก็ไม่ครอบคลุมเท่าไหร่ (เคยสนทนากับท่านอื่น ผมลืมศัพท์ที่เขียนไม่ได้แล้ว
แต่เท่าที่จำได้คือ คำว่า ถนน มั้ง ถฺนฺนົๆ
ถ้าเอาตามกฎแกเป็น ถ skot-น ๆ ອົ skot-น
แล้วเรนเดอร์เอนจินก็แตก ดันมีสระบนมาคั่นระหว่าง blwm สองอัน)
ผลออกก็สภาพอย่างทุกวันนี้ ไม่สุดสักทาง 555
ส่วนตัวเอง อยากให้วกไปเรียงเหมือนอักษรไทยให้จบๆ เรียงตามภาพไปเลย
อักษรกลุ่มไทที่เก็บสระหน้าก่อนพยัญชนะได้เท่าที่นึกออก จะมี ไทย ลาว ไทดำ(ตัวproposal เขาอ้างตามอักษรไทย แต่ก็ดันไปพังเรื่องอื่นแทน) ไทลื้อใหม่(เดิมเก็บ CVp ไปไปมามาก็แก้เป็น VpC ได้)
หวังว่าจะมีสักวัน
thep
in reply to ป่าน • • •@hiohlan ว่าตามตรง ตอนผมทำเว็บปริวรรตใบลานก็ไม่ได้อ่าน proposal ของ Martin เหมือนกันครับ แค่ encode สลับสระหน้ากับพยัญชนะตัวถัดไปก็พอ นอกนั้นก็ตามลำดับอักษรไทยจริงๆ ซึ่งมันก็เวิร์ก แล้วก็มาพบทีหลังว่าเป็นเพราะฟอนต์ผมไม่มี dotted circle นั่นเอง ฮ่าๆ
แต่หลักการของ RichardW ก็คือ เลี่ยงทีก็เลี่ยงให้สุดๆ เลย ใช้แต่ ccmp หรือ liga อย่างเดียว ไม่ต้องมีแม้แต่ blwf หรือ lana script tag เลยในฟอนต์ ให้ engine มันคิดว่าเป็นละตินไปเลย
ส่วนกรณี ถนน คิดว่าต้อง hack เป็น ถ+SAKOT+น+SAKOT+น+ไม้กง นะครับ ไม่งั้น mkmk มันไม่วาง น ห้อย ซ้อนกันดีๆ ให้
thep
in reply to thep • • •@hiohlan เรื่อง visual encoding คิดอยู่ตลอดเหมือนกันครับ ว่านั่นสิ จะทำให้ชีวิตยุ่งยากทำไม เรียก logical แต่ไม่มีทาง logical ได้จริง บางคนเสนอให้เรียกใหม่ว่า phonetic encoding ซึ่งมันอาจใช้ได้กับอักษรอินเดียหรืออักษรเขมร แต่กับอักษรธรรมมันก็ยังไม่ใช่อยู่ดี
ข้ออ้างของ Martin คือ visual encoding จะทำให้เรียงลำดับตามพจนานุกรมไม่ได้ แล้วก็ชอบแขวะอักษรไทยว่ายุ่งยากตอน collate ซึ่งเอาเข้าจริงมันก็แค่สลับสระก่อนเรียง แต่ไม่รู้อักษรธรรมจะเรียงซับซ้อนแค่ไหนเหมือนกันครับ
ป่าน
in reply to thep • • •เกี่ยวข้องแหละครับ ผมเป็น 1 ในคนทำฟอนต์ให้แก 555
ส่วนเรื่องฟอนต์ธรรม ผมก็เลือกเลี่ยงครับ เอา Haftbuzz เป็นหลัก
คนใช้ส่วนใหญ่มีมือถือเป็นแอนดรอย์ บนคอมก็เขเขาให้ลง Libreoffice แทนพอได้อยู่ หรือรั้นจะใช้ MS ก็ต้องขยันแคปข้อความมาเป็นภาพวางเอง