-
Time for Unicode ?
เราควรจะเปลี่ยนไปใช้รหัสข้อมูลอะไรดี ? สำหรับเอกสารภาษาไทยในโลกยุคอินเทอร์เน็ต จะ Windows-874, TIS-620 หรือ ISO-8859-11 ก็คงไม่เพียงพอแล้ว สำหรับโลกยุคอินเทอร์เน็ตและสังคมพหุภาษา แม้แต่เอกสาร “ภาษาไทย” ในปัจจุบันก็ยังมีตัวอักษรละตินหรือสัญลักษณ์พิเศษต่าง ๆ แทรกอยู่มากมาย ซึ่งบางตัวก็ไม่ได้มีอยู่ทั้งใน Windows-874, TIS-620 และ ISO-8850-11 ได้เวลาเปลี่ยนมาใช้ Unicode ให้หมดรึยังนะ ? (สำหรับงานส่วนใหญ่ ที่ขนาดพื้นที่จัดเก็บข้อมูล/แบนด์วิธ ไม่ได้เป็นข้อจำกัดสำคัญอีกต่อไปแล้ว) ทั้งหน้าเว็บ ไฟล์เอกสาร metadata โค้ดโปรแกรมต่าง ๆ แต่จะใช้อะไรดี UTF-8 หรือ UTF-16 ? Windows NT ขึ้นไป, Windows CE, Java, .NET, Mac OS X และ Qt แพลตฟอร์มเหล่านี้ ใช้ UTF-16 เป็น native character…
-
BEST: Word Segmentation
BEST จัด “แข่งขัน” ซอฟต์แวร์ตัดคำไทย ประโยชน์ของการแข่งขันนี้ นอกจากด้านซอฟต์แวร์แล้ว ยังมีเรื่องของการพัฒนาคลังข้อความ (corpus) และค้นหาความหมายของสิ่งที่เรียกว่า “คำ” ในภาษาไทยอีกด้วย ครั้งนี้เล่นที่คำ ครั้งหน้าทีมงานวางแผนจะเล่นที่ “ประโยค” อย่างไรก็ดี ผมว่าที่อาจารย์วิโรจน์ อักษรจุฬาฯ เสนอว่า ภาษาไทยอาจจะไม่มีประโยคก็ได้ ก็ดูเข้าที สนใจดูได้ที่บทความ Wirote Aroonmanakun, Thoughts on Word and Sentence Segmentation in Thai, SNLP 2007. technorati tags: computational linguistic, word segmentation, Thai language
-
Bangkok Pundit: PPP – the Anti-military Party
Bangkok Pundit ยกตัวอย่างคำสัมภาษณ์ผู้มีสิทธิออกเสียงหลายคน จากหลายแหล่งข่าว โดยชี้ว่าผู้มีสิทธิจำนวนหนึ่ง ต้องการโหวตเพื่อต่อต้านรัฐประหาร และคิดว่าการเลือกพลังประชาชน เป็นวิธีที่มีประสิทธิภาพเพื่อการนี้มากกว่า “no vote” อย่างไรก็ดี Bangkok Pundit ไม่คิดว่าจะมีคนคิดเช่นนี้มากนัก โดยคะเนไว้ว่าน่าจะอยู่ที่ 3-4% เท่านั้น Bangkok Pundit: PPP – the Anti-military Party (ในจำนวนนั้น อาจจะมีผมด้วย) เว็บไซต์หนังสือพิมพ์ประชาไท prachatai.com เข้าไม่ได้ตั้งแต่เวลาประมาณ 4:30 น. ของวันนี้ (อาทิตย์ 23 ธ.ค. 2550 – วันเลือกตั้ง) และจนถึงขณะนี้ 8:38 น. ก็ยังไม่สามารถเข้าได้ — เข้าได้แล้วนะครับ (เว็บมาสเตอร์แจ้งว่าเข้าได้ตั้งแต่ประมาณ 9:05 น. ของวันที่ 23 ธ.ค.) — ใครเข้าได้/ไม่ได้ ช่วยแจ้งไปที่ FACT ด้วยครับ…
-
Cry with, cry for me, Thailand
อาจจะจริงที่ว่า วัฒนธรรมการเมืองไทยที่ตระหนักในสิทธิเสรีภาพได้ก้าวหน้าขึ้นบ้าง แต่แน่นอนยิ่งกว่า คือวัฒนธรรมการเมืองบ้านเรายึดติดกับตัวบุคคล และความเชื่อว่ามี ‘เผด็จการโดยธรรม’ นั้น ฝังรากลึกเกินกว่าจะถอนราก “ สำหรับผมแล้ว วันที่ 20 ธันวา ก่อนวันเลือกตั้ง 3 วัน อันเป็นวันที่ สนช. ผ่านร่างกฎหมายฉบับนี้ ทำให้การเลือกตั้งไร้ความหมายไปโดยสิ้นเชิง เพราะจะเลือกตั้งไปทำไม ในเมื่อทหารยังคงเป็นใหญ่ในแผ่นดิน ” — บทบรรณาธิการประชาไท, 21 ธ.ค. 2550 ถึงเวลาหรือยัง ที่เราต้องเลือกข้างให้ชัดเจน ? สนับสนุน/ประนีประนอม กับ รัฐประหาร/อำนาจทหาร/อำนาจที่ควบคุมไม่ได้ หรือ ต่อต้าน/ไม่ประนีประนอม กับ รัฐประหาร/อำนาจทหาร/อำนาจที่ควบคุมไม่ได้ จะเลือกอะไร เลือกด้วยวิธีไหน ก็แล้วแต่คุณ technorati tags: national security, Thailand, internal security, democracy
-
politicalbase.in.th
เปิดแล้ว: ศูนย์ข้อมูลการเมืองไทย – politicalbase.in.th “แต่การเข้ามีส่วนร่วมทางการเมืองของประชาชนโดยเพียงเฉพาะในเลือกตั้งอย่าง เดียวยังไม่เพียงพอ การตรวจสอบการทำงานของพรรคการเมืองทั้งก่อนและหลังจากช่วงการเลือกตั้งยัง เป็นสิ่งจำเป็นอย่างยิ่ง การเริ่มโครงการ politicalbase.in.th ก็เกิดมาจากการตระหนักถึงความจำเป็นดังกล่าวนี้ ทั้งนี้เพื่อลดภาระและต้นทุนการเข้าถึงข้อมูลของนักการเมือง และพรรคการเมืองที่เกี่ยวข้อง เพื่อตรวจสอบนโยบายและความเชื่อมโยงทางการเมือง” ทางผู้จัดทำหวังเป็นอย่างยิ่งว่า จะได้รับการสนับสนุนเป็นอย่างดีจากประชาชนผู้มีสิทธิ์มีเสียง โดยการช่วยกันเพิ่มข้อมูล ทีละเล็กละน้อย ค่อย ๆ สะสมเพื่อประโยชน์ต่อสาธารณะทั้งหมด – ตัวเว็บไซต์เป็นลักษณะวิกิที่เปิดให้ทุกคนเพิ่มและแก้ไขข้อมูลได้ โดยมีกองบรรณาธิการตรวจสอบที่มาของข้อมูลในเบื้องต้น ศูนย์ข้อมูลการเมืองไทย – politicalbase.in.th – โดยการสนับสนุนของ มูลนิธิฟรีดิชเนามัน (เยอรมนี), สถาบันทีอาร์เอ็น (ไทย), และ สยามอินเทลลิเจนซ์ยูนิต แนะนำมูลนิธิฟรีดิชเนามันสั้น ๆ — มูลนิธิฟรีดิชเนามัน (Friedrich-Naumann-Stiftung) เป็นมูลนิธิของประเทศเยอรมนีเพื่อสนับสนุนการเมืองแบบเสรีนิยม (มีความเกี่ยวพันกับพรรคเสรีประชาธิปไตย (FDP) ของเยอรมนี) โดยสนับสนุนเสรีภาพของปัจเจกและแนวคิดเสรีนิยม มูลนิธิดำเนินงานตามแนวคิดอุดมคติของ ฟรีดิช เนามัน ที่เชื่อว่าประชาธิปไตยจะทำงานได้ก็ต่อเมื่อพลเมืองมีการศึกษาและได้รับข่าวสารทางการเมืองอย่างเพียงพอ ซึ่งตามแนวคิดนี้ การศึกษาการบ้านการเมือง (civic education) เป็นสิ่งสำคัญพื้นฐานที่ขาดไม่ได้สำหรับการมีส่วนร่วมทางการเมือง และสำหรับประชาธิปไตย…
-
beyond policy
[ คำเตือนก่อนอ่าน: ในขณะที่เขียนบทความนี้ ในใจผมอยู่ระหว่างตัดสินใจว่า จะ “กาช่องไม่เลือกใคร” หรือ “เลือกพรรคพลังประชาชน” (แต่ไม่ว่าจะเลือกอะไร ก็เพื่อส่งสัญญาณเดียวกัน คือ “ไม่เอารัฐประหาร” ทั้งที่ผ่านมาและในอนาคต) — ดังนั้นข้อเขียนชิ้นนี้ จึงเป็นที่แน่นอนว่าจะต้องได้รับอิทธิพลจากสิ่งนี้ไม่มากก็น้อย กรุณาใช้ความระมัดระวังในการอ่าน — ติชมใด ๆ ผมถือเป็นกำนัล ขอน้อมรับด้วยความขอบคุณยิ่ง ] บางที การเลือกตั้งครั้งนี้ อาจไม่ใช่การเลือกพรรคการเมือง อย่างที่แล้ว ๆ มา ที่ผ่านมา เราบอกว่า สังคมประชาธิปไตยไทย(ไทย) ได้ก้าวพ้นการเลือกตัวบุคคล มาเป็นการเลือกพรรคแล้ว โดยชัยชนะของไทยรักไทยอาจเป็นตัวอย่าง (โดยกลไก ส.ส.แบบบัญชีรายชื่อ ที่เพิ่งมีใหม่ในตอนนั้น เป็นตัวอำนวยให้เกิดได้) เลือกบุคคล ก็คือเลือกจากความชอบพอในตัวบุคคล คนนี้เป็นคนดี เลือกพรรค ก็คือเลือกจากนโยบายของพรรค แต่การเลือกตั้งครั้งนี้ พูดตรง ๆ ผมไม่ได้ตัดสินใจจากทั้งสองอย่าง หลายคนคงคิดเหมือนกัน ตัวบุคคล ? เรารู้จักใครบ้าง ? ถ้าจะคุ้น ๆ…
-
CC in 2 minutes
ฝากเผยแพร่ครับ (โค้ด HTML + รูปทั้งหมด สำหรับเอาไปใช้ในบล็อก/เว็บไซต์ของคุณ) “ครีเอทีฟคอมมอนส์ เป็นองค์กรไม่แสวงหากำไร ที่เสนอทางเลือกนอกเหนือจากลิขสิทธิ์แบบเต็มที่” — creativecommons.org สัญลักษณ์เงื่อนไขครีเอทีฟคอมมอนส์โดยสรุป… ยอมรับสิทธิ (by) หมายถึง: คุณยินยอมให้ผู้อื่นคัดลอก แจกจ่าย ใช้ และจัดแสดงงานลิขสิทธิ์ของคุณ (รวมทั้งงานที่ดัดแปลงจากมัน) – แต่ก็ต่อเมื่อพวกเขาประกาศด้วยว่างานนั้นเป็นของคุณ ไม่ใช้เพื่อการค้า (nc) หมายถึง: คุณยินยอมให้ผู้อื่นคัดลอก แจกจ่าย ใช้ และจัดแสดงงานลิขสิทธิ์ของคุณ (รวมทั้งงานที่ดัดแปลงจากมัน) – แต่สำหรับจุดประสงค์ที่ไม่ใช่เพื่อการค้าเท่านั้น ไม่แก้ไขต้นฉบับ (nd) หมายถึง: คุณยินยอมให้ผู้อื่นคัดลอก แจกจ่าย ใช้ และจัดแสดงงานลิขสิทธิ์ของคุณ เฉพาะตัวที่เหมือนต้นฉบับทุกประการเท่านั้น ไม่ใช่งานที่ถูกแก้ไขดัดแปลง อนุญาตแบบเดียวกัน (sa) หมายถึง: คุณยินยอมให้ผู้อื่นแจกจ่ายงานดัดแปลง ด้วยสัญญาอนุญาตที่เหมือนกันทุกประการกับที่ใช้กับงานของคุณเท่านั้น เงื่อนไขเหล่านี้ สามารถประกอบใช้ร่วมกันได้ เช่น: หมายถึง สัญญาอนุญาตแบบ ยอมรับสิทธิ-ไม่ใช้เพื่อการค้า-อนุญาตแบบเดียวกัน (by-nc-sa) ข้อมูลเพิ่มเติม: ครีเอทีฟคอมมอนส์…
-
your feet, also very count
ประภาส ปิ่นตบแต่ง แนะ บางทีการโหวตด้วย ‘มือ’ อย่างเดียวคงไม่พอ คงต้องโหวตด้วย ‘ตีน’ กันบ้าง 😛 (ส่วนทหารและอภิทหาร เขาโหวตด้วย ‘ปืน’ กันอยู่แล้ว .. แต่หลัง ๆ เริ่มซับซ้อน มีโหวตด้วย ‘ตุลาการ’ และ ‘การร่างรัฐธรรมนูญ/กฎหมาย’ ด้วยนะ .. เนียน เนียน) โซ่มนุษยปิดสนช. พุธ 19 ธ.ค. 8.00 – 19.00 น. หากไม่สะดวกร่วม ยังไงก็ไปลงชื่อปิดสภากันได้ออนไลน์ [ ลิงก์ ประชาไท | ผ่าน พลวัต (ยุคใหม่) ] technorati tags: Thailand, democracy
-
Understanding Language Understanding
ชอบชื่อหนังสือเล่มนี้จริง ๆ – -“ Understanding Language Understanding: Computational Models of Reading Ashwin Ram and Kenneth Moorman (Ed.) MIT Press, Cambridge, MA, 1999. ISBN 0-262-18192-4 | Google Book Search technorati tags: books, computational linguistics, language understanding, creative reading
-
your hands, every hands count
ไปประชุมมาหลายวัน (วีร์ก็ไป) กลับมามีเรื่องเยอะแยะ พร้อมเพรียงโดยสันติ — พุธ 19 ธ.ค. 8:00-19:00 น. — หน้าสภาของเรา คณะกรรมการประสานงานองค์กรพัฒนาเอกชน (กป.อพช.) สมาพันธ์แรงงานรัฐวิสาหกิจสัมพันธ์ (สรส.) สภาเครือข่ายองค์กรประชาชนแห่งประเทศไทย (สค.ปท.) เครือข่ายสลัมสี่ภาค สหพันธ์นิสิตนักศึกษาแห่งประเทศไทย (สนนท.) ขอเชิญชวนพี่น้องประชาชนและองค์กรภาคประชาชนทุกเครือข่าย รวมพลังปิดสภาครั้งที่ 2 ด้วยโซ่มนุษย์ล้อมสภา ร่วมกันยุติบทบาทของสภานิติบัญญัติแห่งชาติในการเร่งออกกฎหมายที่ละเมิดสิทธิเสรีภาพของประชาชน พุธ 19 ธ.ค. 8:00-19:00 น. ยึดหลักสันติวิธีโดยเคร่งครัด ยืนยันไม่เป็นเครื่องมือกลุ่มผลประโยชน์อำนาจทางการเมืองใด ๆ และไม่ยอมให้มีการสร้างสถานการณ์ยกเลิกการเลือกตั้ง เริ่มการเลือกตั้งแล้ว กำลังจะมีสภาผู้แทนของประชาชน แต่สภาแต่งตั้งยังเร่งรีบออกกฏหมายที่ละเมิดสิทธิของประชาชนอย่างรุนแรงเช่นร่างพรบ.ความมั่นคงในราชอาณาจักร เป็นเรื่องที่ขาดความชอบธรรมโดยสิ้นเชิงและเป็นการปิดกั้นการมีส่วนร่วมของประชาชนในการพิจารณากฎหมาย กฎหมายที่สนช.ต้องหยุดพิจารณา: 1. ร่างกฎหมายการรักษาความมั่นคงในราชอาณาจักร มีสาระสำคัญเป็นการขยายอำนาจให้กองทัพควบคุมสังคม โดยปราศจากการตรวจสอบจากสถาบันตุลาการ อันเป็นภัยคุกคามต่อหลักสิทธิเสรีภาพ หลักการปกครองระบอบประชาธิปไตย หลักนิติธรรม และหลักการมีส่วนร่วมของประชาชน ดังที่กำหนดไว้ในรัฐธรรมนูญ 2. ร่างกฎหมายว่าด้วยทรัพยากรน้ำ มีสาระสำคัญเป็นการให้รัฐมีอำนาจบริหารจัดการน้ำแบบเบ็ดเสร็จใน 3 รูปแบบ คือ…