เปิดข้อมูลอย่างเดียวไม่พอ ต้องให้มัน machine-readable ด้วย!

สองสัปดาห์ก่อน พยายามจะเอาข้อมูลรายจ่ายภาครัฐมาใช้งาน แต่ก็พบปัญหาในการเอามาใช้ คือข้อมูลเท่าที่หาได้ มันไม่ machine-readable หรือ “อ่านด้วยเครื่องไม่ได้”

เขียนสรุปเอาไว้ที่บล็อกโอเพ่นดรีม: รายจ่ายภาครัฐ ประจำปีงบประมาณ 2544-2554 ในรูปแบบ machine-readable (ดาวน์โหลดข้อมูลในฟอร์แมต OpenDocument)

สาเหตุหลัก ๆ คือ:

  • เป็น PDF ไม่ใช่ CSV หรือข้อมูลในรูปแบบตารางที่คำนวณได้ อย่าง OpenDocument spreadsheet หรือ Excel
  • แย่กว่านั้น บาง PDF เป็นแบบรูปภาพ-สแกนหน้ากระดาษามา แถมเอียงหรือไม่ชัดอีกต่างหาก
  • PDF ที่เหมือนจะเป็นข้อความดี ๆ บางอันก็มีปัญหาการเข้ารหัสชุดตัวอักษร เช่นแสดงให้เห็นเป็น “๔๕,๐๐๐,๐๐๐,๐๐๐” แต่พอ copy มา paste ก็กลายเป็น “Ùı,,,” แบบนี้คือ human-readable แต่ไม่ machine-readable แบบชัด ๆ เลย
  • เอกสารใช้เลขไทย ซึ่งไม่ใช่ว่าทุก machine จะ read มันในฐานะจำนวนได้ — เช่นถ้าพิมพ์ “๔๕” ลงไปในสเปรดชีตของ Google Docs มันก็จะเห็นเป็น ข้อความ (string) “๔๕” แต่ไม่ใช่ จำนวน (int/float) ๔๕ ที่คำนวณได้ (ตัว LibreOffice นั้นเก่งหน่อย จัดการตรงนี้ได้ มองเห็นเป็นจำนวน)

เวลาจะเปิดข้อมูลสาธารณะ ต้องคิดถึงเรื่องพวกนี้ด้วย จะทำยังไง ให้ข้อมูลที่เปิดออกมา มัน machine-readable เพื่อให้คนเอาไปใช้ประโยชน์ต่อได้อย่างเต็มที่

เช่น ถ้าเป็นข้อมูลภาครัฐ การทำอย่างนั้น ก็จะช่วยให้ประชาชนประชาชนไม่จมอยู่กับกองข้อมูลมหาศาล ที่เอาไปใช้ได้ลำบากเหลือเกิน การเข้าถึงข้อมูลที่สะดวกขึ้น ก็จะทำให้ทุกคนสามารถมีส่วนร่วมกับการปกครองได้มากขึ้น ทั้งในแง่การเอาข้อมูลไปใช้ช่วยในการตัดสินใจในท้องถิ่นหรือในธุรกิจของตัวเอง และทั้งในแง่การตรวจสอบส่วนกลาง (ดูเพิ่มเติมที่บทสัมภาษณ์ ไกลก้อง ไวทยการ เรื่อง Open Data การพัฒนาเศรษฐกิจ-สังคม-การเมือง) ให้สมกับหลักการและเหตุผลของ พ.ร.บ.ข้อมูลข่าวสารของราชการ 2540 ที่ว่า:

ในระบอบประชาธิปไตย การให้ประชาชนมีโอกาสกว้างขวางในการได้รับข้อมูลข่าวสารเกี่ยวกับการดำเนินการต่างๆ ของรัฐเป็นสิ่งจำเป็น เพื่อที่ประชาชนจะสามารถแสดงความคิดเห็นและใช้สิทธิทางการเมืองได้โดยถูกต้องกับความจริง อันเป็นการส่งเสริมให้มีความเป็นรัฐบาลโดยประชาชนมากยิ่งขึ้น สมควรกำหนดให้ประชาชนมีสิทธิได้รู้ข้อมูลข่าวสารของราชการ … ทั้งนี้เพื่อพัฒนาระบบประชาธิปไตยให้มั่นคงและจะยังผลให้ประชาชนมีโอกาสรู้ถึงสิทธิหน้าที่ของตนอย่างเต็มที่

ทิม เบอร์เนิร์ส-ลี ผู้คิดค้นเว็บ แนะนำระบบการให้ดาว 5 ดาว เพื่อบอกว่า ข้อมูลเปิด (Linked Open Data) นั้น มีความ “เปิด” มากเพียงใด ดูตัวอย่างได้ที่เว็บไซต์ LiDRC Lab

  • ★ – หนึ่งดาว – มีข้อมูลให้ดาวน์โหลดบนเว็บ (จะฟอร์แมตไหนก็ได้) ด้วยสัญญาอนุญาตแบบเปิด
  • ★★ – สองดาว – จัดข้อมูลดังกล่าวให้เป็นรูปแบบข้อมูลที่มีโครงสร้าง (เช่น Excel แทนที่จะเป็นภาพสแกนของตาราง)
  • ★★★ – สามดาว – ใช้รูปแบบที่เปิดเผยข้อกำหนด ไม่สงวนเป็นความลับ (เช่น CSV แทนที่จะเป็น Excel)
  • ★★★★ – สี่ดาว – ใช้ URI เพื่อระบุสิ่งต่าง ๆ ในข้อมูล เพื่อที่คนจะได้ชี้ตรงมาที่ข้อมูลได้
  • ★★★★★ – ห้าดาว – เชื่อมโยงข้อมูลของคุณเข้ากับชุดข้อมูลอื่น ๆ เพื่อที่จะบอกบริบทของข้อมูล

(ดูรายละเอียดเพิ่มที่ Linked Open Data star scheme by example)

ตอนนี้ข้อมูลราชการของเรา น่าจะอยู่ประมาณ -1 ดาว ไปจนถึง 3 ดาว คือ

  • -1 ดาว : ไม่มีข้อมูลบนเว็บเลย
  • 0 ดาว : มีข้อมูลแต่ไม่แจ้งสัญญาอนุญาต (สำหรับข้อมูลบางอย่างที่กฎหมายระบุว่าไม่มีลิขสิทธิ์ อันนี้ก็ไม่มีปัญหา ก็เป็น 1 ดาวไป)
  • 1 ดาว : แบบที่ว่ามาข้างบน มาเป็น PDF คนอ่านได้ แต่ไม่มีโครงสร้างข้อมูล เครื่องอ่านไม่ได้
  • 2 ดาว : แบบบางชิ้นที่มีอยู่บนเว็บไซต์ data.pm.go.th ฐานข้อมูลเปิดภาครัฐ ที่มาเป็น Excel
  • 3 ดาว : เคยเห็นบางชิ้นบนเว็บไซต์สำนักงานสถิติแห่งชาติ ที่เป็น XML (แต่ยังไม่เห็น Schema นะ)

The Hague Declaration, call for signers

Support free and open information standards, for transparency, for equality, for participatory, for communication rights, for information freedom, and for freedom of expression. — please consider signing the The Hague Declaration.

ขอเชิญพิจารณาและร่วมลงชื่อใน “คำประกาศเฮก” (The Hague Declaration) เพื่อสนับสนุนมาตรฐานดิจิทัลแบบเปิดและเสรี และเรียกร้องให้รัฐบาลทั่วโลกใช้และส่งเสริมมาตรฐานแบบเปิดและเสรี เพื่อความเท่าเทียมและโปร่งใสในการเข้าถึงข้อมูล มีส่วนร่วมในการปกครอง และใช้บริการของรัฐ ผ่านทางระบบอิเล็กทรอนิกส์ (e-Government) โดยไม่ถูกเลือกปฏิบัติ ตามสิทธิและเสรีภาพของเราใน ปฏิญญาสากลว่าด้วยสิทธิมนุษยชน และตามรัฐธรรมนูญ

มาตรา ๕๖ บุคคลย่อมมีสิทธิได้รับทราบและเข้าถึงข้อมูลหรือข่าวสารสาธารณะ ในครอบครองของหน่วยราชการ หน่วยงานของรัฐ รัฐวิสาหกิจ หรือราชการส่วนท้องถิ่น เว้นแต่ การเปิดเผยข้อมูลหรือข่าวสารนั้นจะกระทบต่อความมั่นคงของรัฐ ความปลอดภัยของประชาชน หรือส่วนได้เสียอันพึงได้รับความคุ้มครองของบุคคลอื่น หรือเป็นข้อมูลส่วนบุคคล ทั้งนี้ตามที่กฎหมายบัญญัติ

ในการจะเข้าถึงข้อมูลเหล่านั้นได้ แม้หน่วยงานรัฐจะ “เปิดเผยข้อมูล” แล้ว แต่หากข้อมูลดังกล่าว ไม่ได้อยู่ในรูปแบบที่เป็นมาตรฐานแบบเปิดและเสรี ก็อาจมีอุปสรรคในการเปิดดูได้ในปัจจุบันหรือในอนาคต การให้รัฐใช้มาตรฐานแบบเปิดและเสรีจึงเป็นการรับประกันว่า ข้อมูลข่าวสารของรัฐที่ควรเปิดเผยจะได้รับเปิดเผยและเรียกดูได้อย่างเสรีตลอดไป ทั้งในปัจจุบันและอนาคต

ร่วมลงชื่อ

technorati tags:
,
,

Open Document Standard, e-Government, and Universal Information Access

ต่อเรื่อง open document standard มาตรฐานเอกสารแบบเปิด ที่ใน duocore ตอนที่ 66 ลืมพูด/เวลาไม่พอเลยข้ามไป

open standard นี่ ทั้งตัว format และ protocol ทุกอย่างที่เกี่ยวข้องเลยนะ


มาตรฐานเอกสารแบบเปิด กับระบบรัฐบาลอิเล็กทรอนิกส์ (e-Government)

เช่นเรื่อง backoffice ระบบบริหารจัดการข้อมูลของระบบราชการ หน่วยงานรัฐ ที่ต้องประมวลผลเอกสารมาก ๆ ทั้งภายในหน่วยงานเอง ระหว่างหน่วยงานรัฐ และกับภาคเอกชน ประชาชน

ถ้าไม่ใช่ฟอร์แมตเปิด การสร้างซอฟต์แวร์ระบบที่จะอ่าน/เขียนเอกสารเหล่านั้นได้อย่างอัตโนมัติ ก็ลำบาก (ต้อง reverse engineering แกะสเปกกันวุ่นวาย) แถมยังไม่สามารถมั่นใจเต็ม 100% ได้ว่าจะอ่าน/เขียนได้ตรงเป๊ะ ซึ่งก็อาจทำให้ข้อมูลบางอย่างตกหล่นสูญหายได้ ยิ่งคิดว่าในกระบวนการทำงานจะต้องมีการส่งเอกสารกันหลายทอด อ่าน/เขียนกันหลายรอบ ก็เป็นไปได้ที่การสูญหายดังกล่าวจะสะสมเยอะขึ้นได้ด้วย


มาตรฐานเอกสารแบบเปิด กับการเข้าถึงข้อมูลข่าวสารถ้วนหน้า (universal information access)

นอกจากนี้ กรณีที่สเปกรูปแบบเอกสารที่มันปิด ไม่ได้เป็นมาตรฐานเปิด
ก็ทำให้มีโอกาสอยู่มาก ที่จำนวนโปรแกรมที่จะมาอ่าน/เขียนเอกสารเหล่านั้นได้ มันจะมีอยู่อย่างจำกัด
และโดยมากก็มักจะเป็นโปรแกรมของผู้กำหนดสเปกเท่านั้น ที่จะอ่าน/เขียนได้สมบูรณ์
ก็เท่ากับว่า มี “การผูกขาดโปรแกรมในการอ่าน/เขียน” อยู่กลาย ๆ

เช่น กรณีที่หน่วยงานราชการเผยแพร่เอกสารในรูปแบบ .doc (หรือ .xls, .ppt) อย่างเดียว (พูดถึงกรณีเมื่อก่อน ที่ยังไม่ได้เปิดสเปก) เท่ากับบังคับให้ประชาชนต้องมี Windows หรือ Mac OS X เป็นอย่างน้อย เพื่อที่จะใช้โปรแกรม Word Viewer, Excel Viewer เพื่อจะดูเอกสารดังกล่าวได้ (แบบเต็ม 100% ไม่ต้องกลัวว่าจะมีข้อมูลอะไรสำคัญหายหรือเพี้ยนไป) ซึ่งซอฟต์แวร์ดังกล่าวเป็นซอฟต์แวร์ที่ต้องซื้อ — หรือกรณีถ้าต้องกรอกแบบฟอร์มส่งหน่วยงานรัฐ เช่น ยื่นภาษี แบบประกันสังคม ก็จำเป็นต้องซื้อ Office อีกชุดหนึ่งด้วย (เพื่อให้แก้ไขได้) — ซึ่งตรงนี้ก็อาจจะขัดกับหลักเรื่อง “การไม่เลือกปฏิบัติ ด้วยฐานะทางเศรษฐกิจ” (?)

ยกตัวอย่าง ประเทศนอร์เวย์ ที่ กระทรวงปฏิรูปการบริหารราชการ ของเขา ประกาศให้หน่วยงานรัฐต้องเผยแพร่ เอกสารในรูปแบบ open standard คือ HTML, PDF กับ OpenDocument (จะมีแบบ non-open ด้วยก็ได้ แต่ต้องมีแบบ open เสมอ)
ดูข่าว: Norway mandates government use of ODF

สหภาพยุโรปและหลายมลรัฐในสหรัฐอเมริกา ก็กำลังจะประกาศระเบียบทำนองนี้เช่นกัน


มาตรฐานเอกสารแบบเปิด กับการเข้าถึงข้อมูลข่าวสารถ้วนหน้า กรณีของประเทศไทย

สำหรับการเปิดเผยข้อมูลข่าวสารของทางราชการ ประเทศไทยมี “พระราชบัญญัติข้อมูลข่าวสารของทางราชการ พ.ศ.๒๕๔๐” ให้หน่วยงานรัฐเปิดเผยข้อมูลต่าง ๆ ให้แก่ประชาชน — โดยยึดหลักนโยบาย “เปิดเผยเป็นหลัก ปกปิดเป็นข้อยกเว้น”

กรณีเผยแพร่ข้อมูลในรูปแบบเอกสารอิเลกทรอนิกส์ที่ใช้ ฟอร์แมตที่ไม่ใช่ มาตรฐานเปิด ก็จะทำให้ประชาชนส่วนหนึ่งไม่สามารถเข้าถึงข้อมูลดังกล่าวได้ ซึ่งอาจผิดรัฐธรรมนูญ 2550 มาตรา 30 (ดูรธน.และพรบ.ดังกล่าวข้างล่าง)

หน่วยงานที่ดูแลเรื่องนี้ของไทยคือ สำนักงานคณะกรรมการข้อมูลข่าวสารของราชการ (สขร.)


รัฐธรรมนูญแห่งราชอาณาจักรไทย พุทธศักราช ๒๕๕๐

มาตรา ๓๐

บุคคลย่อมเสมอกันในกฎหมายและได้รับความคุ้มครองตามกฎหมายเท่าเทียมกัน

ชายและหญิงมีสิทธิเท่าเทียมกัน

การเลือกปฏิบัติโดยไม่เป็นธรรมต่อบุคคลเพราะเหตุแห่งความแตกต่างในเรื่อง ถิ่นกำเนิด เชื้อชาติ ภาษา เพศ อายุ ความพิการ สภาพทางกายหรือสุขภาพ สถานะของบุคคล ฐานะทางเศรษฐกิจ หรือสังคม ความเชื่อทางศาสนา การศึกษาอบรม หรือความคิดเห็นทางการเมืองอันไม่ขัดต่อบทบัญญัติ แห่งรัฐธรรมนูญ จะกระทำมิได้

มาตรการที่รัฐกำหนดขึ้นเพื่อขจัดอุปสรรคหรือส่งเสริม ให้บุคคลสามารถใช้สิทธิและเสรีภาพ ได้เช่นเดียวกับบุคคลอื่น ย่อมไม่ถือเป็นการเลือกปฏิบัติโดยไม่เป็นธรรมตามวรรคสาม


พระราชบัญญัติข้อมูลข่าวสารของทางราชการ พ.ศ. ๒๕๔๐

หมวด ๑ การเปิดเผยข้อมูลข่าวสาร

มาตรา ๗

หน่วยงานของรัฐต้องส่งข้อมูลข่าวสารของราชการอย่างน้อยดังต่อไปนี้ลงพิมพ์ในราชกิจจานุเบกษา
(๑) โครงสร้างและการจัดองค์กรในการดำเนินงาน
(๒) สรุปอำนาจหน้าที่ที่สำคัญและวิธีการดำเนินงาน
(๓) สถานที่ติดต่อเพื่อขอรับข้อมูลข่าวสารหรือคำแนะนำในการติดต่อกับหน่วยงานของรัฐ
(๔) กฎ มติคณะรัฐมนตรี ข้อบังคับ คำสั่ง หนังสือเวียน ระเบียบ แบบแผน นโยบาย หรือการตีความ ทั้งนี้ เฉพาะที่จัดให้มีขึ้น โดยมีสภาพอย่างกฎ เพื่อให้มีผลเป็นการทั่วไปต่อเอกชนที่เกี่ยวข้อง
(๕) ข้อมูลข่าวสารอื่นตามที่คณะกรรมการกำหนด

ข้อมูลข่าวสารใดที่ได้มีการจัดพิมพ์เพื่อให้แพร่หลายตามจำนวนพอสมควรแล้ว ถ้ามีการลงพิมพ์ในราชกิจจานุเบกษาโดยอ้างอิง ถึงสิ่งพิมพ์นั้นก็ให้ถือว่าเป็นการปฏิบัติตามบทบัญญัติวรรคหนึ่งแล้ว ให้หน่วยงานของรัฐรวบรวมและจัดให้มีข้อมูลข่าวสารตามวรรคหนึ่ง ไว้เผยแพร่เพื่อขายหรือจำหน่ายจ่ายแจก ณ ที่ทำการ ของหน่วยงานของรัฐแห่งนั้นตามที่เห็นสมควร

มาตรา ๙

ภายใต้บังคับมาตรา ๑๔ และมาตรา ๑๕ หน่วยงานของรัฐต้องจัดให้มีข้อมูลข่าวสารของราชการอย่างน้อยดังต่อไปนี้ ไว้ให้ประชาชนเข้าตรวจดูได้ ทั้งนี้ ตามหลักเกณฑ์และวิธีการที่คณะกรรมการกำหนด
(๑) ผลการพิจารณาหรือคำวินิจฉัยที่มีผลโดยตรงต่อเอกชน รวมทั้งความเห็นแย้งและคำสั่งที่เกี่ยวข้องในการพิจารณาวินิจฉัย ดังกล่าว
(๒) นโยบายหรือการตีความที่ไม่เข้าข่ายต้องลงพิมพ์ในราชกิจจานุเบกษาตามมาตรา ๗ (๔)
(๓) แผนงาน โครงการ และงบประมาณรายจ่ายประจำปีของปีที่กำลังดำเนินการ
(๔) คู่มือหรือคำสั่งเกี่ยวกับวิธีปฏิบัติงานของเจ้าหน้าที่ของรัฐซึ่งมีผลกระทบถึงสิทธิหน้าที่ของเอกชน
(๕) สิ่งพิมพ์ที่ได้มีการอ้างอิงถึงตามมาตรา ๗ วรรคสอง
(๖) สัญญาสัมปทาน สัญญาที่มีลักษณะเป็นการผูกขาดตัดตอนหรือสัญญาร่วมทุนกับเอกชนในการจัดทำบริการสาธารณะ
(๗) มติคณะรัฐมนตรี หรือมติคณะกรรมการที่แต่งตั้งโดยกฎหมาย หรือโดยมติคณะรัฐมนตรี ทั้งนี้ ให้ระบุรายชื่อรายงาน ทางวิชาการ รายงาน ข้อเท็จจริง หรือข้อมูลข่าวสารที่นำมาใช้ในการพิจารณาไว้ด้วย
(๘) ข้อมูลข่าวสารอื่นตามที่คณะกรรมการกำหนด

ข้อมูลข่าวสารที่จัดให้ประชาชนเข้าตรวจดูได้ตามวรรคหนึ่ง ถ้ามีส่วนที่ต้องห้ามมิให้เปิดเผยตามมาตรา ๑๔ หรือมาตรา ๑๕ อยู่ด้วย ให้ลบหรือตัดทอนหรือทำโดยประการอื่นใดที่ไม่เป็นการเปิดเผยข้อมูลข่าวสาร ส่วนนั้น บุคคลไม่ว่าจะมีส่วนได้เสียเกี่ยวข้องหรือไม่ก็ตาม ย่อมมีสิทธิเข้าตรวจดู ขอสำเนาหรือขอสำเนาที่มีคำรับรองถูกต้องของข้อมูลข่าวสารตามวรรคหนึ่งได้

ในกรณีที่สมควรหน่วยงานของรัฐโดยความเห็นชอบของคณะกรรมการ จะวางหลักเกณฑ์เรียกค่าธรรมเนียม ในการนั้นก็ได้ ในการนี้ให้คำนึงถึงการช่วยเหลือผู้มีรายได้น้อยประกอบด้วย ทั้งนี้ เว้นแต่จะมีกฎหมายเฉพาะบัญญัติไว้เป็นอย่างอื่น คนต่างด้าวจะมีสิทธิตามมาตรานี้เพียงใดให้เป็นไปตามที่กำหนดโดยกฎกระทรวง


Towards universal information access…

เรื่องของ การเข้าถึงข้อมูลข่าวสารถ้วนหน้า (universal information access) นี่ มีหลายประเด็น
นอกเหนือจากเรื่องมาตรฐานเปิด เช่น ยังมีเรื่องของ ความสามารถในการเข้าถึง (accessibility) หรือพูดง่าย ๆ ว่า ความสะดวกในการใช้งาน ด้วย — ถ้าบนเว็บก็คือ web accessibility เช่น ตัวอักษรเล็กไปมั๊ย สีอ่านยากมั๊ย เพราะบางคนมีปัญหาทางสายตา หรือ เมนูใช้ลำบากเกินไปรึเปล่า เพราะบางคนมีความบกพร่องทางร่างกายทำให้คลิกเมาส์เร็ว ๆ ไม่ได้
หรือว่าข้อมูลนั้นค้นหาเจอได้ง่ายรึเปล่า ฯลฯ อะไรพวกนี้ ก็จะเกี่ยวกับเรื่องการออกแบบสารสนเทศและการใช้งาน (information design/interaction design) อยู่ด้วย — คืออันนี้ไม่ได้พูดถึงว่าต้องง่ายสุด ๆ นะ แต่อย่างน้อยต้องยากไม่เกินระดับที่จะทำให้เป็นอุปสรรคในการเข้าถึงข้อมูลข่าวสาร

ซึ่งบางประเทศ บางเมืองในสหรัฐอเมริกา เช่น นิวยอร์ก ได้ประกาศกฎหมายบังคับให้เว็บของหน่วยงานรัฐทุกแห่ง ต้องสอบผ่านมาตรฐานเรื่อง web accessibility นี้แล้ว

ดูเรื่องนี้ต่อได้ที่ Wikipedia
และ W3C

สำหรับนอกเว็บ แต่ยังเกี่ยวข้องกับข้อมูลข่าวสารแบบดิจิทัลอยู่ ก็เช่น พวก kiosk ตู้บริการข่าวสารตามถนน ตามท่ารถ สถานที่ราชการ บริการสาธารณะ พวกนี้ก็ต้องออกแบบมาให้ทุก ๆ คนใช้ได้ด้วย เช่น ผู้มีปัญหาด้านประสาทสัมผัส หูไม่ค่อยดี ตาฝ้าฟาง ก็ต้องใช้ได้ หรือมีความบกพร่องทางกายภาพ นั่งรถเข็น หรือมือพิการ ก็ต้องใช้ได้

อย่าง ตู้บริการข่าวสาร ที่มีแป้นเหยียบให้ใช้เท้าเลือกเมนูได้ แทนการใช้มือกดหน้าจอสัมผัส หรือ ปุ่มขอความช่วยเหลือจากพนักงานเดินรถที่สถานีรถไฟ ที่ต้องมีปุ่มที่ต่ำกว่าระดับปกติด้วย เพื่อให้คนที่นั่งรถเข็นกดได้สะดวก และไมค์และลำโพงก็ต้องมีอีกชุดที่อยู่ในตำแหน่งใกล้เคียงกับปุ่มอีกปุ่มที่ว่าด้วย

เหล่านี้คือสิ่งที่จะช่วยให้ พลเมืองทุกคน สามารถเข้าถึงข้อมูลข่าวสารต่าง ๆ ได้อย่างเท่าเทียมกันมากขึ้น

technorati tags:
,
,

Time for Unicode ?

เราควรจะเปลี่ยนไปใช้รหัสข้อมูลอะไรดี ? สำหรับเอกสารภาษาไทยในโลกยุคอินเทอร์เน็ต

จะ Windows-874, TIS-620 หรือ ISO-8859-11 ก็คงไม่เพียงพอแล้ว สำหรับโลกยุคอินเทอร์เน็ตและสังคมพหุภาษา แม้แต่เอกสาร “ภาษาไทย” ในปัจจุบันก็ยังมีตัวอักษรละตินหรือสัญลักษณ์พิเศษต่าง ๆ แทรกอยู่มากมาย ซึ่งบางตัวก็ไม่ได้มีอยู่ทั้งใน Windows-874, TIS-620 และ ISO-8850-11

ได้เวลาเปลี่ยนมาใช้ Unicode ให้หมดรึยังนะ ?
(สำหรับงานส่วนใหญ่ ที่ขนาดพื้นที่จัดเก็บข้อมูล/แบนด์วิธ ไม่ได้เป็นข้อจำกัดสำคัญอีกต่อไปแล้ว)

ทั้งหน้าเว็บ ไฟล์เอกสาร metadata โค้ดโปรแกรมต่าง ๆ

แต่จะใช้อะไรดี UTF-8 หรือ UTF-16 ?

Windows NT ขึ้นไป, Windows CE, Java, .NET, Mac OS X และ Qt แพลตฟอร์มเหล่านี้ ใช้ UTF-16 เป็น native character set
แต่ถ้าเป็นโลก Unix และอินเทอร์เน็ต UTF-8 ก็แพร่หลายกว่า

ถ้าพูดถึงเฉพาะที่เกี่ยวข้องกับอินเทอร์เน็ต ไปใช้ UTF-8 กันให้หมดเลยดีมั๊ย ? สำหรับข้อมูลภาษาไทย ทั้งหน้าเว็บ ฐานข้อมูล metadata ฯลฯ

ข้อดี-ข้อเสีย ? อะไรคืออุปสรรค ?

technorati tags:
,
,

Provinces of Thailand HTML selection box

HTML option’s values according to TIS 1099-2535 Standard for Province Identification Codes for Data Interchange

ค่า value ของแต่ละ option ตาม รหัสจังหวัดเพื่อการแลกเปลี่ยนข้อมูล (มอก. 1099-2535)

download: จังหวัดในประเทศไทย HTML selection box

technorati tags:
,
,

OOXML Advertorial — NoOOXML

OOXML ทำเนียน

วันนี้เจอโฆษณา “Open XML” ใน ฐานเศรษฐกิจ ฉบับวันที่ 30 ส.ค. – 1 ก.ย. 2550 หน้า 34 (เซคชั่น “ตลาด-ตลาดภูมิภาค”)

หน้าตาทำเหมือนเป็นบทความ ขึ้นหัวใหญ่ว่า

“ธุรกิจไทย คนไทย มีทางเลือกหรือไม่ในเวทีระดับโลก
ประเทศไทยควรโหวตรับมาตรฐานการจัดเก็บเอกสารใหม่หรือไม่…”

ในนั้นมียกคำพูดจากบุคคลในวงการไอทีต่าง ๆ
เช่นจาก คุณฟูเกียรติ จุลนวล ผู้จัดการฝ่ายกลยุทธ์และแพลตฟอร์ม บริษัท ไมโครซอฟท์ (ประเทศไทย) จำกัด
คุณสมเกียรติ อึ้งอารี ประธานกรรมการบริหาร บริษัท ซีเนียร์ คอม จำกัด นายกสมาคมอุตสาหกรรมซอฟต์แวร์ไทย (ATSI)
คุณสุวิภา วรรณสาธพ ผู้อำนวยการเขตอุตสาหกรรมซอฟต์แวร์ประเทศไทย (ซอฟต์แวร์พาร์ค)

ตรงกลาง ๆ “บทความ” ตอนหนึ่งเขียนว่า

“ที่สำคัญ การโหวตครั้งนี้เป็นการทำให้ภาษาไทยได้เข้าไปเป็นหนึ่งในมาตรฐานโลก ซึ่งหากต่อไปจะมีการพัฒนาแอพพลิเคชั่นอะไรขึ้นมาแล้ว ภาษาไทยก็จะเป็นหนึ่งภาษาที่ถูกนำไปพิจารณาด้วย แม้ว่าจะมีผู้ใช้เฉพาะในประเทศไทยเท่านั้น”

… จริงหรือไม่ครับ ?
(แต่เป็นการใช้ภาษาที่ดูดีทีเดียว เขียนแบบให้ความหวังมากในที่แรก จะมีภาษาไทยแน่ ๆ … แต่ในตอนสุดท้ายก็ทิ้งระยะความรับผิดชอบแบบนิ่ม ๆ .. จะถูกนำไปพิจารณาเท่านั้นแหละนะ ไม่ได้สัญญาอะไรมากกว่านี้)

อีกตอนหนึ่งเขียนว่า

“วันนี้เรากำลังมีทางเลือกในการที่จะมีอีกมาตรฐานที่ช่วยในการจัดเก็บเอกสารไว้ใช้งาน ประเทศไทยอาจจะไม่จำเป็นต้องรับรองให้ Open XML เป็นมาตรฐาน ISO ก็ได้ แต่ถามว่า วันนี้เรามีมาตรฐานที่เหมาะสมที่ช่วยในการจัดกับเอกสารที่เรามีใช้งานอยู่แล้วในองค์กร รวมถึงมาตรฐานที่ช่วยให้เอกสารของเราสามารถทำงานร่วมกับระบบงานต่าง ๆ ที่มีใช้งานอยู่แล้วในองค์กร”

อ่านโดยรวมทั้งหมดแล้ว จะเน้นกลุ่มองค์กรที่ใช้งานไมโครซอฟท์ออฟฟิศอยู่แล้ว และสร้างความไม่แน่ใจเกิดขึ้นว่า ถ้า Open XML ไม่ได้เป็นมาตรฐาน ISO แล้วเอกสารทั้งหมดของพวกเขา จะทำงานกับระบบอื่น ๆ ในโลกไม่ได้

ก็ติดตามตรวจสอบกันไปครับ ใครพูดจริงเท็จ พูดครึ่งเดียว พูดบิดเบือน …

แล้ว สมอ. ของไทย จะเชื่อใคร โหวตให้ใคร เพื่อเห็นแก่ประโยชน์ของใคร … ก็ดูกันไป

พวกเราจะไปมีส่วนร่วมอะไรได้ไหม ??


ลองอ่าน รวมความเห็น OOXML จากหลายฝ่าย ที่ Blognone

ถ้าใครพิจารณาแล้ว ไม่สนับสนุนการมีอีกมาตรฐาน (ตอนนี้ ISO มีมาตรฐานการจัดเก็บเอกสารอยู่แล้ว ชื่อว่า OpenDocument)
ก็ไปลงชื่อคัดค้านกัน ที่ No OOXML (ในนั้นมีเหตุผลให้อ่านเป็นข้อ ๆ เลย ลองอ่านดู)


(เลือกรูปอื่น ๆ ไปแปะเว็บ ได้จาก NoOOXML Banners)

technorati tags:
,
,
,

Data Interchange Format in Emergency

Information chaos is the last thing we need in the middle of a chaos.

Tsunamis, tornados, volcano eruptions, earthquakes, mudflow, landslides, wildfire, flood, avalanche, … we never know what next. — Be prepared.

บ้านเราปีที่แล้วมีสึนามิ ถัดมาไม่นานที่สหรัฐมีคาทรินา อินเดียมีแผ่นดินถล่ม อินโดแผ่นดินไหวภูเขาไฟระเบิด น้ำท่วมใหญ่ที่เชค และสด ๆ ร้อน ๆ น้ำท่วมโคลนถล่มแถบภาคเหนือตอนล่าง ภัยธรรมชาติ (หรือจะรวมก่อการร้ายเข้าไปด้วยก็ได้) พวกนี้ป้องกันไม่ได้ จะทำได้เพียงเตือนภัยล่วงหน้าก่อนเกิดเพื่อลดการสูญเสียชีวิต และเตรียมระบบเพื่อให้การช่วยเหลือหลังเกิดเหตุการณ์ จากประสบการณ์ที่ผ่านมาเมื่อสึนามิที่ผ่านมา เราพบว่าการแลกเปลี่ยนแบ่งปันข้อมูลระหว่างหน่วยงานบรรเทาภัย เป็นไปอย่างยากลำบาก หรือเป็นไปไม่ได้เลย ทำให้การช่วยเหลือเป็นไปอย่างมีประสิทธิภาพน้อยกว่าที่ศักยภาพจริงจะทำได้ ควรถึงเวลาที่เราจะคิดถึง มาตรฐานสำหรับแลกเปลี่ยนข้อมูลในเหตุการณ์ฉุกเฉิน/ภัยพิบัติ เสียที

Data interchange format for emergency and disaster response:

OpenCARE — [Open] Exchange for Collaborative Activities in Response to Emergencies โครงการนำโดยผู้มีประสบการณ์จากเหตุการณ์สึนามิที่ผ่านมา

tags: , , , , ,