-
เปิดข้อมูลอย่างเดียวไม่พอ ต้องให้มัน machine-readable ด้วย!
สองสัปดาห์ก่อน พยายามจะเอาข้อมูลรายจ่ายภาครัฐมาใช้งาน แต่ก็พบปัญหาในการเอามาใช้ คือข้อมูลเท่าที่หาได้ มันไม่ machine-readable หรือ “อ่านด้วยเครื่องไม่ได้” เขียนสรุปเอาไว้ที่บล็อกโอเพ่นดรีม: รายจ่ายภาครัฐ ประจำปีงบประมาณ 2544-2554 ในรูปแบบ machine-readable (ดาวน์โหลดข้อมูลในฟอร์แมต OpenDocument) สาเหตุหลัก ๆ คือ: เป็น PDF ไม่ใช่ CSV หรือข้อมูลในรูปแบบตารางที่คำนวณได้ อย่าง OpenDocument spreadsheet หรือ Excel แย่กว่านั้น บาง PDF เป็นแบบรูปภาพ-สแกนหน้ากระดาษามา แถมเอียงหรือไม่ชัดอีกต่างหาก PDF ที่เหมือนจะเป็นข้อความดี ๆ บางอันก็มีปัญหาการเข้ารหัสชุดตัวอักษร เช่นแสดงให้เห็นเป็น “๔๕,๐๐๐,๐๐๐,๐๐๐” แต่พอ copy มา paste ก็กลายเป็น “Ùı,,,” แบบนี้คือ human-readable แต่ไม่ machine-readable แบบชัด ๆ เลย เอกสารใช้เลขไทย ซึ่งไม่ใช่ว่าทุก…
-
The Hague Declaration, call for signers
Support free and open information standards, for transparency, for equality, for participatory, for communication rights, for information freedom, and for freedom of expression. — please consider signing the The Hague Declaration. ขอเชิญพิจารณาและร่วมลงชื่อใน “คำประกาศเฮก” (The Hague Declaration) เพื่อสนับสนุนมาตรฐานดิจิทัลแบบเปิดและเสรี และเรียกร้องให้รัฐบาลทั่วโลกใช้และส่งเสริมมาตรฐานแบบเปิดและเสรี เพื่อความเท่าเทียมและโปร่งใสในการเข้าถึงข้อมูล มีส่วนร่วมในการปกครอง และใช้บริการของรัฐ ผ่านทางระบบอิเล็กทรอนิกส์ (e-Government) โดยไม่ถูกเลือกปฏิบัติ ตามสิทธิและเสรีภาพของเราใน ปฏิญญาสากลว่าด้วยสิทธิมนุษยชน และตามรัฐธรรมนูญ มาตรา ๕๖ บุคคลย่อมมีสิทธิได้รับทราบและเข้าถึงข้อมูลหรือข่าวสารสาธารณะ ในครอบครองของหน่วยราชการ หน่วยงานของรัฐ รัฐวิสาหกิจ หรือราชการส่วนท้องถิ่น เว้นแต่…
-
Open Document Standard, e-Government, and Universal Information Access
ต่อเรื่อง open document standard มาตรฐานเอกสารแบบเปิด ที่ใน duocore ตอนที่ 66 ลืมพูด/เวลาไม่พอเลยข้ามไป open standard นี่ ทั้งตัว format และ protocol ทุกอย่างที่เกี่ยวข้องเลยนะ มาตรฐานเอกสารแบบเปิด กับระบบรัฐบาลอิเล็กทรอนิกส์ (e-Government) เช่นเรื่อง backoffice ระบบบริหารจัดการข้อมูลของระบบราชการ หน่วยงานรัฐ ที่ต้องประมวลผลเอกสารมาก ๆ ทั้งภายในหน่วยงานเอง ระหว่างหน่วยงานรัฐ และกับภาคเอกชน ประชาชน ถ้าไม่ใช่ฟอร์แมตเปิด การสร้างซอฟต์แวร์ระบบที่จะอ่าน/เขียนเอกสารเหล่านั้นได้อย่างอัตโนมัติ ก็ลำบาก (ต้อง reverse engineering แกะสเปกกันวุ่นวาย) แถมยังไม่สามารถมั่นใจเต็ม 100% ได้ว่าจะอ่าน/เขียนได้ตรงเป๊ะ ซึ่งก็อาจทำให้ข้อมูลบางอย่างตกหล่นสูญหายได้ ยิ่งคิดว่าในกระบวนการทำงานจะต้องมีการส่งเอกสารกันหลายทอด อ่าน/เขียนกันหลายรอบ ก็เป็นไปได้ที่การสูญหายดังกล่าวจะสะสมเยอะขึ้นได้ด้วย มาตรฐานเอกสารแบบเปิด กับการเข้าถึงข้อมูลข่าวสารถ้วนหน้า (universal information access) นอกจากนี้ กรณีที่สเปกรูปแบบเอกสารที่มันปิด ไม่ได้เป็นมาตรฐานเปิด ก็ทำให้มีโอกาสอยู่มาก ที่จำนวนโปรแกรมที่จะมาอ่าน/เขียนเอกสารเหล่านั้นได้…
-
Time for Unicode ?
เราควรจะเปลี่ยนไปใช้รหัสข้อมูลอะไรดี ? สำหรับเอกสารภาษาไทยในโลกยุคอินเทอร์เน็ต จะ Windows-874, TIS-620 หรือ ISO-8859-11 ก็คงไม่เพียงพอแล้ว สำหรับโลกยุคอินเทอร์เน็ตและสังคมพหุภาษา แม้แต่เอกสาร “ภาษาไทย” ในปัจจุบันก็ยังมีตัวอักษรละตินหรือสัญลักษณ์พิเศษต่าง ๆ แทรกอยู่มากมาย ซึ่งบางตัวก็ไม่ได้มีอยู่ทั้งใน Windows-874, TIS-620 และ ISO-8850-11 ได้เวลาเปลี่ยนมาใช้ Unicode ให้หมดรึยังนะ ? (สำหรับงานส่วนใหญ่ ที่ขนาดพื้นที่จัดเก็บข้อมูล/แบนด์วิธ ไม่ได้เป็นข้อจำกัดสำคัญอีกต่อไปแล้ว) ทั้งหน้าเว็บ ไฟล์เอกสาร metadata โค้ดโปรแกรมต่าง ๆ แต่จะใช้อะไรดี UTF-8 หรือ UTF-16 ? Windows NT ขึ้นไป, Windows CE, Java, .NET, Mac OS X และ Qt แพลตฟอร์มเหล่านี้ ใช้ UTF-16 เป็น native character…
-
Provinces of Thailand HTML selection box
(เลือกจังหวัด)นอกประเทศไทยกรุงเทพมหานครเชียงรายเชียงใหม่น่านพะเยาแพร่แม่ฮ่องสอนลำปางลำพูนสุโขทัยอุตรดิตถ์ กาฬสินธุ์ขอนแก่นชัยภูมินครพนมนครราชสีมาบุรีรัมย์มหาสารคามมุกดาหารยโสธรร้อยเอ็ดเลยสกลนครสุรินทร์ศรีสะเกษหนองคายหนองบัวลำภูอุดรธานีอุบลราชธานีอำนาจเจริญ กำแพงเพชรชัยนาทนครนายกนครปฐมนครสวรรค์นนทบุรีปทุมธานีพระนครศรีอยุธยาพิจิตรพิษณุโลกเพชรบูรณ์ลพบุรีสมุทรปราการสมุทรสงครามสมุทรสาครสระบุรีสิงห์บุรีสุพรรณบุรีอ่างทองอุทัยธานี จันทบุรีฉะเชิงเทราชลบุรีตราดปราจีนบุรีระยองสระแก้ว กาญจนบุรีตากประจวบคีรีขันธ์เพชรบุรีราชบุรี กระบี่ชุมพรตรังนครศรีธรรมราชนราธิวาสปัตตานีพังงาพัทลุงภูเก็ตยะลาระนองสงขลาสตูลสุราษฎร์ธานี HTML option’s values according to TIS 1099-2535 Standard for Province Identification Codes for Data Interchange ค่า value ของแต่ละ option ตาม รหัสจังหวัดเพื่อการแลกเปลี่ยนข้อมูล (มอก. 1099-2535) download: จังหวัดในประเทศไทย HTML selection box technorati tags: Thailand, HTML, province
-
OOXML Advertorial — NoOOXML
OOXML ทำเนียน วันนี้เจอโฆษณา “Open XML” ใน ฐานเศรษฐกิจ ฉบับวันที่ 30 ส.ค. – 1 ก.ย. 2550 หน้า 34 (เซคชั่น “ตลาด-ตลาดภูมิภาค”) หน้าตาทำเหมือนเป็นบทความ ขึ้นหัวใหญ่ว่า “ธุรกิจไทย คนไทย มีทางเลือกหรือไม่ในเวทีระดับโลก ประเทศไทยควรโหวตรับมาตรฐานการจัดเก็บเอกสารใหม่หรือไม่…” ในนั้นมียกคำพูดจากบุคคลในวงการไอทีต่าง ๆ เช่นจาก คุณฟูเกียรติ จุลนวล ผู้จัดการฝ่ายกลยุทธ์และแพลตฟอร์ม บริษัท ไมโครซอฟท์ (ประเทศไทย) จำกัด คุณสมเกียรติ อึ้งอารี ประธานกรรมการบริหาร บริษัท ซีเนียร์ คอม จำกัด นายกสมาคมอุตสาหกรรมซอฟต์แวร์ไทย (ATSI) คุณสุวิภา วรรณสาธพ ผู้อำนวยการเขตอุตสาหกรรมซอฟต์แวร์ประเทศไทย (ซอฟต์แวร์พาร์ค) ตรงกลาง ๆ “บทความ” ตอนหนึ่งเขียนว่า “ที่สำคัญ การโหวตครั้งนี้เป็นการทำให้ภาษาไทยได้เข้าไปเป็นหนึ่งในมาตรฐานโลก ซึ่งหากต่อไปจะมีการพัฒนาแอพพลิเคชั่นอะไรขึ้นมาแล้ว ภาษาไทยก็จะเป็นหนึ่งภาษาที่ถูกนำไปพิจารณาด้วย…
-
OpenSearch
OpenSearch is a set of simple formats for the sharing of search results. Any website that has a search feature can make their results available in OpenSearch format. Other tools, like web browser integrated search service, can then read those search results. See what major browsers will do with this OpenSearch: Firefox 2, IE 7,…
-
Data Interchange Format in Emergency
Information chaos is the last thing we need in the middle of a chaos. Tsunamis, tornados, volcano eruptions, earthquakes, mudflow, landslides, wildfire, flood, avalanche, … we never know what next. — Be prepared. บ้านเราปีที่แล้วมีสึนามิ ถัดมาไม่นานที่สหรัฐมีคาทรินา อินเดียมีแผ่นดินถล่ม อินโดแผ่นดินไหวภูเขาไฟระเบิด น้ำท่วมใหญ่ที่เชค และสด ๆ ร้อน ๆ น้ำท่วมโคลนถล่มแถบภาคเหนือตอนล่าง ภัยธรรมชาติ (หรือจะรวมก่อการร้ายเข้าไปด้วยก็ได้) พวกนี้ป้องกันไม่ได้ จะทำได้เพียงเตือนภัยล่วงหน้าก่อนเกิดเพื่อลดการสูญเสียชีวิต และเตรียมระบบเพื่อให้การช่วยเหลือหลังเกิดเหตุการณ์ จากประสบการณ์ที่ผ่านมาเมื่อสึนามิที่ผ่านมา เราพบว่าการแลกเปลี่ยนแบ่งปันข้อมูลระหว่างหน่วยงานบรรเทาภัย เป็นไปอย่างยากลำบาก หรือเป็นไปไม่ได้เลย ทำให้การช่วยเหลือเป็นไปอย่างมีประสิทธิภาพน้อยกว่าที่ศักยภาพจริงจะทำได้ ควรถึงเวลาที่เราจะคิดถึง มาตรฐานสำหรับแลกเปลี่ยนข้อมูลในเหตุการณ์ฉุกเฉิน/ภัยพิบัติ…