-
เปิดข้อมูลอย่างเดียวไม่พอ ต้องให้มัน machine-readable ด้วย!
สองสัปดาห์ก่อน พยายามจะเอาข้อมูลรายจ่ายภาครัฐมาใช้งาน แต่ก็พบปัญหาในการเอามาใช้ คือข้อมูลเท่าที่หาได้ มันไม่ machine-readable หรือ “อ่านด้วยเครื่องไม่ได้” เขียนสรุปเอาไว้ที่บล็อกโอเพ่นดรีม: รายจ่ายภาครัฐ ประจำปีงบประมาณ 2544-2554 ในรูปแบบ machine-readable (ดาวน์โหลดข้อมูลในฟอร์แมต OpenDocument) สาเหตุหลัก ๆ คือ: เป็น PDF ไม่ใช่ CSV หรือข้อมูลในรูปแบบตารางที่คำนวณได้ อย่าง OpenDocument spreadsheet หรือ Excel แย่กว่านั้น บาง PDF เป็นแบบรูปภาพ-สแกนหน้ากระดาษามา แถมเอียงหรือไม่ชัดอีกต่างหาก PDF ที่เหมือนจะเป็นข้อความดี ๆ บางอันก็มีปัญหาการเข้ารหัสชุดตัวอักษร เช่นแสดงให้เห็นเป็น “๔๕,๐๐๐,๐๐๐,๐๐๐” แต่พอ copy มา paste ก็กลายเป็น “Ùı,,,” แบบนี้คือ human-readable แต่ไม่ machine-readable แบบชัด ๆ เลย เอกสารใช้เลขไทย ซึ่งไม่ใช่ว่าทุก…
-
Thailand Open Data Catalog บัญชีข้อมูลเปิดของไทย
Open Data Thailand เป็นสมุดทะเบียนสำหรับชุดข้อมูลและเนื้อหาแบบเปิด เว็บไซต์นี้ทำงานด้วยซอฟต์แวร์ CKAN ซึ่งทำให้การค้นหา แบ่งปัน และใช้ข้อมูลซ้ำ ไปเป็นได้โดยง่าย โดยเฉพาะการทำงานเหล่านั้นด้วยวิธีการอัตโนมัติด้วยคอมพิวเตอร์ Open Data Thailand is an open registry of data and content packages. Harnessing the CKAN software, this site makes it easy to find, share and reuse content and data, especially in ways that are machine automatable. ไอเดียของ Open Data Catalog คือ พยายามรวบรวมข้อมูลสาธารณะและข้อมูลภาครัฐ ที่เปิดเผยอยู่แล้วในอินเทอร์เน็ต แต่อาจจะกระจัดกระจายอยู่…
-
สัมภาษณ์ @klaikong เรื่อง “ข้อมูลเปิดภาคสาธารณะ” กับการพัฒนาเศรษฐกิจ-สังคม-การเมือง #opendata #opengov
ผมสัมภาษณ์ พี่แต๊ก ไกลก้อง ไวทยการ (@klaikong) เอาไว้เมื่อวันที่ 4 ธ.ค. 2553 ที่ผ่านมา ระหว่างเวิร์กช็อป “Open Data Hackathon” ที่ Opendream คุยกันเรื่องความเคลื่อนไหว “ข้อมูลเปิดภาครัฐ” หรือ “ข้อมูลเปิดภาคสาธารณะ” (Open Government Data หรือ Open Public Data) กับความจำเป็นของสังคมไทยที่ภาครัฐจะต้องเปิดเผยข้อมูลให้สาธารณะเข้าถึงได้ เพื่อให้ทุกภาคส่วนสามารถร่วมพัฒนาประเทศไปพร้อม ๆ กัน ด้วยการตัดสินใจบนข้อมูลที่รอบด้าน ในสถานการณ์โลกที่เปลี่ยนแปลงไปอย่างรวดเร็ว วันนี้เพิ่งถอดเทปเสร็จ มีคุยกันเรื่องรูปแบบข้อมูล รวมถึงความเป็นไปได้ในการจะออกกฎระเบียบที่เกี่ยวข้อง : เรื่องมาตรฐานข้อมูลเนี่ย ประเทศเราทำไม่ได้จริงซะที คุยกันมานานแล้ว ว่าจะต้องมีระบบมาตรฐาน จะต้องมี standard อะไรต่าง ๆ XML ฯลฯ แต่ถึงทุกวันนี้ เท่าที่เห็น ร้อยละ 80 ข้อมูลก็ยังอยู่ในรูปแบบ PDF ซึ่งอันนี้มันสะท้อนเรื่องวิธีคิดว่า ข้อมูลนี้ก็ยังเป็นข้อมูลของหน่วยงานนั้นอยู่…
-
Lao44 – Free the Lao documents
Lao44 or Coalition for Lao Information, Communication and Knowledge is the largest repository of documents in Lao language. The number 44 in Lao44 refers to Article 44 in the Constitution of Lao PDR, which says: Lao citizens have the right and freedom of speech, press and assembly; and have the right to set up associations…