มีเรื่องมาชวนร่วมคิดร่วมทำกันครับ
เผอิญช่วงนี้คิดๆเรื่อง Digital Library (Online) อยู่ว่าจะทำอย่างไรประเทศไทยถึงจะมีระบบ Digital library ที่เชื่อมโยงกัน ที่มีข้อมูลทั้งด้าน
– Digital Content ที่มีอยู่แล้วแต่กระจัดกระจาย
– Physical content ที่ต้อง digitize เช่น หนังสือ แผ่นฟิลม์ ภาพ รูปถ่าย ฯลฯ เช่น ที่หอสมุดแห่งชาติ ห้องสมุดมหาวิทยาลัย และหอจดหมายเหตุ เป็นต้น (ที่อเมริกานั้น scan ไปแล้วกว่าล้านเล่ม ฝรั่งเศสสองแสน ญี่ปุ่นอีกสามแสน) ซึ่งอาจจะเน้นหนังสือที่มีความสำคัญ และหมดลิขสิทธิ์หรือ out of print (ไม่แน่ใจว่าเมืองไทยนี้กฏหมายเกี่ยวกับ out of print เป็นอย่างไร)
– Research/journals ที่เกิดจากงานของคนไทย
อยากให้เป็นระบบที่เข้าถึงข้อมูลทั้งหมดได้จากที่เดียวเชื่อมโยงได้หมด สามารถเปิดดูออนไลน์และโหลดไปได้เลย
เรื่องนี้คิดว่าเบื้องต้น สสส. สวทช./NECTEC สำนักนายกฯ และเครือข่ายอย่าง YouFest น่าจะสามารถขับเคลื่อนเป็นเจ้าภาพร่วมได้
ไม่ทราบว่าใครมีข้อมูล ข้อคิดเห็นอย่างไรครับ
เข้าใจว่ามีคนทำอยู่แล้วในหลายส่วน เช่นห้องสมุดมหาวิทยาลัยอย่างจุฬา-ธรรมศาสตร์ ฯลฯ แต่ยังไม่แน่ใจว่าจะเชื่อมโยงกันอย่างไร อาจจะออกมาคล้ายๆเป็นเครือข่ายเว็บกาญจนาภิเษก 2.0 อะไรประมาณนี้…
มีคนเสนอโมเดลการ Finance การจัดการในหลากหลายรูปแบบ ทั้งที่เป็นทุนของรัฐ การสนับสนุนด้าน CSR หรือแม้แต่การสนับสนุนจากบุคคลธรรมดาในการแสกนหนังสือ… มีโมเดลอะไรน่าสนใจไหมครับ ใครรู้บ้าง
อีกด้านหนึ่งก็คิดว่าเรื่องนี้คงจะได้ใช้ประโยชน์จากเรื่อง CC ของไทยที่ใกล้เรียบร้อยแล้วเป็นแน่แท้
ผมได้แรงบรรดาลใจอย่างมากจาก Brewster Kahle: A digital library, free to the world
ตอนนี้มี facebook page หัวข้อ “Digital Library for Thailand” อีกที่หนึ่งสำหรับการพูดคุยครับ
สุนิตย์
คุณอาจไม่ทราบว่าบริษัทเอทิซ ของคนไทยเราเป็น player สำคัญของการสร้างห้องสมุดดิจิตัลของโลก เราได้พบมาหมดแล้ว ทั้ง Google, Amazon, และ Internet Archive (Brewster)
คุณทราบไหมครับว่าเครื่องสแกนหนังสือความเร็วสูงที่ Internet Archive มีอยู่กี่เครื่อง ข้อมูลล่าสุดคือประมาณ 50 เครื่อง (ซึ่งบางคนอาจจะคิดว่ามากแล้ว) แต่เอทิซ เป็นผู้อยู่เบื้องหลัง ผลิตและขายเครื่องสแกนความเร็วสูงใหักับพิพิธภัณท์และมหาวิทยาลัยทั่วโลกไปแล้วประมาณ 500 เครื่อง ซึ่งเครื่องเหล่านั้นได้ถูกนำไป digitize หนังสือหลายล้านเล่มแล้ว คงจะมากกว่าที่ Internet Archive หรือ Google ทำด้วยซ้ำไป เพียงแต่หนังสือที่มีค่าที่ถูกสแกนแล้ว (เช่นคัมภีร์ต่างๆขออิสลาม และอื่นๆ) เขาไม่ได้เอามาไว้บน Google เท่านั้นเอง
คุณ Brewster พี่แกเขา hi-profile แต่ของเรามัน low-profile ในฐานะที่เราเป็น Enabler คนทั่วไปเลยอาจไม่รู้
คุณสารสิน เยี่ยมมากเลยครับ แล้วเราจะหาข้อมูลของเอทิซได้ที่ไหนครับ น่าจะลองนัดคุยกันซักครั้งนักครับ low profile มารวมๆกันน่าจะทำอะไรได้ง่าย จริง และเร็วครับ
จริงๆทั้ง Chitpong และ Pop เคยเล่าให้ฟังเรื่อง Atiz อยู่เหมือนกัน น่าสนใจมากครับ แล้วถ้าเราจะพยายามสร้างความร่วมมือดันเรื่องนี้ในเมืองไทย ATIZ มีบทเรียนอะไรจากที่เป็นผู้อยู่เบื้องหลังโครงการสำคัญๆนอกประเทศครับ? แล้วเราจะทำอย่างไรถึงจะจัดการเรื่องต้นทุนอย่างไรโครงการลักษณะนี้จึงจะเกิดขึ้นและขยายผลได้ ขณะที่ ATIZ ก็ต้องอยู่ได้ด้วยครับ?
(ตอบไปแล้วใน facebook discussion)
อยากเสนอว่าเรื่องนี้ต้องทำ 3 layer พร้อมๆ กัน
1. application คือเว็บกลาง ที่ทำหน้าที่นำเสนอต่อผู้ใช้ และเป็นระบบรวบรวม / เชื่อมข้อมูล
2. coordination คือการเจรจา เชื่อมประสานหน่วยงานต่างๆ อาจใช้ทีม openbase ส่วนหนึ่งก็ได้ เพราะทำเรื่องการประสานขอข้อมูลจากแหล่งต่างๆ อยู่แล้ว
3. support คือกลไกสนับสนุน โดยเฉพาะการสนับสนุนให้หน่วยงานแหล่งข้อมูลต่างๆ ใช้สัญญาอนุญาตแบบยืดหยุ่น อย่าง creative commons ซึ่งกลุ่ม CC Thailand ทำอยู่ แต่น่าจะต้องกำหนด plan ร่วมกันว่าจะขอจากหน่วยงานบ้าง อะไรก่อน อะไรหลัง
อันที่จริง ถ้าทำเรื่อง support (3) ได้ เรื่อง coordination (2) ก็จะง่าย เพราะเนื้อหาเป็น CC อยู่แล้ว เหลือแค่วิธีทางเทคนิคในระดับ application (1)
จริงๆเรื่องนี้คิดเป็นการต่อยอด openbase, CC เพื่อยกระดับขึ้นมาให้เกิดผลวงกว้างขึ้นอีกนะ ดีดี จริงๆเรื่องนี้น่าจะคุยต่อผ่าน google group นะ เดี๋ยวไปทำ แป็ปหนึ่ง
ช่วยด้วยคน!
เต็มที่!
คัดเอาจากอีเมลที่ส่งให้สุนิตย์มาแปะไว้นะครับ
==============================
งานที่ต้องทำแบ่งเป็น
– technical
– non-technical พวกเรื่องกฎหมาย กฎระเบียบ (งานของ อ.
จะต้องเป็นสิทธิ์ของมหาลัย etc.) งานเจรจา
ในแง่ technical มันจะมี 2 ส่วนย่อย
1) index
2) content
2.1) digitized content
2.2) paper content
คือผมคิดว่ารูปแบบมันจะเป็นการมอง digitized content เป็นแค่ medium
ชนิดนึง คุณค้นข้อมูลจาก index เจอ มันจะเป็นหนังสือปกติหรือไฟล์
ก็ไม่ใช่เรื่องที่ต้องสนใจ ขอแค่เจอแล้วรู้ว่าจะไปหาตัว content
ได้จากไหน (เช่น เดินไปที่ shelf ไหน หรือ โหลดไฟล์จาก Url อะไร)
ถ้ามี digitized content เยอะๆ ก็ดี สะดวก แต่คิดว่าเราน่าจะรวบเอา
library index system ให้เป็นอันเดียว ไม่ต้องแยกว่าตัว content จะเป็น
ditigal หรือไม่
ในอีกทางก็ digitize content ไปเรื่อยๆ ขนานกันไป
อันนี้ก็ต้องไปถามบริษัท Atiz ที่่ว่า
ผมคิดว่าส่วนสำคัญมันจะไปอยู่ที่ 1) กับ 2.1) แต่ 1) สำคัญกว่า
1)
ห้องสมุดทุกแห่งมีระบบ index ที่เป็น digital หมดแล้ว
ปัญหาคือเราจะรวบเอามาเป็น single query ยังไง แบบว่าค้นที่เดียวเจอหมด
มันก็มี 2 แนวทางคือ
a) ทำ index กลาง แบบว่าทุกฝ่ายต้องส่ง index ของตัวเองมาทำที่หน่วยงานกลางสักอัน
b) ทำ metasearch ไปดึง index มาจากฐานข้อมูลต่างๆ (ต้องเจรจาให้เค้าเปิด
API ให้ ผมคิดว่าส่วนมากห้องสมุดมันใช้ระบบ library management
แบบสำเร็จรูปของฝรั่ง ไม่ค่อยได้ทำกันเองหรอก ทางเทคนิคไม่น่าใช่ปัญหา)
a) เนี่ยมันเป็นไปได้ยากด้วยการเมืององค์กร ก็คงต้องใช้ b)
ซึ่งมันจะออกมาคล้ายๆ Google Scholar นะ เราคงต้องดู best practice
ของพวกเว็บ online journal แบบนี้น่าจะตรงกับ req. ที่สุด
2.1)
ส่วนเรื่องการจัดเก็บ digitized content ที่จะทำต่อจากนี้
ผมยังคิดไม่ค่อยออก เพราะไม่ใช่เรื่องถนัด แต่ที่เล็งๆ ไว้คือ
– เก็บแบบกระจาย เก็บใครเก็บมัน
– เปิดช่องทางให้ดูดไฟล์กันได้ง่ายๆ
– มี centralized server สักอัน สำหรับสำรองไฟล์ที่สำคัญๆ
และน่าจะใช้บ่อย (อันนี้เป็นงานยากที่จะต้องมาคัดว่าไฟล์อะไรบ้าง)
เพื่อกันเว็บใดเว็บหนึ่งล่มแล้วจะซวย
– อาจจะต้อง distribute file ด้วย P2P ควบคู่ไปด้วย
จริงๆ อีกเรื่องผมคิดว่าควรจะมีคือ full text search ภาษาไทยแบบ perfect
อันนี้มันว่ากันยาว ไว้ทำพวกนี้เสร็จหมดแล้วค่อยคิด
ฟังๆ ดู ในฝั่งเทคนิคจะคล้ายๆ Open Knowledge Framework ที่เคยคุยกับเก่ง (OpenDream) + กล้า (Thoth) เมื่อต้นปีที่แล้ว อยากเห็นๆ
น่าสนใจมากครับ ผมเป็นนิสิตหากพอจะช่วยอะไรได้ ติดต่อได้ครับ