วันนี้ได้มีโอกาสกินข้าวเย็นคุยกับเก่งและคนทำงานใน google สองคนที่รับผิดชอบภูมิภาคแถวนี้… เขาดูง่วงกันพอควรเพราะเห็นว่าเครื่องเพิ่ง landed เมื่อสองชั่วโมงที่แล้ว คุยไปคุยมาหลายเรื่อง.. แต่ที่สนใจที่สุดคือ gap minder ซึ่งก็เป็น tool ใหม่ที่ google เพิ่งไป acquired มา เป็นเครื่องมือทำ data visualization ที่ interactive เหมาะกับการนำเสนอข้อมูลที่ซับซ้อนมาทำใหเข้าใจง่าย เช่นอัตราการตายเมื่อเทียบกับการเจริญทางเศรษฐกิจระหว่างหลายประเทศ หรือจังหวัด ซึ่งน่าจะเกิดประโยชน์มากกับการสื่อสารเพื่อให้เกิดผลเชิงนโยบาย ผมเคยเขียนเรื่องนี้ไว้ที่ blog เดิมสนใจคลิกอ่านได้ที่นี่เขาว่าตอนนี้ที่ google head office ทางเข้าจะมี gap minder โชว์หราอยู่ คนที่ google ก็เลยรู้เรื่องนี้กันทั่วไป สิ่งที่น่าสนใจก็คือการนำข้อมูลสำคัญๆ เช่นข้อมูลสุขภาพคนไทยจากกระทรวงสาธารณสุขหรือ สสส. มานำเสนอ แบ่งตามจังหวัด แล้วเอาไปให้ที่ประชุมผู้ว่าดู รับรองว่าเกิดผลสุดๆแน่ เช่นการแข่งขันของแต่ละจังหวัดเรื่องการตายจากเอดส์ หรือแม้แต่ข้อมูลไข้หวัดนก อย่างไรก็ตามเขาว่าจะ connect ให้เพราะทางทีมที่ทำ gap minder คงอยากได้ dataset จากประเทศกำลังพัฒนาเพื่อเอาไปทดลองดู หวังว่าคงจะได้ทำอะไรเรื่องนี้ในอนาคตอันใกล้เขาว่าสิ่งที่เขาสนใจคือเรื่องของ content ในไทย ก็เลยชวนเขาว่าหากจะทำ google books / google scholars นั้นเรายินดีจะลองช่วยกันหา partner ที่สนใจในเมืองไทย เพื่อให้ฐานข้อมูลความรู้ งานวิจัย และหนังสือสำคัญๆเข้าถึงได้โดยคนทั่วไป ซึ่งอย่างไร TRN ก็คงต้องทำอยู่แล้ว ไม่ว่าจะทำกับใคร แต่หากมี technology partner ที่มีประสบการณ์มาแล้วก็คงจะดี
มันน่าจะชื่อ Trendalyzer นา… ในรูปอ่ะ
Google Books นี่ อุปสรรคนึง น่าจะเป็นตัว OCR ภาษาไทย
เพราะมันไม่ใช่แค่สแกนมาเก็บเป็นรูป แต่ต้องค้นได้ด้วย ก็ต้องเก็บเป็นข้อความจริง ๆ ต้องแปลงรูปให้เป็นข้อความ
แต่ระดับกูเกิ้ล ก็อาจจะแก้ตรงนี้ให้ดีขึ้นได้ง่าย ๆ ถ้าจะทำ
ถ้าทำจริงนี่ ขอคอลเลคชั่นหนังสือหายากและหนังสือต้องห้ามที่ท่าพระจันทร์ก่อนเลย
trandalyzer เป็นชื่อที่เขาเรียกตอน TED นะ แต่พอมาถึง google มันกลายเป็น tool หนึ่งที่เรียกว่า gap minder นะ ไม่แน่ใจเหมือนกัน
OCR ของไทยมีใครทำไว้บ้างครับ ?
เคยทำ OCR ภาษาไทยไว้สมัยเรียน ป.ตรี แต่เป็นแบบโง่ๆ ยังไงก็มะรุ ฮา