คลังข้อมูล (Data Warehouse)

พ.อ.รศ.ดร.เศรษฐพงค์  มะลิสุวรรณ
settapong_m@hotmail.com
ประจำกรมข่าวทหาร กองบัญชาการกองทัพไทย
กรรมการกำหนดและจัดสรรคลื่นความถี่ใหม่ ภายใต้คณะกรรมการกิจการโทรคมนาคมแห่งชาติ (กทช.)


          การใช้ข้อมูลเป็นเครื่องมือสำคัญในการตัดสินใจขององค์กร ไม่ว่าจะเป็นเพื่อการลงทุนทางธุรกิจ การวางแผนงานในองค์กรภาครัฐและวางแผนกลยุทธ์ในทุกองค์กรเพื่อให้สามารถตอบ โต้กับการเปลี่ยนแปลงอย่างรวดเร็วของสิ่งแวดล้อมและคู่แข่งขัน ฉะนั้นก็อาจกล่าวได้ว่าการมีข้อมูลมากทำให้มีโอกาสและมีชัยเหนือคู่แข่งใน ระดับหนึ่ง แต่ทว่าหากมองในทางกลับกัน การมีข้อมูลจำนวนมากแต่ขาดการจัดการที่เป็นระบบ ก็จะทำให้มีความยุ่งยากในการเข้าถึงเพื่อนำมาใช้ประโยชน์ และยังต้องเสียค่าใช้จ่ายจำนวนมหาศาลในการเก็บรักษาข้อมูลเหล่านั้นไว้โดย ไม่จำเป็น นอกจากนี้หากมีการนำข้อมูลมาวิเคราะห์อย่างผิดพลาดอาจจะก่อให้เกิดผลเสียหาย ได้ ซึ่งอาจจะเกิดการสูญเสียที่ไม่อาจประเมินค่าได้ เช่น ความผิดพลาดในการตัดสินใจเพื่อความมั่นคงของชาติ การเสียโอกาสทางธุรกิจไป เป็นต้น เพราะฉะนั้นในยุคที่ผู้บริหารมีความต้องการใช้ข้อมูลเพื่อการตัดสินใจนั้น การจัดระบบข้อมูลสารสนเทศเพื่อนำเสนอข้อมูลที่มีคุณค่าและผ่านการกลั่นกรอง แล้วแก่ผู้บริหารเพื่อใช้ในการตัดสินใจให้ทันต่อเหตุการณ์อย่างมิ ประสิทธิภาพ จึงเป็นสิ่งที่จำเป็นอย่างยิ่ง ดังนั้นการสร้างคลังข้อมูล (Data Warehouse) จึงเกิดขึ้นเพื่อเป็นที่เก็บรวบรวมข้อมูลสำคัญและจำเป็นจากแหล่งต่าง ๆ ซึ่งเป็นประโยชน์ต่อการตัดสินใจของผู้บังคับบัญชา และผู้บริหาร 

           ในส่วนของกองทัพ โดยหลักการแล้ว คลังข้อมูล (Data Warehouse) เป็นส่วนหนึ่งของระบบสารสนเทศ (Management Information Systems; MIS) ของกองทัพ ซึ่งถือว่าเป็นขุมทรัพย์ที่สามารถนำมาใช้ประโยชน์ได้มากมายมหาศาล เช่น นำมาช่วยรวบรวม คัดแยก วิเคราะห์ ข้อมูล/สารสนเทศ จากฐานข้อมูลในหน่วยงานต่าง ๆ เพื่อส่งให้ระบบการจัดการความรู้ (Knowledge Management systems) ในการสร้างองค์ความรู้ให้กับองค์กร หรือช่วยสนับสนุนข้อมูลให้กับระบบการตัดสินใจ (Decision Support System; DSS) ให้กับการตัดสินใจของผู้บังคับบัญชา เป็นต้น ที่เห็นได้อย่างเป็นรูปธรรมคือ การนำมาใช้เพื่อการวางกลยุทธ์ในการตอบโต้ภัยคุกคาม อีกทั้งยังสามารถพยากรณ์รูปแบบภัยคุกคามที่จะเกิดขึ้นในอนาคต อย่างไรก็ตาม การที่ Data Warehouse จะทำงานได้ตามที่กล่าวไว้ได้ดีหรือไม่นั้น ก็ต้องเกิดจากการรวบรวมข้อมูลที่ครบรอบด้าน ทุกมิติ และควรเก็บข้อมูลในอดีตที่ยาวนานเพียงพอ จึงจะทำให้การพยากรณ์แม่นยำ นั่นก็คือ กองทัพต้องมีการจัดหน่วยงานเล็ก ๆ ทำงานเฉพาะการรวบรวม คัดแยกข้อมูล และสร้างข้อมูล เพื่อนำมาใส่ในระบบ และเป็นผู้ประสานงานจากทุก ๆ หน่วย เพื่ออำนวยความสะดวกให้กับหน่วยต่าง ๆ นำเอาข้อมูลสารสนเทศมาใส่ในระบบ แต่ถ้าไม่มีการจัดการดังกล่าว ก็เสมือนกับการสร้างห้องสมุด แต่ไม่มีหนังสือและบรรณารักษ์

“ จงตระหนักเสมอว่า อย่าสร้างห้องสมุด ทั้ง ๆ ที่ ไม่มีหนังสือและบรรณารักษ์ ”
พ.อ.เศรษฐพงค์ มะลิสุวรรณ

แนวคิดเกี่ยวกับคลังข้อมูล

Data Warehouse หมายถึง ฐานข้อมูลขนาดใหญ่ขององค์กรหรือหน่วยงานหนึ่งๆ ซึ่งเก็บรวบรวมข้อมูลจากฐานข้อมูลระบบงานประจำวัน หรือเรียกอีกอย่างว่า Operational database และฐานข้อมูลอื่นภายนอกองค์กร หรือเรียกว่า External database โดยข้อมูลที่ถูกจัดเก็บในคลังข้อมูลนั้น มีวัตถุประสงค์ในการนำมาใช้งาน และมีลักษณะของการจัดเก็บแตกต่างไปจากข้อมูลในฐานข้อมูลระบบงานอื่น    การย้ายข้อมูลจากฐานข้อมูลปกติ   เข้าไปไว้ใน Data Warehouse  มีข้อดีหลายอย่าง เช่น ทำให้องค์กรหรือเจ้าของข้อมูล  มีโอกาสได้ออกแบบรูปแบบการเก็บข้อมูลใหม่ให้เหมาะสมกับการเรียกใช้มากยิ่ง ขึ้นในงานเฉพาะด้าน  และทำให้เหมาะสำหรับการนำไปใช้ช่วยในการตัดสินใจ หรือใช้ในงานวิเคราะห์ นอกจากนั้นระบบ Data Warehouse  ยังรวมเอาข้อมูลที่ใช้อยู่ในปัจจุบันเข้ากับข้อมูลในอดีตเป็นฐานข้อมูลเดียว กัน สามารถเรียกใช้งานได้จากอินเตอร์เฟสแบบ กราฟิกได้โดยตรง (GUI) พร้อมสำหรับการจัดการข้อมูลและนำข้อมูลที่ได้ไปวิเคราะห์ ข้อดีอีกข้อก็คือ ระบบ Data Warehouse ทำให้ผู้ใช้ที่เป็นผู้บังคับบัญชาระดับสูง หรือเจ้าหน้าที่ทั่วไปสามารถเข้าถึงและเรียกใช้ฐานข้อมูลได้ด้วยตัวเอง โดยไม่ต้องอาศัยความช่วยเหลือจากเจ้าหน้าที่ทางเทคนิกอีกต่อไป


รูปแสดงระดับของข้อมูล

           จากรูปแสดงระดับของข้อมูล โดยลำดับจากฐานไปสู่ยอดสามเหลี่ยม จะเห็นได้ว่า ระดับข้อมูลระดับฐานนั้นเป็นข้อมูลวันต่อวัน (Transaction) ที่ได้จากการเก็บรวบรวมจากทุกส่วนขององค์กรที่เป็นหน่วยงานระดับปฏิบัติการ (Operation) เพื่อทำการจัดระบบเป็นหมวดหมู่ ให้สามารถเรียกใช้ได้ง่าย ซึ่งโดยทั่วไปเราเรียกว่า การจัดเก็บไว้เป็นรูปแบบ “ฐานข้อมูล (Database)” หลังจากผ่านกระบวนการแยกแยะ วิเคราะห์ สรุป แล้วจะนำไปเก็บไว้ในระบบข้อมูลที่สูงขึ้น นั่นคือ Data Warehouse  โดยข้อมูลใน Data Warehouse นี้ถือว่าเป็นข้อมูลที่มีระโยชน์ในเชิงกลยุทธ์ ในทางธุรกิจถือว่าเป็นระบบพื้นฐานที่คอยสนับสนุนระบบ “ธุรกิจอัจฉริยะ (Business Intelligent System)” ซึ่งเป็นข้อมูลที่สามารถช่วยให้ผู้บริหารระดับกลางและระดับสูงสามารถนำมาใช้ เพื่อการวางกลยุทธ์ สามารถช่วยในการพยากรณ์สถานการณ์ในอนาคตเพื่อการวางแผนการใช้ทรัพยากรได้ อย่างมีประสิทธิภาพ ซึ่งในด้านความมั่นคงก็นำมาใช้เพื่อการวางกลยุทธ์ในการตอบโต้ภัยคุกคาม อีกทั้งยังสามารถพยากรณ์รูปแบบภัยคุกคามที่จะเกิดขึ้นในอนาคต อย่างไรก็ตาม การที่ Data Warehouse จะทำงานได้ตามที่กล่าวไว้ได้ดีหรือไม่นั้น ก็ต้องเกิดจากการรวบรวมข้อมูลที่ครบรอบด้าน ทุกมิติ และควรเก็บข้อมูลในอดีตที่ยาวนานเพียงพอ จึงจะทำให้การพยากรณ์แม่นยำ 

           ถ้าข้อมูลใน Data Warehouse ถูกพัฒนาในเชิงวิเคราะห์และสังเคราะห์มากขึ้น ก็สามารถนำไปใช้ในระดับการวางยุทธศาสตร์ในระดับผู้บริหารระดับสูง (Executives) ได้ในที่สุด

ทำไมต้องใช้ระบบ Data Warehouse

           องค์กรต่างๆ ในปัจจุบันส่วนใหญ่จะมีการลงทุนลงแรงไปมากกับระบบที่เรียกว่า “ระบบฐานข้อมูลประจำวัน (Operational System)”  ระบบข้อมูลที่ว่านี้จะมีหน้าที่หลักในการรวบรวมและจัดเก็บข้อมูลเอาไว้ ไม่ว่าจะเป็นข้อมูลของบุคคลากร ข้อมูลลูกค้า ข้อมูลการขาย ข้อมูลฝ่ายบุคคล ข้อมูลเกี่ยวกับคงคลังก็ตาม โดยที่ระบบเหล่านี้มีการลงทุนไปมาก ดังนั้นปริมาณข้อมูลที่มหาศาลก็เลยถือได้ว่าเป็นทรัพย์สินและทรัพยากรอย่าง หนึ่งขององค์กร  จึงจำเป็นต้องมีการจัดการที่เหมาะสมเพื่อนำเอาทรัพย์สินเหล่านี้มาใช้ให้ เกิดประโยชน์สูงสุด ในองค์กรหลายแห่ง ได้นำข้อมูลเหล่านี้มาช่วยในการตัดสินใจโดยประยุกต์ใช้เป็นระบบการตัดสินใจ “Decision Support System (DSS)”  โดยนำเอาระบบ Data Warehouse  มาช่วยเพื่อให้ผู้บริหารสามารถเรียกใช้ข้อมูลที่ต้องการได้อย่างรวดเร็วและ มีประสิทธิภาพมากขึ้น โดยข้อมูลเชิงบริหารนี้จะสามารถช่วยลดปัญหาที่เกิดจากการใช้ข้อมูลจากฐาน ข้อมูลปฏิบัติการ (operational database) ซึ่งเป็นการเก็บข้อมูลในระบบในรูปแบบวันต่อวัน (Transaction system) จึงไม่อยู่ในรูปแบบที่เป็นประโยชน์ต่อผู้บริหาร ซึ่งโดยทั่วไปปัญหาที่พบเมื่อต้องการเรียกข้อมูลเพื่อช่วยในการตัดสินใจ ได้แก่

           - การเรียกข้อมูลจากฐานข้อมูลปฏิบัติการ ซึ่งมีขนาดใหญ่ ทำให้ประสิทธิภาพของระบบลดลงและทำงานได้ช้าลง
           - ข้อมูลที่นำเสนอมีรูปแบบเดียว ไม่สามารถเปลี่ยนแปลงได้ตามความต้องการของผู้บริหาร
           - ไม่สามารถหาคำตอบในเชิงพยากรณ์ได้
           - ไม่ตอบสนองการแสดงผลที่ซับซ้อนได้ดีเท่าที่ควร
           - ข้อมูลถูกจัดเก็บอยู่ตามฐานข้อมูลของระบบงานต่างๆ ซึ่งยากแก่การเรียกใช้และขาดความสัมพันธ์ในเชิงภารกิจ

ความแตกต่างระหว่างระบบที่ผ่านการวิเคราะห์และระบบปฏิบัติงานทั่วไป

                ระบบ  Data Warehouse  นั้นเรียกได้ว่าเป็นระบบฐานข้อมูล (Database) ที่ผ่านการวิเคราะห์แล้ว ผลลัพธ์ที่ได้จะถูกนำมาช่วยในการตัดสินใจได้ ในขณะที่ระบบปฏิบัติงานทั่วไป  จะเป็นเพียงระบบฐานข้อมูลที่ออกแบบมาเพื่อช่วยอำนวยความสะดวกในงานประจำวัน เท่านั้นแตกต่างโดยสิ้นเชิงกับระบบ Data Warehouse  ซึ่งจะนำข้อมูลมาผ่านการวิเคราะห์ก่อน ซึ่งออกแบบมาให้ข้อมูลเหล่านั้นช่วยผู้ใช้ในการตัดสินใจได้ทันที  ไม่ว่าจะโดยการนำข้อมูลมาวิเคราะห์ สรุปและเสนอเป็นรายงาน

           หัวใจของระบบฐานข้อมูลปฏิบัติงานทั่วไปนั้น จะสนใจเพียงการรับข้อมูลเข้าสู่ฐานข้อมูล  คอยดูแลให้ข้อมูลมีความทันต่อเหตุการณ์เสมอ โดยดูแลให้สามารถเรียกใช้ได้ด้วยความรวดเร็ว ถูกต้อง  และมีประสิทธิภาพ  ส่วนข้อมูลที่ผ่านการวิเคราะห์แล้ว  จะเป็นข้อมูลที่สนใจในช่วงเวลาใดเวลาหนึ่งเป็นจุด ๆ เท่านั้น  การวิเคราะห์ข้อมูลนั้น ส่วนใหญ่จะอยู่ในรูปแบบของการเปรียบเทียบ  หรือไม่ก็เป็นการพยายามหารูปแบบของ (Pattern) ของข้อมูล เพื่อพยายามหาแนวโน้มที่จะเกิดต่อไปในอนาคต เช่น  วิเคราะห์รูปแบบเหตุการณ์ความไม่สงบใน 3 จังหวัดชายแดนภาคใต้ โดยการเปรียบเทียบเหตุการณ์ที่เกิดขึ้นในวันหนึ่ง ๆ ของทุกๆปีว่ามีรูปแบบเฉพาะหรือไม่ ซึ่งถ้าเป็นการนำข้อมูลในอดีตมาดูย้อนหลัง ก็อาจจะทำให้เห็นพฤติกรรมของผู้ก่อความไม่สงบ เปลี่ยนแปลงไปอย่างไร

           ความแตกต่างอีกอย่างหนึ่งที่มองเห็นได้ชัดของสองระบบก็คือ ระบบฐานข้อมูลปฏิบัติงานนั้น จะเป็นข้อมูลที่ได้จากกิจกรรมจริงในแต่ละวัน  ดังนั้นข้อมูลตัวหนึ่ง ๆ จึงเปลี่ยนแปลงไปเรื่อย ๆ และถือได้ว่าเป็นข้อมูลที่ไม่ถาวร ส่วนข้อมูลจากระบบวิเคราะห์นั้น จะถือได้ว่าเป็นข้อมูลที่ค่อนข้างนิ่ง  เพราะเป็นการวิเคราะห์ที่จุดใดจุดหนึ่งของเวลา เช่น บันทึกของข้อมูลตอนเที่ยงคืนของเมื่อวานนี้ เป็นต้น  ข้อมูลที่อยู่ในฐานข้อมูลแบบ วิเคราะห์นั้นจะอยู่คงที่ถาวร และจะเป็นการเพิ่มข้อมูลใหม่เข้ามาเรื่อย ๆ  ตามระยะเวลาที่กำหนด 

ตัวอย่างของระบบ Data Warehouse ที่ประสบความสำเร็จ
ต่อไปนี้จะเป็นตัวอย่างจำนวนหนึ่งของการนำระบบ Data Warehouse ไปประยุกต์ใช้ที่เรียกได้ว่าประสบความสำเร็จ 

           • ระบบจัดการชนิดสินค้า (Categories Management)ช่วยให้ธุรกิจค้าปลีกเข้าใจพฤติกรรมการใช้จ่ายของลูกค้ามาก ขึ้นและทราบว่าลูกค้ามีปฏิกิริยากับโปรโมชั่นของตนอย่างไร 
           • ระบบวิเคราะห์การ “Claim” หรือการอ้างสิทธิของธุรกิจประกันสุขภาพ  ช่วยให้บริษัทควบคุมค่าใช้จ่ายของลูกค้าได้ดีขึ้น 
           • ระบบควบคุมการทุจริตและควบคุมค่าใช้จ่ายของธุรกิจประกันสุขภาพ 
           • ระบบ Supplier Management หรือระบบจัดการ Supplier  ช่วยให้องค์กรเหล่านั้นสามารถประเมินคาดการณ์ และวางแผนสำหรับอนาคตได้ดีกว่า 
           • ระบบการเงิน ซึ่งมีองค์กรทั้งหลายนำไปใช้อย่างกว้างขวาง ทำให้องค์กรเหล่านี้สามารถประเมินคาดการณ์ และวางแผนสำหรับอนาคตได้ดีกว่า 
           • ระบบจัดการค่าใช้บริการ ซึ่งบริษัทโทรคมนาคมนำไปใช้  ทำให้บริษัทเหล่านั้นสามารถกำหนดอัตราค่าบริการ ที่ทำกำไรได้สูงสุด ในขณะเดียวกันก็เป็นอัตราที่จูงใจลูกค้ามากที่สุดด้วย ไม่ว่าจะเป็นค่าบริการโทรศัพท์เคลื่อนที่โทรศัพท์ ทางไกลหรือโทรศัพท์บ้านก็ตาม 
           • ระบบประวัติลูกค้า ระบบทำนายความต้องการและระบบการตลาดขนาดจุลภาคที่มีใช้ในบริษัทบริการสื่อสาร 
           • ระบบจัดเก็บค่าบริการ ระบบจัดการเครดิต  และระบบการตลาดขนาดจุลภาคที่มีใช้ในสถาบันการเงิน 

           หนึ่งในระบบ Data Warehouse ที่ประสบความสำเร็จมากที่สุดเห็นจะเป็นการนำมาประยุกต์ใช้กับธุรกิจค้าปลีก เพราะระบบ Data Warehouse  ทำให้เจ้าของสามารถสร้างระบบรายงานที่ดึงเฉพาะข้อมูลที่ต้องการออกมาจาก เครื่องเก็บเงินได้ (Point-of-Sales) และนำข้อมูลนั้นมาสร้างและทดสอบโปรโมชั่นต่าง ๆ ช่วยในการดูพฤติกรรมการซื้อ (เช่น ของบางอย่างลูกค้ามักจะซื้อคู่กัน อย่างเช่น เสื้อเชิ้ตกับเนคไทหรือรองเท้ากับกระเป๋าถือ เป็นต้น) หรือสร้างบริการและ ผลิตภัณฑ์ใหม่ ๆ  ถ้าคุณกำลังใช้ระบบ Data Warehouse อยู่ล่ะก็ คาดการณ์ไว้ได้เลยว่า ไม่ช้าก็เร็วเขาจะต้องนำระบบ ดังกล่าวเพื่อช่วยในการวางแผนการตลาดเพื่อให้ตรงกับความต้องการของลูกค้าที่ สูดและสร้างความได้เปรียบสูงสุด

ใครต้องการข้อมูลช่วยเหลือ
 

           • ผู้ที่ต้องการข้อมูลช่วยการตัดสินใจ   ซึ่งเป็นข้อมูลที่ได้จากระบบ  Data Warehouse นั้น ก็คือใคร ๆ ก็ตามใน องค์กรที่ต้องการข้อมูลเพิ่มเติมเพื่อให้บริการลูกค้าที่ดีกว่า ซึ่งเป็นไปได้ดังต่อไปนี้ 
           • ผู้ใช้มือใหม่ หรือผู้ใช้ธรรมดา (ผู้ซึ่งต้องการใช้ข้อมูลเป็นครั้งคราว และต้องการข้อมูลที่วิเคราะห์ไว้ก่อนแล้ว เช่น บุคคลากรที่อยู่ในพื้นที่ปฏิบัติการ (Remote users) 
           • นักวิเคราะห์ (ผู้ซึ่งต้องใช้ข้อมูลทุกวัน  เพื่อปรับให้ทันกับเหตุการณ์แต่ละวัน แต่เขาเหล่านั้นไม่มีความรู้ พอที่จะสร้างโปรแกรมรายงานขึ้นด้วยตนเอง) 
           • ผู้ใช้ระดับเชี่ยวชาญ (ผู้ที่เขียนโปรแกรมขึ้นด้วยตนเองเพื่อสร้างรูปแบบการเรียกใช้ข้อมูล (Query) ขึ้นแบบเฉพาะหน้าโดยอาศัยข้อมูลที่ได้จากระบบ (Data warehouse) 
           • ระบบ Data Warehouse เป็นระบบที่ทำงานสองงานในเวลาเดียวกัน คืองานแรกเป็นระบบที่ให้ผู้ใช้สามารถ สำรวจและเรียกใช้ข้อมูลที่มีอยู่ได้อย่างไม่จำกัด  สามารถสร้างรูปแบบการเรียกดูข้อมูลขึ้นได้ตามใจและเจาะลึกลงไปในข้อมูลได้ ตราบ เท่าที่ต้องการ  และในขณะเดียวกันก็ยังเป็นระบบที่รวบรวมข้อมูลเข้าระบบ  ข้อมูลที่ว่าก็จะเป็นข้อมูลที่ตรงกับหัวข้อที่สนใจอยู่ (Subject-Oriented) เป็นข้อมูลที่รวมกันเป็นชุด มิใช่ข้อมูลเดี่ยว ๆ เป็นข้อมูลเก็บสะสมตามการเปลี่ยนแปลงไป ตามเวลา และก็เป็นข้อมูลที่คงตัวด้วย  ดังนั้นการสร้างระบบ Data Warehouse จึงจำเป็นต้องประกอบด้วยสี่ขั้นตอน ดังต่อไปนี้ 

           1. การกลั่นกรองข้อมูลสร้างเป็นโมเดลและรวบรวมจากระบบปฏิบัติงาน 
           2. แปลงข้อมูลดิบจากระบบปฏิบัติการ ไปเป็นข้อมูลที่ผู้ใช้สนใจ 
           3. เผยแพร่และจัดการกับความเปลี่ยนแปลงที่เกิดกับข้อมูล 
           4. ให้บริการเข้าใช้ข้อมูล

สถาปัตยกรรมของทData Warehouse

           สถาปัตยกรรม มีความหมายคือ กลุ่มของกฎ หรือ โครงสร้างจำนวนหนึ่ง ที่เป็นกรอบสำหรับการออกแบบระบบโครงสร้างพื้นฐานที่จำเป็นสำหรับการสร้าง ระบบ Data Warehouse ขึ้นมาสักระบบหนึ่งก็ต้องประกอบด้วย แพลตฟอร์ม (มาตรฐานเทคโนโลยีปฏิบัติการที่ใช้) ของระบบที่จะทำการเชื่อมต่อฐานข้อมูลในระบบ LAN เป็นต้น ในด้านของฮาร์ดแวร์ ระบบ Data Warehouse สามารถ จะอยู่บนหลาย  ๆ แพลตฟรอร์มได้ เช่น อาจจะเป็นเมนเฟรม ระบบที่ใช้หลายโปรเซสเซอร์ทำงานพร้อม ๆ กัน หรืออาจจะ เป็น Client/Server ก็ได้ ยุคหลัง ๆ นี้พัฒนาการของแพลตฟอร์มก็มีแนวโน้มจะเคลื่อนย้ายจากระบบเมนเฟรมาเป็นการทำ งานแบบหลายโปรเซสเซอร์ขนานกัน (Parallel processing) มากขึ้น เพราะช่วยให้ระบบทำงานได้เร็วขึ้นหลายเท่าตัว โดยทั่วไปแล้วถ้าระบบของคุณมีขนาดไม่ใหญ่มากนัก  ระบบ Client/Server ก็จะเป็นทางเลือกที่ประหยัดและเหมาะสมที่สุด 

           สำหรับโครงสร้างของสถาบัตยกรรมของข้อมูลนั้นก็เป็นอีกส่วนที่มีความสำคัญ เพราะจะเป็นพิมพ์เขียวบอกเราว่า ข้อมูลของเราจะมีทิศทางการไหลหรือเคลื่นที่ไปอย่างไรภายในระบบจะสามารถนำมา ใช้ประโยชน์ได้เพียงใด สำหรับระบบ Data Warehouse นั้น สถาปัตยกรรมของข้อมูลหลักก็จะเป็นข้อมูลที่อ่านได้อย่างเดียว  โดยเอามาใช้ในระบบช่วย การตัดสินใจ  โดยในรูปแบบนี้  ข้อมูลก็จะถูกคัดเลือกมาจากฐานข้อมูลปกติหรืออาจจะไฟล์ต่าง ๆ แล้วก็จะนำมาปรับแปลงให้อยู่ในรูปแบบที่เหมาะสมก่อนจะจัดเก็บเข้าสู่  Warehouse ต่อไป

ส่วนประกอบของ Data Warehouse

ระบบ Data Warehouse ไม่ใช่ระบบสำเร็จรูปที่ซื้อมาแกะกล่องก็ใช้งานได้ทันที จำเป็นต้องมีการออกแบบ ขึ้นเพื่อทำการหาความต้องการที่แท้จริงขององค์กร โดยมีหลักคิด ดังนี้
           • พิจารณาเครื่องมือที่เหมาะสมเพื่อช่วยออกแบบฐานข้อมูลของ Data Warehouse  และโปรแกรมที่จะทำหน้าที่เก็บรวบรวมข้อมูลจากระบบปฏิบัติงานหรือแหล่งข้อมูล อื่น ๆ 
           • ส่วนที่ทำหน้าที่เป็น Directory ของข้อมูล  เพื่ออำนวยความสะดวกแก่ผู้ดูแลระบบหรือผู้ใช้ทั่วไป ให้เข้าใจถึงข้อมูลแต่ละตัวและความหมายของมัน 
           • ตัวฐานข้อมูลของ Data Warehouse เอง 
           • ส่วนที่ทำหน้าที่ Data Acquisition ซึ่งก็คือตัวที่ทำ หน้าที่ดับจับ เก็บรวบรวมข้อมูล รักษาความถูกต้อง โอนย้าย หรือแปลงข้อมูลจากแหล่งข้อมูลอื่นให้อยู่ ในรูปแบบที่เหมาะสมก่อนจะเก็บเข้าสู่ Data Warehouse ต่อไป 
           • ส่วนที่ทำหน้าที่ Data Management สำหรับจัดการ และควบคุมการปฏิบัติงานของ Data Warehouse 
           • ส่วนที่ทำหน้าที่เข้าถึงข้อมูล จะเป็นส่วนที่ให้บริการแก่ผู้ใช้ที่มีพื้นมาทางธุรกิจ  ให้สามารถใช้มันเป็นเครื่องมือช่วยการตัดสินใจได้   ซึ่งแน่นอนว่าต้องการเครื่องมือตัวนี้เพื่อช่วยเขาเข้าถึงและวิเคราะห์ ข้อมูล 
           • ส่วนที่ทำหน้าที่โอนย้ายข้อมูลเป็นส่วนที่ทำหน้าที่ export ข้อมูลภายใน  Data Warehouse  ออกสู่ภายนอกอาจจะเพื่อจะโอนย้ายไปสู่ระบบ Data Warehouse  ระบบอื่น Data Mart หรือระบบอื่น ๆ ทั่วไป


การเคลื่อนที่ของข้อมูลในคลังข้อมูล               
ข้อมูลที่ จะจัดเก็บภายในคลั งข้อมูลมีการเคลื่อนที่ของข้อมูล (information flow) 5 ประเภทดังนี้

           •  Inflow คือการนำข้อมูลจากฐานข้อมูลอื่นเข้าสู่คลังข้อมูลทั้ฐานข้อมูลภายในและภาย นอกองค์กร โดยในขั้นนี้อาจมีการเปลี่ยนแปลงโครงสร้างข้อมูล การทำ de-normalizeการลบหรือเพิ่มฟิลด์ เพื่อให้ข้อมู ลทั้งหมดอยู่ในเนื้อหาที่สนใจเดียวกัน ในขั้นตอนนี้อาจใช้เครื่องมือที่เรียกว่า data warehouse tool
           • Upflow เมื่อข้อมูลที่เราต้องการอยู่ในคลังข้อมูลแล้วในบางครั้งอาจต้องมีการเพิ่ม คุณค่าให้กับข้อมูลด้วยเพื่อให้ข้อมูลอยู่ในรูปแบบที่เป็นประโยชน์มากที่สุด ต่อการนำเครื่องมือมาใช้ ซึ่งได้แก่การจัดกลุ่มข้อมูลหาค่ าทางสถิติที่ซับซ้อน จัดข้อมูลให้ อยู่ในรูปแบบหรือเทมเพลตมาตรฐาน
           • Downflow เป็นขั้นตอนของการปรับปรุงเปลี่ยนแปลงข้อมูลที่เก่า และไม่อยู่ในเนื้อหาที่องค์กรสนใจออกไปจากคลังข้อมูลขององค์กร
           • Outflow เป็นขั้นที่ผู้ใช้เรียกใช้ข้อมูลในคลังข้อมูลผ่านเครื่องมือต่างๆ โดยการเรียกใช้อาจมีเพียงขอเรียกเป็นครั้งคราวเป็นประจำทุกวัน/เดือน หรือแม้กระทั่งต้องการแบบทันที
           • Metafolw ข้อมูลที่จัดเก็บในคลังข้อมูลจะถูกทำข้อมูลไว้อีกชุดหนึ่ง เป็นแหล่งที่มาของข้อมูลนั้น หรือแม้กระทั่งที่อยู่ของข้อมูลนั้นในคลังข้อมูลและข้อมูลอื่นที่เกี่ยวข้อง

การจัดและการบริหาร Data Warehouse

           การจัดการ Data Warehouse ก็จะเริ่มด้วยการพัฒนาระบบขึ้นมาเสียก่อน เครื่องมือสำหรับช่วยพัฒนา Data Warehouse ก็จะเป็นตัวที่ช่วยสร้างและรักษาอินเตอร์เฟสระหว่างระบบที่ใช้งานปกติกับ ระบบ Data Warehouse ซอฟต์แวร์สำหรับพัฒนาระบบ Data Warehouse ก็จะรับงานอันซับซ้อนในการสร้าง อินเตอร์เฟส โดยการสร้างโปรแกรมเพื่อ สร้าง จัดการ และดูแลรักษาอินเตอร์เฟสโดยอัตโนมัติ อินเตอร์เฟสที่ว่านี้ เมื่องานการรวบรวมและแปลงข้อมูลทำเสร็จแล้ว ก็ควรจะมีหน้าที่อย่างน้อยดังต่อไปนี้ แปลงข้อมูล , Mapping ข้อมูล, ปรับรูปแบบข้อมูล, คำนวณค่าใหม่, ปรับโครงสร้าง Key ของข้อมูล, สรุปข้อมูล

การใช้งาน วิเคราะห์และขอรายงาน

           ปัจจุบันเครื่องเก่ง ๆ ก็มีเพิ่มขึ้นเรื่อย ๆ ซึ่งรวมไปถึงโปรแกรมพวก Spreadsheet อย่าง Lutus 1-2-3 และ Microsoft Access, ระบบฐานข้อมูลบนเครื่องเดสก์ทอป และโปรแกรมที่ทำหน้าที่เป็น Front End สำหรับเข้าถึงข้อมูลเช่น Business Objects, Impromptu, 1Q/Objects และ Forest & Tree เป็นต้น เครื่องมือพวกนี้ทำให้เราสามารถเข้าใช้งานข้อมูลใน Ware House ได้โดยไม่ต้องรู้โครงสร้างภายในของมันเลย หรือไม่รู้ วิธีการเรียกใช้ SQL เลยก็ได้ พวกมันยังสามารถเจาะลึกเข้าไปในข้อมูล หรือก็อปปี้ออกมาเก็บไว้ใน Spread Sheet เพื่อ จะเอามาวิเคราะห์ต่อไป เครื่อง Workstation ทั่วไปสามารถเข้าใช้งานหรือวิเคราะห์ได้อย่างอิสระทั้งข้อมูลที่เป็นราย ละเอียดหรือข้อมูลสรุปสามารถเข้าใช้ได้ที่ระดับนี้เลยเครื่องมือ

สิ่งที่ควรพิจารณาก่อนสร้างคลังข้อมูล

           เนื่องจากการลงทุนสร้างคลังข้อมูลขึ้นมาใช้เพื่อสนับสนุนการทำงานขององค์กร นั้นจำเป็นต้องมีค่าใช้ จ่ายในการลงทุนมหาศาล ทั้งนี้สามารถวัดออกมาเป็นตัวเงินได้ เช่น ค่าใช้จ่ายด้านฮาร์ดแวร์ ซอฟต์แวร์ และโครงสร้างพื้นฐานอื่น ๆ ที่จำเป็นต้องใช้ ส่วนค่าใช้จ่ายที่ไม่เป็นตัวเงิน แต่มีความสำคัญอย่างมากได้แก่ กำลังแรงงานที่จะเสียไปของทรัพยากรบุคคลขององค์กรและเวลาที่ใช้ไปกับการ พัฒนา ดังนั้น เมื่อองค์กรตัดสินใจสร้างคลังข้อมูลขึ้นแล้ว ควรจะประสบความสำเร็จด้วย ทั้งนี้ Poe ได้เสนอ “8 ประการที่ควรให้ความสนใจ” โดยมีรายละเอียดดังนี้

           • ควรมีความชัดเจนในเป้าหมายร่วมของการสร้างระบบนี้ของคนในองค์กร เหมือนการตอบคำถามว่าทำไม คุณถึงคิดจะสร้างคลังข้อมูล ซึ่งคำตอบขององค์กรที่จะได้ คือเป้าหมายที่ต้องการ โดยควรจะเขียนเป้าหมายนี้ออกมาเป็นลายลักษณ์อักษรที่ชัดเจน เพื่อให้ทีมพัฒนาได้เข้าใจเป้าหมายร่วมกัน
           • ทำความเข้าใจสถาปัตยกรรมของระบบ เพื่อให้ทีมพัฒนาเข้าใจตรงกัน ในที่นี้หมายถึง blueprint ของระบบ
           • เทคโนโลยีที่ใช้ควรอยู่ในวิสัยที่เหมาะสม ทั้งด้านของตัวเงินและความยากง่ายในการเรียนรู้ ทั้งนี้หมายรวมทั้ง ฮาร์ดแวร์ ซอฟต์ แวร์ และเครือข่ าย อาจต้องมีการทดสอบและฝึกอบรมก่อนการใช้งานจริง
           • ทีมพัฒนาต้องมีวิสัยทัศน์เชิงบวกในการทำงาน เนื่องจากทีมพัฒนามักมาจากส่วนงานด้านเทคโนโลยีสารสนเทศแต่ในเนื้องานจริงๆ แล้ว ผู้ใช้เป็นส่วนขับเคลื่อน ดังนั้นจึงจำเป็นอย่างยิ่งที่จะให้ผู้ใช้เข้ามาร่วมทำงานด้วยตั้งแต่ต้น โครงการ
           • ต้องมั่นใจได้ว่าทีมพัฒนาเข้าใจเป็นอย่างดีถึงความแตกต่างกันระหว่างฐานข้อมูลปฏิบัติการและฐานข้อมูลสนับสนุนการตัดสินใจ
           • จัดให้มีการฝึกอบรมโดยควรเป็นการฝึกอบรมก่อนเริ่มโครงการ โดยเฉพาะอย่างยิ่งการฝึกอบรมเกี่ยวกับเครื่องมือที่องค์กรจะใช้ในการพัฒนา ทั้งนี้อาจเป็นการฝึกอบรมจากบริษัทผู้ขาย
           • ควรหาบุคลากรที่มีประสบการณ์ในการพัฒนาคลังข้อมูลเพื่อทำหน้าที่ป็นผู้ จัดการโครงการหรือถ้าในองค์กรไม่เคยมีประสบการณ์เลย อาจจ้างที่ปรึกษาที่มีความเชี่ยวชาญและมีประสบการณ์ด้าน นี้โดยเฉพาะมาช่วยทีมพั ฒนา
           • โปรแกรมที่จะใช้นำเสนอข้อมูลในคลังข้อมูลต้องสามารถเรียนรู้ได้ง่ายและผู้ใช้สามารถใช้งานได้อย่างมีประสิทธิภาพ

สรุป
           คลังข้อมูลเป็นการรวบรวมข้อมูลจากฐานข้อมูลของระบบงานปฏิบัติงานประจำวันของ องค์กร แล้วนำมาแปลงข้อมูลให้อยู่ในรูปแบบที่เหมาะสมในการเก็บและสะดวกในการใช้งาน แล้วจึงนำข้อมูลนั้นเข้าไปเก็บในคลังข้อมูล (Data Warehouse) การพัฒนาหรือสร้างคลังข้อมูลมาใช้ในองค์กรจะต้องมีการพิจารณาถึงองค์ประกอบ ที่จำเป็นในการสร้างให้เหมาะสมด้วย ทั้งนี้เพื่อให้เกิดความคุ้มค่าในการลงทุนและเกิดประโยชน์สูงสุดต่อองค์กร ถึงแม้ว่าเทคโนโลยีคลังข้อมูล จะให้ประสิทธิภาพในการใช้ข้อมูลอย่างมากก็ตาม แต่สิ่งที่ต้องคำนึงถึงด้วยคือทรัพยากรที่องค์กรจะต้องทุ่มเทลงไปในการพัฒนา ระบบ มีทั้งที่สามารถวัดเป็นตัวเงินได้และที่ไม่สามารถตีค่าออกมาเป็นตัวเงินได้ นอกจากนี้ ปัญหาในระหว่างการพัฒนาที่อาจจะเกิดขึ้นจนองค์กรไม่สามารถจะพัฒนาระบบนี้จน สำเร็จ และนำมาใช้งานได้ เกิดการลงทุนที่สูญเปล่า ดังนั้นจึงต้องมีการวางแผนควบคุมและจัดการให้รอบคอ  การพยายามสร้างระบบ Data Warehouse แบบเต็มรูปแบบนั้นเป็นงานที่ซับซ้อน ควรเริ่มต้นทำตามขั้นตอนดังต่อไปนี้เพื่อไม่ให้เกิดความเสี่ยงในการลงทุนมาก นัก

           • เริ่มต้นโครงการด้วยขนาดที่ไม่ใหญ่มากนัก แต่เป็นโครงการที่ท้าทายและเป็นประโยชน์ และใช้เวลาไม่มากนัก ประมาณ 90 วันเป็นต้น 
           • ทำความเข้าใจกับปัญหาขององค์กรที่คุณพยายามจะแก้ ใช้เวลากับผู้ใช้มาก ๆ เพื่อค้นหาว่าข้อมูลอะไรที่เป็นที่ต้องการ 
           • กำหนดข้อมูลทั้งหมดให้ครบและสมบูรณ์ที่สุดแต่อย่ารวมเอาข้อมูลทั้งหมดที่ มีเข้าไป ให้เลือกเอาเฉพาะข้อมูลที่คาดว่าจะเป็นประโยชน์ต่อความก้าวหน้าขององค์กร 
           • พยายามติดต่อกับผู้เชี่ยวชาญทางเครือข่ายในทุกขั้นตอนของการพัฒนา เพื่อวิเคราะห์ในประเด็นอย่าง เช่น แบนด์วิธที่เพียงพอต่อการใช้งาน Warehouse และการจัดการสื่อสารเพื่อหลีกเลี่ยงปัญหาคอขวด เป็นต้น 
           • กำหนดเครื่องมือทุกชนิดที่จำเป็นสำหรับการสร้าง ดูแลรักษาและควบคุม Data Warehouse 
           • จัดการอบรมให้กับผู้ใช้ ไม่เพียงแต่การอบรมการใช้ระบบเท่านั้น แต่ยังรวมไปถึงความเข้าใจระบบสารสนเทศ 
           • คำนึงถึงเรื่องความถูกต้องของข้อมูลให้เร็วที่สุด พยายามหาปัญหาความผิดพลาดในข้อมูลแหล่งต้นฉบับข้อมูล เพื่อจะหาวิธีแก้ปัญหาดังกล่าว

ก่อนที่ข้อมูลที่ผิดพลาดจะถูกรวมเข้าไปใน Data Warehouse 

           โดยหลักการแล้ว ระบบ Data Warehouse เป็นส่วนหนึ่งของระบบสารสนเทศ (MIS) ของกองทัพ ซึ่งเป็นเครื่องมือช่วยในการบูรณาการ (Integration) และวิเคราะห์/สังเคราะห์ (Analysis and Synthesis) ข้อมูลทุกส่วนในระดับปฏิบัติการจากทุกหน่วย (หน่วยใดบ้างขึ้นกับการกำหนดเชิงยุทธศาสตร์และยุทธวิธีของกองทัพ) และถ้าการบูรณาการดังกล่าวประสบความสำเร็จ เราก็จะเห็นการตอบสนองข่าวสาร/สารสนเทศจากกรมฝ่ายเสนาธิการสู่ผู้บังคับ บัญชาระดับสูงอย่างมีประสิทธิภาพ โดยมีทั้งความรวดเร็ว ถูกต้อง และยังสามารถเสนอข้อพิจารณาเพื่อการตัดสินใจได้อย่างมีหลักการและเหตุผล นำไปสู่การเป็นกองทัพที่ชาญฉลาดต่อไป

เอกสารอ้างอิง

Arun Sen and Varghese S. Jacob, Industrial Strength Data Warehousing, Communications of the ACM, September 1998, Volume 41, Number 9,p.29-31
Charles bontempo and George Zagelow, The IBM Data Warehouse Architecture, Communications of the ACM, September 1998, Volume 41, Number 9, p.38-48
Mary Ann Richardson,Data Warehousing:Overview,Managing Information Technology,May 1996. On the Internet: http://www.datapor.com
Stephen R. Gardner,Building the Data Warehouse,Communications of the ACM, September 1998,Volume 41, Number 9, p.52-60.
http://datawarehouse.ittoolbox.com/
http://en.wikipedia.org/wiki/Data_warehouse
www.oracle.com/technology/products/warehouse/
www.bmc.com/products/documents/93/22/9322/9322.pdf
www.statsoft.com/products/ brochures/pdf/datawarehouse.pdf
www2.sas.com/proceedings/sugi22/DATAWARE/PAPER116.PDF
www.educause.edu/ir/library/pdf/eqm0349.pdf
www.nectec.or.th/courseware/ pdf-documents/articles/it-reform-gov.pdf
www.asu.edu/data_admin/ data_warehouse-WUG%20Meetings.html
www.educause.edu/ir/library/powerpoint/CMR0159.pps
www.santafe.cc.fl.us/~faeds/Presentations/
www.tpa.or.th/newtpa/consult/it/it
www.nectec.or.th/courseware/ pdf-documents/articles/it-reform-gov.pdf
www.nitc.go.th/cio/cio_training/peter_walker.pdf

ที่มา http://www.muslimthai.com

หน้าหลัก

 


ไม่สงวนลิขสิทธิ์สำหรับบทความของเว็บไซต์นี้ ทีมงานสนับสนุนให้มีการเผยแพร่ต่อเพื่อความดีงาม
ติดต่อทีมงานผ่านอีเมล :piwdee@hotmail.com,  husna@piwdee.net

ฟรี สถิติเว็บไซต์