fbpx

คุณลักษณะและกระบวนการเจาะ Big Data มาใช้งาน

10 Jul คุณลักษณะและกระบวนการเจาะ Big Data มาใช้งาน

Photo credit: freepik.com

 

คุณลักษณะสำคัญ 4 อย่างของ Big Data

 

Big Data มีคุณลักษณะสำคัญอยู่ 4 อย่างคือ ต้องเป็นข้อมูลที่มีจำนวนมากขนาดมหาศาล (Volume) มีความซับซ้อนหลากหลาย (Variety) มักจะเปลี่ยนแปลงอย่างรวดเร็วอยู่ตลอดเวลา (Velocity) และยังไม่สามารถนำมาใช้เป็นข้อมูลที่สมบูรณ์เพื่อนำมาใช้ในการประกอบการพิจารณาได้ (Veracity)

 

ข้อมูลมากมายมหาศาลเป็นอย่างไร (Volume)

 

ข้อมูลจำนวนมหาศาลนี้ได้มาจากการดำเนินธุรกิจ เช่น ข้อมูลจากทุกแผนก การเงิน บัญชี ฝ่ายขาย การตลาด ลูกค้าสัมพันธ์ ฯลฯ หรือ จากบทสนทนาของเรากับลูกค้าใน Social Media ทั้งหมด ไม่ว่าจะแบบ Online หรือ offline ไปจนถึง URLs ที่คุณ Bookmarks เอาไว้ จะจัดเก็บในรูปแบบไหนประเภทใดก็ได้ ซึ่งในแต่ละวันข้อมูลใหม่พวกนี้ก็จะมีเข้ามาตลอด วันหนึ่งก็ถือว่ามากมายแล้ว ยิ่งถ้าข้อมูลที่มีจำนวนมากเข้ามาตลอดวัน 7 วันในหนึ่งอาทิตย์ เข้ามาทุกเดือนตลอดทั้งปี รวมกันหลายๆ ปีจะมากมายก่ายกองขนาดไหน

 

ข้อมูลที่มีความหลากหลายและซับซ้อน (Variety)

 

เอาเป็นว่าทุกรูปแบบที่คุณพอจะนึกออกนับเป็นความหลากหลายและความซับซ้อนได้ทั้งหมด ไม่ว่าจะเป็น Behavioral data: ข้อมูลเชิงพฤติกรรมการใช้งานต่างๆ หรือ Image & sounds: ภาพ, วีดีโอ, ข้อมูลเสียงที่ถูกบันทึกไว้ รวมทั้ง Languages: ข้อความใดๆที่เกิดขึ้นในเว็บไซต์ ไปจนถึง Records: ข้อมูลที่เก็บไว้อยู่ในสกุลไฟล์ใดๆ เช่น .bmp .gif .jpeg .png .tif .tiff .svg .doc .docx .odt .pdf .rtf .tex และอื่นๆอีกมากมาย ความหลากรูปแบบและความซับซ้อนของข้อมูลนี่เองที่เป็นส่วนหนึ่งของ Big Data

 

ข้อมูลที่มีการเปลี่ยนแปลงอย่างรวดเร็วอยู่ตลอดเวลา (Velocity)

 

อัตราการเพิ่มขึ้นของข้อมูลเป็นไปด้วยความรวดเร็ว เช่น ข้อมูลการพิมพ์สนทนา ข้อมูลการอัดภาพวีดีโอ ข้อมูลการสั่งซื้อสินค้า ข้อมูลโปรโมชั่นต่างๆ หรือ ข้อมูล Sensor เป็นต้น ลองสังเกตุว่าในทุกๆ วัน ทุกๆ ชั่วโมง หน้าเฟสบุคของเรามีการฟีดข้อมูลมามากมายแค่ไหน ดังนั้นถ้าองค์กรธุรกิจใดสามารถนำข้อมูลเหล่านั้นไปใช้ให้เกิดประโยชน์ได้ ก็จะสามารถได้เปรียบทางธุรกิจ

 

ข้อมูลที่มีความไม่ชัดเจน (Veracity)

 

เป็นข้อมูลที่มีความคลุมเครือ มีความไม่แน่นอน  เนื่องจากข้อมูลมีความหลากหลายและมาจากแหล่งต่างๆ เช่น Facebook, Twitter, Youtube ซึ่งเป็นสิ่งที่ยากที่เราจะสามารถควบคุมคุณภาพของข้อมูลได้ข้อมูลที่มีคุณภาพนั้นจะต้องถูกต้องแม่นยำและเชื่อถือได้ ถ้าข้อมูลไร้คุณภาพก็จะส่งผลต่อการวิเคราะห์ต่อไป แต่เราจะทำให้ข้อมูลที่ยังไม่ได้คุณภาพนี้กลายเป็นข้อมูลที่ดีได้อย่างไร ขึ้นอยู่กับวิธีในการเก็บและกระบวนการทำ Data Cleansing

 

 

กระบวนการจาก Big Data สู่ความสัมพันธ์ของข้อมูล

 

บางคนอาจสงสัยว่าวิธีการประมวลผล แยกแยะ วิเคราะห์ของ Big Data จะเป็นไปอย่างไร เราสามารถอธิบายคร่าวๆได้ดังนี้

1. Storage: การรวบรวมข้อมูลมาจัดเก็บ

 

การรวบรวมข้อมูลจากแหล่งต่างๆ ทั้งข้อมูลที่มีคุณภาพ ข้อมูลที่คาดว่าจะมีประโยชน์ / ไม่ครบถ้วน ข้อมูลรูปภาพ วิดีโอ ไฟล์เสียงทั้งหลาย ถูกส่งมาจัดเก็บที่ถังข้อมูล

 

2. Processing: การประมวลผล

 

เมื่อข้อมูลต่างๆถูกนำมารวมกันไว้ในที่เดียวแล้ว จะถูกนำไปจัดหมวดหมู่ข้อมูลที่มีความเกี่ยวข้องสัมพันธ์กัน ให้ผลคล้ายคลึงกัน แล้วนำมาเปลี่ยนเป็นรูปแบบข้อมูลเพื่อเอาเข้าระบบคลังข้อมูลที่ผ่านการประมวลผลแล้ว

 

3. Analyst: การวิเคราะห์และนำเสนอ

 

จากนั้นข้อมูลมากมายทั้งหมดที่ถูกจัดเรียงแล้วในหลายมิติจะถูกนำมาวิเคราะห์หา Pattern ของข้อมูลที่มองไม่เห็นด้วยตาเปล่า เช่น หารูปแบบความสัมพันธ์ที่ซ่อนอยู่ หาแนวโน้มการตลาด เทรนด์ความชอบของลูกค้า และข้อมูลอื่นๆที่เป็นประโยชน์ทางธุรกิจ และถูกนำเสนอออกมาในรูปแบบที่เข้าใจง่ายผ่านทางสถิติ กราฟ หรือรูปภาพนั่นเอง

 

เเม้ว่าเราจะรู้ว่า Big Data ได้ถูกพูดถึงมาสักระยะแล้ว ประโยชน์ที่เกิดขึ้นจริงคืออะไร เราชวนคุณอ่านต่อที่นี่

 

เนื้อหาที่เกี่ยวข้อง

About Matana Wiboonyasake

Digital Marketing Executive | Aware Group เพิ่งเริ่มทำงานและเขียนเนื้อหาทางด้านเทคโนโลยี ตั้งใจที่จะส่งมอบเนื้อหาที่เป็นประโยชน์ เขียนให้อ่านง่ายและเข้าใจง่าย แม้ผู้ที่ไม่มีความรู้ทางด้านเทคโนโลยีมาก่อนก็สามารถศึกษาร่วมกันได้ ยินดีที่จะนำเสนอเรื่องราวน่าสนใจด้านเทคโนโลยี มาร่วมเรียนรู้ด้วยกันนะคะ