วันเสาร์ที่ 10 มิถุนายน พ.ศ. 2560

ประเภทของข้อมูล

                ประเภทของข้อมูล (Data Type)

ในการที่เราจะศึกษาเกี่ยวกับข้อมูล เราจำเป็นที่จะต้องแยกประเภทของข้อมูลให้ได้ก่อน เพื่อที่จะทำความเข้าใจธรรมชาติของข้อมูลประเภทนั้นๆ และเพื่อให้เราสามารถที่จะเลือกใช้เครื่องมือทางสถิติที่เหมาะสมในการวิเคราะห์หรืออธิบายข้อมูลนั้นๆ  เราสามารถแบ่งประเภทของข้อมูลได้ดังต่อไปนี้
ข้อมูลเชิงคุณภาพ (Qualitative or Attribute Data)
เป็นข้อมูลที่ไม่สามารถวัดด้วยอุปกรณ์การวัดใดๆ ได้เลย แต่ได้มาจากการนับ การสังเกตุ เราจึงนิยามชนิดของข้อมูลที่ได้ว่าเป็นข้อมูลเชิงคุณภาพ  แบ่งได้เป็นสองลักษณะย่อยได้ดังนี้
  •  แบ่งโดยใช้ลักษณะนาม (Nominal Scale) เช่น. ข้อมูลของ ผู้ที่ผ่านเข้าออกประเทศไทย ทางสนามบินดอนเมืองที่แสดงดังต่อไปนี้เป็นตัวอย่างที่ดี (ตัวเลขสมมุติ)
               - สัญชาติ  :   ไทย 13.4%      อเมริกัน   7.9%      ญี่ปุ่น 7.3%      จีน 5.4%       อินเดีย 3.4 %
               - ภารกิจ :  ท่องเที่ยว 56.5%     ธุรกิจ 34.5%       การศึกษา 4.5% 
               - เพศ :  ชาย  67.3%       หญิง 32.7%
จากตัวอย่าง จะเห็นว่า สัญชาติ ภารกิจ เพศ เป็นลักษณะของข้อมูลที่เราเก็บจากการศึกษาเป็นข้อมูลขั้นแรก หรือปฐมภูมิ (Primary) ในขณะที่ ไทย อเมริกัน ญี่ปุ่น จีน อินเดีย  ท่องเที่ยว ธุรกิจ การศึกษา ชาย และ หญิง  เป็นข้อมูลขั้นทุติยภูมิ (Secondary)  ส่วนตัวเลขคือค่าที่ได้จากการศึกษา  
หรือถ้าเป็นตัวอย่างในงานอุตสาหกรรมดังต่อไปนี้ เป็นผลการศึกษา การทำงานของ Hard disk ที่ผ่านการผลิตแล้วจำนวน 1,000 หน่วย
               - ผลการทดสอบฟังชั่น (Functional test) :  ผ่าน (Pass) 700 unit      ไม่ผ่าน (Fail) 300 unit
               - อาการปัญหา (Defect) : เป็นรอยขีดข่วน (Scratch) 45.5%    หักหรืองอ (Bent) 30.5%     มีคราบสกปรก (Contamination) 23.0%
เช่นเดียวกันกับตัวอย่างแรก ข้อมูลที่เก็บมาได้ เป็นข้อมูลเชิงคุณภาพ ถึงแม้ว่าการเก็บข้อมูลตามตัวอย่างที่สองจะใช้เครื่องมือช่วยก็ตาม เช่น การทดสอบฟังชันการทำงาน จะใช้เครื่องทดสอบโดยเฉพาะ แต่ลักษณะ ผลการทดสอบ แค่รายงานว่า ผ่าน หรือไม่ผ่าน การทดสอบ เราก็ถือว่าเป็นข้อมูลเชิงคุณภาพอยู่ดี
ถ้าสังเกตดีๆ เราจะพบว่าข้อมูลบางชนิด แยกย่อยได้มากกว่าสองลักษณะ (Category) เช่น สัญชาติ หรือ อาการของปัญหา แต่บางชนิดแบ่งได้เพียงสองกลุ่ม เช่น เพศ ผลการทดสอบ เป็นต้น
  •  แบ่งโดยอันดับ (Ordinal Scale) คล้ายกับแบบ Nominal แต่มีข้อแตกต่างกันอยู่ ตรงที่ ข้อมูลทั้งหมด จะเรียงลำดับกันอย่างชัดเจน การสลับที่ของข้อมูลจะทำให้สาระที่เรา ไดผิดปกติไปทันที  ในขณะที่ Nominal ไม่มีผล ตัวอย่างเช่น
            ผลการสำรวจความคิดเห็นต่อนโยบายจัดระเบียบสังคมของรัฐบาล ออกมาเป็นลักษณะดังนี้
                  - ความเห็น :  เห็นด้วย อย่างยิ่ง 55.5%    เห็นด้วย 30.%   ไม่ออกความคิดเห็น 5%   ไม่เห็นด้วย 5%   ไม่เห็นด้วยอย่างยิ่ง 4.5%
                  - ระดับการศึกษา :  มัธยม 12%    อนุปริญญา 23%     ปริญญาตรี 40 %    ปริญญาโท 20%     ปริญญาเอก 5%
            จะเห็นว่าข้อมูลที่เก็บมานั้น มีอันดับ อย่างชัดเจน นี่คือความแตกต่างของข้อมูล Nominal กับ Ordinal

ข้อมูลเชิงปริมาณ (Quantitative or Variable data)
คือข้อมูลที่มีลักษณะเป็นตัวเลข สามารถแบ่งออกได้อีกเป็นสองชนิดย่อย ดังนี้
  •  ข้อมูลแบบไม่ต่อเนื่อง (Discrete Data) ลักษณะที่สำคัญคือ เป็นตัวเลขที่ได้จากการนับ ค่าทศนิยมมีค่าได้จำกัด หรือไม่มีความหมาย ดังตัวอย่างต่อไปนี้
                    - จำนวนครั้งที่เครื่องจักรหยุดทำงาน วันนี้ เท่ากับ 12 ครั้ง
                    - พบจุดบกพร่องในงานที่เพิ่งผลิตเสร็จ 9 จุด
 จากตัวอย่างเราจะเห็นว่า จำนวน หรือตัวเลขจะไม่มีทางที่เป็นทศนิยมได้เลย ถึงแม้ว่าบางครั้งจะนำค่าข้อมูลเหล่านี้หลายค่า มาหาค่าเฉลี่ยได้ค่าที่มีทศนิยมก็ตาม ค่านั้นก็จะไม่มีจริง หรือไม่มีความหมายใดๆ  หรือดูค่าจากตัวอย่างต่อไปนี้แล้วลองเปรียบเทียบกับสองตัวอย่างข้างบน
                 - เขาขายสินค้าได้เงิน 1,000.50 บาท
ถึงแม้ว่าจำนวนเงินจะมีทศนิยมละเอียดแค่ไหนก็ตาม ค่าในชีวิตจริง หน่วยย่อยของเงินก็มีได้แค่ 0.75 , 0.50 และ 0.25 บาทเท่านั้น
  • ข้อมูลแบบต่อเนื่อง (Continuous Data) ลักษณะที่สำคัญคือ ต้องใช้เครื่องมือวัดมา  ค่าทศนิยมมีความหมายและไม่มีที่สิ้นสุด ขึ้นอยู่กับความละเอียดของเครื่องวัดว่าจะแยกแยะออกเป็นทศนิยมได้กี่ตำแหน่ง  ดังตัวอย่างต่อไปนี้
                    - อุณหภูมิห้อง ขณะนี้  27.5 องศาเซลเซียส
                    - น้ำหนักของวัสดุชิ้นนี้  23.45 กรัม
จากสองตัวอย่างที่ผ่านมา อุณหภูมิ ต้องวัดโดย เทอร์โมมิเตอร์ หรือระบบการวัดอุณหภูมิ อย่างแน่นอนเพราะเรามิอาจรับรู้ค่าอุณหภูมิได้เอง และค่าน้ำหนัก เราก็ต้องวัดโดยเครื่องชั่งน้ำหนัก หรือระบบอื่นๆ ที่ออกแบบมาให้วัดค่าน้ำหนักได้   นั่นคือลักษณะอย่างแรก ส่วนลักษณะที่สองคือ คุณสมบัติของค่าเหล่านี้ เช่น  27.505 องศาจะสูงกว่า 27.500 องศาแน่นอน แลก่อนจะไปถึงค่า 27.505 ได้อุณหภูมิจะต้องเพิ่มไปเรื่อยๆ ไม่ใช่กระโดดไปค่าใหม่ได้ทันที แต่ในชีวิตจริงที่เราเห็นอุณหภูมิ เปลี่ยนไปที่ 0.005 องศา ก็เพราะว่าความจำกัดของระบบ การวัด และวิธีแสดงผล ของระบบการวัดเท่านั้นเอง

ไม่มีความคิดเห็น:

แสดงความคิดเห็น