هل كل البيانات دقيقة كما نراها؟

دائماً ما تشدنا الرسومات البيانية وغالبا هي أول ما يجذب انتباهنا سواءً في الأخبار، المنشورات، الكتب، العروض التوضيحية أو حتى في تغريدات تويتر. السبب في ذلك قدرة هذه الرسوم على ايصال الرسالة المطلوبة بوضوح وسرعة، لكن إذا تم تمثيلها بطريقة خاطئة يمكن أن تعطي معلومة مظللة أو غير كاملة عن نتائج البيانات الصحيحة. لُوحظ مؤخراً أن عدد من الرسوم البيانية يتم التلاعب فيها لتوهم بنتائج معينة وهذا تصرف غير أخلاقي ويقلل من تقدير حاجة المُتلقي للمحتوى الفعلي. هذه الفئة من الأخطاء كثيرة ومتنوعة ولكن سنستعرض الأخطاء الأكثر شيوعا.

محاور الرسم البياني

إذا أردت أن توصل فكرة معينه فقم بالتركيز عليها وهذا ما يقوم به “مظللي البيانات” بحيث يبدؤون محور الرسم البياني من نقطة كبيره وقريبه للنتائج المعروضة وبالتالي يظهر أن هناك تباين كبير بين النتائج وهذا من أكثر أنواع التظليل شيوعاً. لذلك تأكد دائما بأنه لا يمكن ان تبدأ محاور الرسم البياني إلا من نقطة الصفر.

Chart size

كما نرى في المثال أعلاه بأن التمثيل الخاطئ على يسار الشكل بدأ من نقطة متأخرة بحيث يظهر أن هناك اختلاف كبير بين مبيعات هذه المنتجات، ولكن في الحقيقة عند تمثيلها وبدأ المحور الصادي من النقطة صفر يظهر أن الاختلاف اقل وهذا قد يؤثر في اتخاذ القرار ويجب الانتباه له.

الالوان

الألوان وسيلة مناسبة للخداع البصري وترتبط بعض الألوان لدينا بقيم أو إشارات معينة، ولذلك فإن بعض الالوان في الرسم البياني تعطي المتلقي انطباع سيء عن نتائج معينه وأخرى العكس فمن الأفضل التحقق من الأرقام قبل الانخداع بالألوان فقط.

Colors

لو افترضنا بأن هذا الرسم يوضح عدد المصابين بفايروس COVID-19 في كل منطقة من مناطق كندا. سنجد الخطأ هنا بأنه جعل اللون يتدرج عكسياً من درجات اللون البرتقالي الغامق الى الفاتح وهذا قد يكون تفسيره لدى المتلقي بأن المناطق الأغمق لوناً على الخارطة تحتوي عدد حالات أكبر. لذلك من الافضل ان يجعل الأوان الداكنة للدلالة على الكثافة الأعلى لتجنب مثل هذا اللبس.

نوع التمثيل البياني

اختيار التمثيل البياني المناسب لنوع البيانات شيء مهم جداً لأن كل نوع رسم بياني يستخدم لتوضيح معلومات معينة، وبالتالي إذا قمنا باستعمال الرسم الخاطئ قد تصل رسالة أخرى تماماً عن البيانات المعروضة كما في هذه المقارنة:

The right chart type

استعمال المخطط الدائري غير صحيح، لان المخططات الدائرية تستعمل للمقارنة فعلاً لكن لمقارنة جزء من كل وليس مقارنة قيم مختلفة كم هو في المثال. ولو قمنا باستعمال الاعمدة كما هو بالجزء الأيمن من الشكل ستكون أدق وأوضح للقارئ.

الأرقام او الاحجام

كما ذكرنا سابقاً بان الرسومات تكون أسهل وأوضح عند تلقي المعلومة ولكن عندما تمثل البيانات على غير حقيقتها تكمن المشكلة. البعض عند تمثيل البيانات يستغل هذي النقطة بان يلفت انتباه المتلقي بأحجام رسوم لا تتناسب مع القيم الفعلية وهكذا تظهر نصف الحقيقة. لدينا هنا مثال افتراضي لمقارنة صادرات بعض الدول:

Number Vs Size

في التمثيل الخاطئ قام بإبراز دولة “Canada” في فقاعة أكبر من حجمها الحقيقي وهذا سيشد القارئ ويوهمه بانها اعلى صادرات، ولكن لو نظرنا الى الأرقام لوجدنا ان الفرق ليس كبير جداً. في المقابل عند القيام بالرسم البياني بالطريقة الصحيحة سنجد ان حجم الفقاعات متقارب جداً مما لا يحمّل الحقائق المعروضة تصورات خاطئة.

استبعاد بعض القيم

أحد الطرق الشائعة أيضاً والتي تستخدم في التلاعب بالرسم البياني هي أن يتم استبعاد بعض القيم من التمثيل لجعل الرسم البياني سلس أكثر دون التعمق في التفاصيل. لكن بهذا ستكون الحقيقة غير مكتملة لان جميع القيم مهمه واستبعاد بعضها قد يؤثر على قرارات مستقبليه.

Droping Data

في المثال أعلاه تم استبعاد بعض الأشهر لجعل الرسم يظهر أبسط، ولكن فعلياً تجاهل الأشهر قد يخل بالمتجه النهائي للبيانات، فعندما قمنا بتمثيل باقي الأشهر في الرسم البياني يمين الشكل تغير المتجه تماماً وأظهر بان هناك انخفاض واضح على عكس ما كان يظهره الرسم الأول الموضح يسار الشكل.

عند اطلاعنا وتعرفنا على هذه المظللات والتلاعبات سنكون أكثر وعيا ودقة في المستقبل عند رؤيتنا أو قراءتنا لأي تمثيل بياني ونقوم بفهمه وتحليله بالشكل المطلوب.. كما يجب في المقابل ان لا نقع نحن في مثل هذه الأخطاء عند استخدام التمثيل البياني لوصف البيانات حتى نتمكن من اظهار البيانات بشكل صحيح، كامل ودقيق لتكون ذات قيمة وفائدة.

الكاتبة


طالبة بكالوريوس نظم المعلومات الحاسوبية في جامعة الإمام عبدالرحمن بن فيصل. مهتمة بمجال تحليل البيانات و بالأثر الاجتماعي للبيانات الضخمة. مؤمنة أن نشر الوعي بفوائد تحليل البيانات لغير المتخصص سيساعد برفع جودة الحياة، وهذا ما أسعى لتحقيقه.