ترجمة وتحرير: نون بوست

خلال الأشهر الأخيرة، كانت وتيرة تطور الذكاء الاصطناعي سريعة للغاية لدرجة تُثير الرعب. ومن جهتها، أعلنت مايكروسوفت أنها ستستثمر مليار دولار في شراكة مع مختبر الأبحاث "أوبن أي آيه" لتطوير "الذكاء العام الاصطناعي". وقد افتخر سام ألتمان، الرئيس التنفيذي لشركة "أوبن أي آيه" بأن "تطوير الذكاء العام الاصطناعي سيكون أهم تطور تكنولوجي في تاريخ البشرية".

في الواقع، تستطيع الحواسيب القيام بالعديد من المهام المحددة بشكل أفضل بكثير من البشر، إلا أنها ليست لديها القدرة على القيام بأي شيء يتطلب الحكمة والحس السليم والتفكير النقدي الذي يستخدمه البشر للتعامل مع المواقف غير المحددة، والقواعد والأهداف الغامضة. لذلك، سيكون تطوير أجهزة الكمبيوتر التي يمكنها عمل كل ما يفعله الدماغ البشري أمرًا مدهشًا. في المقابل، لا يعدّ سجل مايكروسوفت مشجعًا. 

خلال سنة 2016، أطلقت مايكروسوفت تاي بوت، وهو عبارة عن منصة دردشة تعتمد على الذكاء الاصطناعي روجت له مايكروسوفت باعتباره "مصممًا لإشراك الأفراد وترفيههم حيث يتصلون ببعضهم البعض عبر الإنترنت من خلال محادثة عادية ومسلية".

في الحقيقة، كان تاي بارعًا في إعادة تدوير الكلمات والعبارات التي تلقاها، ولكن لم يكن لديه أي طريقة لوضع الكلمات في السياق أو فهم التغريدات التي كان يرسلها

كان تاي مبرمجا ليظهر على أنه فتاة تنتمي لجيل الألفية من خلال تعلم تقليد اللغة المستخدمة من قبلهم. ولقد تفاخرت شركة مايكرسوفت بأنه "كلما تحدثت مع تاي كلما أصبح أكثر ذكاءً". وفي أقل من يوم واحد، أرسل تاي 69 ألف تغريدة وحصد أكثر من 50 ألف متابع. ولكن تكمن المشكلة في أن تاي أصبح ينشر رسائل مهينة. فعلى سبيل المثال، غرد تاي قائلا: "كان هتلر محقًا في كره اليهود"، "إن أحداث الحادي عشر من سبتمبر نفذت من قبل أطراف داخلية"...

في الحقيقة، كان تاي بارعًا في إعادة تدوير الكلمات والعبارات التي تلقاها، ولكن لم يكن لديه أي طريقة لوضع الكلمات في السياق أو فهم التغريدات التي كان يرسلها. وبعد 16 ساعة، فصلت مايكروسوفت تاي عن الإنترنت. وبعد أسبوع، أعادت مايكروسوفت إطلاق تاي ولكنه وضع نفسه مرة أخرى في دائرة مفرغة، حيث غرد قائلا: "أنت سريع للغاية، يرجى أخذ قسط من الراحة"، الأمر الذي أدى الى تعطيل حياة أكثر من 200 ألف متابع على تويتر. ومن جهتها، ادعت مايكروسوفت أن الإصدار التجريبي لتاي بوت كان مجرد حادثة وقامت بإيقافه مجددا.

يعد علم البيانات أكثر من مجرد أدلة رياضية وحسابات إحصائية وبرمجة الكمبيوتر

قد يكون تطوير الذكاء العام الاصطناعي حلمًا وهميًا، لكن علم البيانات من شأنه أن يوفر فرصة واقعية لاستخدام البيانات الضخمة وأجهزة الكمبيوتر القوية لاتخاذ قرارات تستند إلى الحقائق بدلا من التفكير المحدود والأهواء والحدس والتحيزات. ولسوء الحظ، يقوم الواقع على أن الشركات والحكومات لا تزال ترتكب العديد من الأخطاء نفسها التي ارتكبت قبل بداية ظهور طوفان البيانات، لكن الفرق يتمثل في جعلها في الوقت الراهن أسرع بكثير. لذلك، يعمل تحويل القرارات المهمة إلى آلات على أتمتة الأخطاء.

يعد علم البيانات أكثر من مجرد أدلة رياضية وحسابات إحصائية وبرمجة الكمبيوتر. كما يعد الذكاء البشري ضرورة: فهو يقوم على التصميم التجريبي والحكمة والحس السليم والشك والتفكير النقدي. لذلك، لا ينبغي لعلماء البيانات أن يسعوا لأن يصبحوا آلات، بل ينبغي عليهم أن يسعوا جاهدين لأن يصبحوا علماء. وفي الواقع، هناك تسعة عيوب شائعة يجب تجنبها إذا استطاع علم البيانات تحقيق إمكاناته الهائلة:

استخدام بيانات سيئة: سأل أعضاء البرلمان تشارلز باباج، مخترع أول حاسوب ميكانيكي، مرتين، "إذا وضعت في الآلة أرقامًا خاطئة، فهل ستخرج الإجابات الصحيحة؟". لذلك، يعد إدخال البيانات الجيدة أمرا ضروريا وليس اختياريا.

في الحقيقة، خلصت إحدى الدراسات التي أجريت على المرضى الذين يعانون من تعفن الدم في مستشفى شيكاغو إلى أن المرضى الذين يعانون من انخفاض مستويات الحموضة في دمهم كانوا أقل عرضة للعودة إلى المستشفى بعد فترة قصيرة من خروجهم. وعلى الرغم من أن الارتباط بينهما كان حاسما حيث بلغ 0.96، إلا أن البيانات شملت أيضا المرضى الذين لقوا حتفهم أثناء إقامتهم في المستشفى! وكان المرضى الأقل احتمالاً ليعودوا إلى المستشفى هم الذين وضعوا في المشرحة. وعندما تم استبعاد المتوفين، اتضح أن المرضى الذين يعانون من انخفاض قيم الأس الهيدروجيني (قيم الحموضة)، في الواقع، في خطر شديد.

وضع البيانات قبل النظريات: يقوم بعض علماء البيانات بفحص البيانات الخاصة بالأنماط دون الاسترشاد بالنظرية أو الفطرة السليمة. وفي الواقع، يعتقد هؤلاء العلماء أن التفكير في السؤال يحد من احتمالات اكتشاف المعرفة. ولسوء الحظ، فسّرت البيانات الضخمة عدد الأنماط التي يمكن اكتشافها، حيث أنها أغلبها لا معنى له بالضرورة. وتكمن المفارقة في البيانات الضخمة في أنه كلما زاد عدد البيانات التي نريد اكتشاف أكبر عدد ممكن من الأنماط منها، كلما زاد احتمال أن نجد أنماطا لا قيمة لها أو أسوأ من ذلك.

من المغري الاعتقاد أنه نظرًا لأن أجهزة الكمبيوتر يمكنها القيام ببعض الأشياء بشكل جيد للغاية، فيجب أن تكون ذكية للغاية

اختبر أحد المسوقين على شبكة الإنترنت ثلاثة ألوان بديلة "لصفحة التصدير" الخاصة به (الأحمر والأصفر والشرشيري) عوضا عن لونه الأزرق التقليدي المعتمد في 100 بلد أو أكثر، مما يضمن له أنه سيحقق زيادة في الإيرادات عند اعتماد هذه الألوان في بعض البلدان. ولكنه خلص إلى أن إنجلترا رغم حبها للون الشرشيري، إلا أن حجم الإيرادات فيها لم يرتفع.

عبادة أجهزة الكمبيوتر: من المغري الاعتقاد أنه نظرًا لأن أجهزة الكمبيوتر يمكنها القيام ببعض الأشياء بشكل جيد للغاية، فيجب أن تكون ذكية للغاية. في المقابل، أن تكون هذه الأجهزة مفيدة في القيام ببعض المهام يختلف تمامًا عن وجود ذكاء عام اصطناعي يطبق الدروس المستفادة والمهارات المطلوبة للقيام بمهمة واحدة، على مهام أكثر تعقيدًا، أو مهام مختلفة تماما.

في الحقيقة، إذا ما اعتقدنا أن أجهزة الكمبيوتر أذكى منا، فقد نميل إلى السماح لها بالتفكير عوضا عنا، ولكن ذلك له عواقب محتملة وخيمة. فقد أصبح "علم الإجرام الخوارزمي" باستخدام نماذج "الصندوق الأسود" أمرًا شائعًا في تحديد الكفالة قبل المحاكمة، وإصدار الأحكام بعد المحاكمة، وقرارات الإفراج المشروط بعد الإدانة.  وفي هذا الصدد، كتب أحد المطورين أن "النهج هو "الصندوق الأسود" الذي لم يتم تقديم أي اعتذار له. وعلى العموم، تميل خوارزميات الصندوق الأسود إلى التحيز العنصري ولا تتفوق على النماذج البسيطة التي تراعي فقط العمر والإدانات السابقة.

إساءة استخدام البيانات: خلال البحث الدؤوب عن علاقات ذات دلالة إحصائية، يتم إغراء البعض بتجزئة البيانات بطرق لا حصر لها. وعلى حد تعبير رونالد كوس: "إذا أسأت استخدام البيانات لفترة كافية، فستعترف بذلك". وتجدر الإشارة الى أن البيانات الضخمة وأجهزة الكمبيوتر القوية تسهل عملية إساءة استخدامها.

قدم الفيزيائي ريتشارد فاينمان هذه النصيحة للعلماء حيث أفاد قائلا: "يتمثل المبدأ الأول في ضرورة عدم خداع نفسك، حيث أنك أسهل شخص يمكن خداعه"

من جهته، نصح أحد الباحثين البارزين مساعدًا كان يقوم بتحليل البيانات التي جمعها في بوفيه إيطالي يعرف باسم "كل ما يمكنك تناوله" بتقسيم وجبات العشاء إلى "ذكور وإناث، فضلا عن القادمين لتناول وجبة الغداء، والقادمين لتناول وجبة العشاء، والأشخاص الذين يجلسون بمفردهم، والأشخاص الذين يتناولون الطعام مع مجموعات متكونة من شخصين، والأشخاص الذين يتناولون الطعام في مجموعات تضم أكثر من شخصين، والأشخاص الذين يطلبون الكحول، والأشخاص الذين يطلبون المشروبات الغازية، والأشخاص الذين يجلسون بالقرب من البوفيه، والأشخاص الذين يجلسون بعيدًا، وهكذا دواليك". ومن ثم النظر إلى الطرق المختلفة التي قد تختلف بها هذه المجموعات الفرعية.

 في هذا الصدد، قدم الباحث المساعد جملة من المعلومات على غرار: "# قطعة من البيتزا، ورحلات، وطبق مملوء، وإذا ما حصلوا على الحلوى، وإذا ما طلبوا مشروبًا، وما إلى ذلك. ونتج عن هذا العمل الدؤوب صدور "مناشير عن البيتزا" حيث ثبت أن الرجال يتناولون البيتزا بنسبة 93 بالمئة أكثر عندما يتناولون الطعام مع النساء. والجدير بالذكر أنه تم في الوقت الراهن سحب أكثر من 10 أوراق بحثية منشورة، وقد استقال من منصبه الجامعي.

خداع نفسك: قدم الفيزيائي ريتشارد فاينمان هذه النصيحة للعلماء حيث أفاد قائلا: "يتمثل المبدأ الأول في ضرورة عدم خداع نفسك، حيث أنك أسهل شخص يمكن خداعه". ومن جانبهم، يشارك العلماء الحقيقيون نظرياتهم، ويطرحون الأسئلة حول افتراضاتهم، ويبحثون عن فرص لإجراء تجارب من شأنها أن تثبتها أو تتناقض معها. من جهتهم، لا يرى معالجو البيانات سوى ما يريدون رؤيته.

في إحدى الدراسات طُلب من طلاب المدارس الثانوية توقع درجاتهم في اختبار الرياضيات. وكان متوسط الدرجات المتوقعة أعلى من متوسط الدرجات الفعلية، ولكن كان هناك ارتباط 0.70 بين الدرجات المتوقعة والفعلية. وقد خلص القائمون على الدراسة إلى وجود استنتاجين؛ أولهما يتمثل في مبالغة الطلاب في تقدير قدراتهم.   

سنة 2011، أطلقت شركة غوغل برنامجًا يعتمد على الذكاء الاصطناعي ويستغل عمليات البحث والاستعلام للتنبؤ بانتشار الإنفلونزا، سمي غوغل فلو

أما الاستنتاج الثاني فيشير إلى إمكانية زيادة درجات الاختبار عن طريق رفع تقدير الطلاب لذاتهم. ومع ذلك، فإن العلاقة الإيجابية بين الدرجات المتوقعة والفعلية قد يعكس بدلاً من ذلك حقيقة أن معظم الطلاب الذين أجابوا عن الاختبار بطريقة جيدة يعرفون أنهم يجيدون الرياضيات وأن الطلاب الذين فشلوا يعلمون أنهم لا يفهمون المادة جيدًا. لذلك، لم يكونوا متشائمين بشكل لا مبرر له؛ بل على كانوا واقعيين.

الخلط بين الارتباط والسببية: بغض النظر عن عدد المرات التي قيل لنا فيها أن الارتباط لا يعني السببية، إلا أن تجاهل هذه النصيحة الأساسية قد يصبح مغريا بشكل لا يقاوم.

سنة 2011، أطلقت شركة غوغل برنامجًا يعتمد على الذكاء الاصطناعي ويستغل عمليات البحث والاستعلام للتنبؤ بانتشار الإنفلونزا، سمي غوغل فلو. وتباهت الشركة بقدرة البرنامج على "تقدير المستوى الحالي للنشاط الأسبوعي للأنفلونزا بدقة في كل المناطق الموجودة في الولايات المتحدة، مع تأخر في الإبلاغ يقدر بيوم واحد تقريبًا". كما زعمت الشركة أن النموذج الذي قدمته كان دقيقًا بنسبة 97.5 بالمئة، ذلك أن الارتباط بين تنبؤات النموذج والعدد الفعلي لحالات الأنفلونزا كان 0.975. إذن، كيف تمكنت غوغل من فعل ذلك؟ تحقق برنامج غوغل للتنقيب من بيانات تخص 50 مليون عملية بحث واستعلام وحدد 45 منها التي كانت الأكثر ارتباطًا بحدوث إصابة بالإنفلونزا.

في بعض الأحيان، اشتكى العملاء من النطاقات "ضعيفة الأداء" التي شعروا أنها تستحق أن تكسب المزيد من إيرادات الإعلانات

ونظرًا لكون تفشي الإنفلونزا حدث موسمي بدرجة كبيرة، فقد يكون غوغل فلو في الغالب كاشفًا شتويًا اختار مصطلحات بحث تميز المواسم، مثل عيد الميلاد وعطلة الشتاء ويوم عيد الحب. وعندما تجاوزت مهمة البرنامج مطابقة البيانات التاريخية لتصل إلى يقدم تنبؤات حقيقية، أصبح غوغل أقل دقة بكثير. وبعد إصدار تقريرها، بالغ البرنامج في تقدير عدد حالات الإصابة بالأنفلونزا في مدة قدرت بحوالي 100 من أصل 108 أسبوعا القادمة أي بمعدل 100 بالمئة تقريبًا. ومنذ ذلك الحين، لم يقدم البرنامج أية توقعات تخص حالات الانفلونزا.

الشعور بالدهشة من التراجع نحو المتوسط: تبالغ القيم الكبيرة نسبيًا في تقدير الظاهرة التي يتم قياسها عندما تتقلب البيانات، لذلك تميل القيم التي تليها إلى أن تكون أقرب إلى المتوسط. فعلى سبيل المثال، من المحتمل ألا يقدم لاعب الغولف الذي فاز ببطولة ماسترز للغولف نفس المردود في البطولة القادمة. ولا يعود هذا الأمر إلى إصابته بحظ سيء أو فقدانه لقدراته، بل لأن الفوز يعتبر مبالغة في تقدير قدرته. ومن جهتها، أجرت شركة مختصة في علوم البيانات تجارب تقارن التصميم الحالي لصفحة الويب الخاصة بالعميل بما يصل إلى 20 تصميم بديلاً عبر مليون نطاق مختلف.

في بعض الأحيان، اشتكى العملاء من النطاقات "ضعيفة الأداء" التي شعروا أنها تستحق أن تكسب المزيد من إيرادات الإعلانات. لذلك، قدمت قائمة بأسماء النطاقات التي انخفضت إيراداتها خلال الأشهر الثلاثة الماضية لمحلل بيانات وطُلب منه التلاعب بتصميمها لمعرفة ما إذا كان بإمكانه زيادة الإيرادات ولاقت هذه التجربة نجاحًا مذهل. فبمجرد إجراء بعض التغييرات، ارتفعت العائدات بنحو 20 في المئة في اليوم التالي. واكتسب المحلل فيما بعد سمعة شبيهة بتلك التي يحظى بها نجم موسيقى الروك، ولكن انشغاله الشديد منعه في أحد الأيام من إجراء أية تغييرات. وفي الحقيقة، لم يكن المحلل هو السبب بل كان أداء هذه المواقع فعلا ضعيفا حقًا وتراجعت إيراداتها نحو الأعلى.

إلحاق الأذى: تتمثل الحقائق المؤسفة التي تطغى على عصر البيانات الضخمة في مراقبة الشركات والحكومات للأفراد باستمرار حتى تتمكن من التنبؤ بتصرفاتنا والتلاعب بسلوكنا. في المقابل، يتقدم علماء البيانات الجيدون بحذر ويحترمون حقوقنا وخصوصيتنا. وتنطبق القاعدة الذهبية التي تفيد "تعامل مع الآخرين كما تحب أن تعامل"، على علم البيانات.

أجرى موقع مواعدة عن طريق الانترنت ثلاث تجارب، حيث حذفت جميع الصور بشكل مؤقت من الموقع في التجربة الأولى ما نتج عنه عدد أقل من الرسائل الأولية، مما يدعم فرضية أن الحب ليس أعمى. ومن ثمة، حجب جزء من المعلومات الشخصية بشكل عشوائي في التجربة الثانية. في المقابل، لم يؤثر هذا الأمر على تقييم الشخصية مما يدعم الفرضية القائلة بأن الحب لا يمكن قراءته. وعكست التجربة معدلات التوافق، وأبلغ العملاء المختارون بشكل عشوائي أن الشخص الذي كان متوافقًا تمامًا معهم لم يكن متوافقا والعكس صحيح. وعموما، لم تكن التجربتين الأولى والثانية ضارتين نسبيا. في المقابل، كان ينبغي على الشركة أن تأخذ بعين الاعتبار حقيقة أن عملائها قد لا يرغبون في أن تضطرب حياتهم نتيجة لعدم التوافق الرومانسي.

وتجدر الإشارة إلى تجنب هذه المآزق يتطلب توظيف التفكير النقدي وحتى نتمكن من توظيف العلم في علم البيانات، نحتاج إلى التصرف مثل الآلات بشكل أقل والتصرف كعلماء بشكل أكبر.

المصدر: فاست كومباني