وجدت دراسة لمجموعة من الباحثين من مركز “بيث ديكونيس الطبي” في بوسطن أنّ برنامج الدردشة “Chat GPT” تفوق على الأطباء عند تقييم تاريخ الحالات الطبية، حتى عندما كان هؤلاء الأطباء يستخدمون روبوت الدردشة.
ففي إحدى التجارب، كان أداء الأطباء الذين تم إعطاؤهم برنامج “ChatGPT” لتشخيص المرض أفضل قليلاً من الأطباء الذين لم يستخدموه، لكن برنامج الدردشة وحده تفوق على جميع الأطباء.
وكان الدكتور “آدم رودمان” الخبير في الطب الباطني في مركز “بيث ديكونيس” الطبي في بوسطن، يتوقع بثقة أنّ روبوتات الدردشة المصممة لاستخدام الذكاء الاصطناعي ستساعد الأطباء في تشخيص الأمراض لكن ثبت أنّه كان مخطئاً، حيث كشفت دراسة ساعد الدكتور رودمان في تصميمها أنّ أداء الأطباء الذين تم إعطاؤهم برنامج “ChatGPT-4” إلى جانب الموارد التقليدية كان أفضل قليلاً من الأطباء الذين لم يكن لديهم إمكانية الوصول إلى الروبوت، فيما تفوق برنامج ChatGPT وحده على الأطباء، ما جعل رودمان يعرب عن صدمته من النتائج.
وحصل برنامج الدردشة الآلي من شركة OpenAI على متوسط درجات بلغ 90% عند تشخيص حالة طبية من تقرير حالة وشرح أسبابها، بينما حصل الأطباء الذين تم اختيارهم عشوائياً لاستخدام برنامج الدردشة الآلي على متوسط درجات بلغ 76%، أما أولئك الذين تم اختيارهم عشوائياً لعدم استخدامه فقد حصلوا على متوسط درجات بلغ 74%.
وأكّدت الدراسة اقتناع الأطباء الثابت أحياناً بالتشخيص الذي توصلوا إليه، حتى عندما يقترح برنامج الدردشة الآلي تشخيصاً أفضل. وأشارت أنّه في حين يتعرّض الأطباء لأدوات الذكاء الاصطناعي في عملهم، فإنّ قِلة من الناس يعرفون كيفية استغلال قدرات برامج الدردشة الآلي، ونتيجة لذلك، فشلوا في الاستفادة من قدرة أنظمة الذكاء الاصطناعي على حل المشكلات التشخيصية المعقدة وتقديم تفسيرات لتشخيصاتهم.