مصنوعی ذہانت (اےآئی) اب ہماری روزمرہ زندگی کا لازمی حصہ بن چکی ہے اور ہمارے روزمرہ کے فیصلوں میں بھی شامل ہو چکی ہے مگر کیا یہ واقعی ہماری ریاضی کی الجھنیں حل کر سکتی ہے؟
حالیہ تحقیق کے نتائج سے حیران کن انکشاف ہوا ہے کہ سب سے جدید AI چیٹ بوٹس بھی ہر چوتھے سوال میں غلطی کرنے کے امکانات رکھتے ہیں۔ اس مطالعے نے یہ سوال کھڑا کر دیا ہے کہ کون سا AI ماڈل واقعی حساب کتاب میں سب سے زیادہ قابلِ اعتماد ہے اور کہاں یہ ہمارے اعتماد کو چیلنج کر سکتے ہیں۔
محققین نے ایک حیران کن مطالعہ کیا تاکہ پانچ AI ماڈلز کی درستگی کا تجزیہ کیا جا سکے، جس میں 500 روزمرہ کے ریاضی کے سوالات شامل تھے۔ دلچسپ نتائج سے ظاہر ہوا کہ کسی بھی AI کے غلط جواب دینے کا امکان تقریباً 40 فیصد ہے۔
Omni Research on Calculation in AI (ORCA) سے معلوم ہوا کہ جب آپ AI چیٹ بوٹ سے روزمرہ کی ریاضی کرنے کے لیے پوچھتے ہیں، تو درستگی مختلف کمپنیوں اور مختلف قسم کے ریاضیاتی کاموں میں نمایاں طور پر مختلف ہوتی ہے۔
تحقیق میں 4 معروف ماڈلز کا جائزہ لیا گیا جن میں جیمنی (گوگل)، چیٹ جی پی ٹی (اوپن اے آئی)، ڈیپ سیک اور گروک شامل ہیں۔ نتائج کے مطابق کسی بھی ماڈل نے 63 فیصد سے زیادہ درستگی حاصل نہیں کی۔ سب سے بہتر جیمینی رہا جس نے 63 فیصد درست جوابات دیے جبکہ گروک 62.8 فیصد، ڈیپ سیک 52 فیصد اور چیٹ جی پی ٹی 49.4 فیصد پر رہا۔
ریاضی اور تبادلوں کے شعبے میں اے آئی کی کارکردگی سب سے زیادہ رہی، جہاں جیمینی نے 83 فیصد درستگی کے ساتھ سبقت لی، گروک 76.9 فیصد، فیصد، ڈیپ سیک 74.1 اور چیٹ جی پی ٹی 66.7 فیصد درست جواب دینے میں کامیاب رہا۔
ماہرین کے مطابق اے آئی کی غلطیوں کی چار اہم اقسام ہیں جن میں کمپیوٹیشن کی غلطیاں، خراب منطقی فیصلے، ہدایات کی غلط تشریح اور سوال سے انکار شامل ہیں۔





































