رقابت ایلان ماسک و اوپن ای آی بر سر دقت مدل های هوش مصنوعی

هفته گذشته یکی از کارمندان اوپن ای آی شرکت هوش مصنوعیxAI متعلق به ایلان ماسک را به انتشار نتایج گمراه کننده از سنجش گورک ۳ با یکی از معیارهای بررسی قدرت مدل متهم کرد.

به گزارش لینک بگیر دات کام به نقل از تک کرانچ، ایگور بابوشکین یکی از بنیانگذاران xAI تأکید دارد ادعاهای این شرکت در رابطه با قدرت گورک۳ صحت دارند. این شرکت فناوری در یک پست وبلاگی نموداری را منتشر نمود که عملکرد گورک ۳ را در AIME ۲۰۲۵ (مجموعه ای از سوالات چالش برانگیز ریاضی از یک آزمون ریاضی) نشان می داد. البته بعضی از کارشناسان اعتبار AIME را بعنوان یک معیار هوش مصنوعی زیر سوال برده اند. با این وجود AIME ۲۰۲۵ و نسخه های قدیمی تر این تست به صورت معمول جهت بررسی قابلیت های ریاضی مدلهای هوش مصنوعی به کار می روند. نمودار استارت آپ هوش مصنوعی ایلان ماسک نشان می داد عملکرد نسخه های «گورک ۳ »، «گورک ۳ استدلالی بتا» و «گورک ۳ استدلالی مینی» در معیار AIME ۲۰۲۵ بهتر از مدل «o۳مینی» شرکت اوپن ای آی است. اما کارمندان اوپن ای آی در پلت فرم ایکس به این نکته اشاره کردند که در نمودارxAI امتیاز «o۳مینی» در شاخص cons@۶۴ در ارتباط با معیار AIME ۲۰۲۵ شامل نشده است. cons@۶۴ به مدلهای هوش مصنوعی اجازه می دهد تا ۶۴ بار به سوالات پاسخ دهند و نتایج پرتکرار را بعنوان پاسخ نهائی درنظر می گیرد که حذف آن می تواند نتایج را گمراه کننده جلوه دهد. بابوشکین در پلت فرم ایکس ادعا نمود اوپن ای آی قبلا جدول های معیار گمراه کننده مشابه را منتشر نموده است، هرچند این جدول ها مقایسه بین عملکرد مدلهای هوش مصنوعی خود بوده است. دراین میان ناتان لمبرت محقق هوش مصنوعی در پستی این نکته را ذکر کرد که نتیجه مهم ترین معیار مدلهای هوش مصنوعی، یعنی هزینه رایانشی و مالی هر مدل برای دستیابی به بهترین امتیاز همچنان نامشخص است. این امر نشان داده است بیشتر معیارهای هوش مصنوعی فقط اندکی از قدرت ها و محدودیت های مدلها را نمایش می دهند.

منبع: لینك بگیر دات كام

1403/12/05

19:50:33

5.0 / 5

294

تگهای مطلب: اوپن ای آی , ایکس , هوش مصنوعی , فناوری