پاسخهای نادرست هوش مصنوعی دو برابر شد؛ Claude معتبرترین و ChatGPT در صدر خطاها

مطالعهای تازه نشان میدهد که اطلاعات نادرست چتباتهای هوش مصنوعی در یک سال گذشته دو برابر شده و حتی گوگل و OpenAI را درگیر کرده است.
به گزارش تکناک، نتایج مطالعهای تازه نشان میدهد که میزان انتشار اطلاعات نادرست چتباتهای هوش مصنوعی در سال گذشته دو برابر شده است. در این میان، اگرچه جمنای در مقایسه با بسیاری از رقبا عملکرد مطمئنتری از خود نشان داده، همچنان نرخ خطا در پاسخهای آن در مقایسه با سال قبل افزایش چشمگیری یافته است.براساس این پژوهش، Claude محصول شرکت آنتروپیک بهعنوان معتبرترین ابزار هوش مصنوعی معرفی شده است. این چتبات فقط در ۱۰ درصد پاسخهای خود مرتکب خطا شده و مانند سال گذشته سطح ثابتی از اعتبار را حفظ کرده است. پس از آن، جمنای گوگل با ۱۷ درصد خطا در جایگاه دوم قرار دارد؛ درحالیکه ChatGPT متعلق به OpenAI همراه با ابزار متا با ۴۰ درصد پاسخهای نادرست، در رتبههای بعدی فهرست دیده میشوند.
نوت بوک چک می نویسد که محققان در این بررسی اعلام کردند افزایش رقابت میان چتباتهای هوش مصنوعی مهمترین عامل رشد چشمگیر تولید اطلاعات نادرست بوده است. در سال ۲۰۲۴ زمانی که چتباتی پاسخی برای پرسشهای خبری نداشت، در ۳۱ درصد مواقع هیچ جوابی ارائه نمیداد؛ اما در سال جاری این رقم به صفر رسید و درعوض، محتوای نادرست جایگزین آن شد.
بیشترین میزان خطا به چتبات Pi از شرکت Inflection نسبت داده شده است؛ ابزاری که تلاش میکند تا هوش هیجانی انسان را شبیهسازی کند. بااینحال، این قابلیت باعث شده است تا بیشتر درمعرض پذیرش اخبار جعلی و منابع تبلیغاتی قرار گیرد.
سم آلتمن، مدیرعامل OpenAI، نیز در مصاحبه اخیرش به مشکل انتشار اطلاعات نادرست ChatGPT اذعان کرد و گفت که اختلاف میان سهولت افزودن این قابلیت به مدلهای آینده و سطح اعتمادی که کاربران به پاسخهای ChatGPT دارند، بزرگترین نگرانی اوست.
درمقابل، اپل پساز چندین آزمایش مستقل دریافت که Claude معتبرترین گزینه برای استفاده در دستیار صوتی سیری است؛ به همین دلیل، مذاکراتی را با آنتروپیک آغاز کرده است تا در کنار جمنای گوگل، مدلهای اختصاصی هوش مصنوعی را روی سرورهای ابری خود پیادهسازی کند.
برترین ابزارهای هوش مصنوعی از نظر اعتبار عبارتاند از:
Claude با ۱۰ درصد پاسخ نادرست
جمنای با ۱۷ درصد پاسخ نادرست
Grok/You با ۳۳ درصد پاسخ نادرست
Copilot/Mistral با ۳۶ درصد پاسخ نادرست
ChatGPT/Meta یا ۴۰ درصد پاسخ نادرست
همچنین، مطالعه یادشده نشان داد که عملیات نفوذ خارجی، بهویژه فعالیتهای روسیه، نقش پررنگی در گسترش اطلاعات نادرست دارد. این کشور با تولید و انتشار میلیونها تصویر ساختگی و پست و خبر ازطریق شبکه وبسایتهای Pravda، تلاش میکند تا جهتگیری الگوریتمهای جستوجو و پاسخدهی چتباتهای هوش مصنوعی را تغییر دهد.
پژوهشگران هشدار دادهاند که تولید و مقابله با این اطلاعات نادرست به بازی بیپایان میان شرکتهای فناوری و کارزارهای تبلیغاتی تبدیل شده است. در نتیجه، اکنون بیش از یکسوم پاسخهای چتباتهای هوش مصنوعی به پرسشهای خبری نامطمئن است و سطح اطلاعات نادرست تولیدشده با این ابزارها فقط در یک سال گذشته دو برابر شده است.
منبع:تک ناک