تکنولوژی

پاسخ‌های نادرست هوش مصنوعی دو برابر شد؛ Claude معتبرترین و ChatGPT در صدر خطاها

مطالعه‌ای تازه نشان می‌دهد که اطلاعات نادرست چت‌بات‌های هوش مصنوعی در یک سال گذشته دو برابر شده و حتی گوگل و OpenAI را درگیر کرده است.
به گزارش تک‌ناک، نتایج مطالعه‌ای تازه نشان می‌دهد که میزان انتشار اطلاعات نادرست چت‌بات‌های هوش مصنوعی در سال گذشته دو برابر شده است. در این میان، اگرچه جمنای در مقایسه با بسیاری از رقبا عملکرد مطمئن‌تری از خود نشان داده، همچنان نرخ خطا در پاسخ‌های آن در مقایسه با سال قبل افزایش چشمگیری یافته است.براساس این پژوهش، Claude محصول شرکت آنتروپیک به‌عنوان معتبرترین ابزار هوش مصنوعی معرفی شده است. این چت‌بات فقط در ۱۰ درصد پاسخ‌های خود مرتکب خطا شده و مانند سال گذشته سطح ثابتی از اعتبار را حفظ کرده است. پس از آن، جمنای گوگل با ۱۷ درصد خطا در جایگاه دوم قرار دارد؛ در‌حالی‌که ChatGPT متعلق به OpenAI همراه با ابزار متا با ۴۰ درصد پاسخ‌های نادرست، در رتبه‌های بعدی فهرست دیده می‌شوند.
نوت بوک چک می نویسد که محققان در این بررسی اعلام کردند افزایش رقابت میان چت‌بات‌های هوش مصنوعی مهم‌ترین عامل رشد چشمگیر تولید اطلاعات نادرست بوده است. در سال ۲۰۲۴ زمانی که چت‌باتی پاسخی برای پرسش‌های خبری نداشت، در ۳۱ درصد مواقع هیچ جوابی ارائه نمی‌داد؛ اما در سال جاری این رقم به صفر رسید و درعوض، محتوای نادرست جایگزین آن شد.
بیشترین میزان خطا به چت‌بات Pi از شرکت Inflection نسبت داده شده است؛ ابزاری که تلاش می‌کند تا هوش هیجانی انسان را شبیه‌سازی کند. با‌این‌حال، این قابلیت باعث شده است تا بیشتر درمعرض پذیرش اخبار جعلی و منابع تبلیغاتی قرار گیرد.
سم آلتمن، مدیرعامل OpenAI، نیز در مصاحبه اخیرش به مشکل انتشار اطلاعات نادرست ChatGPT اذعان کرد و گفت که اختلاف میان سهولت افزودن این قابلیت به مدل‌های آینده و سطح اعتمادی که کاربران به پاسخ‌های ChatGPT دارند، بزرگ‌ترین نگرانی اوست.
درمقابل، اپل پس‌از چندین آزمایش مستقل دریافت که Claude معتبرترین گزینه برای استفاده در دستیار صوتی سیری است؛ به همین دلیل، مذاکراتی را با آنتروپیک آغاز کرده است تا در کنار جمنای گوگل، مدل‌های اختصاصی هوش مصنوعی را روی سرورهای ابری خود پیاده‌سازی کند.

برترین ابزارهای هوش مصنوعی از نظر اعتبار عبارت‌اند از:
Claude با ۱۰ درصد پاسخ نادرست
جمنای با ۱۷ درصد پاسخ نادرست
Grok/You با ۳۳ درصد پاسخ نادرست
Copilot/Mistral با ۳۶ درصد پاسخ نادرست
ChatGPT/Meta یا ۴۰ درصد پاسخ نادرست
همچنین، مطالعه یادشده نشان داد که عملیات نفوذ خارجی، به‌ویژه فعالیت‌های روسیه، نقش پررنگی در گسترش اطلاعات نادرست دارد. این کشور با تولید و انتشار میلیون‌ها تصویر ساختگی و پست و خبر ازطریق شبکه وبسایت‌های Pravda، تلاش می‌کند تا جهت‌گیری الگوریتم‌های جست‌وجو و پاسخ‌دهی چت‌بات‌های هوش مصنوعی را تغییر دهد.
پژوهشگران هشدار داده‌اند که تولید و مقابله با این اطلاعات نادرست به بازی بی‌پایان میان شرکت‌های فناوری و کارزارهای تبلیغاتی تبدیل شده است. در نتیجه، اکنون بیش از یک‌سوم پاسخ‌های چت‌بات‌های هوش مصنوعی به پرسش‌های خبری نامطمئن است و سطح اطلاعات نادرست تولیدشده با این ابزارها فقط در یک سال گذشته دو برابر شده است.

منبع:تک ناک

نمایش بیشتر

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا