هوش مصنوعی تنها یک سال تا «پیروزی بر همه کارشناسان جهان» فاصله دارد

توسعهدهندگان هشدار میدهند که هوش مصنوعی در عرض چند ماه آماده است تا نمره کامل را در یکی از سختترین آزمونهای دانش جهان به نام «آخرین امتحان بشریت» یا HLE کسب کند. این آزمون که توسط رهبران فناوری طراحی شده، شامل ۲۵۰۰ سوال انتخابشده دقیق از حدود صد موضوع از علم موشک تا اساطیر و فیزیولوژی است و برای پاسخگویی حتی نزدیک به ۱۰۰ درصد، دانش سطح دکترا لازم است؛ کسی که موفق شود، عنوان «کارشناس جهانی» را به دست میآورد.
دو سال پیش، ChatGPT تنها ۳ درصد از HLE را پاسخ داد و رقبای آن در گوگل و Anthropic عملکرد قابلتوجهی نداشتند. این آزمون زمانی برای کاهش نگرانیها درباره تسلط روزافزون هوش مصنوعی طراحی شد و نشان داد فاصله قابلتوجهی بین مدلهای زبانی بزرگ و بهترین دانشمندان جهان وجود دارد. اما امروز، HLE ممکن است صرفاً یک مرحله دیگر در مسیر صعود بیوقفه هوش مصنوعی باشد.
گوگل جمنای به تازگی ۴۵.۹ درصد از نمره را کسب کرده، در حالی که اولین تلاش آن تنها ۱۸.۸ درصد بود. Anthropic نیز به سرعت به ۳۴.۲ درصد رسیده و پیشرفت سریعی دارد. کالوین ژانگ، رهبر تحقیقات Scale، شرکت پشت HLE، میگوید: «ما میخواستیم یک معیار آکادمیک محدود و در مرز دانش انسانها ایجاد کنیم که تنها تعداد انگشتشماری از افراد در جهان بتوانند آن را حل کنند.»
این آزمون، طراحی شده توسط Scale و مرکز ایمنی هوش مصنوعی، هم دامنه دانش AI و هم عمق استدلال آن را میسنجد. حدود ۵۰ کشور با ۷۰ هزار سؤال در سال ۲۰۲۴ مشارکت کردند، از آن میان ۲۵۰۰ سوال انتخاب شد که بسیاری هنوز محرمانه هستند تا مدلها نتوانند از پاسخهای عمومی بهره ببرند.
موفقیت در HLE یادآور پیروزی ابرکامپیوتر Deep Blue بر قهرمان شطرنج جهان، گری کاسپاروف در سال ۱۹۹۷ است. از آن زمان، هوش مصنوعی موفق شده مجموعهای از معیارهای چندرشتهای را پشت سر بگذارد و اکنون توسعهدهندگان بر هدفی بزرگتر تمرکز دارند: فراتر رفتن از محدودیتهای دانش انسانی.
با این حال، ژانگ تأکید میکند که مهارتهای تخصصی انسانی، مانند جراحی و تصمیمگیری خلاقانه، هنوز برای هوش مصنوعی چالشبرانگیز باقی خواهند ماند و جایگاه انسان در برخی زمینهها محفوظ است.







