هوش مصنوعی در آستانه کشف جهان؛ آزمایش OpenAI برای سنجش مرزهای علم

ایده استفاده از هوش مصنوعی برای پیشبرد علم، سالهاست الهامبخش چهرههای برجسته دنیای فناوری بوده است؛ از رویای «هوش برای حل همهچیز» گرفته تا وعده ایجاد «کشوری از نابغهها در یک دیتاسنتر». حالا OpenAI با معرفی FrontierScience تلاش کرده نشان دهد هوش مصنوعی تا چه حد به ایفای نقش یک همکار علمی واقعی نزدیک شده است.
FrontierScience شامل پرسشهایی در فیزیک، شیمی و زیستشناسی در دو سطح است: سطح المپیادی که توانایی حل مسایل بسیار دشوار را میسنجد و سطح پژوهشی که توسط دانشمندان دکتری طراحی شده و مهارتهایی مانند استدلال باز، قضاوت علمی و پشتیبانی از تحقیقات واقعی را ارزیابی میکند. برخی از این پرسشها آنقدر پیچیدهاند که حل آنها برای پژوهشگران انسانی هفتهها یا حتی ماهها زمان میبرد.
نتایج نشان میدهد پیشرفت مدلهای هوش مصنوعی در این حوزه بسیار سریع بوده است. GPT-5.2 در حال حاضر بهترین عملکرد را ثبت کرده و در سطح المپیادی به دقت بالای 77 درصد رسیده است، هرچند در سطح پژوهشی هنوز فاصله قابل توجهی با عملکرد انسانی دارد. با این حال، پژوهشگران OpenAI معتقدند اگر مدلها به نمرات نزدیک به کامل در این سطح برسند، میتوانند سرعت و دامنه پیشرفت علمی را چند برابر کنند.
با وجود این خوشبینی، محدودیتهایی نیز وجود دارد. FrontierScience تنها تواناییهای متنی را میسنجد و آزمایش عملی، تحلیل تصاویر یا ویدیوها را در بر نمیگیرد. همچنین تعداد کم سوالات و نبود معیار مقایسه انسانی، ارزیابی دقیق را دشوار میکند. برخی دانشمندان نیز نسبت به قابلیت واقعی هوش مصنوعی در تولید ایدههای نو تردید دارند و از سیل مقالات ضعیف تولیدشده با کمک مدلهای زبانی ابراز نگرانی میکنند. با این حال، نمونههایی مانند AlphaFold نشان میدهد هوش مصنوعی میتواند تأثیر عمیقی بر علم بگذارد.










